Refine
Year of publication
- 2015 (1)
Document Type
- Master's Thesis (1)
Language
- German (1)
Has Fulltext
- yes (1)
Is part of the Bibliography
- no (1)
Institute
Die vorliegende Arbeit beschäftigt sich mit der Automatisierung der Merkmalsextraktion
und der Stimmungsanalyse der extrahierten Merkmale in Produktbewertungen von
Onlineportalen. Der Fokus liegt dabei auf der Merkmalsextraktion.
Ziel dieser Arbeit ist es zu eruieren, ob die automatisierte Extraktion der von Kunden
bewerteten Merkmale eines Produktes aus einem Bewertungstext möglich ist. Ein
weiteres Ziel ist es die von den Kunden geäußerte Meinung bezüglich der genannten
Merkmale zu analysieren.
Mit dem Wissen aus dem Fazit dieser Arbeit soll es möglich sein eine Zusammenfassung
der bewerteten Merkmale von Bewertungstexten sowie der zugehörigen Stimmungen zu
erstellen. Eine solche Zusammenfassung dient dem Zweck sowohl potenziellen Käufern,
als auch den Herstellern der Produkte einen Überblick über die geäußerten Stimmungen
zu den erkannten Merkmalen eines Produktes zu verschaffen.
Es werden zwei Methoden zur Merkmalsextraktion angewendet und die Resultate anhand
von Metriken verglichen. Die Merkmalsextraktion mit Hilfe von Word2Vec ist ein
neuer Ansatz. Die Beschreibung und Evaluation dieses Ansatzes bilden den Hauptteil
dieser Arbeit. Der zweite Ansatz ist die Extraktion der Merkmale mittels der häufigsten
Nomen. Dessen Ergebnisse werden als Referenz für den neueren Ansatz herangezogen.
Beide Methoden wurden bereits bei englischsprachigen Bewertungen erfolgreich eingesetzt.
In dieser Arbeit werden beide Methoden auf deutschsprachige Bewertungen von
Modeartikeln angewendet.
Zunächst werden Bewertungsdaten aus einem Onlineportal extrahiert und vorverarbeitet.
Für die Merkmalsextraktion mittels häufigster Nomen werden die Daten Partof-
Speech annotiert und es wird diskutiert, wie aus den auf diese Weise gefundenen
häufigsten Nomen tatsächliche Merkmale herausgefiltert werden können.
Bei Merkmalsextraktion mit Word2Vec wird eine manuell erstellte Liste von Merkmalen
mit ähnlichen Begriffen erweitert.
Zum Ende der Arbeit wird eine Stimmungsanalyse beschrieben, welche anhand von
Wortlisten mit positiver beziehungsweise negativer Konnotation die gefundenen Merkmale
in positive, negative und neutrale Merkmale einteilt. Für die Merkmalsextraktion
wird hierbei die Word2Vec Methode genutzt.
Sowohl die Ergebnisse der Merkmalsextraktion als auch der Stimmungsanalyse werden
von zwei unabhängigen Nutzergruppen bewertet. Im Anschluss werden die Resultate
der Nutzerbewertung diskutiert.