Dürfen wir Ihnen SiEBERT vorstellen – ein Sprachmodell für Sentimentanalysen

01. September 2022

Sentiments sind grundlegend für die menschliche Kommunikation. Der Umgang mit Sentimentanalysen ist für ForscherInnen jedoch kein Leichtes, eine exakte und akkurate Erfassung der Sentiments aus den Daten zu erzielen erweist sich oft als schwierig und komplex. Während Lexika lediglich einzelne Wörter und Ausdrücke mit Sentiment-Scores in Verbindung bringen können, sind Methoden des Machine Learnings meist zu komplex zum Interpretieren, versprechen aber eine höhere Genauigkeit, d.h. weniger Fehlklassifikationen. Doch welche Methode wirkt sich wie auf die Genauigkeit der Sentiments-Klassifizierung aus? Die neue Publikation von Jochen Hartmann, Mark Heitmann, Christian Siebert, und Christina Schamp im International Journal of Research Marketing, "More than a Feeling: Accuracy and Application of Sentiment" soll jetzt Abhilfe schaffen. Sie vergleichen die gängigsten Methoden der Sentimentanalyse mithilfe einer Meta-Analyse, die die unterschiedlichen Erkenntnisse aus 272 Datensätzen von Computer Science Publikationen extrahiert. Basierend auf zugrunde liegenden Charakteristika der Textkorpora (z.B. Herkunft der Texte, Länge der Texte, Sprache, oder Interpretierbarkeit der Ergebnisse), leiten sie die richtige Methodenwahl für unterschiedliche Use Cases ab. Neben diesen praktischen Entscheidungshilfen stellen sie auch ein Open-Source Skripte für Sentimentklassifikationen (SiEBERT) zur Verfügung, das sich der neusten Deep Learning Modelle genauso anwenderfreundlich ist wie ein altbewährtes Lexikon.

Lesen Sie die Ergebnisse jetzt hier nach.

zurück zur Übersicht