Sentimentanalyse ist eine digitale Methodik, die häufig im NLP Bereich eingesetzt wird, um eine grundsätzliche Haltung – positiv oder negativ – des jeweiligen Textes zu ermitteln. Am häufigsten wird sie bei der Analyse von Bewertungen, Rezensionen, Kommentaren, Tweets u.Ä. angewendet. In den letzten Jahren hat die Sentimentanalyse ihren Weg in die Literaturwissenschaft gefunden, in der sie zunehmend mehr Beachtung findet.
Im Rahmen dieser Arbeit werden zwei Romane eines der bedeutendsten russischen Schriftsteller des 19. Jahrhunderts Fjodor Michailowitsch Dostojewski (1821-1881) analysiert. Für die Analyse wurde der Text des Romans "Verbrechen und Strafe" in der Übersetzung von Alexander Eliasberg aus der digitalen Textsammlung TextGrid Repository im XMLFormat
bezogen. "Die Brüder Karamasow" wurde in der deutschen Übersetzung von Hermann Röhl vom Internetportal "Projekt Gutenberg-DE" heruntergeladen.
Im Rahmen dieser Arbeit wird das Ziel verfolgt, die zwei Romane mithilfe des Tools SentText zu analysieren und die gewonnenen Ergebnisse mit der literaturwissenschaftlichen Forschung zu Dostojewski zu vergleichen. Die Arbeit ist wie
folgt strukturiert. Zuerst wird die Sentimentanalyse in der Literaturwissenschaft diskutiert. Im Anschluss daran wird das Tool SentText samt seiner Funktionalität vorgestellt. Im nächsten Teil wird auf die zwei Dostojewskis Romane eingegangen. Es werden die Haupthemen kurz skizziert sowie dominierende Emotionen erläutert, die in der Forschung bereits beschrieben wurden und die für die folgende Sentimentanalyse relevant sein können.
Anschließend werden die Ergebnisse der Sentimentanalyse mit SentText vorgestellt. Es werden die Fragen beantwortet, welche Gefühlslagen in den Romanen herrschen und welche Terminologie für ihre Beschreibung am häufigsten verwendet wird. Darüber hinaus soll überprüft werden, ob und inwieweit dieses Verfahren zur Analyse der Polarität geeignet ist und ob es zuverlässige sowie aussagekräftige Ergebnisse liefert. Schließlich soll kritisch reflektiert werden, welche Schwierigkeiten damit verbunden sind und was es bei einer Sentimentanalyse zu beachten gibt. Die Arbeit wird mit einem Fazit abgeschlossen, in dem die Ergebnisse der durchgeführten Analyse noch einmal zusammengefasst und mögliche Perspektiven für weitere Forschungsprojekte aufgezeigt werden.
Inhaltsverzeichnis
1. Einleitung
2. Sentimentanalyse in den Romanen „Verbrechen und Strafe“ und „Die Bruder Karamasow“
2.1. Sentimentanalyse in der Literaturwissenschaft
2.2. Sentimentanalyse mit SentText
2.3. „Verbrechen und Strafe“ und „Die Bruder Karamasow“ - Hauptthemen und Probleme
2.4. Sentimentanalyse in den Romanen „Verbrechen und Strafe“ und „Die Bruder Karamasow“
3. Fazit
Literaturverzeichnis
Quellenverzeichnis
Anhang
1. Einleitung
Sentimentanalyse ist eine digitale Methodik, die haufig im NLP Bereich eingesetzt wird, um eine grundsatzliche Haltung - positiv oder negativ - des jeweiligen Textes zu ermitteln. Am haufigsten wird sie bei der Analyse von Bewertungen, Rezensionen, Kommentaren, Tweets u.A. angewendet. In den letzten Jahren hat die Sentimentanalyse ihren Weg in die Literaturwissenschaft gefunden, in der sie zunehmend mehr Beachtung findet.
Im Rahmen dieser Arbeit werden zwei Romane eines der bedeutendsten russischen Schriftsteller des 19. Jahrhunderts Fjodor Michailowitsch Dostojewski (1821-1881) analysiert. Der Roman „Verbrechen und Strafe“ (1866), je nach Ubersetzung auch als „Schuld und Suhne“ oder „Raskolnikow“ bekannt, gehort vermutlich zu den bekanntesten Werken der russischen Literatur weltweit. Der zweite Roman - „Die Bruder Karamasow“ (1880) ist der letzte Roman des Autors. Zwischen den Romanen liegen einige Jahre, jedoch sind sie auf eine gewisse Weise thematisch verbunden. In seinen Romanen hat sich Dostojewski Menschen und ihren schweren Schicksalen gewidmet und dadurch die Grausamkeit der Welt in ihren verschiedenen Facetten gezeigt (vgl. Schwarzwaller 2004). Oft handelt es sich um Menschen, die sich in psychischen Ausnahmezustanden befinden und die fur den Schriftsteller von besonderem Interesse sind. Die menschliche Natur in ihren verschiedenen Auspragungen wird in seinen Romanen immer wieder thematisiert und aus unterschiedlichen Blickwinkeln erforscht.
Fur die Analyse wurde der Text des Romans „Verbrechen und Strafe“ in der Ubersetzung von Alexander Eliasberg aus der digitalen Textsammlung TextGrid Repository im XMLFormat bezogen. „Die Bruder Karamasow“ wurde in der deutschen Ubersetzung von Hermann Rohl vom Internetportal „Projekt Gutenberg-DE“ heruntergeladen.
Im Rahmen dieser Arbeit wird das Ziel verfolgt, die zwei Romane mithilfe des Tools SentText zu analysieren und die gewonnenen Ergebnisse mit der literaturwissenschaftlichen Forschung zu Dostojewski zu vergleichen. Die Arbeit ist wie folgt strukturiert. Zuerst wird die Sentimentanalyse in der Literaturwissenschaft diskutiert. Im Anschluss daran wird das Tool SentText samt seiner Funktionalitat vorgestellt. Im nachsten Teil wird auf die zwei Dostojewskis Romane eingegangen. Es werden die Haupthemen kurz skizziert sowie dominierende Emotionen erlautert, die in der Forschung bereits beschrieben wurden und die fur die folgende Sentimentanalyse relevant sein konnen. AnschlieBend werden die Ergebnisse der Sentimentanalyse mit SentText vorgestellt. Es werden die Fragen beantwortet, welche Gefuhlslagen in den Romanen herrschen und welche Terminologie fur ihre Beschreibung am haufigsten verwendet wird. Daruber hinaus soll uberpruft werden, ob und inwieweit dieses Verfahren zur Analyse der Polaritat geeignet ist und ob es zuverlassige sowie aussagekraftige Ergebnisse liefert. SchlieBlich soll kritisch reflektiert werden, welche Schwierigkeiten damit verbunden sind und was es bei einer Sentimentanalyse zu beachten gibt. Die Arbeit wird mit einem Fazit abgeschlossen, in dem die Ergebnisse der durchgefuhrten Analyse noch einmal zusammengefasst und mogliche Perspektiven fur weitere Forschungsprojekte aufgezeigt werden.
2. Sentimentanalyse in den Romanen „Verbrechen und Strafe“ und „Die Bruder Karamasow“
2.1. Sentimentanalyse in der Literaturwissenschaft
Unter dem Begriff „Sentimentanalyse“, die auch als Stimmungsanalyse oder Stimmungserkennung bekannt ist, wird „die automatisierte Analyse von in Texten dargestellten menschlichen Gefuhlen, Empfindungen und/oder Meinungen, die verbalisiert und dadurch nach auBen getragen werden“ (Fluh 2019) verstanden. Wie aus der Definition hervorgeht, steht im Fokus der Sentimentanalyse eine gezielte Suche nach emotionstragenden Wortern und/oder Ausdrucken, die eine gewisse Stimmungslage erzeugen. Die Methode stammt ursprunglich aus dem Bereich information Retrieval“ und gehort zu den gangigen NLP Kategorisierungstasks.
In der Literaturwissenschaft wird die Sentimentanalyse seltener eingesetzt, eignet sich jedoch fur eine Reihe von Fragestellungen: von der Analyse der Stimmungsverlaufe in der gesamten Handlung bis hin zur Ermittlung von positiv- oder negativgeladenen Emotionen, die mit einer gewissen Figur in Verbindung gebracht werden. Oft werden die sogenannten Stimmungsbogen erstellt, die die Stimmungsverlaufe des gesamten literarischen Werks und/oder seiner Teile abbilden (vgl. Reagan/Mitchell/Kiley/Danforth & Dodds 2016). Die Sentimentanalyse kann auch eine prognostische Funktion erfullen, indem anhand der Stimmungsverlaufe ein gluckliches oder ungluckliches Ende vorhergesagt wird (vgl. Zehe/Becker/Hettinger/Hotho/Reger & Jannidis 2016). Grundsatzlich lassen sich die Ansatze in zwei Gruppen unterteilen: lexikonbasierte Ansatze und Ansatze, die auf dem uberwachten maschinellen Lernen basiert sind. Bei den letzteren wird anhand einer manuellen Annotation ein Model trainiert, das auf literarische Texte mit dem Ziel angewendet wird, eine spezifische literaturwissenschaftliche Forschungsfrage zu beantworten. Besonders in den letzten Jahren zeigt sich ein erhohtes Interesse an solchen Verfahren (vgl. Zehe/Arns/Hettinger & Hotho 2020).
Bei den lexikonbasierten Verfahren wird auf spezielle Sentimentworterbucher zuruckgegriffen, in denen stimmungsgeladene Worter erfasst sind. Allerdings unterscheiden sich solche Worterbucher stark voneinander - je nach Textsorte sowie (historischem) Kontext wurden sie unterschiedliche Worter beinhalten. Ein Vorteil solcher Ansatze besteht darin, dass sie keine manuell gelabelten Daten benotigen. Allerdings hangt die Performance stark von dem Umfang und der Spezifik des verwendeten Worterbuchs ab. Lexikonbasiert sind beispielsweise einige Pakete in der Statistik-Software R wie syuzhet (Jockers 2015) zur Erstellung von Stimmungsbogen oder sentimentr zur Ermittlung von Polaritatsscore.
Ein anderes Tool fur die lexikonbasierte Analyse stellt SentText dar, worauf im nachsten Abschnitt naher eingegangen wird.
2.2. Sentimentanalyse mit SentText
Das Textanalysetool SentText wurde von Johanna Dangel und Thomas Schmidt an der Universitat Regensburg entwickelt, und ist ein frei zugangliches browserbasiertes Tool. Auf der Website von SentText ist eine kurze Beschreibung der Grundprinzipien, auf denen es basiert samt Literaturquellen gegeben. Das Tool ist bis jetzt nur auf deutschsprachige Texte im .txt oder .xml Format anwendbar. In den Einstellungen werden die Optionen zur Lemmatisierung, Erkennung von negierten Wortern, zur case-sensitiven Analyse sowie zum Ausfiltern von Stopwortern angeboten. SentText ist ausschlieBlich online nutzbar, es besteht keine Moglichkeit, Zwischenergebnisse zu speichern. Die Funktionalitat des Tools sowie einige Anwendungsbeispiele wurden ausfuhrlich von Fluh (2020a) erlautert.
Da das Tool relativ neu ist, ist es momentan nicht moglich, eine Aussage uber seine Etablierung in der Forschung zu treffen und sich auf die damit bereits durchgefuhrten Analysen zu beziehen. Allerdings wird es als zuverlassig eingestuft (vgl. Fluh 2020b).
Das Tool bietet zwei Sentimentworterbucher zur Auswahl an: SentiWS (Remus/Quasthoff & Heyer 2010) und The Berlin Affective Word List Reloaded BAWL- R (Vo/Conrad/Kuchinke/Urton/Hofmann & Jacobs 2009). AuBerdem besteht die Moglichkeit, mit einem eigenen Worterbuch zu arbeiten. Fur die Analyse wurde SentiWS gewahlt. SentiWS, oder SentimentWortschatz, ist eine online verfugbare Ressource, die fur die deutsche Sprache entwickelt wurde. Die aktuelle Version beinhaltet 1650 negative und 1818 positive Worter, einschlieBlich der Wortformen sind das dementsprechend 16406 und 16328 Worter. Das Labeln als positiv oder negativ schien mit SentiWS etwas genauer als mit BAWL-R und somit fur die gewahlten Texte besser geeignet zu sein. Auch die Ergebnisse anderer Analysen haben bestatigt, dass SentiWS zuverlassigere Ergebnisse bei der Analyse literarischer Werke liefert (vgl. Schmidt/Burghardt & Dennerlein 2018).
Da das Projekt SentText noch in Bearbeitung ist, weisen seine Autor*innen explizit darauf hin, dass der Sentiment-Wortschatz einige Lucken sowie Fehler ausweisen kann. Ob und inwieweit diese Ungenauigkeiten im Labeln im Rahmen dieser Analyse festgestellt werden konnen, wird im Laufe der Arbeit diskutiert.
2.3. „Verbrechen und Strafe“ und „Die Bruder Karamasow“ - Hauptthemen und Probleme
„Verbrechen und Strafe“ sowie „Die Bruder Karamasow“ zahlen zu den groBten Romanen von Dostojewski, die in der Forschung sowohl als polyphon als auch als polythematisch beschrieben werden. Zwar werden in den beiden Romanen unterschiedliche thematische Schwerpunkte in den Vordergrund gestellt, sie sind aber durch das Hauptthema „Verbrechen und Strafe“ miteinander verbunden. In den beiden Romanen werden Psychologie und Anthropologie des Verbrechens untersucht und aus verschiedenen Blickwinkeln betrachtet (vgl. Worn 1998; Poljakova 2018).
„Verbrechen und Strafe“ handelt von dem in Armut und Isolation lebenden Studenten Raskolnikow, der einen Doppelmord an der Wucherin Aljona und ihrer unschuldigen Schwester Lisaweta begeht und schlieBlich an den Folgen seiner Untat leidet. Im Laufe dieses Erzahlstrangs werden die Lebensgeschichten anderer Figuren - seiner Mutter, seiner Schwester Dunja, seines Freundes Rasumichin, des Trinkers Marmeladow und seiner Tochter Sonja sowie anderer - erzahlt. Im Roman wird die Frage gestellt, ob ein Verbrechen fur einen scheinbar guten Zweck uberhaupt gerechtfertigt werden kann. Der Protagonist Raskolnikow findet sein Recht als Mensch im „Recht auf Verbrechen“. Nachdem er sein Vorhaben umgesetzt und das Verbrechen tatsachlich verubt hat, beginnt sein schrecklicher Leidensweg, begleitet von seelischen Kampfen und schwerer Krankheit. In diesem Zusammenhang tritt eine weitere Frage auf, ob Konsequenzen nach einem Verbrechen von einer Person getragen und ertragen werden konnen.
Der Roman „Die Bruder Karamasow“, der kurz vor dem Tod des Autors beendet wurde, erzahlt die Geschichte der drei Bruder Dmitri, Iwan und Aljoscha und ihrem Vater Fjodor Pawlowitsch Karamasow. Im Laufe der Geschichte wird der Vater - vermutlich von einem seiner Sohne - ermordet, und die weitere Handlung dreht sich um das Aufklaren dieses ratselhaften Kriminalfalls. Der Roman stellt eine Art Synthese aller Themen dar, die in den vorherigen Romanen Dostojewskis aufgegriffen wurden. Die Forscher*innen sind sich einig, dass im Roman die Weltanschauung sowie die Lebensphilosophie Dostojewskis ihre hochste Auspragung erreicht hatten (vgl. Braun 1976; Kluge 1998; Guski 2018). Als zwei Hauptfragestellungen werden „Dialektik des Guten und Bosen innerhalb einer Familie“ sowie das Problem der „berechtigten Inhumanitat“ (Braun 1976: 113f.) genannt. Als Bindeglied zwischen den zwei Themenkomplexen gilt das Thema „Verbrechen und Strafe“, das im Roman im Vergleich zum gleichnamigen Roman von einer neuen Perspektive gezeigt und in einen neuen Kontext gesetzt wird.
Mit diesem Thema geht ein weiteres fur Dostojewskis Werke zentrales Thema - Thema der Schuld - einher. Fur Raskolnikow werden seine Schuldgefuhle zu seiner eigenen moralischen Strafe, zur inneren Last, an der der Protagonist schlieBlich zugrunde geht. In „Die Bruder Karamasow“ hat das Thema eine andere Wendung. Iwan, der selbst den Vatersmord nicht begangen hat, bekennt seine Schuld. Dabei hat sie einen doppelten Charakter - er fuhlt sich schuldig fur die Tat sowie fur die Schuld seines Bruders Dmitri, der fur den Mord schuldig gesprochen wurde. Schuld tritt im Zusammenhang mit der Idee der Gerechtigkeit auf (vgl. Poljakova 2018). Ihre Deutung reprasentiert Dostojewskis Vorstellung von der „russischen Idee“ - den russischen Rechts- und Moralvorstellungen, die auf dem orthodoxen Glauben fuBen und die Russland vom Westen abheben (Guski 2019). Wahrend die „westliche“ Idee der Gerechtigkeit mit gesellschaftlicher Strafe verbunden ist, wird die Gerechtigkeit nach der russischen Art als „alles vergebende Liebe“ aufgefasst (vgl. Poljakova 2018). Diese Idee der Nachstenliebe ist stark in den beiden Romanen vertreten.
Schuld ist nicht nur mit Gerechtigkeit, sondern auch mit Scham verbunden. In der Forschung zum Roman „Die Bruder Karamasow“ findet sich eine interessante Idee, dass Scham (shame) und Schuld (guilt) die zwei pragnantesten Emotionen im Roman seien, die die Beziehungen zwischen den Figuren bestimmen (vgl. Bergamino 2017). Bergamino stellt Scham und Schuld gegenuber. Der Unterschied zwischen den beiden Gefuhlen liegt in der Perspektive des Urteilenden: liegt sie bei einem selbst, so handelt es sich um das Schuldgefuhl. Bei der Scham wird eine Verurteilung von auBen erwartet und gefurchtet, was das Verhalten, die Gedankenweise, die Beziehungen zu anderen Menschen und nicht selten das ganze Leben der betroffenen Person bestimmt.
[...]