Lade Inhalt...

Generierung von Items für einen Eye-Tracking-Versuch zur Schreibfehlererkennung

Hausarbeit (Hauptseminar) 2011 28 Seiten

Sprachwissenschaft / Sprachforschung (fachübergreifend)

Leseprobe

Inhaltsverzeichnis

1 Forschungsschwerpunkt

2 Theoretische Grundlagen

3 Aufbau und Durchführung der Vortests
3.1 Überprüfung des Materials
3.2 1.Vortest
3.3 2.Vortest

4 Auswertungen in Bezug auf unseren Forschungsschwerpunkt
4.1 1. Vortest
4.2 2. Vortest
4.3 Konsequenzen

5 Itemkonstruktion für einen möglichen Eye-Tracking-Versuch
5.1 Fragestellung
5.2 Die Elektro-Okulographie
5.3 Methodik
5.3.1 Item 1 - Einfluss der Fehlerposition
5.3.2 Item 2 - Einfluss visueller vs. phonologischer Informationen

6 Ausblick

7 Anhang

8 Literaturverzeichnis

1 Forschungsschwerpunkt

Beim Korrekturlesen selbst geschriebener Hausarbeiten haben wir die Erfahrung gemacht, dass dem Autor - aber auch anderen Personen - bestimmte Schreibfehler auch bei mehrmaligem Lesen nicht auffallen.

Man könnte nun annehmen, dass sich bei der Produktion und Rezeption geschriebener Texte bestimmte kognitive Prozesse beim Schreiben und beim Lesen ergänzen (etwa in der Form, dass Schreiber und Leser etwas Weggelassenes unbewusst für unwichtig erachten oder automatisch Korrekturen vornehmen). Ein ähnlicher Gedanke findet sich bei BIERWISCH (1970 : 399) :

„Das bedeutet, dass die Wortvertauschung - wie auch andere Störungsprozesse - keineswegs auf die Sprecherstrategie beschränkt sind, sondern in der Hörerstrategie ein automatisch funktionierendes Korrektivprinzip besitzen.“

Die Forschungsfrage lautete also ganz allgemein: Was haben diese Fehler an sich, dass man sie so schwer identifizieren kann und ggf. nur unter konkreter Such-Anweisung findet? Wie unterscheiden sie sich von anderen Schreibfehlern?

2 Theoretische Grundlagen

Um unsere Fehler im Testentwurf zu systematisieren, orientierten wir uns an der Klassifikation von Versprechern nach MERINGER/MAYER (1895) und dem darauf aufbauenden Aufsatz von VATER (2010). VATER listet folgende Versprecherkategorien auf: Metathese, Antizipation, Perseveration, Substitution und Kontamination. Metathesen sind Vertauschungen zweier Laute wie in Meringers Beispiel eine Sorte von Tacher. Bei Antizipationen kommt es zu einer verfrühten Realisation eines eigentlich später geplanten Lautes, so z.B. in der fehlerhaften Äußerung Musterbrust. Der Versprecher Tränengras weist dagegen eine Perseveration auf. Dies ist der gegenläufige Prozess zur Antizipation: ein weiter vorn im Wort vorkommender Laut wird an späterer Stelle erneut realisiert. Eine Substitution bezeichnet das fehlerhafte Einfügen eines Lautes, der gar nicht im Zielwort vorhanden ist, der Fehler lässt sich also nicht mit dem unmittelbaren lautlichen Kontext des Wortes erklären: Blicklicht statt Blitzlicht. Wenn zwei Wörter zu einem neuen Wort verschmelzen, nennt man dies Kontamination: Das Haus verkommelt (aus verkommt + vergammelt) 1.

VATER (2010: 307) betrachtet weiterführend Additionen und Elisionen als Sonderformen der Substitution: bei einer normalen Substitution wird ein Laut des Wortes durch einen Laut ersetzt, der nicht im Wort oder im weiteren Kontext vorkommt. Bei einer Addition wird eine phonetische Leerstelle im Wort durch einen zusätzlichen Laut ersetzt, bei einer Elision wird ein existierender Laut durch eine solche Leerstelle ohne phonetische Information ersetzt. Zur Auswertung des Experimentes konzentrierten wir uns auf Rezeptionsprozesse. Wir zogen hauptsächlich Literatur zur Worterkennung heran, da sich die von uns in den Text eingebauten Fehler größtenteils auf die Wortebene beziehen. Um Aussagen über Text- bzw. Satzverstehen treffen zu können, hätten in den Fehlertext vermehrt Fehler auf syntaktischer Ebene integriert werden müssen.

Leider ist die Forschung im Bereich der Schreibfehlererkennung nicht sehr weit vorangeschritten. Viele Artikel streiften unser Thema lediglich. Grundlegend muss man zwischen zwei verschiedenen Ansätzen unterscheiden: solchen, die die Worterkennung von der phonologischen Seite betrachten und solchen, die von visuellen bzw. grafischen Prozessen bei der Worterkennung ausgehen.

VAN ORDEN (1987:181-194) geht davon aus, dass Phonologie bei der Worterkennung eine große Rolle spielt. Er widerlegt in seinen Experimenten die Annahme, dass auch geübte Leser keinen oder nur wenig Gebrauch von phonologischen Informationen machen. Er führt verschiedene Experimente durch, in denen Studenten die nach semantischen Feldern geordneten Items als Wort oder Nicht-Wort kategorisieren sollen. Es erweist sich, dass homophon klingende Nicht-Wörter häufig für Wörter erklärt werden oder dass zumindest die Reaktionszeiten für die Erklärung zum Nicht-Wort erheblich länger sind. VAN ORDEN kommt zu dem Schluss, dass die Phonologie bereits frühzeitig im Prozess der Worterkennung von Bedeutung sein muss, eine visuelle, graphologische Analyse folgt in seinem Modell als fakultativer Verifikationsprozess auf die phonologische Analyse.

Zu gegenteiligen Resultaten kommt die Forschungsgruppe um HENDERSON/CHARD (1980:85). Diese gehen davon aus, dass die Wahrnehmung eines Wortes holistisch geschieht. Hierbei wird nicht auf die Identität einzelner Buchstaben geachtet. Der word superiority effect, also das Phänomen, dass Buchstaben innerhalb eines Wortes besser erkannt werden, als wenn sie allein oder in Pseudowörtern auftreten, beruht ihrer Meinung nach nicht auf einer phonologischen Umwandlung von Wörtern.

COHEN (1980:135) betreibt ebenso Untersuchungen zum phonologischen Code beim Lesen. Seine Ergebnisse weisen darauf hin, dass phonologisches Encodieren bei Nicht-Wörtern notwendig ist, der Zugriff auf Lexikoneinträge allerdings vornehmlich über die visuelle Ebene erreicht wird.

Weiterhin könnten die Ausführungen von RAWLINSON (1976:1f.) für unsere Untersuchung interessant sein. Dieser führt Tests durch, in denen die innere Buchstabenstruktur von Wörtern geändert wird. Allerdings bleiben der erste und letzte Buchstabe immer an korrekter Stelle stehen. Er kommt zu dem Ergebnis, dass die Identifikation der inneren Buchstaben relativ unabhängig von deren Position im Wort geschieht. Viel signifikanter scheint die korrekte Positionierung der Anfangs- und Endbuchstaben: eine fehlerhafte Positionierung der mittleren Buchstaben kann im Worterkennungsprozess durch Informationen zur Wortlänge und durch Erkennen der Struktur längerer phonemischer oder silbischer Einheiten kompensiert werden. Daran anschließend können auch die Studien von MCCUSKER ET AL. (1981:538) erwähnt werden. Er widerlegt in sechs Experimenten anhand von Wörtern mit vier Buchstaben die parallele, gleichzeitige Verarbeitung aller wahrgenommenen Buchstaben und weist eine schnellere Verarbeitung abhängig vom Priming einiger Buchstaben nach: Wenn die äußeren beiden Buchstaben 50 msec früher als das gesamte Wort präsentiert werden, wird das Wort schneller erkannt, als wenn die inneren beiden Buchstaben 50 msec früher präsentiert werden. Auch die Befunde von RAYNER/POLLATSEK (1989:62) bestätigen diese Befunde, dass Buchstaben in kurzen Wörtern 2 parallel (zur selben Zeit) verarbeitet werden.

Aus dem Forschungsbereich der mündlichen Rezeptionstheorie liegen Erkenntnisse über den sog. point of uniqueness vor. Dieser ist Teil der Theorie des Kohortenmodells und definiert den ersten Punkt, der ein Wort von anderen Wörtern unterscheidet. MARSLEN-WILSON/TYLER (1980:1-72) kommen zu der Annahme, dass Wörter anhand ihres point of uniqueness zuverlässig zu identifizieren sind. Die minimal benötigte Informationsfülle, die zur Worterkennung führt, ist also mit dem Diskriminationspunkt erreicht. Dieser ist rein linguistisch definiert. Das Kohorten-Modell von MARSLEN-WILSON/TYLER (1980:1-72) beschäftigt sich mit dem Suchprozess bei der Worterkennung. Hierbei beginnt die Suche mit dem ersten erkannten Laut, dem Initialphonem. Alle Wörter der Sprache, die mit dem entsprechenden Laut beginnen, werden als potentielle Zielwörter in Betracht gezogen. Je mehr Laute erkannt werden, desto weniger in Frage kommende Zielwörter gibt es. Der Diskriminationspunkt sowie die Eigenschaften des Suchprozesses könnten beim Erkennen von Schreibfehlern eine Rolle spielen.

Ein wichtiger Einflussfaktor auf den Suchprozess bei der Worterkennung ist der Frequenzeffekt. Die Wortentscheidung findet bei hochfrequenten Lexemen schneller statt als bei niederfrequenten.

Rayner/Pollatsek (1989:100 ) stufen hierbei sogar Wörter aus 3-6 Buchstaben als kurze Wörter ein. Laut dem Oxford Handbook of Eye Movement (2011, 732) gelten Wörter mit 4-5 Buchstaben als kurze Wörter.

3 Aufbau und Durchführung der Vortests

3.1 Erster Materialtest

Wir suchten authentische Fehler in noch unkorrigierten Hotelbeschreibungen der Firma GIATA, die von deutschen Muttersprachlern am Computer erstellt wurden. Daraus entwarfen wir einen ersten Text mit drei verschiedenen Fehlermengen: „wenig“ mit 4 Fehlern, „mittel“ mit 11 Fehlern und „viel“ mit insgesamt 17 Fehlern3. Zunächst gaben wir den Versuchspersonen (VPp) die Instruktion, den Text innerhalb von 5 min. aufmerksam zu lesen, da man ihnen anschließend Fragen stellen würde. Es ging uns hierbei zunächst darum, eine passende Fehlermenge für den Text zu finden, was sicherstellen soll, dass die VP nicht erkennt, dass es sich um einen absichtlich fehlerhaften Text handelt. Wir wollten so eine möglichst natürliche Lesesituation schaffen.

Insgesamt wurden fünf VPp aus privatem Kreise herangezogen, von denen jeder einen anderen Text mit unterschiedlicher Fehlermenge bekam. Anschließend an den Fehlertext wurde ihnen der korrekte, fehlerlose Text präsentiert, in dem sie Fehler anstreichen sollten, die ihnen zuvor aufgefallen waren. Dies sollte uns als Kontrollinstrument dienen, um den Prozess des Fehlerlesens zu überprüfen. Als letzten Schritt bekamen sie ihren Fehlertext nochmals ausgehändigt, mit der Anweisung, nun konkret nach Fehlern zu suchen. Für den Durchgang waren jeweils 5 min angesetzt.

Bei dieser ersten Testung des Materials wurde deutlich, dass einigen VP auch bei dem Text mit wenigen Fehlern aufgefallen war, dass ungewöhnlich viele Fehler vorhanden sind, was als irritierend empfunden wurde. Des Weiteren ist durch die Vorgehensweise, die Positionen der Fehler im fehlerfreien Text markieren zu lassen, eine Übertragung der Ergebnisse auf Rezeptionsprozesse beim normalen Lesen ohne direkte Fehlersuche schwierig. Einige VPp konnten sich gar nicht an Fehler erinnern und nahmen dementsprechend auch keine Markierungen vor. Andere erinnerten sich an den Fehler, bei dem ihnen aufgefallen war, dass es sich um einen fehlerhaften Text handelte, und wiederum Andere markierten fälschlicherweise Wörter, von denen sie annahmen, sie könnten fehlerhaft gewesen sein. Auf dieser Grundlage entschieden wir uns im weiterführenden Verlauf, Material mit vielen Fehlern zu verwenden, zusammen mit der Arbeitsanweisung, konkret nach Fehlern zu suchen. Wie wir später zeigen werden, ergaben die folgenden Vortests, dass selbst bei direkter Fokussierung auf Fehlersuche bestimmte Fehlerklassen nur schwer gefunden wurden.

3.2. 1.Vortest

Den ersten Vortest führten wir in einem Kurs des Studiengangs 'Maschinenbau' (2.-5. Semester) der Technischen Universität Berlin mit insgesamt 38 Versuchsteilnehmern durch 4, die also kaum linguistik-bezogenes Vorwissen aufwiesen. Der Test wurde gleich zu Beginn des Seminars durchgeführt. Die VPp erhielten 4:30 min Zeit und die Anweisung, den neu designten Text5 gründlich zu lesen, auf Rechtschreibfehler zu untersuchen und diese zu markieren. Wenn sie eher fertig würden, so sollten sie das Blatt umdrehen, damit wirklich nur in einem einmaligen Durchgang nach Fehlern gesucht werden konnte. Zusätzlich sollten die VPp markieren, bis zu welcher Stelle im Text sie in der vorgegeben Zeit gekommen waren und anschließend Alter und Geschlecht vermerken, und ob sie Muttersprachler sind. Wenn dem nicht so war, sollten sie vermerken, seit wann sie Deutsch sprechen.

3.3. 2.Vortest

Den 2. Vortest führten wir innerhalb unseres Psycholinguistik-Seminars durch, in dessen Rahmen das Experiment erstellt wurde. Der Text wurde hierfür nochmals verbessert, indem Fremdwörter, die die Probanden zuvor trotz richtiger Schreibweise irritiert hatten (z.B. Family Spa), ausgetauscht wurden6. Insgesamt nahmen hier nochmals 16 VPp teil. Die Instruktionen blieben unverändert.

4 Auswertungen in Bezug auf unseren Forschungsschwerpunkt

Im Anhang sind die Ergebnisse der beiden Vortests in Form von Tabellen zu finden7. Mit erfasst wurden Alter und Geschlecht, ob es sich um Muttersprachler handelt und, wenn nicht, seit wie vielen Jahren die VP Deutsch lernt, und ob zusätzliche Markierungen vorgenommen wurden. Eine Liste fälschlicher Markierungen und weiterer Anmerkungen der VPp, anhand derer wir uns Verbesserungsmöglichkeiten für den 2. Vortest überlegt haben, ist ebenfalls einzusehen.

Die Tabellen sind folgender Maßen zu lesen: Linker Hand stehen alle Fehler, die wir in den Text eingebaut haben. Wir haben für jede VP aufgelistet, ob sie einen bestimmten Fehler gefunden hat (=1) oder nicht (=0), und schließlich für jeden einzelnen Fehler berechnet, wie oft er insgesamt gefunden wurde.

Zusätzlich haben wir eine gesonderte Quote berechnet, um ersichtlich zu machen, welchen Unter den VP befindet sich nur eine Frau; dies ist entsprechend gekennzeichnet in der Tabelle 1 Schnitt Muttersprachler und Nicht-Muttersprachler erreicht haben. Die Quoten der Muttersprachler haben wir nur für den Textbereich berechnet, den alle VPp bearbeitet haben. Es ist zu erwähnen, dass nicht alle VPp den Fehlertext fertig gelesen und markiert haben. Die Stelle, bis zu der alle gekommen sind, ist durch einen durchgehenden Strich auf der rechten Seite gekennzeichnet.

Die jeweilige Gesamtquote des einzelnen Fehlers berechnet sich aus der Anzahl der Fehlersumme durch die Anzahl der VPp, die bis zu dem jeweiligen Fehler gekommen sind. Dies soll kurz am Beispiel Meererfrüchte demonstriert werden: Im 1.Vortest wurde der Fehler Meererfrüchte insgesamt 20 mal gefunden (siehe 1.Tabelle), jedoch haben nur 37 von insgesamt 38 VPp den Text bis zu dieser Stelle gelesen und markiert: ? 20/ 37 VPp = 0,54 Quote.

Die vereinzelten durchgestrichenen Fehler sollen kennzeichnen, dass diese Fehlerklassen - grammatische Fehler und Freudsche Versprecher - für weiterführende Experimente ausgesondert wurden, da wir uns auf die Worterkennung spezialisieren möchten.

4.1. Vortest

Für unsere Auswertung haben wir dennoch alle Fehler (neben den ausgesonderten) beachtet, da der Großteil (23 von 38 VPp im 1. Vortest) den Fehlertext bis zum Ende gelesen und bearbeitet hat bzw. sehr weit im Text gekommen ist. Als oft gefundene Fehler haben wir Fehler klassifiziert, die mehr als 20 mal gefunden wurden, als selten gefundenen Fehler haben wir Fehler eingestuft, die weniger als 10 mal markiert wurden.

Die am häufigsten gefundenen Fehler und ihre Klassifikationen nach VATER (2010): (Anzahl/Quote8 )

1. ferfügen als Antizipation: (32/ 0,84)
2. aucgh als Addition: (31/ 0,82)
3. lügt als Substitution: (26/ 0,76)
4. Zimemr als Metathese: (25/ 0,66)
5. eignem und komfortable als Elision bzw. Metathese: (22/ 0,58)
6. Meererfrüchte als Perseveration: (20/ 0,54)

Zusammenfassend lässt sich sagen, dass Elisionen, Additionen, Metathesen und selbst Antizipationen am Wortanfang oder -ende leicht erkannt werden, wie an den Bsp. ferfügen (32-mal und damit am häufigsten gefunden) und komfortable zu sehen ist. Bei kurzen Wörtern werden auch Buchstabenfehler in der Wortmitte gut erkannt, wie zum Bsp. bei lügt und aucgh9. Die hohe Findequote der Wörter Zimemr und Meererfrüchte lässt sich dadurch erklären, dass Zimemr morphologisch nicht möglich ist und nach Aktivierung des Lexems durch die Grapheme Z-i-m- zudem ein zweites -m- erwartet wird. Nicht zuletzt ist hier auch der visuelle Unterschied zwischen den Graphemen -m- und -e- hoch. Bei dem zweiten Beispiel, Meererfrüchte, wird nach Aktivierung des Lexems ein -s- in der Mitte des Wortes erwartet. Bei einigen aufgelisteten Wörtern, wie z. B. ferfügen, lügt, aucgh und eignem sind die Buchstabenfehler eher am Wortanfang zu finden, wodurch sie schneller und somit öfter gefunden werden, was auch durch das Konzept des point of uniqueness nach MARSLEN- WILSON/TYLER (1980) gestützt wird.

Diese fehlerhaften Wörter fallen aber nicht nur visuell auf, sondern auch phonologisch. Leser sprechen 'in Gedanken' die gespeicherte phonologische Information des erkannten Wortes nach, dies nennt u.a. HUNZIKER (2006:107) 'Phonological Loop'10. Bei der kognitiven Artikulation der geschriebenen Wörter während des Leseprozesses fallen einige unserer fehlerhaften Wörter als unaussprechbar auf, sie sind phonetisch also nicht realisierbar. Dies gilt hierbei für alle oben aufgelisteten Wörter, außer ferfügen und lügt.

Es lässt sich hierbei vermuten, dass Auslassungen automatisch und eher unbewusst kompensiert werden; Hinzufügungen müssen hingegen korrigiert werden. Dies würde erklären, warum aucgh häufiger gefunden wurde als eignem.

Die am seltensten gefundenen Fehler waren:

1. Gehmimuten als Perseveration: (2/ 0,07)
2. fantstischen als Elision: (8/ 0,28)
3. südlch und benötig als Elision: (9/ 0,24)
4. Statdt als Antizipation bzw. Addition: (10/ 0,31)

Unser Champion unter den Wörtern, die nur sehr selten beim Fehlerlesen gefunden werden, ist das Wort Gehmimuten, das nur 2 von insgesamt 38 VPp markierten. Bei diesem und dem Wort fantstischen handelt es sich um Wörter, die Buchstabenfehler in der Wortmitte aufweisen, jedoch länger als 4-5 Buchstaben sind, wodurch der Fehler nicht oder nur noch kaum auffällt11.

[...]


1 V ATER (2010:307), auch die Beispiele entstammen der Auflistung in V ATER (2010: 307)

2 Rayner/Pollatsek (1989:100 ) stufen hierbei sogar Wörter aus 3-6 Buchstaben als kurze Wörter ein. Laut dem Oxford Handbook of Eye Movement (2011, 732) gelten Wörter mit 4-5 Buchstaben als kurze Wörter.

3 s. Anhang S. 18-20, Material 1-3

4 Unter den VP befindet sich nur eine Frau; dies ist entsprechend gekennzeichnet in der Tabelle 1

5 s. Anhang S. 21, Material 4

6 s. Anhang S. 22, Material 5

7 s. Anhang S. 23-24

8 s. Tabelle S.23

9 Entsprechend der Theorie von MCCUSKER ET AL. (1981: 538-551)

10 Hunziker (2006:107)

11 Vgl. RAYNER/POLLATSEK (1989:62)

Details

Seiten
28
Jahr
2011
ISBN (eBook)
9783656987857
ISBN (Buch)
9783656987864
Dateigröße
651 KB
Sprache
Deutsch
Katalognummer
v337298
Institution / Hochschule
Technische Universität Berlin – Fakultät 1 – Geisteswissenschaften
Note
1,3
Schlagworte
Psycholinguistik Eye-Tracking Schreibfehler Generierung von Studien-Items

Autor

Teilen

Zurück

Titel: Generierung von Items für einen Eye-Tracking-Versuch zur Schreibfehlererkennung