In der vorliegenden Hausarbeit wird die Assimilation des un-Präfixes bei Adjektiven untersucht. Die Assimilation ist von daher interessant, da sie als mündliches Phänomen eigentlich nicht in unser schriftliches Sprachbild passt oder passen sollte. Dennoch kommt sie vor, wie in den folgenden Kapiteln gezeigt werden soll. Hierfür werden zwei Korpora näher betrachtet, deren Textsorten in unterschiedlicher Nähe zum Schriftlichen stehen. Dazu werden ausschließlich Daten aus COSMAS II verwendet. Dabei wird der Frage nachgegangen, inwieweit sich dieses spezielle Phänomen der Präfix-Assimilation in den verschiedenen Korpora (Wikipedia-Diskussionskorpus/Zeitungskorpus) beobachten lässt und ob sich dabei eventuell signifikante Unterschiede feststellen lassen.
Inhaltsverzeichnis
Inhaltsverzeichnis
Abkürzungsverzeichnis
1. Einleitung
2. Was versteht man unter Assimilation? 2
2.1 Definition
2.2 Kontextbedingungen für die Assimilation des un -Präfixes
3. Assimilation - ein ausschließlich mündliches Phänomen?
3.1 Begründung der These
3.2 Korpusauswahl
4. Korpusuntersuchung
4.1 Die Suche nach Adjektiven mit assimiliertem un -Präfix
4.1.2 Auswertung der Ergebnisse des Zeitungskorpus
4.1.3 Auswertung der Ergebnisse des Wikipedia-Diskussionskorpus
5. Vergleich beider Korpora
6. Fazit
Literaturverzeichnis
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1. Einleitung
In der vorliegenden Hausarbeit wird die Assimilation des un -Präfixes bei Adjektiven untersucht. Die Assimilation ist von daher interessant, da sie als mündliches Phänomen eigentlich nicht in unser schriftliches Sprachbild passt oder passen sollte. Dennoch kommt sie vor, wie in den folgenden Kapiteln gezeigt werden soll. Hierfür werde ich zwei Korpora untersuchen, deren Textsorten in unterschiedlicher Nähe zum Schriftlichen stehen. Dazu verwende ich ausschließlich Daten aus COSMAS II , die teilweise schon als Korpus vorhanden sind (Wikipedia-Diskussionskorpus) und welche, die ich mir als Korpus selbst zusammenstelle (Zeitungskorpus).
Im Folgenden werde ich der Frage nachgehen, inwieweit sich dieses spezielle Phänomen der Präfix-Assimilation in den verschiedenen Korpora beobachten lässt und ob sich dabei eventuell signifikante Unterschiede feststellen lassen. Im Hinblick darauf ist der direkte Vergleich der Ergebnisse beider Korpora besonders interessant, wofür die Untersuchung des Phänomens in den einzelnen Korpora die Grundlage bildet. Durch den Vergleich der Korpora will ich zudem herausfinden, ob die Häufigkeit des falsch gesetzten um -Präfixes abnimmt, je näher sich die Textsorte am schriftlichen Standartdeutsch orientiert. Dabei stellt sich letztendlich auch die Frage, ob die Häufigkeit der Assimilation tatsächlich von der Schriftlichkeit bzw. Mündlichkeit einer Textsorte abhängig gemacht werden kann, oder ob es eventuell auch andere Kriterien gibt, die die schriftliche Assimilation des un -Präfixes beeinflussen.
2. Was versteht man unter Assimilation?
2.1 Definition
Laut Hall (2000: 89/90) versteht man unter Assimilation einen lautlichen Angleichungsprozess von benachbarten Segmenten mit ähnlichen artikulatorischen Eigenschaften. Dabei muss sich mindestens eine Eigenschaft eines Lautes an die eines direkt benachbarten Lautes, also an seine unmittelbare Lautumgebung, anpassen. Die kann entweder partiell erfolgen, indem die Laute einander ähnlicher werden (a) oder es erfolgt eine totale Assimilation, bei der alle Merkmale angeglichen werden, so dass beide Laute ineinander aufgehen (b).
(a) <unbekannt>:. ?onbokant. -> <umbekannt>: . ?ombokant.
(b) <bitter>: /biteR/ <bitta>: /bitE/
Die Assimilation hat die Funktion, die Aussprache von benachbarten Segmenten zu erleichtern, was vor allem bei hoher Sprechgeschwindigkeit der Fall ist (Hall 2000: 89). Hall nennt 4 Parameter, durch die sich Assimilationen prinzipiell unterscheiden können:
i. phonetischen Eigenschaften, die angeglichen werden
ii. die Richtung der Assimilation: entweder wirkt sich er nachfolgende Laut auf den vorangehenden aus ( regressive Assimilation ) oder der vorangehende Laut wirkt sich auf den nachfolgenden aus ( progressive Assimilation )
iii. die Laute, die Assimilation unterliegen
iv. die Laute, die Assimilation auslösen
(Hall 2000: 90; Hervorhebung im Original)
2.2 Kontextbedingungen für die Assimilation des un -Präfixes
Die Kontextbedingungen für die Assimilation vom un -Präfix zum um -Präfix lassen sich anhand der IPA-Tabelle für Konsonanten veranschaulichen (siehe Abbildung 1 im Anhang). Das Phonem /n/ unterscheidet sich von dem Phonem /m/ nur in der Eigenschaft, dass es an einem unterschiedlichen Artikulationsort gebildet wird. Beide Laute sind stimmhafte Nasale, wobei das /n/ alveolar, das /m/ bilabial artikuliert wird. Daraus ergibt sich, dass im Fall der Assimilation vom un- zum um- Präfix lediglich der Artikulationsort angeglichen wird. Wenn man sich nun die Umgebung des Phonems /m/ ansieht, gibt es nur zwei weitere Laute, die ebenfalls bilabial gebildet werden, nämlich die Plosive /p/ und /b/. Diese zwei Laute müssen also ausschlaggebend für die zu untersuchende Assimilation sein und regressiv auf das /n/ einwirken, so dass sich der Artikulationsort an den des /p/ und /b/ annähert. So wird aus dem Wörtchen un -bekannt auf lautlicher Ebene häufig auch um -bekannt. Nach Halls Parameter würde diese Assimilation wie folgt beschrieben:
i. die Artikulationsstelle wird angeglichen (= Ortsassimilation)
ii. die Ausrichtung ist regressiv, da sich der Folgelaut auf den vorausgehenden auswirkt
iii. der Laut der der Assimilation unterliegt: /n/
iv. die Laute, die die Assimilation auslösen: bilabiale Plosive /p/ und /b/
Im Gegenzug müsste das bedeuten, dass un - niemals zu um - wird, wenn der Folgelaut, ebenso wie das /n/, alveolar gebildet wird, wie beispielsweise das /d/ in un -deutlich.1
Ebenfalls interessant könnte es werden, wenn man den Fall der Präfix-Assimilation mit dem labiodentalen Folgelaut /f/ bzw. /v/ untersucht. Hier könnte das un ebenfalls zum um -Präfix werden, weil der Artikulationsort des labiodentalen Frikativs zentral zwischen denen von /m/ und /n/ liegt, so dass eventuell Wörter wie um -vergesslich oder um -fähig entstehen könnten. In diesen Korpora war das Phänomen, zumindest in Bezug auf Adjektive, leider nicht zu finden. Dennoch halte ich es für wahrscheinlich, dass man es in einem größeren Korpus oder unter der Einbeziehung weiterer Wortarten feststellen kann.
3. Assimilation - ein ausschließlich mündliches Phänomen?
3.1 Begründung der These
„Assimilationen sind die in den Sprachen der Welt am häufigsten vorkommenden phonologischen Prozesse“ (Hall 2000: 90). Warum also sollte sich dieses Phänomen nicht auch schon schriftlich manifestiert haben? Man spricht nicht wie man schreibt und schreibt nicht wie man spricht, zumindest ist dies ein gerne gepriesener Grundsatz. Aber wie es scheint, sind die Grenzen bei der Assimilation so fließend, dass sie für den Laien nur schwer zu erkennen sind.
Die Vermutung, dass die Assimilation nicht mehr nur ein ausschließlich mündliches Phänomen ist, lässt sich durch eine einfache Google Suchanfrage stützen.2 Wenn man z.B. nach Wörtern wie umbedingt (4.560.000 Ergebnisse), umbekannt (8.850 Ergebnisse) oder umproblematisch (8.570 Ergebnisse) sucht, findet man eine Vielzahl an Ergebnissen. Dadurch wird ersichtlich, dass zumindest eine Unsicherheit in Bezug auf die richtige Schreibweise oder auch Nutzung bestehen muss. Unter den ersten Ergebnissen kann man auch solche finden, die sich explizit in Foren mit der Frage beschäftigen, ob un -bedingt oder um -bedingt die richtige Form ist.3
Natürlich bietet diese Google Suchanfrage nur einen groben Überblick über die Existenz dieser speziellen Präfix-Assimilation, ohne dabei etwas über die tatsächliche Häufigkeit auszusagen. Sie soll an dieser Stelle auch nur einen ersten Eindruck vermitteln und zeigen, dass das Phänomen sich vom mündlichen auch in den schriftlichen Bereich ausgeweitet zu haben scheint.
3.2 Korpusauswahl
Für die Auswahl der Korpora halte ich es für sinnvoll Texte mit unterschiedlicher Nähe zur geschriebenen Sprache zu untersuchen. So kann gezeigt werden, inwieweit dieses eigentlich mündliche Phänomen in den schriftlichen Bereich vorgedrungen ist. Dazu werde ich zum einen das Zeitungskorpus (ZK) benutzen, welches ich mir in COSMAS II aus den Daten verschiedener Zeitungen4 zusammengestellt habe und das 236.421.161 Tokens enthält. Dieses Korpus soll stellvertretend für die geschriebene Sprache stehen, da Zeitungsartikel sowohl medial als auch konzeptuell schriftlich entstehen.5
Zum anderen werde ich das in COSMAS II vorhandenen Wikipedia Diskussionskorpus (WDK) verwenden, das 246.009.270 Tokens6 enthält und bei meiner Untersuchung die Ebene zwischen geschriebener und gesprochener Sprache repräsentieren soll. Denn auch wenn Foren-Diskussionen medial schriftlich entstehen, sind sie konzeptionell, unter anderem aufgrund ihrer Spontanität und Dialogizität, der gesprochenen Sprache näher.7
Bei der Auswahl und Zusammenstellung der Korpora habe ich vor allem darauf geachtet, dass die Gesamtmenge an Tokens in beiden Korpora ungefähr gleich hoch ist, um die gewonnenen Ergebnisse direkt miteinander vergleichen zu können.8
Beide Korpora vertreten also Ebenen mit unterschiedlicher Nähe zum Schriftlichen. Davon ausgehend sollte sich überprüfen lassen, ob das orthographisch falsche um Präfix im Diskussionskorpus häufiger beobachtet werden kann als im Zeitungskorpus und damit auch, ob die Häufigkeit abnimmt, je näher sich die Textsorte am Schriftlichen orientiert.
4. Korpusuntersuchung
4.1 Die Suche nach Adjektiven mit assimiliertem un -Präfix
Da es sich bei der Assimilation des un -Präfixes von Adjektiven um ein Phänomen handelt, dass sich in einem nicht-getaggten Korpus nur schwer auf Anhieb finden lässt, musste eine breite Suchanfrage formuliert werden. Durch die vorherige Klärung der Kontextbedingungen für die Assimilation (Kap.1.2) konnte die Suchanfrage dementsprechend auf umb * bzw. ump * eingegrenzt werden. Die Ergebnisse der Suchanfragen zeigten einen Überblick über die im Korpus vorkommenden Wortformen, die mit dieser Buchstabenfolge beginnen.
Von dieser Grundlage ausgehend mussten alle möglichen Adjektive, die mit einem um -Präfix beginnen, aber rein theoretisch auch mit einen un -Präfix gebildet werden könnten, extrahiert und genauer betrachtet werden. Hier bestand die Schwierigkeit vor allem bei der Aussortierung von Wörtern, die aufgrund eines semantischen Unterschieds regulär beide Schreibungen zulassen (z.B. unbemalt/umbemalt oder unbestimmt/umbestimmt ). Oft lässt sich erst durch die Betrachtung eines größeren Kontexts feststellen, ob diese Treffer für die Untersuchung relevant sind oder nicht. Die gefundenen Ergebnisse habe ich in einer „Probe“9 nochmal gezielt in den Korpora gesucht, um sicher zu gehen, dass die Tokens richtig gezählt und notiert wurden.
Die Untersuchung zur regulären un -Schreibweise für den Vergleichswert gestaltete sich etwas schwieriger. Während sich die Adjektive mit um -Präfix in beiden Korpora aufgrund der überschaubaren Treffermenge noch einzeln betrachten ließen, musste dies bei einer Trefferzahl von über 100.000 Gesamttokens im WDK anders gelöst werden. Hier habe ich die Treffer nicht einzeln durchsehen können, sondern musste mit Stichproben10 arbeiten. Die Exportlisten habe ich also nach meinen Möglichkeiten überprüft und bereinigt, aber man sollte im Hinterkopf behalten, dass die Ergebnisse der un -präfigierten Adjektive aufgrund der großen Treffermengen in beiden Korpora nicht mit hundertprozentiger Sicherheit bestimmt werden konnten, sondern lediglich extrapolierte Werte darstellen.
Ebenso muss erwähnt werden, dass einige Treffer häufiger in identischem Kontext auftauchen, was sowohl die un -Types als auch die um -Types betrifft. Auch hier war ein Herausstreichen doppelter Einträge vor allem in Bezug auf die Datenmenge der un -Schreibweise zu umfangreich, weswegen ich mich dazu entschlossen habe doppelte Treffer nicht auszusortieren.
Die gefunden Treffer habe ich in Lemma-Types11 zusammengefasst und die absolute Häufigkeit der zugehörigen Tokens, sowie deren relative Häufigkeit im Einzelnen und im Gesamten berechnet (Belegsammlung I und II). Zudem habe ich die prozentuale Verteilung von um - und un -Präfixen der einzelnen Lemmata gegenübergestellt (Belegsammlung IV, Sp. Präfixverteilung). Auch die Gesamttreffer an um -Tokens bzw. un -Tokens wurde prozentual auf die Types im Korpus umgerechnet (Belegsammlung IV, Sp. Tokenverteilung).
4.1.2 Auswertung der Ergebnisse des Zeitungskorpus
Das Zeitungskorpus beinhaltet 236.421.161 Tokens. Nach gründlicher Untersuchung konnten 6 Lemma-Types zur um -Schreibweise gefunden werden, die eine Gesamttreffermenge und somit absolute Häufigkeit von 17 Tokens12 beinhalten (25). Die relative Häufigkeit des um -Types liegt in diesem Korpus somit bei 0,0719 pMW und ist damit eher selten vertreten. Bei der Anwendung eines 95%- Konfidenzintervalls13 liegt die wahre relative Häufigkeit zu 95 Prozent zwischen 0.04327 pMW und 0.1178 pMW. Das Vorkommen des um -Phänomens liegt bei einer Millionen Textwörtern also noch weit unter 1 und ist somit als sehr gering anzusehen.
Ausgehend von den gefundenen um -Types wurden ebenfalls die Types mit standardsprachlichem un -Präfix untersucht, deren absolute Häufigkeit hier bei 20.842 Tokens liegt (50). Die relative Häufigkeit beträgt 88,16 pMW, wobei die wahre relative Frequenz zu 95% zwischen 86.97 und 89.36 pMW liegt.
Man kann in diesem Korpus somit auch beobachten, dass die Realisierung der Schreibung zu 99,92 Prozent mit einem un -Präfix stattfinden, wobei nur 0,08 Prozent ein assimiliertes um -Präfix besitzen (75,100). Das Verhältnis der Schreibungen zeigt, dass bei einem Vorkommen von 1226 un -Schreibungen einmal die um -präfigierte Variante realisiert wird (75).14
[...]
1 weitere alveolare Laute sind /t,s,z,r/
2 Suchanfrage der Wörter in Anführungszeichen (www.google.de); Stand 02.10.2014.
3 Hierzu zwei Auszüge der gefundenen Überschriften: Umbedingt oder Unbedingt? (http://www.gutefrage.net/frage/umbedingt-oder-unbedingt); “umbedingt”und “unbedingt“- Wo ist der Unterschied? (http://www.woistderunterschied.de/sprachen/unterschied- zwischen-unbedingt-und-umbedingt/); Stand 02.10.2014.
4 Mannheimer Morgen; Nürnberger Nachrichten, die tageszeitung: Jahrgänge 2007-2011.
5 Vergleiche hierzu auch Parameter für Nähe-Distanz-Modell : Koch & Oesterreicher (2007:351).
6 Jahrgänge 2002-2011.
7 Vgl. Koch & Oesterreicher (2007:351).
8 Die Differenz beider Korpora beträgt ungefähr 4 Prozent.
9 Das Suchanfragenmuster für die Probe ist mit Grundformoperator „&“ (z.B. &umbedingt) oder aber auch mit Platzhalteroperator „* “ möglich (z.B. unbedingt*). Praktischer finde ich die Suche mit dem Grundformoperator, da dieser, je nach Lemmatisierung, nur das Lemma mit entsprechenden Flexionsformen anzeigt. Bei der Suche mit Platzhalter werden auch andere Wortbildungsmuster (z.B. Umbegingt- heit, Umbedingt- heit-s - kämpfer ) angezeigt, die dann zusätzlich aussortiert werden müssen. Die Ergebnislisten müssen aber unabhängig von dem Suchanfragenmuster immer gründlich geprüft werden.
10 Dazu habe ich 300 Treffer aus der Gesamtmenge gezogen, aussortiert und anschließend hochgerechnet. Siehe hierzu: Perkuhn/Keibel/Kupietz (2012: 91,92).
11 Dieser Lemma-Type reduziert syntaktische Wörter, die sich nur über ihre Flexions-endungen und eventuell Groß-/Kleinschreibungen unterscheiden, auf eine Grundeinheit (Perkuhn/Keibel/Kupietz 2012: 27). Unterschiedlich realisierte Präfixe führen demnach zu unterschiedlichen Lemma-Types, so dass ein Lemma durch das entsprechende un - oder um -Präfix in zwei Lemma-Types aufgespalten wird. Im Folgenden meine ich mit Type immer den Lemma-Type und unterscheide dabei zwischen un - und um -Type.
12 Mehrmals findet sich zu einem um -Type lediglich nur ein Token (Hapax legomena), was eventuell den Anschein von Zufälligkeit erweckt (gilt auch für den WDK). Dennoch muss man auch solche Ergebnisse werten, denn auch wenn sie alleine nicht sehr viel mehr aussagen, als dass sie nachgewiesen werden konnten, tragen sie im Gesamten betrachtet ebenso zum Vorkommen des Phänomens im Korpus bei, wie Types mit mehreren Treffern. Besonders auch, weil diese Hapax legomena in beiden Korpora um die 50% ausmachen.
13 Da sich das 95%-Konfidenzintervall erst ab einer gewissen absoluten Treffermenge (Perkuhn 2002: 89) lohnt, habe ich es nur auf das Gesamtergebnis der Tokens in den einzelnen Korpora anwenden können. Zur Berechnung habe ich das SIGIL-Portal von Evert/Baroni verwendet (http://www.sigil.collocations.de/; Stand: 15.11.2014).
14 Dieser Wert bezieht sich auf die gefundenen Treffer beider Types und ist daher abhängig von der Gesamttreffermenge dieser, wobei allein 59% des um -Wertes durch umbarmherzig definiert werden, worauf ich im Folgenden noch näher eingehen werde.