Lade Inhalt...

Entschlüsselung unseres deutschen Familiennamensgedächtnisses

Wissenschaftliche Studie 2012 30 Seiten

Soziologie - Methodologie und Methoden

Leseprobe

Inhaltsverzeichnis

1 Einführung

2 Motivation

3 Das Prinzip

4 Ausgangspunkt und Vorgehen
4.1 Datenbasis
4.2 Eingesetzte Software
4.3 Aufbereitung der Daten

5 Ergebnisse und Deutungsversuche
5.1 Einführung
5.1.1 Geschichtlicher Vergleichszeitraum
5.1.2 Auswahl und Darstellung der Muster
5.1.3 Aussagekraft der Diagramme
5.1.4 Eignung von Diagrammtypen
5.2 Muster
5.2.1 Nord-Süd-Aufteilung
5.2.1.1 Das Phänomen
5.2.1.2 Weitere Beispiele
5.2.2 Ostdeutschland
5.2.2.1 Das Phänomen
5.2.2.2 Weitere Beispiele
5.2.2.2.1 Osten
5.2.2.2.2 Erweiterter Osten
5.2.3 Westliches Niedersachsen, Nordrhein-Westfalen und Ruhrgebiet
5.2.3.1 Das Phänomen
5.2.3.2 Weitere Beispiele
5.2.4 Rheinland-Pfalz
5.2.4.1 Das Phänomen
5.2.4.2 Weitere Beispiele
5.2.5 Thüringen und Sachsen
5.2.5.1 Das Phänomen
5.2.5.2 Weitere Beispiele
5.2.6 Bayern
5.2.6.1 Das Phänomen
5.2.7 Großstädte
5.2.7.1 Das Phänomen
5.2.7.2 Weitere Beispiele

6 Fazit und Ausblick
6.1 Konzept und Methode
6.2 Erkenntnisse aus unserem kollektiven Gedächtnis
6.3 Ausblick

7. Referenzen

1 Einführung

Der vorliegende Beitrag präsentiert eine Methode, Einblicke in unser kollektives

Familiennamensgedächtnis zu erhalten. Die Ergebnisse der Untersuchung werden kartografisch auf Deutschlandkarten dargestellt und kurz interpretiert.

2 Motivation

Alle Menschen in Deutschland tragen einen Familiennamen. Der Familienname entstand in früheren Jahrhunderten. Auch wenn der Familienname ursprünglich zur Bezeichnung einer Person entstand, so sagt er doch auch etwas aus über die Zeit, in der er entstand. Alle deutschen Familiennamen zusammengenommen bilden deshalb ein großes Reservoir mit vielfältigen Informationen über unsere Vergangenheit. Ein Großteil dieser Informationen liegt nach Meinung des Autors noch brach und wartet auf Entdeckung. Ein naheliegender Ansatz ist, die Bedeutung sowie die Verbreitung der einzelnen Familiennamen zu erforschen. Doch es gibt auch andere Wege und Herangehensweisen.

In dem Beitrag wird die Gesamtheit aller deutschen Familiennamen und deren Verbreitung in Deutschland betrachtet. Auf dieser Basis wird von einzelnen Familiennamen abstrahiert und es werden übergreifende Zusammenhänge oder Muster abgeleitet. Diese Muster zeigen, dass Facetten unserer Geschichte immer noch in unseren Familiennamen präsent sind; wir müssen nur richtig hinsehen und die Muster zu deuten wissen.

Natürlich können wir nicht zu viel von der Analyse der Familiennamen erwarten. Unsere Familiennamen sind in gewisser Hinsicht vergleichbar mit einem Gesteinsabdruck, der über lange Zeit erhalten blieb, an dem aber der Zahn der Zeit nagt. Aus den Überresten lassen sich noch manche Eigenschaften der ursprünglichen Artefakte erschließen; eine vollständige Rekonstruktion aller ursprünglich vorhandenen Eigenschaften wird jedoch nicht möglich sein.

3 Das Prinzip

Personen besitzen einen Familiennamen und leben an einem Wohnort. Es gibt also eine Beziehung zwischen Familiennamen und Orten. Da im allgemeinen Personen mit gleichen Familiennamen an verschiedenen Orten wohnen, und an einem Ort Personen mit unterschiedlichen Familiennamen, stehen auch die Orte untereinander in einer Beziehung, die aus der Verteilung der Familiennamen resultiert. Letztendlich ergibt sich aus diesen Beziehungen eine Art Maß für die Durchmischung der Bevölkerung.

Die Beziehung der Orte untereinander kann zum Beispiel durch eine Metrik definiert werden (siehe /Metrik2011/): Zu zwei Orten existiert ein Abstand, der sich aus der Anzahl der gemeinsamen Familiennamen ergibt - der Familiennamensabstand oder kurz Namensabstand. Besitzen zwei Orte viele gemeinsame Familiennamen, ist ihr Namensabstand klein; umgekehrt ist der Namensabstand bei einer geringen Anzahl gemeinsamer Familiennamen groß. Das nachfolgende Schema soll den Sachverhalt verdeutlichen:

Die Idee ähnelt in gewissem Maße einem Vorgehen der Populationsgenetik (siehe /Population2011/). Da die Berechnung von Verwandtschaftsbeziehungen einer Population aufwendig ist, wird manchmal auf ein vereinfachtes Schätzverfahren zurückgegriffen (siehe /Schätzen2011/). Das Schätzverfahren basiert auf der Annahme, dass die Häufigkeit des Vorkommens von Familiennamen in engem Zusammenhang mit der Verwandtschaft der Population untereinander einhergeht. Wenn die Menschen, die in einem Ort wohnen, als Teile der Population betrachtet werden, geht es hier um eine Art "Verwandtschaft" zwischen Orten. Für den Grad der Verwandtschaft wird hier der Begriff Namensabstand gewählt, da es in der Genetik den Begriff des genetischen Abstands gibt.

Mit dem Konzept des Namensabstandes wird für beliebige Orte ein Abstand zueinander definiert. Bei der Berechnung des Namensabstandes fließen die Familiennamen ein, spielen jedoch in der Folge keine explizite Rolle mehr - sie sind aus den Folgeberechnungen eliminiert.

Die weitere Analyse beschränkt sich auf deutsche Orte und ihre Namensabstände. Auf dieser Datengrundlage sind insbesondere mathematische Cluster-Analysen mit anschließenden kartografischen Darstellungen möglich. Die generierten Karten sind die Grundlage der Interpretationsansätze und Deutungsversuche.

4 Ausgangspunkt und Vorgehen

4.1 Datenbasis

Die Datenbestand mit Stand 1997 umfasst die Zuordnung von über 830.000 unterschiedlichen Familiennamen auf deutsche Orte, ergänzt mit der Anzahl von Telefonanschlüssen der Namen an dem jeweiligen Ort (basierend auf der Telefonbuch-CD /DInfo1997/). Für die Zuordnung von Orten und Postleitzahlen zu geografischen Koordinaten werden die Dienste von GeoNames (siehe /Geo2009/) in Anspruch genommen.

Um Verbindungen zwischen Orten herzustellen, kommen nur Familiennamen mit mindestens zwei Telefonanschlüssen in Frage. Daher reduziert sich der Ausgangsdatenbestand für das Projekt auf gut 510.000 Familiennamen.

4.2 Eingesetzte Software

Die Daten sind in dem relationalen Datenbanksystem MySQL (siehe /MySQL2011/) abgelegt. Die Transformationen zur Berechnung der Namensabstände werden mit Hilfe von MySQL auf einem Linux Notebook durchgeführt1.

Zur Darstellung der Ergebnisse einschließlich vorbereitender Umformungen wird auf die ebenso flexible wie performante kartografische Software RuG/L04 zurückgegriffen (siehe /RuGL2011/). Für Dokumentation, Einsatzbeispiele und weiterführende Erläuterungen wird auf die angegebene Quelle verwiesen.

4.3 Aufbereitung der Daten

Nach der Berechnung der Namensabstände aller deutschen Orte untereinander aus den über 510.000 deutschen Familiennamen, werden die Ortsdaten auf 4-, 3-, 2- und 1-stellige Postleitzahlen- Gebieten aggregiert. Damit stehen Namensabstände auch für die Postleitzahlen-Gebiete zur Verfügung. Diese Maßnahme wird aus zwei Gründen durchgeführt: Zum einen soll herausgefunden werden, ob sich auf den unterschiedlichen Granularitätsebenen unterschiedliche Ergebnisse ergeben. Zum anderen wird auf jeder Aggregationsstufe die Datenmenge reduziert; die Berechnung der Karten geht schneller vonstatten.

Außerdem werden die Namensabstände nicht nur für den gesamten Bestand an Familiennamen, sondern auch für Teile des Gesamtbestandes berechnet. Die Familiennamen werden nach absteigender Häufigkeit des Auftretens angeordnet und nach diesem Ordnungskriterium in Bereiche aufgeteilt. Für einige dieser zusammenhängenden Teilbereiche oder Kombinationen von Teilbereichen aus Familiennamen werden ebenfalls die Namensabstände errechnet. In einer weiteren Variation werden alle Daten der 25 größten deutschen Städte entfernt und ebenfalls die Namensabstände errechnet.

Mit diesem Vorgehen stehen unterschiedliche Datenbestände in unterschiedlichen Aggregationsstufen zur weiteren Auswertung und zum Vergleich untereinander zur Verfügung. Die Datenbestände stellen die Eingangsdaten für die kartografische Analyse-Software dar. Mit dieser Software werden insbesondere Cluster-Analysen durchgeführt. Die Ergebnisse werden grafisch dargestellt.

5 Ergebnisse und Deutungsversuche

5.1 Einführung

5.1.1 Geschichtlicher Vergleichszeitraum

Familiennamen gibt es zwar schon seit etlichen Jahrhunderten in Deutschland. Allerdings ist die historische Bevölkerungsentwicklung bei den Interpretationsansätzen zu berücksichtigen. Die Einwohnerzahlen Deutschlands haben sich in den letzten 200 Jahren etwa vervierfacht (siehe /Einw2011/). Daher dürften die meisten Erkenntnisse aus den Diagrammen unsere neuere Geschichte betreffen.

5.1.2 Auswahl und Darstellung der Muster

Nicht alle erkennbaren Muster können hier im Detail abgehandelt werden; die Darstellung wird auf eine Reihe auffälliger Strukturen beschränkt. Tiefer liegende Überlegungen und Untersuchungen zum Zustandekommen der Muster werden hier nicht angestellt; es geht dem Autor hier erst einmal nur um das Erkennen der Phänomene.

In den folgenden Abschnitten werden einzelne Phänomene betrachtet. In Unterabschnitten werden jeweils einige Diagramme dargestellt, auf denen das betreffende Phänomen zu erkennen ist.

Zur optischen Verdeutlichung der Phänomene sind in einigen Diagrammen schwarzfarbige Linien ergänzt.

5.1.3 Aussagekraft der Diagramme

Nicht alle generierten Karten sind in der vorliegenden Publikation dargestellt. Bei manchen Parametervariationen wurden Diagramme ohne ersichtliche Aussagekraft ermittelt. Die Wahl der Parameter spielt offensichtlich bei der Generierung der Diagramme eine wichtige Rolle. Es ist also wichtig, dem Modell die richtigen Fragen zu stellen, damit auch brauchbare Antworten entstehen.

Die Analyse der ermittelten Diagramme ist im Wesentlichen eine Suche nach optischen Mustern oder Strukturen, die Gegebenheiten der Vergangenheit oder der Gegenwart widerspiegeln. Bei der Interpretation der Farben in den Diagrammen wird der Schwerpunkt nicht auf die Farben selbst, sondern auf Farbunterschiede oder Farbähnlichkeiten gelegt.

5.1.4 Eignung von Diagrammtypen

Die RuG/L04-Software (siehe /RuGL2011/) erlaubt die Erstellung verschiedener Darstellungstypen von Diagrammen; Verwendung finden hier Dendrogramme, Differenzkarten, kophenetische Karten, Fuzzy Clustering, Multidimensionales Skalieren, Cluster- und Vektorkarten.

Auf unterschiedlichen Aggregationsstufen sind die verschiedenen Diagrammtypen, die mittels RuG/L04-Software (siehe /RuGL2011/) erstellt werden können, unterschiedlich gut zur Darstellung geeignet.

Dendrogramme werden werden bereits ab zweistelligen Postleitzahlengebieten unübersichtlich.

Differenzkarten (bei denen Grenzlinien die Unterschiede zwischen den Gebieten verdeutlichen) sind etwa bis zu dreistelligen Postleitzahlengebieten einsetzbar. Beide Darstellungstypen spielen deshalb in der vorliegenden Arbeit eine geringe Rolle.

5.2 Muster

5.2.1 Nord-Süd-Aufteilung

5.2.1.1 Das Phänomen

illustration not visible in this excerpt

Auf etlichen Diagrammen erkenne ich eine Nord-Südaufteilung von Deutschland. Die nördlich der Aufteilungslinie gelegenen Gebiete sind enger miteinander verbunden als mit dem Süden. Mit den südlichen Gebieten enthält es sich entsprechend. Eine gewisse Sonderstellung nimmt das Gebiet um Thüringen und Sachsen ein. Teilweise ist Thüringen/Sachsen enger mit dem Norden verbunden, teilweise steht es separat von den übrigen Regionen. Im westlichen Teil ist der Norden durch das Ruhrgebiet gegen den Süden abgegrenzt. Nur in einer Karte gehört auch das Gebiet bis zur Rheinland-Pfalz herunter noch zum Norden.

Die grobe Unterteilung in Norden und Süden entspricht in etwa der physischen Aufteilung von Deutschland (siehe /DPhys2011/).

5.2.1.2 Weitere Beispiele

illustration not visible in this excerpt

5.2.2 Ostdeutschland

5.2.2.1 Das Phänomen

In einer Reihe von Diagrammen hebt sich eine Region im Osten ab. Je nach Diagramm handelt es sich dabei um zwei verschiedene Gebiete. Zum einen kann ein Gebiet, das den Ausmaßen der ehemaligen DDR sehr ähnlich ist, erkannt werden.

illustration not visible in this excerpt

Auf etlichen anderen Diagrammen ist jedoch ein Gebiet zu erkennen, das sich deutlich weiter nach Westen erstreckt:

[...]


1 In den Folgejahren der Untersuchung hat insbesondere das Aufkommen des Cloud Computing sowie der Einsatz von NoSQL-Datenbanken neue Möglichkeiten der Verarbeitung großer Datenmengen eröffnet. Diese neuen Möglichkeiten würden Untersuchungen wie die vorliegende deutlich beschleunigen und vereinfachen.

Details

Seiten
30
Jahr
2012
ISBN (eBook)
9783656867920
Dateigröße
7.6 MB
Sprache
Deutsch
Katalognummer
v286511
Note
Schlagworte
Familiennamen Kollektives Gedächtnis Deutschland Geografie Geschichte Cluster-Analyse Deutscher Bund Rheinbund Königreich Bayern Reichskreis Bayern Franken Oberpfalz Schwaben Thüringen Sachsen Rheinland-Pfalz Ruhrgebiet Nordrhein-Westfalen
Zurück

Titel: Entschlüsselung unseres deutschen Familiennamensgedächtnisses