Lade Inhalt...

Quantitative Analyse einer Datenbasis mit Hilfe von "R"

Analyse des erwarteten Aufwands im Modul Statistik unter Berücksichtigung der Mathenote und des Geschlechts

Hausarbeit 2018 11 Seiten

Mathematik - Statistik

Leseprobe

Table of Contents

Einleitung

Das Modul Statistik ist vor allem in nichttechnischen Studiengängen für Studierende eine große Hürde. Einige sprechen gar von einem Horrorfach. Andere sehen in Statistik ein Instrument zum Hinausprüfen von Studierenden. Das würde bedeuten, dass das Modul Statistik bewusst sehr schwer gemacht wird, damit einige Studenten durchfallen und somit deren Anzahl minimiert wird. Im Wintersemester 2016/17 sind an der Westfälischen Wilhelms-Universität (WWU) in Münster von 453 Studenten im Modul Statistik I insgesamt 135 Studenten und damit knapp 30% durchgefallen. In Statistik II sind es 51 von 264 Studierenden, also immerhin noch knapp 20%. So oder so - die Angst vor Statistik scheint nachvollziehbar. Diese Hausarbeit dreht sich um den erwarteten Aufwand für das Modul Statistik. Für einige Studenten ein Horrorfach, für andere eine große Hürde und für wiederum andere zumindest ein Modul nicht wie jedes andere: Wie schätzen Studierende den erwarteten Aufwand für Statistik ein? 1

Zusätzlich werden die Mathenote und das Geschlecht in den Fokus gerückt. Mathematik empfinden viele Studenten als ähnlich herausfordernd wie Statistik und in etwa als genauso große Hürde. Ebenfalls im Wintersemester 2016/17 an der WWU in Münster haben 191 von 621 Studenten die Klausur Mathematik nicht bestanden. Das sind knapp über 30%. Ähnlich hohe Durchfallquoten lassen sich außerdem in Finanzmathematik und Wirtschaftsmathematik feststellen. Hier könnte ein Zusammenhang zwischen einer schlechten Mathenote und einem eher hohen erwarteten Aufwand für Statistik bestehen. 2

Nun zum Geschlecht: Lernen geschieht durch erfahrungsbedingte Veränderung des Verhaltens oder Wissens eines Menschen und funktioniert sowohl bei weiblichen als auch bei männlichen Personen gleichermaßen. Trotzdem deuten zwei Untersuchungsergebnisse darauf hin, dass es sehr wohl geschlechtsspezifische Unterschiede beim erwarteten Aufwand im Modul Statistik geben kann. Erstens sind männliche Schüler in der gymnasialen Oberstufe häufiger im Mathematik-Leistungskurs anzutreffen, wohingegen Schülerinnen häufiger Deutsch, Fremdsprachen oder Biologie als Leistungskurs wählen. Das könnte für eine höhere Affinität und ein besseres Verständnis statistischer Themen sorgen. Zweitens gaben die Schülerinnen an, für Hausaufgaben und Klausurvorbereitung im Schnitt über 12 Stunden zu Hause zu arbeiten. Bei den männlichen Schülern sollen es weniger als 10 Stunden sein. Auch in einer studentischen Stichprobe gaben Frauen an, mehr zu lernen. Haben diese beiden Erkenntnisse einen Einfluss auf den erwarteten Aufwand im Modul Statistik? 3

Zusammengefasst geht es in der quantitativen Datenanalyse um die Frage, ob die Mathenote oder das Geschlecht einen signifikanten Einfluss auf den erwarteten Aufwand im Modul Statistik haben. Erwarten Studenten einen höheren Aufwand im Modul Statistik, wenn sie eine schlechtere Note in Mathe haben? Macht es einen Unterschied in der Aufwandserwartung, ob der Student männlich oder weiblich ist? Oder sind die Mathenote und das Geschlecht nicht entscheidend, wenn es um den erwarteten Aufwand im Modul Statistik geht?

Methode

Die in dem Analyseteil verwendete Kernmethode ist die Lineare Regression. Regression im statistischem Sinne bedeutet “zurückführen”, das heißt es soll überprüft werden, ob eine abhängige Variable Y auf eine oder mehrere unabhängige Variablen X zurückgeführt werden kann. Andere Lehrbücher sprechen vom Zielmerkmal Y und erklärendem Merkmal X. Bei nur einer unabhängigen Variable X wird von einer einfachen linearen Regression gesprochen, bei mehreren unabhängigen Variablen handelt es sich um eine multiple lineare Regression. 4

Dabei soll ein linearer Zusammenhang untersucht werden. Es wird angenommen, dass f() eine lineare Funktion ist. Für die multiple lineare Regression dieser Hausarbeit wird der “erwartete Aufwand in Statistik” der Achsenabschnitt dieser linearen Funktion sein, die beiden unabhängigen Variablen “Mathenote” und “Geschlecht” bilden die Steigung der Geraden. Im Idealfall würden im Streudiagramm alle Punkte auf einer Geraden liegen. Je näher die Punkte an der Geraden liegen, desto stärker ist ein linearer Zusammenhang zu vermuten. Außerdem werden p-Werte und ein R² ermittelt. Der p-Wert für die unabhängigen Variablen zeigt einem an, inwieweit diese Variable signifikant ist. Um eine für jede Analyse faire Aussage treffen zu können, wird das Signifikanzniveau alpha auf 5% festgelegt. Es kann zum Signifikanzniveau von alpha = 5% entweder die Nullhypothese H_0 (“Da ist nichts”) verworfen werden - oder eben nicht. Außerdem wird das Bestimmtheitsmaß R² ermittelt, das den Anteil der im Modell erklärten Variation des erwarteten Aufwands im Modul Statistik angibt. R² wird eine Zahl zwischen 0 und 1 sein. Je größer R² dabei ist, desto besser ist das Modell. 5

Auf die Forschungsfrage lässt sich übertragen, dass analysiert wird, wie viel Prozent der Variation des erwarteten Aufwands im Modul Statistik durch die Mathenote und das Geschlecht modelliert werden können.

Datenanalyse

Die verwendeten Daten stammen aus einer anonymen, freiwilligen Online-Umfrage zu Semesterbeginn der Herren G., H. L. und M. Jeder Studierende hat eine individuelle Datenbasis mit verschiedenen Variablen zugeordnet bekommen. Die mir zugeordnete Datenbasis umfasst 134 Beobachtungen und 9 Variablen. Die für meine quantitative Ausarbeitug relevanten Variablen sind der erwartete Aufwand des Moduls Statistik (B_SATS_Aufwand), die Mathenote (C1_Mathe) sowie das Geschlecht (G01_Geschlecht).

Abbildung in dieser Leseprobe nicht enthalten

Im Folgenden werden die Skalenniveaus der ausgewählten Variablen näher betrachtet:

- Aufwand_Statistik: abhängige Variable, numerisch, intervallskaliert, latent, Ausprägungen: 1-7 (Dezimalzahlen, 1: Trifft überhaupt nicht zu, 7: Trifft voll und ganz zu)

Mögliche Ausreißer sollen entfernt werden für diejenigen Daten, bei denen Studenten quasi gar keinen Aufwand für das Modul Statistik erwarten. Daher werden nur Beobachtungen berücksichtigt, bei denen ein Aufwand von 2 oder höher erwartet wird, denn “gar nicht lernen” ist nicht nur in Statistik, sondern auch in allen anderen Modulen nicht zielführend.

- Mathenote: unabhängige Variable, numerisch, intervallskaliert, latent, Ausprägungen: 1-7 (ganze Zahlen, 1: Überhaupt nicht gut, 7: Sehr gut)
- Geschlecht: unabhängige Variable, kategorial (binär), manifest, Ausprägung: männlich oder weiblich

Nun werden die Nullhypothesen H_0 sowie die Alternativhypothesen H_A formuliert:

- H_0: Es gibt keinen Zusammenhang zwischen dem erwarteten Aufwand im Modul Statistik und der Mathenote, “da ist nichts”
- H_A: Es gibt einen Zusammenhang zwischen dem erwarteten Aufwand im Modul Statistik und der Mathenote, “da ist was”
- H_0: Es gibt keinen Zusammenhang zwischen dem erwarteten Aufwand im Modul Statistik und des Geschlechts, “da ist nichts”
- H_A: Es gibt einen Zusammenhang zwischen dem erwarteten Aufwand im Modul Statistik und des Geschlechts, “da ist was”

Abbildung in dieser Leseprobe nicht enthalten

Die erste Datenübersicht zeigt, dass es keine fehlenden Werte gibt und wir aus diesem Grund keine Beobachtungen entfernen müssen. Dazu ist ersichtlich, dass der Anteil männlicher Studenten bei etwa 45,1% liegt. Der Anteil weiblicher Studenten überwiegt also. Allerdings ist ein Ausreißer herausgeflogen, weil bei der Variable Aufwand_Statistik ein Wert von größer oder gleich 2 festgelegt wurde. Statt 134 Beobachtungen sind es nun noch 133 Beobachtungen.

Deskriptive Statistiken

Abbildung in dieser Leseprobe nicht enthalten

Der Mittelwert der insgesamt 133 Beobachtungen für den erwarteten Aufwand in Statistik liegt mit 6,18 sehr nah am Maximum (7). Das Minimum liegt bei 3,8. Die eine Beobachtung, die herausgeflogen ist, lag unter dem Wert von 2. Das Entfernen dieses Ausreißers hat sich also als richtig erwiesen, denn sonst hätte diese Beobachtung verzerren können.

[...]


1 Vgl. 10.1007/978-3-658-04605-7, Vgl. 10.1007/s11943-008-0034-y, Vgl. www.wiwi.unimuenster. de/pruefungsamt/downloads/statistiken/pruefungsstatistiken_noten/bachelor/ Bachelor-WS16-17.pdf

2 Vgl. www.wiwi.unimuenster. de/pruefungsamt/downloads/statistiken/pruefungsstatistiken_noten/bachelor/ Bachelor-WS16-17.pdf

3 Vgl. Handbuch der Pädagogischen Psychologie, ISBN 9783801718633

4 Vgl. 10.1007/978-3-531-19890-3, Vgl. 10.1007/978-3-662-50372-0

5 Vgl. 10.1007/978-3-531-19890-3, Vgl. 10.1007/978-3-662-50372-0

Details

Seiten
11
Jahr
2018
ISBN (eBook)
9783346038753
Sprache
Deutsch
Katalognummer
v501853
Institution / Hochschule
FOM Essen, Hochschule für Oekonomie & Management gemeinnützige GmbH, Hochschulleitung Essen früher Fachhochschule
Note
2,0
Schlagworte
R R-Studio Quantitative Datenanalyse Lineare Regression p-Wert Signifikanzniveau Nullhypothese Grafische Verfahren Bestimmtheitsmaß R²

Teilen

Zurück

Titel: Quantitative Analyse einer Datenbasis mit Hilfe von "R"