2.1. Formulieren von
Hypothesen |
|
Hypothesen dienen in der Wissenschaft der Überprüfung von
Theorien. In Kapitel 1 haben wir von Eigenschaften in einer
Stichprobe auf Eigenschaften in der Grundgesamtheit geschlossen.
Hier wählen wir einen etwas anderen Zugang: Zunächst stellen wir
bestimmte Behauptungen über Sachverhalte in der Population auf, um
sie danach anhand einer Stichprobe zu überprüfen. Diese Behauptungen
nennen wir Hypothesen, die wir aus einer Theorie ableiten und an der
Empirie (erhobene Daten) überprüfen.
Alternativhypothesen
(H1)
Alternativhypothesen sind Teilaussagen
einer Theorie und gehen über den gegenwärtigen Erkenntnisstand
hinaus. Man betritt sozusagen neues Terrain, postuliert neue
Sachverhalte und konfrontiert diese hernach mit der empirischen
Erfahrungswelt. Im Großen und Ganzen unterscheidet man zwischen
Unterschiedshypothesen und (Vergleiche von Häufigkeiten und
Mittelwerten) und Zusammenhangshypothesen (Korrelationen, lineare
Regression etc.). Eine weitere Dimension in der Differenzierung von
Hypothesen besteht in der Gerichtetheit vs. Ungerichtetheit einer
Hypothese. Gerichtete Hypothesen behaupten, eine
Gruppe/Produkt/Objekt etc. sei bezüglich einer Eigenschaft besser
oder schlechter als eine vergleichbare Einheit, ungerichtete
Hypothesen postulieren lediglich, dass ein Unterschied
besteht (Unterschiedshypothesen). Gerichtete
Zusammenhangshypothesen beschreiben positive oder negative
Zusammenhänge (vgl. Korrelation, lineare Regression), während
ungerichtete Zusammenhangshypothesen lediglich behaupten, dass
ein Zusammenhang besteht, in welche Richtung auch immer.
Hypothesen müssen schließlich in statistische Hypothesen
übergeführt werden, um sie entsprechenden statistischen Tests zu
unterziehen. Diese beinhalten meist mathematische Beziehungen und
müssen den Inhalt der ursprünglichen Hypothese so gut wie möglich
wiedergeben.
Nullhypothesen (H0)
Die Nullhypothese ist im Grund genommen bezüglich der
Alternativhypothese redundant, d.h. sie besitzt keinerlei
zusätzliche, neue Information. Sie ist lediglich die
Negativhypothese zur Alternativhypothese, und negiert das in ihr
formulierte Postulat. Allerdings stellt sie in den klassischen
Verfahren zur Überprüfung der Signifikanz die Basis dar, aufgrund
deren entschieden wird, ob die Alternativhypothese beibehalten wird
oder nicht.
Lernstoff |
2.2. Kriterien einer
wissenschaftlichen Hypothese |
|
Eine
wissenschaftliche Hypothese...
(1) ... bezieht sich auf
einen realen Sachverhalt, der empirisch untersuchbar ist.
(2) ... ist eine allgemeingültige Aussage (All-Satz).
(3) ... hat zumindest implizit die Struktur eines
Konditional-Satzes (Wenn-dann-Satz, Je-desto-Satz).
(4) ...
ist grundsätzlich falsifizierbar, d.h. es müssen Ereignisse denkbar
sein, die sie wiederlegen.
Aufgabe:
Bearbeiten Sie nun Punkt 3 des
Aufgabenblatts
Eintrag in
das Lerntagebuch |
2.3. Fehlerarten |
|
In der
klassischen Prüfstatistik können uns grundsätzlich zwei Arten von
Fehlern passieren: Entweder wir akzeptieren eine
Alternativhypothese, obwohl in der Grundgesamtheit tatsächlich die
Nullhypothese gilt (Fehler erster Art bzw. ALPHA-Fehler,
Irrtumswahrscheinlichkeit) oder wir behalten die Nullhypothese bei,
obwohl in der Population tatsächlich die Alternativhypothese gilt
(Fehler zweiter Art bzw. BETA-Fehler).
Mit den
jeweiligen Fehlertypen sind in der sozialwissenschaftlichen
Forschung unterschiedliche Konsequenzen verbunden. Je nach Art
dieser Folgen, muss man von Fall zu Fall entscheiden, welche der
beiden Fehlerquellen man reduzieren möchte.
Aufgabe:
Bearbeiten Sie nun Punkt 4 des
Aufgabenblattes (siehe link unter Kap. 1.2)!
Eintrag in das
Lerntagebuch |
2.4. Das
Konzept der Signifikanz http://www.mathe-online.at/materialien/die_normalverteilten/files/m1_bortz4.pdf
|
|
Grundlegende Idee
Die grundlegende Idee
bei der Überprüfung der Signifikanz eines Stichprobenergebnisses,
eine Hypothese als richtig voraus zu setzen und zu überprüfen, ob
das gewonnene Ergebnis ein Beleg für die Richtigkeit der Annahme ist
oder ob es eher dagegen spricht. In der klassischen Prüfstatistik
gehen wir von der Gültigkeit der Nullhypothese aus. Danach berechnen
wir einen Kennwert für die Verträglichkeit der Stichprobendaten mit
der Nullhypothese. Im Grund genommen handelt sich hierbei also um
die Berechnung einer Wahrscheinlichkeit, einen ALPHA-Fehler zu
begehen. Das heißt, mit welcher Wahrscheinlichkeit unterliegen wir
einen Irrtum, wenn wir uns aufgrund der vorliegenden Daten für die
Annahme der Alternativhypothese entscheiden (unter der
Voraussetzung, dass in der Population die H0 gelte). Ist diese
Wahrscheinlichkeit unter einem zuvor festgelegten Maß, können wir
beruhigt die H1 annehmen. Das Festlegen der Grenze, ab wann wir
eine Nullhypothese verwerfen obliegt dem Forscher. Je nach
Konsequenzen und Folgen des Begehens eines ALPHA-Fehlers wird man
diese Grenze niedriger oder höher ansetzen. Sind die Folgen eines
solchen Fehlers nicht weiter schlimm, so setzt man die Grenze
üblicherweise bei 5% an (man spricht dann auch von einem
signifikanten Ergebnis). Sind die Konsequenzen negativ, so legt man
die Grenze bei 1% (hoch signifikantes Ergebnis) oder darunter fest.
Achtung: Bei der Berechnung der Irrtumswahrscheinlichkeit
handelt sich sozusagen um eine "bedingte" Wahrscheinlichkeit:
P(Ergebnis|H0 gilt) (sprich: die Wahrscheinlichkeit für
dieses Stichprobenergebnis unter der ANNAHME, dass die H0
gelte).
Berechnung der Irrtumswahrscheinlichkeit
Die Berechnung der Irrtumswahrscheinlichkeit sei an
einem Beispiel erklärt werden: Ein besonders motivierter, junger
Statistiker wird mit der Leitung einer Lehrveranstaltung betraut.
Großspurig verkündet er, durch den Einsatz neuer Medien, die
Vermittlung von Statistik fundierter gestalten zu können. Davon
sollen die Studenten im Sinne eines besseren Verständnisses der
Inhalte profitieren. Aus jahrelanger Erfahrung weiß man an der
Universität, dass Studenten der Statistik im Mittel 24 Punkte auf
einem standardisierten Multiple-Choice-Test erreichen. Die Streuung
betrage 8 Punkte. Aufgrund der jahrelangen Erfahrung (zahlreiche
Einzel"untersuchungen"), können diese Werte zur Schätzung der
Populationsparameter heran gezogen werden. Der motivierte Lektor
unterrichtet nun 2 Gruppen mit insgesamt 70 Studenten. Am Ende des
Semesters stellt sich heraus, dass seine Studenten im Schnitt 28
Punkte auf dem standardisierten Test erreichen. Kann nun von einem
signifikantem Unterschied gesprochen werden?
In diesem
Zusammenhang stellen sich noch mehr Fragen: Wirkt hier die besondere
Fähigkeit des Lektors, Inhalte zu vermitteln? Wirkt hier tatsächlich
seine neue Lernmethode? Sind die Studenten repräsentativ für alle
Studierenden (unterrichtet er z.B. nur ältere, berufstätige
Studierende)? Von diesen und weiteren Überlegungen hängt schließlich
das Untersuchungsdesign ab. Hier soll aber nun das Konzept der
Signifikanz geklärt werden.
Aus Kapitel 1 wissen wir, dass
sich Mittelwerte hinreichend großer Stichproben normalverteilen mit
Mittelwert µ0=24. Dies natürlich unter der Annahme der
Nullhypothese. Wie wahrscheinlich ist nun ein Ergebnis (Mittelwert!)
von 26 Punkten?
Dazu nun folgende Überlegung: Ziehen wir
sehr viele Stichproben eines bestimmten Umfangs (z.B. n=70) von
Studenten, die nach der herkömmlichen Methode unterrichtet wurden,
so erhalten wir die beschriebene Stichprobenkennwerteverteilung.
Manche dieser Stichproben werden einen besseren Mittelwert als 28
erzielen, manche einen schlechteren (für den Lektor "günstige", weil
seine Alternativhypothese ja lautete, seine Methode würde zu
besseren Ergebnissen führen). Dividieren wir nun die Anzahl der
"günstigen" Stichproben durch die Gesamtanzahl der (fiktiv)
gezogenen Stichproben, so hätten wir eine Wahrscheinlichkeit für
einen ALPHA-Fehler (Irrtumswahrscheinlichkeit) ermittelt.
Da
dies in der Praxis nicht möglich ist, nehmen wir an:
(1)
dass die Verteilung Mittelwert µ0=24 hat (2) die Verteilung hat
die Streuung (Standardfehler): 0,96 (gerundet) (3) es sich um
eine Normalverteilung handelt (zentrales Grenzwerttheorem).
ad (2) Setzten Sie in die Formel von Kapitel 1.3 für σ=8 und
n=70 ein!
Wir müssen nunmehr nur noch den kritischen z-Wert
der Standardnormalverteilung berechnen, dem der gefundene Mittelwert
in der Zufallsverteilung der Mittelwerte (MW = 24 und SD = 0,96)
entspricht. Wir ziehen von 26 den Mittelwert (24) ab und dividieren
diesen Wert durch SD (0,96) und erhalten: 2,08.
Dieser Wert
schneidet 1,02% der Normalverteilungsfläche ab. Das ist die
Wahrscheinlichkeit für das Auftreten dieses Werts unter der
Annahmen, die H0 sei gültig. Das Ergebnis steht nur sehr schwer in
Einklang mit der H0. Wir verwerfen sie daher und bestätigen
(vorläufig!) die Hypothese des motivierten Lektors.
Bei
empirischen Untersuchungen ist im Vorhinein (a priori) eine Grenze
für die Wahrscheinlichkeit anzugeben, aber der wir von einem
signifikanten Ergebnis sprechen. In den Sozialwissenschaften ist
dies in der Regel 5%. Liegt die Irrtumswahrscheinlichkeit darunter,
sprechen wir von einem signifikantem Ergebnis. Die Festlegung dieser
Grenze ist allerdings auch von den Folgen einer irrtümlichen
Entscheidung abhängig: Sind diese z.B. sehr gravierend (kostspielig
o.Ä.), so werden wir die Grenze herabsetzen (1%, 0,1%). Lernstoff |
2.5. Zum
Schluss... |
|
... sei
noch auf folgendes hingewiesen:
(1) Mit dem oben
durchgeführten Signifikanz hat der motivierte Lektor nichts
"bewiesen", sondern nur einen Wahrscheinlichkeitswert für sein
Ergebnis (unter der Annahme, dass in Wirklichkeit ein anderes gelte)
berechnet.
(2) Es bleibt jedem unbenommen, über den Effekt
seiner Methode zu urteilen. Ist dieser ausreichend für die
Rechtfertigung einer neuen (vielleicht teureren) Methode? In
hinreichend großen Stichproben werden oft auch kleine Unterschiede
signifikant, die in der Praxis allerdings nicht von Bedeutung wären
und einen Mehraufwand nicht rechtfertigen würden. So legt man oft so
genannnte Effektgrößen fest, z.B. hätte man oben behaupten können
(aufgrund sachlogischer Überlegungen), erst eine Differenz von 4
Punkten sei auch tatsächlich relevant. Sei diese Differenz
signifikant, so könne man einen Umstieg auf eine teurere Methode
rechtfertigen etc.
Zu guter letzt seien Ihnen nochmals
die im Literaturverzeichnis angeführten Standardwerke ans Herz
gelegt, v.a. Bortz/Döring: Evaluation... |
Lernpfadseite
als User öffnen (Login)
Falls Sie noch kein registrierter User sind, können Sie sich einen neuen
Zugang anlegen. Als registrierter User können Sie ein persönliches
Lerntagebuch zu diesem Lernpfad anlegen. |