2.1 Formulieren von Hypothesen
|
|
Hypothesen dienen in der Wissenschaft der Überprüfung von Theorien. In Kapitel
1 haben wir von Eigenschaften in einer Stichprobe auf Eigenschaften in der
Grundgesamtheit geschlossen.
Hier wählen wir einen etwas anderen Zugang: Zunächst stellen wir bestimmte
Behauptungen über Sachverhalte in der Population auf, um sie danach anhand
einer Stichprobe zu überprüfen. Diese Behauptungen nennen wir Hypothesen, die
wir aus einer Theorie ableiten und an der Empirie (erhobene Daten) überprüfen.
Alternativhypothesen (H1)
Alternativhypothesen sind Teilaussagen einer Theorie und gehen über den
gegenwärtigen Erkenntnisstand hinaus. Man betritt sozusagen neues Terrain,
postuliert neue Sachverhalte und konfrontiert diese hernach mit der empirischen
Erfahrungswelt. Im Großen und Ganzen unterscheidet man zwischen
Unterschiedshypothesen und (Vergleiche von Häufigkeiten und Mittelwerten) und
Zusammenhangshypothesen (Korrelationen, lineare Regression etc.). Eine
weitere Dimension in der Differenzierung von Hypothesen besteht in der
Gerichtetheit vs. Ungerichtetheit einer Hypothese. Gerichtete Hypothesen
behaupten, eine Gruppe/Produkt/Objekt etc. sei bezüglich einer Eigenschaft
besser oder schlechter als eine vergleichbare Einheit, ungerichtete Hypothesen
postulieren lediglich, dass ein Unterschied besteht (Unterschiedshypothesen).
Gerichtete Zusammenhangshypothesen beschreiben positive oder negative
Zusammenhänge (vgl. Korrelation, lineare Regression), während ungerichtete
Zusammenhangshypothesen lediglich behaupten, dass ein Zusammenhang
besteht, in welche Richtung auch immer.
Hypothesen müssen schließlich in statistische Hypothesen übergeführt werden,
um sie entsprechenden statistischen Tests zu unterziehen. Diese beinhalten
meist mathematische Beziehungen und müssen den Inhalt der ursprünglichen
Hypothese so gut wie möglich wiedergeben.
Nullhypothesen (H0)
Die Nullhypothese ist im Grund genommen bezüglich der Alternativhypothese
redundant, d.h. sie besitzt keinerlei zusätzliche, neue Information. Sie
ist lediglich die Negativhypothese zur Alternativhypothese, und negiert das
in ihr formulierte Postulat. Allerdings stellt sie in den klassischen
Verfahren zur Überprüfung der Signifikanz die Basis dar, aufgrund deren
entschieden wird, ob die Alternativhypothese beibehalten wird oder nicht.
Lernstoff
|
2.2 Kriterien einer wissenschaftlichen Hypothese
|
|
Eine wissenschaftliche Hypothese...
(1) ... bezieht sich auf einen realen Sachverhalt, der empirisch untersuchbar ist.
(2) ... ist eine allgemeingültige Aussage (All-Satz).
(3) ... hat zumindest implizit die Struktur eines Konditional-Satzes (Wenn-dann-Satz, Je-desto-Satz).
(4) ... ist grundsätzlich falsifizierbar, d.h. es müssen Ereignisse denkbar sein, die sie wiederlegen.
Aufgabe:
Bearbeiten Sie nun Punkt 3 des Aufgabenblatts
Eintrag in das Lerntagebuch
|
2.3 Fehlerarten
|
|
In der klassischen Prüfstatistik können uns grundsätzlich zwei Arten von Fehlern
passieren: Entweder wir akzeptieren eine Alternativhypothese, obwohl in
der Grundgesamtheit tatsächlich die Nullhypothese gilt (Fehler erster Art bzw.
ALPHA-Fehler, Irrtumswahrscheinlichkeit) oder wir behalten die Nullhypothese bei,
obwohl in der Population tatsächlich die Alternativhypothese gilt (Fehler zweiter
Art bzw. BETA-Fehler).
Mit den jeweiligen Fehlertypen sind in der sozialwissenschaftlichen Forschung
unterschiedliche Konsequenzen verbunden. Je nach Art dieser Folgen, muss man
von Fall zu Fall entscheiden, welche der beiden Fehlerquellen man reduzieren
möchte.
Aufgabe:
Bearbeiten Sie nun Punkt 4 des Aufgabenblattes (siehe link unter Kap. 1.2)!
Eintrag in das Lerntagebuch
|
2.4 Das Konzept der Signifikanz
http://www.mathe-online.at/materialien/die_normalverteilten/files/m1_bortz4.pdf
|
|
Grundlegende Idee
Die grundlegende Idee bei der Überprüfung der Signifikanz eines Stichprobenergebnisses, eine
Hypothese als richtig voraus zu setzen und zu überprüfen, ob das gewonnene Ergebnis
ein Beleg für die Richtigkeit der Annahme ist oder ob es eher dagegen spricht.
In der klassischen Prüfstatistik gehen wir von der Gültigkeit der Nullhypothese aus. Danach
berechnen wir einen Kennwert für die Verträglichkeit der Stichprobendaten mit
der Nullhypothese. Im Grund genommen handelt sich hierbei also um die
Berechnung einer Wahrscheinlichkeit, einen ALPHA-Fehler zu begehen.
Das heißt, mit welcher Wahrscheinlichkeit unterliegen wir einen Irrtum, wenn
wir uns aufgrund der vorliegenden Daten für die Annahme der Alternativhypothese
entscheiden (unter der Voraussetzung, dass in der Population die H0 gelte).
Ist diese Wahrscheinlichkeit unter einem zuvor festgelegten Maß, können wir
beruhigt die H1 annehmen.
Das Festlegen der Grenze, ab wann wir eine Nullhypothese verwerfen obliegt
dem Forscher. Je nach Konsequenzen und Folgen des Begehens eines ALPHA-Fehlers wird
man diese Grenze niedriger oder höher ansetzen. Sind die Folgen eines solchen
Fehlers nicht weiter schlimm, so setzt man die Grenze üblicherweise bei
5% an (man spricht dann auch von einem signifikanten Ergebnis). Sind die
Konsequenzen negativ, so legt man die Grenze bei 1% (hoch signifikantes
Ergebnis) oder darunter fest.
Achtung: Bei der Berechnung der Irrtumswahrscheinlichkeit handelt sich sozusagen um eine
"bedingte" Wahrscheinlichkeit: P(Ergebnis|H0 gilt) (sprich: die
Wahrscheinlichkeit für dieses Stichprobenergebnis unter der ANNAHME, dass die
H0 gelte).
Berechnung der Irrtumswahrscheinlichkeit
Die Berechnung der Irrtumswahrscheinlichkeit sei an einem Beispiel erklärt werden:
Ein besonders motivierter, junger Statistiker wird mit der Leitung einer
Lehrveranstaltung betraut. Großspurig verkündet er, durch den Einsatz neuer
Medien, die Vermittlung von Statistik fundierter gestalten zu können. Davon
sollen die Studenten im Sinne eines besseren Verständnisses der Inhalte profitieren.
Aus jahrelanger Erfahrung weiß man an der Universität, dass Studenten der Statistik
im Mittel 24 Punkte auf einem standardisierten Multiple-Choice-Test erreichen.
Die Streuung betrage 8 Punkte. Aufgrund der jahrelangen Erfahrung (zahlreiche
Einzel"untersuchungen"), können diese Werte
zur Schätzung der Populationsparameter heran gezogen werden. Der motivierte
Lektor unterrichtet nun 2 Gruppen mit insgesamt 70 Studenten. Am Ende des Semesters
stellt sich heraus, dass seine Studenten im Schnitt 28 Punkte auf dem standardisierten
Test erreichen. Kann nun von einem signifikantem Unterschied gesprochen werden?
In diesem Zusammenhang stellen sich noch mehr Fragen: Wirkt hier die besondere
Fähigkeit des Lektors, Inhalte zu vermitteln? Wirkt hier tatsächlich seine
neue Lernmethode? Sind die Studenten repräsentativ für alle Studierenden (unterrichtet
er z.B. nur ältere, berufstätige Studierende)? Von diesen und weiteren Überlegungen
hängt schließlich das Untersuchungsdesign ab. Hier soll aber nun das Konzept
der Signifikanz geklärt werden.
Aus Kapitel 1 wissen wir, dass sich Mittelwerte hinreichend großer Stichproben
normalverteilen mit Mittelwert µ0=24.
Dies natürlich unter der Annahme der Nullhypothese. Wie wahrscheinlich ist nun
ein Ergebnis (Mittelwert!) von 26 Punkten?
Dazu nun folgende Überlegung: Ziehen wir sehr viele Stichproben eines
bestimmten Umfangs (z.B. n=70) von Studenten, die nach der herkömmlichen Methode
unterrichtet wurden, so erhalten wir die beschriebene Stichprobenkennwerteverteilung.
Manche dieser Stichproben werden einen besseren Mittelwert als 28 erzielen, manche
einen schlechteren (für den Lektor "günstige", weil seine Alternativhypothese
ja lautete, seine Methode würde zu besseren Ergebnissen führen).
Dividieren wir nun die Anzahl der "günstigen" Stichproben durch die Gesamtanzahl
der (fiktiv) gezogenen Stichproben, so hätten wir eine Wahrscheinlichkeit für
einen ALPHA-Fehler (Irrtumswahrscheinlichkeit) ermittelt.
Da dies in der Praxis nicht möglich ist, nehmen wir an:
(1) dass die Verteilung Mittelwert µ0=24 hat
(2) die Verteilung hat die Streuung (Standardfehler): 0,96 (gerundet)
(3) es sich um eine Normalverteilung handelt (zentrales Grenzwerttheorem).
ad (2) Setzten Sie in die Formel von Kapitel 1.3 für σ=8 und n=70 ein!
Wir müssen nunmehr nur noch den kritischen z-Wert der Standardnormalverteilung
berechnen, dem der gefundene Mittelwert in der Zufallsverteilung der Mittelwerte
(MW = 24 und SD = 0,96) entspricht. Wir ziehen von 26 den Mittelwert (24) ab und
dividieren diesen Wert durch SD (0,96) und erhalten: 2,08.
Dieser Wert schneidet 1,02% der Normalverteilungsfläche ab. Das ist die Wahrscheinlichkeit
für das Auftreten dieses Werts unter der Annahmen, die H0 sei gültig. Das Ergebnis
steht nur sehr schwer in Einklang mit der H0. Wir verwerfen sie daher und bestätigen
(vorläufig!) die Hypothese des motivierten Lektors.
Bei empirischen Untersuchungen ist im Vorhinein (a priori) eine Grenze für die
Wahrscheinlichkeit anzugeben, aber der wir von einem signifikanten Ergebnis
sprechen. In den Sozialwissenschaften ist dies in der Regel 5%. Liegt die
Irrtumswahrscheinlichkeit darunter, sprechen wir von einem signifikantem Ergebnis.
Die Festlegung dieser Grenze ist allerdings auch von den Folgen einer irrtümlichen
Entscheidung abhängig: Sind diese z.B. sehr gravierend (kostspielig o.Ä.), so
werden wir die Grenze herabsetzen (1%, 0,1%).
Lernstoff
|
2.5 Zum Schluss...
|
|
... sei noch auf folgendes hingewiesen:
(1) Mit dem oben durchgeführten Signifikanz hat der motivierte Lektor nichts
"bewiesen", sondern nur einen Wahrscheinlichkeitswert für sein Ergebnis (unter
der Annahme, dass in Wirklichkeit ein anderes gelte) berechnet.
(2) Es bleibt jedem unbenommen, über den Effekt seiner Methode zu urteilen.
Ist dieser ausreichend für die Rechtfertigung einer neuen (vielleicht teureren)
Methode? In hinreichend großen Stichproben werden oft auch kleine Unterschiede
signifikant, die in der Praxis allerdings nicht von Bedeutung wären und
einen Mehraufwand nicht rechtfertigen würden. So legt man oft so genannnte
Effektgrößen fest, z.B. hätte man oben behaupten können (aufgrund sachlogischer
Überlegungen), erst eine Differenz von 4 Punkten sei auch tatsächlich relevant.
Sei diese Differenz signifikant, so könne man einen Umstieg auf eine teurere
Methode rechtfertigen etc.
Zu guter letzt seien Ihnen nochmals die im Literaturverzeichnis angeführten
Standardwerke ans Herz gelegt, v.a. Bortz/Döring: Evaluation...
|
Lernpfadseite als User öffnen (Login) Falls Sie noch kein registrierter User sind, können Sie sich einen neuen Zugang anlegen. Als registrierter User können Sie ein persönliches Lerntagebuch zu diesem Lernpfad anlegen.
|