1.1 Einführende Bemerkungen
|
|
Die Statistik als sozialwissenschaftliches Betätigungsfeld (Instrumentarium)
zerfällt im Wesentlichen in zwei Gebiete: die deskriptive (beschreibende)
Statistik und die Inferenz- (schließende) statistik. Die
deskriptive Statistik befasst sich mit der kompakten Beschreibung
von erhobenen/festgestellten Merkmalsverteilungen in einer bestimmten Menge von
Objekten. Sie gibt uns Hilfsmittel in die Hand mit denen wir uns einen Überblick
über die Fülle des Materials verschaffen können. Sie erleichtert uns auch die
Kommunikation wesentlicher Informationen. In den Sozialwissenschaften
stellen wir uns aber häufig auch die Frage nach der Generalisierbarkeit von
Ergebnissen, d.h. wir wollen aufgrund der Beschaffenheit einer kleinen Teilmenge (Stichprobe) Aussagen über die
Strukturen der zugrundeliegenden Menge (Grundgesamtheit, Population) machen.
Mit den damit verbundenen Verfahren und Problemen beschäftigt sich die
Inferenzstatistik .
In einer empirischen Untersuchung ziehen wir zunächst eine Stichprobe (siehe 1.2),
anhand deren wir bestimmte statistische Kennwerte (wie arithmetisches Mittel,
Standardabweichung usw.) berechnen, anhand deren wir die Parameter in der Population
schätzen. Diese Punktschätzungen sind mehr oder weniger genau. Um diese Ungenauigkeit
abschätzen zu können, haben wir letztes Semester die Konfidenzintervalle kennen
gelernt. Mit den Eigenschaften des Konfidenzintervalls beschäftigt sich Pkt. 1.4
In Pkt. 1.3 wird das fundamentale Konzept der Signifikanztests erläutert. Hierbei
wird die Theorie behandelt, wie man von Kennwerten einer Stichprobe auf den entsprechenden
Parameter in der Grundgesamtheit schließen kann. Aus didaktischen Gründen der Einfachheit beschränken
wir uns dabei auf das arithmetische Mittel bzw. den Parameter µ [mü].
Zur Ergänzung und Vertiefung dienen Ihnen die im
Literaturkapitel angeführten Standardwerke sowie diverse Suchmaschinen des
Internets.
Unter 1.3. ist etwa ein link angegeben, der ein Folienset zum Thema "Inferenzstatistik" enthält, welches
durch die Suchmaschine "Google" mit dem Begriff "Stichprobenkennwerteverteilung" gefunden wurde. Beachten
Sie aber, dass auf das Internet im Grunde genommen das Bildnis eines Müllhaufens zutrifft!
Vorgriff
|
1.2 Ziehen von Stichproben, Arten von Stichproben
http://www.mathe-online.at/materialien/die_normalverteilten/ files/aufgabenblatt.doc
|
|
Statistische Untersuchungen haben meist das Ziel über interessierende Eigenschaften einer bestimmten Gruppe von Personen oder Objekten (Grundgesamtheit) Informationen zu erhalten. Da es aus vielerlei Gründen nicht immer möglich ist, die ganze Grundgesamtheit zu untersuchen (Vollerhebung), beschränkt man sich häufig auf die Untersuchung eines Teils dieser Grundgesamtheit (Stichprobe) und versucht von den in dieser Teilmenge vorgefundenen Eigenschaften auf die Eigenschaften in der Grundgesamtheit zu schließen.
Kann aufgrund theoretischer Überlegungen von der Verteilung der Merkmalsausprägungen in der Stichprobe auf jene in der Grundgesamtheit geschlossen werden, so nennt man die Stichprobe repräsentativ für die Grundgesamtheit.
Ist eine Stichprobe in bezug auf alle Merkmale der Grundgesamtheit repräsentativ, so spricht man von globaler Repräsentativität, ist sie dies nur bezüglich bestimmter
Merkmale, so spricht man von spezifischer Repräsentativität. Die Wahl der Repräsentativität
ist vom Untersuchungsdesign und den Vorkenntnissen über die zu überprüfenden Hypothesen abhängig.
Eine Stichprobe ist sozusagen ein Miniaturbild der Grundgesamtheit. Je besser
dieses Bild ist, desto besser lassen sich Schlüsse über die Population ziehen.
Darüber hinaus ist die Präzision der getroffenen Aussagen von der Größe der Stichprobe abhängig
(siehe hierzu 1.3, 1.5 und 1.6).
Zufallsstichprobe (random sample)
Eine Zufallsstichprobe ist dadurch charakterisiert, dass jedes Element der Grundgesamtheit
mit gleicher Wahrscheinlichkeit in die Stichprobe aufgenommen werden kann.
Die Ziehung einer Zufallsstichprobe empfiehlt sich dann, wenn über die
Verteilung der für die Untersuchung relevanten Merkmale wenig oder gar nichts bekannt ist.
Geschichtete Stichprobe (stratified sample)
Sind in einer Untersuchung die relevanten Einflussgrößen bekannt (wie etwa Geschlecht, Einkommen etc.),
so empfiehlt es sich eine in bezug auf diese Determinanten repräsentative
Stichprobe zu ziehen, d.h. die Verteilung dieser Merkmale in der Population in
der Stichprobe abzubilden. Die Auswahl innerhalb der Schichten erfolgt wiederum zufällig.
Klumpenstichprobe (cluster sample)
Eine Klumpenstichprobe besteht aus allen Einheiten, die sich in zufällig ausgewählten
Klumpen befinden. Interessiert man sich z.B. für die Grundgesamtheit der AHS-Schüler,
so stellt die zufällige Auswahl und vollständige (!) Untersuchung mehrerer Schulklassen
eine Klumpenstichprobe dar.
Aufgabe: Bearbeiten Sie nun Punkt 1 des Aufgabenblatts (siehe link)!
Eintrag in das Lerntagebuch
|
1.3 Stichprobenkennwerteverteilung
http://www2.rz.hu-berlin.de/esf/statI/ hypothesenueberpruefung.pdf
|
|
Nehmen Sie sich für dieses Kapitel ausreichend Zeit! Versuchen Sie jeden
einzelnen Gedankengang nachzuvollziehen und fahren Sie mit dem Lesen des
Textes erst dann fort, wenn Sie der Meinung sind, diesen Gedankengang
jemand anderen erklären zu können, sprich: Sie sind der Auffassung, Sie
haben ihn verstanden :-)
Die fundamentale Aussgangssituation sieht folgendermaßen aus: Zunächst wird
eine Grundgesamtheit definiert, aus der eine Zufallsstichprobe vom Umfang n
gezogen wird. Wir erheben in dieser Stichprobe die Ausprägungen der Variablen X
und berechnen das arithmetische Mittel (AM). Wie gut schätzt nun AM den
Parameter (wahre Kenngröße) µ?
Der zentrale Gedanke ist nun: Angenommen wir ziehen noch eine zweite Stichprobe
vom gleichen Unfang aus der Population und berechnen abermals AM. Je näher
diese beiden Kennwerte beieinander liegen, desto eher würden wir annehmen,
dass sie den Parameter µ gut schätzen. Es erscheint auch plausibel, das AM
der beiden Kennwerte zu berechnen und als Schätzwert heran zu ziehen. Des
weiteren wird angenommen, dass die AM verschiedener Stichproben aus derselben
Grundgesamtheit nicht identisch sind, sondern um den Parameter µ streuen.
Ziehen wir nun aus der Population (theoretisch unendlich) viele Stichproben, so
erhalten wir für jede ein AM. Die Verteilung dieser (theoretisch unendlich)
vielen AM nennt man Stichprobenkennwerteverteilung.
Der Standardfehler
Die Streuung der Stichprobenkennwerteverteilung ist ein Maß dafür, wie gut
ein Kennwert den Parameter schätzt. Die Standardabweichung der AM-Werteverteilung
von gleich großen Stichproben wird als Standardfehler bezeichnet.
Der Standardfehler ist im Wesentlichen von 2 Determinanten abhängig:
(1) Von der Streuung der Messwerte in der Population.
Dieser Feststellung liegt folgender Gedankengang zu Grunde: Angenommen in der
Population wären alle Messwerte identisch. Wie verhalten sich die gewonnen
Kennwerte gezogener Stichproben zueinander? Sie wäre ebenfalls identisch! Das
wiederum bedeutet, sie entsprächen alle dem Parameter µ, der Standardfehler wäre
Null. Streut das Merkmal in der Population sehr stark, so sind Stichproben
denkbar, in den sich viele Einheiten mit geringer (oder hoher) Ausprägung befinden, so
dass die erhaltenen AM stark voneinander abweichen, der Standardfehler wäre groß.
Mathematisch formuliert: Der Standardfehler (genau genommen die
Varianz der AM-Werteverteilung) ist proportional zur Streuung
des Merkmals in der Grundgesamtheit. D.h.: Je größer die Streuung des Merkmlas, desto
größer der Standardfehler.
(2) Von der Stichprobengröße n
Wiederum sei dieser Sachverhalt an folgendem Gedankengang skizziert:
Angenommen, die Stichproben wären alle vom gleichen Umfang der Population, so
würden wir bei Ziehung von k Stichproben de facto k-mal die Grundgesamtheit
untersuchen. Wie hoch wäre dann der Standardfehler? Da wir k-mal den Parameter
µ berechnen würden, wäre die Streuung Null. Würden wir hingegen Stichproben
vom Umfang n=1 ziehen, so entspräche der Standardfehler der Streuung des
Merkmals in der Population. Warum?
Mathematisch ausgedrückt: Der Standardfehler (genau genommen die
Varianz der AM-Werteverteilung) ist indirekt proportional zum
Stichprobenumfang. D.h. Je größer der Stichprobenumfang, desto kleiner der
Standardfehler.
In Korrespondenz obiger Gedankengänge liefert die mathematische Herleitung
des Standardfehlers folgende Beziehung:
In den meisten Fällen ist uns aber die Varianz (Streuung) σ² des
Merkmals nicht bekannt, sodass wir auch diese schätzen müssen (als
Schätzwert dient uns die Bias-korrigierte Varianz; vgl. letztes Sommersemester).
Aufgabe:
Beschreiben Sie die Abhängigkeit des Stichprobenfehlers
von der Stichprobengröße n! Bearbeiten Sie desweiteren Punkt 2
des Aufgabenblattes (siehe link Kapitel 1.2)!
Eintrag in das Lerntagebuch
|
1.4 Zentrales Grenzwerttheorem
|
|
Die Verteilung von Mittelwerten (AM) aus theoretisch unendlich vielen Stichproben,
die aus ein und derselben Grundgesamtheit stammen, strebt mit wachsendem
Stichprobenumfang n gegen eine Normalverteilung. Dieses Faktum ist unabhängig
von der Verteilungsform des Merkmals in der Grundgesamtheit.
Lernstoff
|
1.5 Parameterschätzung
|
|
Das arithmetische Mittel (AM) der AM-Kennwerteverteilung entspricht dem Parameter
µ der Verteilung des entsprechenden Merkmals in der Grundgesamtheit (dies
lässt sich mathematisch beweisen, ist aber intuitiv auch plausibel).
Zusammenfassung: Entsprechend den obigen Ausführungen können wir nun davon
ausgehen, dass sich die AM aus hinreichend großen Stichproben (vgl.
zentrales Grenzwerttheorem) um den unbekannten Parameter µ mit der
Streuung des Standardfehlers (den wir ebenfalls schätzen müssen, sofern wir
nicht die wahre Streuung des Merkmals in der Population kennen) normalverteilen.
Die Normalverteilung besitzt überaus hilfreiche und interssante Eigenschaften:
So befinden sich im Intervall µ ± σ ca. 68% und im Intervall
µ ± 2σ ca. 95,5% aller Fälle (hier: Mittelwerte).
Ausgehend von unserer AM-Kennwerteverteilung ergibt sich für die AM, dass
sie mit 95,5%iger Wahrscheinlichkeit im folgenden Intervall liegen:
Anstelle des Koeffizienten 2 können wir je nach gewünschter Wahrscheinlichkeit
für
KI 95% 1,96 und
KI 99% 2,58 einsetzen.
Nun müssen wir uns allerdings noch vor Augen halten, dass der Paramter µ
unbekannt ist. Ziehen wir jetzt aber eine Stichprobe und berechnen für ein
Merkmal das AM, so können wir für dieses AM mit Hilfe obiger Überlegungen
bestimmte Parameter µ für dessen "Zustandekommen" ausschließen.
Hierzu ein kleines Beispiel:
(Nochmals) Angenommen, der Parameter µ sei bekannt mit µ=100. Dann liegt ein
AM einer beliebigen Zufallstichprobe mit 95%iger Wahrscheinlichkeit
im Intervall µ ± 1,96 mal Standardfehler des AM! Sei der Standardfehler = 10, so
entspricht das einem Intervall von [80,4;119,6]. Ein erhobenes AM von 115 fällt
also in diesen Bereich, ist µ allerdings 90 so ergibt sich bei gleichem
Standardfehler ein Intervall von [70,4;109,6] - unser erhobenes AM ist
also nicht inkludiert, der Parameter µ=90 fällt also mit hoher Wahrscheinlichkeit
als "Erzeuger" eines AM von 115 aus.
Damit wären wir auch schon am Ende unserer Überlegungen zur Parameterschätzung.
Stellen wir obige Ungleichung um, so können wir für jedes erhobene AM mit einer
festgelegten Wahrscheinlichkeit ein Intervall von Populationsparametern angeben,
welche für die "Erzeugung" dieses Stichprobenkennwertes AM in Frage kommen.
Die umgestellte Ungleichung lautet:
Lernstoff
|
1.6 Eigenschaften des Konfidenzintervalls
|
|
1. Wie wirken sich folgende Kenngrößen auf die Breite des Konfidenzintervalls aus?
1.1 Stichprobengröße n
1.2 gewählte Wahrscheinlichkeit (80%; 90%; 95%, 99%)
Für das 95%-Konfidenzintervall eines Anteilswerts gilt:
2.1 Für welchen Anteilswert p erreicht die Funktion p(1-p) ihr Maximum?
2.2 Was folgt daraus bezüglich der Breite des Konfidenzintervalls?
Übungsaufgaben, Eintrag in das Lerntagebuch
|
Lernpfadseite als User öffnen (Login) Falls Sie noch kein registrierter User sind, können Sie sich einen neuen Zugang anlegen. Als registrierter User können Sie ein persönliches Lerntagebuch zu diesem Lernpfad anlegen.
|