1.2 Begegnungen im Alltag
|
|
Viel zu oft benutzen wir Statistik "wie ein Betrunkener einen Laternenpfahl:
vor allem zur Stütze unseres Standpunktes und weniger zum Beleuchten
eines Sachverhaltes." (Andrew Lang).
Statistiken und grafisch aufbereitetes statistisches Material begegnen uns
ständig im Alltag. Sei es durch Kommunikation unter Freunden, der Blick in
die Tageszeitung oder die Kurznachrichten im Fernsehen. Wie häufig dabei das
Material fehlerhaft oder dessen Aussage relativ ist, fällt uns oft gar nicht auf.
Denken Sie über die (weitreichenden?) Folgen (bewusst?) falsch verbreiteter
statistischer Information nach! Machen Sie diesbezüglich stichwortartige Einträge in
Ihr Lerntagebuch!
Eintrag in das Lerntagebuch
|
1.3 Die Definition entscheidet...
|
|
Lügen mit Statistik beginnt nicht bei der Analyse und Aufbereitung von gesammelten Daten, sondern meist schon viel früher – bei der Definition von Begriffen. Zu jeder wissenschaftlichen Untersuchung gehört die Definition von verwendeten Begriffen, sofern diese nicht in einem allgemeinen Konsens bereits definiert wurden. Bei zahlreichen Begriffen ist dies jedoch nicht der Fall, z.B. Arbeitslosigkeit, Ausländer, Geburtenrate, Tourist, Wohnung, Ureinwohner, Armut, Wohlstand, Wirtschaftswachstum, Schulbildung, Kriminalität, Analphabetismus, Streik, Säuglingssterblichkeit etc. Solange die gewählten Definitionen plausibel (und konsensfähig) erscheinen ist nichts gegen eine begriffliche Vielfalt einzuwenden (auch wenn sie mitunter mühsam ist), die Manipulation beginnt jedoch dann, wenn Begriffe bewusst so bestimmt werden, damit sich das Ergebnis mühelos in das eigene Weltbild einfügen lässt.
Definieren Sie die Begriffe "Kriminalität" und "Analphabetismus" . Schreiben Sie diese in Ihr Lerntagebuch!
Anschließend stellen Sie Ihre Definiton ins Forum und vergleichen diese mit Ihren
KollegInnen!
Lernstoff, Eintrag in das Lerntagebuch
|
1.4 Basis
http://mathe-online.at/materialien/reinhard.raml/files/aufgabe_selbstmordraten.doc
|
|
Prozentangaben sind das Um und Auf in der deskriptiven Statistik und haben es per definitionem in sich, dass sie sich auf eine bestimmte Basis (Nenner) beziehen. Je nach gewählter Basis werden große Prozentwerte plötzlich ganz klein. Viele Prozentangaben in der Tageszeitung und daraus gezogene spektakuläre Schlussfolgerungen sind oftmals nichts anderes als grob fahrlässig verursachte Irrtümer. Kann man z.B. aus der Tatsache, dass in den USA die meisten Gewaltverbrechen zu Hause geschehen, schließen, dass man am sichersten im Central Park schläft? Wohnungen sind nicht zwingend ein gefährliches Pflaster, sondern wir halten uns nun mal die meiste Zeit dort auf (deshalb passieren auch so viele Unfälle im eigenen Heim). Oder: Krankenhäuser sind lebensgefährlich (die Hälfte aller Österreicher stirbt dort). Weiter: Rasen ist nicht gefährlich, es sterben viel mehr Personen bei Unfällen mit Tempo 50 km/h.
Diese Schlussfolgerungen sind offensichtlich nicht korrekt, manchmal ist der Irrtum aber nicht so einfach zu erkennen: Ein Politiker fordert die Einführung einer Pflichtversicherung für Radfahrer. Zur Begründung verweist er auf eine Statistik, die besagt, dass Radfahrer ein Drittel aller (registrierten) Sportunfälle verursachen. Das mag eine ganz korrekte Aussage sein, sie kann aber auch gar nichts besagen. Ohne weitere Informationen ist sie nutzlos. Um sie beurteilen zu können, müssen wir wissen, welchen Anteil die Radfahrer an allen Sportlern des Landes überhaupt ausmachen. Ist Radfahren mit einem Anteil von 10% an allen sportlichen Aktivitäten vertreten, so könnte man obiger Forderung durchaus zustimmen. Machen die Radfahrer allerdings über die Hälfte aller Sportler aus, so relativiert sich auch ihr Anteil an allen Sportunfällen. Im Übrigen sind es häufig die alpinen Skifahrer, die überproportional viele Unfälle verursachen. Durch solche Überlegungen relativieren sich rasch sehr viele Aussagen.
Bearbeiten Sie nun die unter dem link angegebene Aufgabe in Ihrem Lerntagebuch!
Übungsaufgabe, Eintrag in das Lerntagebuch
|
1.5 Wertlose Maßzahlen
|
|
Je nach Datenniveau dürfen bestimmte Maßzahlen berechnet werden oder nicht (z.B. würde eine mittlere Haarfarbe keinen Sinn machen). Entscheidend für die Wahl der angemessen Maßzahl ist aber nicht nur das Datenniveau, sondern auch die Beschaffenheit der Verteilung: Sind in einer Stichprobe (wenn auch nur wenige) extreme Ausreißer zu finden, so verzerren diese das arithmetische Mittel besonders stark und lassen den Median meist unverändert.
Über Eigenschaften der Lagemaße Bescheid zu Wissen kann einem so manchen Fehltritt ersparen: So beklagte die Weltbank 1980, dass in den USA mehr als die Hälfte der Einwohner an Hunger leiden würden. Sie definierten als hungrig, wer weniger als die durchschnittliche Zahl an Kalorien zu sich nehme. Diese Definition alleine kann man schon als wenig sinnvoll bezeichnen, sie hat aber einen entscheidenden anderen Haken: Ein Durchschnitt ist im Wesen so definiert, dass in etwa die Hälfte der einbezogenen Werte darunter liegt (beim Median ist es genau die Hälfte), also verwundert es einen Statistiker wohl kaum, dass „halb Amerika hungere“.
Der Kardinalfehler in der Statistik ist allerdings die Angabe von Lagemaßen ohne ein dazu gehörendes Streuungsmaß. Viele Untergruppen (z.B. Frauen/Männer) mögen bezüglich eines bestimmten Merkmals den gleichen „Durchschnitt“ aufweisen und sind sich dennoch überhaupt nicht ähnlich. Deshalb bringen uns z.B. Durchschnittstemperaturen in der Klimatologie (in der Schule Teilgebiet der Geografie) so gut wie gar nichts, wenn wir keine Standardabweichung als Information dazu erhalten. Erst durch die Streuung kann man auch auf die Vegetation schließen: Zwei Orte mit der gleichen durchschnittlichen Jahrestemperatur können ganz unterschiedlich beschaffen sein, je nachdem wie extrem die Temperaturschwankungen sind (angegeben durch die Standardabweichung).
Vertiefung
|
1.6 Korrelation und Kausalität
|
|
Eine Korrelation zwischen zwei Merkmalen (z.B. Intelligenzquotient und Einkommen) ist ein wie auch immer gearteter Gleich- oder Widerklang dieser beiden Merkmale. Korrespondiert z.B. ein hoher Wert der einen Variablen (hoher Intelligenzquotient) mit einem hohen Wert der anderen Variable (hohes Einkommen), so spricht man von einer positiven Korrelation (Gleichklang). Eine negative Korrelation (Widerklang) liegt vor, wenn z.B. mit steigendem Intelligenzquotienten das Einkommen sinken würde. Durch das gemeinsame Variieren der Variablen kann aber nicht auf einen Ursache-Wirkung-Mechanismus geschlossen werden. Es ist nicht ohne weiteres aus einer positiven Korrelation zu schließen, dass ein hoher Intelligenzquotient ein hohes Einkommen bedingt („verursacht“).
Vielmehr könnte hinter diesem Zusammenhang eine dritte Variable (eine so genannte intermittierende Variable bzw. Moderatorvariable ) stecken, welche die beiden positiv korrelierten Merkmale systematisch beeinflusst. Dies könnte in unserem Fall die Variable „Einkommen der Eltern“ sein. Man könnte annehmen, dass reiche Eltern ihre Kinder mehr fördern, auch im Hinblick auf die Intelligenz des Kindes, außerdem arbeiten sie in guten Positionen und können so ihren Kindern gut bezahlte Jobs vermitteln. In dieser Argumentation sind sehr viele umstrittene Annahmen eingebaut worden, um zu demonstrieren, dass das Interpretieren in der Statistik alles andere als einfach und eindeutig ist. Es ist ein Irrglaube, anzunehmen, dass Zahlen eine eindeutige Sprache sprächen.
Es wurden in zahlreichen Untersuchungen folgende Korrelationen festgestellt: Anzahl der Störche und Anzahl der Geburten (pos. Korr.), Ausländeranteil und Kriminalitätsrate (pos. Korr.), Luftqualität und Sterberate (pos. Korr.), Heuschnupfen und Weizenpreis (neg. Korr.)! Welche Moderatorvariablen könnten für diese (kuriosen) Zusammenhänge verantwortlich sein? Könnte auch eine Kausalität vorliegen, z.B. der Schluss, Ausländer seien krimineller – die Statistik beweist es (wieder einmal)?
Lernstoff, Übungsaufgabe, Eintrag in das Lerntagebuch
|
Lernpfadseite als User öffnen (Login) Falls Sie noch kein registrierter User sind, können Sie sich einen neuen Zugang anlegen. Als registrierter User können Sie ein persönliches Lerntagebuch zu diesem Lernpfad anlegen.
|