STAT6 Statist. Hypothesenprüfung

Modul STAT6 Statist. Hypothesenprüfung
Kategorie Statistik
Autor Schumacher
Voraussetzung AFM2 Hypothesen
STAT3 Wahrscheinlichkeiten
Bearbeitungsdauer ca. 45 Minuten
Status finalisiert
Lehrveranstaltung Lernziel
SE Quantitative Forschungsmethoden - Hypothesenarten kennen und verstehen, Beispiele entwickeln können
- potenzielle Fehler bei der Entscheidung kennen und unterscheiden können
- Signifikanztest für $\alpha$-Fehler verstehen und durchführen können

Einleitung

Forschungshypothesen bilden die Grundlage für eine wissenschaftliche Untersuchung. Sie beschreiben eine Abhängigkeit von Ursache zu Wirkung, um einen allgemeingültigen Sachverhalt (Wissen) zu erzeugen. Dabei stellt auch die Verwerfung einer Hypothese einen Wissensgewinn dar. Folgende Fragen werden in diesem Wiki-Modul thematisiert:

  • Worauf muss geachtet werden, wenn eine solche Hypothese aufgestellt wird?
  • Wie funktioniert die Schlussfolgerung von einem Ergebnis zu einer Erkenntnis oder Aussage?
  • Was ist eigentlich ein „signifikantes Ergebnis“? Wie funktioniert ein Signifikanztest?

Statistische Hypothesen

Je nach dem, welche Aussagen die Hypothesen vorschlagen, werden diese unterschiedlich benannt. So gibt es die Alternativhypothese und die Nullhypothese.

Hypothesen, die z.B. auf Theorien beruhen und den bisherigen Wissenstand erweitern, also etwas „Neues“ oder „Innovatives“ beinhalten, werden als Alternativen zum bisherigen Wissen angesehen und als Alternativhypothesen $H_1$ bezeichnet. Dem gegenüber steht die Nullhypothese $H_0$, die lediglich die Negativhypothese (das Gegenteil) zu der Alternativhypothese darstellt. Ein zweiter Erklärungsansatz basierend auf einer weiteren Theorie würde eine neue Alternativhypothese darstellen (Bös et al., 2004; Bortz, 1993).
Zusätzlich ist es notwendig, die gebildete Hypothese (z.B. aus AFM2 Hypothesen) in eine statistische Hypothese zu überführen (Bortz und Döring, 1995). Hierbei wird eine direkte Verbindung der Ursache-Wirkbeziehung anhand von quantitativen Werten $\mu$ (Zahlenwerte wie z.B. Mittelwert etc.) festgemacht.

Wie sieht nun also die Nullhypothese für folgende Alternativhypothese aus: 'Wird Merkmal A erhöht, so erhöht sich Merkmal B' ($H_1: \mu_1 > \mu_2$)?
Nullhypothese 1: 'Wird Merkmal A erhöht, so erhöht sich Merkmal B nicht.' ($H_0: \mu_1 = \mu_2$)
Nullhypothese 2: 'Wird Merkmal A erhöht, so verringert sich Merkmal B.' ($H_0: \mu_1 < \mu_2$)

In diesem Beispiel sind beide Nullhypothesen möglich, der genaue Gegensatz (Nullhypothese 1) oder der Ausschluss (Nullhypothese 2). Letztlich wird allerdings nur eine Nullhypothese verwendet.

Es zeigt sich, dass zunächst eine Alternativhypothese aufgestellt wird, aus der anschließend die Nullhypothese abgeleitet wird. Zusätzlich wird die Alternativhypothese nur durch den Ausschluss der Nullhypothese bestätigt, z.B. indem ausgeschlossen wird, dass kein Effekt vorliegt und die alternative Hypothese gelten muss (Siebertz et. al, 2010).

Exkurs: Was ist eine gerichtete / ungerichtete Hypothese?

$\alpha$- und $\beta$-Fehler

Für den folgenden Abschnitt versetzen wir uns in die Perspektive der Feuerwehr. Die Feuerwehr ist dafür zuständig auszurücken und ein Feuer zu löschen, wenn ein Alarm bei der Leitzentrale eingeht. So wie in unserer vereinfachten Alternativhypothese ('Wird Merkmal A erhöht, so erhöht sich Merkmal B') können wir eine Ursache-Wirkung-Beziehung zwischen Feuer und Alarm herstellen:

Nullhypothese $H_0$: Wenn der Alarm nicht geht, brennt es nicht.
Alternativhypothese $H_1$: Wenn der Alarm geht, brennt es. 

Sitzen wir nun in der Leitzentrale der Feuerwehr, ergeben sich vier mögliche Szenarien, die in Tabelle 1 dargestellt sind:

es gilt $H_0$: kein Brand es gilt $H_1$: Brand
Entscheidung für $H_0$ A: richtige Entscheidung
B: $\beta$-Fehler
Fehlfunktion des Feuermelders, kein Notruf abgesetzt
Entscheidung für $H_1$ C: $\alpha$-Fehler
Fehlalarm
D: richtige Entscheidung

In Fall A wird davon ausgegangen, dass es nicht brennt, da kein Alarm vorliegt (die Nullhypothese wird bestätigt). In diesem Fall ist die Entscheidung nicht auszurücken korrekt, da die Ursache (Brand) nicht vorliegt.

In Fall B kommt es jedoch vor, dass es brennt, der Brand allerdings aufgrund einer Fehlfunktion des Feuermelders nicht erkannt wird. Hier wäre es fatal, keinen Löschzug loszuschicken. Der Fehler, dass die Ursache-Wirkung (Brand → Alarm) nicht erkannt wird, wird $\beta$-Fehler genannt. Hierbei wird die Nullhypothese beibehalten, obwohl eigentlich ein Effekt vorliegt und die Alternativhypothese bestätigt werden müsste.

In Fall C liegt eigentlich kein Brand vor. Trotzdem wird (z.B. durch eine Fehlfunktion des Feuermelders) ein Fehlalarm ausgelöst. Entscheidet man sich in diesem Fall für die Alternativhypothese, fährt die Feuerwehr umsonst aus. Hier wird der Ursache-Wirkungs-Beziehung fälschlicherweise ein Effekt zugewiesen ($\alpha$-Fehler). In einem Experiment könnte z.B. starkes Rauschen des Messsystems als „Effekt“ interpretiert werden.

In Fall D ist die Entscheidung wieder richtig. Hier brennt es und der Alarm wird korrekterweise als Feuer interpretiert.

Damit trotzdem Aussagen über das Zutreffen eines entsprechenden Sachverhalts (Feuer oder kein Feuer) ziehen lassen, wird die jeweilige Auftretenswahrscheinlichkeit für $\alpha$- und $\beta$-Fehler bestimmt. Die Wahrscheinlichkeit für einen $\alpha$-Fehler wird Irrtumswahrscheinlichkeit genannt (Bortz, 1993).

Signifikanztest

Um die genannte Irrtumswahrscheinlichkeit zu bestimmen, wird ein Signifikanztest durchgeführt. Als Beispiel gucken wir uns den Effekt von täglichem Rauchen (10 Zigaretten pro Tag) auf das durchschnittliche Körpergewicht einer 30-50 jährigen Personengruppe an:

$H_0$: Tägliches Rauchen von 10 Zigaretten erhöht das Körpergewicht nicht.
$H_1$: Tägliches Rauchen von 10 Zigaretten erhöht das Körpergewicht.

Die Verteilung des Körpergewichts bei einer Personengruppe von Nichtrauchern ist normalverteilt (siehe Normalverteilung) mit einem Mittelwert $\mu_0$ und einer Standardabweichung $\sigma$. Nehmen wir an, das Körpergewicht der Probanden, die täglich 10 Zigaretten rauchen, liegt tatsächlich bei einem höheren Mittelwert $\overline{x}$. In der Abbildung 1 ist dieser Zusammenhang dargestellt. Die schraffierte Fläche gibt dabei die Wahrscheinlichkeit an, mit der sich bei Beibehalten der Nullhypothese eine Erhöhung des Körpergewichts ergeben hätte (aufgrund von Messfehlern und anderen Effekten). Somit gibt die Fläche die Wahrscheinlichkeit an, mit der bei Verwerfung der Nullhypothese (Bestätigung der Alternativhypothese) ein Irrtumsfehler ($\alpha$-Fehler) eingetreten wäre: die Irrtumswahrscheinlichkeit (Bös et al., 2004; Bortz, 1993).

Abb. 1: Irrtumswahrscheinlichkeit bei Verwerfen der Nullhypothese, (Bortz, 1993, S.109)


Aber wie wird die Irrtumswahrscheinlichkeit berechnet?
Dazu berechnen wir den z-Wert und schlagen die Wahrscheinlichkeit in einer Tabelle nach. Die Formel für den z-Wert lautet:

$ z = \frac{\overline{x} - \mu_0}{\sigma_x} $

Sie beinhaltet sowohl den Mittelwert $\overline{x}$ und die Standardabweichung $\sigma_x$ der Stichprobe, als auch den Mittelwert $\mu_0$ der normalverteilten nichtrauchenden Population. Der Wert charakterisiert die mittlere Abweichung der Stichprobe (10 Raucher) von dem durchschnittlichen Wert der Vergleichspopulation (Nichtraucher) und bezieht diesen auf die Streuung der Stichprobe. Mit Hilfe des z-Wertes können wir die Irrtumswahrscheinlichkeit aus einer Tabelle ablesen. Zur Verdeutlichung die Beispielrechnung:

Beispielrechnung
Gegeben:
Mittelwert des Körpergewichts bei Nichtrauchern $ \mu_0 = 75 kg $
Standardabweichung des Körpergewichts bei Nichtrauchern $ \sigma_x = 5 kg $
Mittelwert des gemessenen Körpergewichts (Stichprobe) der rauchenden Personengruppe $\overline{x} = 85 kg$
Berechnung:
$ z = \frac{\overline{x} - \mu_0}{\sigma_x} = \frac{85 kg - 75 kg}{5 kg} = 2,0 $
Wir schauen für den Wert $z = 2,0 $ in der Tabelle der Standardnormalverteilung (Wikipedia.de) nach und lesen eine Wahrscheinlichkeit von $P\,(\,-\infty \leq \overline{x}\,) = 97,725\% $ ab. Damit ergibt sich eine Irrtumswahrscheinlichkeit von $P\,(\,\overline{x} \leq +\infty\,) = 2,275\% $.
Was sagt die Irrtumswahrscheinlichkeit aus?

Damit eine Nullhypothese verworfen wird, hat man sich darauf geeinigt, Grenzwerte von $\alpha = 5\%$, $\alpha = 1\%$ oder $\alpha = 0,1\%$ zu verwenden (Bös et al., 2004). Diese Grenzwerte werden auch als Signifikanzniveau bezeichnet. Der Signifikanztest untersucht nun, ob die Irrtumswahrscheinlichkeit unterhalb eines definierten Signifikanzniveaus liegt. Er liefert damit eine Entscheidensgrundlage für oder gegen die Verwerfung der Nullhypothese.

Neben dem Signifikanztest der Irrtumswahrscheinlichkeit für den $\alpha$-Fehler gibt es auch einen Signifikanztest für den $\beta$-Fehler, also der Fehler, bei dem die Alternativhypothese fälschlicherweise verworfen und die Nullhypothese beibehalten wird. An dieser Stelle wird dabei auf die weiterführende Literatur verwiesen.

Mit Hilfe des interaktiven Geogebra-Applets kann man ein wenig herumspielen und das Signifikanzniveau ein wenig besser kennenlernen:

erstellt von Ann Defranco (2015, CC-BY-SA) - Link zur Quelle

Zusammenfassung

In diesem Wiki wurde die Null- und die Alternativhypothese vorgestellt und deren Bedeutung erläutert. Die Alternativhypothese stellt dabei die aus der Forschungsfrage abgeleitete Forschungshypothese dar, der die Nullhypothese gegenüber steht. Im Zusammenhang mit beiden Hypothesentypen wurden die zwei Fehler ($\alpha$- und $\beta$-Fehler), die bei der Entscheidung (Verwerfung/Beibehaltung der Hypothese) auftreten können, behandelt. Als Entscheidungsgrundlage wird hierbei ein Signifikanztest mit einem definierten Signifikanzniveau durchgeführt. Für den $\alpha$-Fehler wird dabei die Irrtumswahrscheinlichkeit bestimmt.

Fragen zur Wiederholung

  • Wie könnten eine Alternativhypothese und eine dazugehörige Nullhypothese im Bereich des Sportmanagements aussehen?
  • Was für Fehler kann man begehen, wenn man eine Hypothese verwirft oder beibehält?
  • Was wird bestimmt, um einen Signifikanztest gegenüber dem $\alpha$-Fehler durchzuführen?

Literatur

  • Bös, K., Hänsel, F., & Schott, N. (2004). Empirische Untersuchungen in der Sportwissenschaft. Hamburg, Czwalina.
  • Bortz, J. (1993). Statistik: Für Sozialwissenschaftler. Springer-Verlag.
  • Bortz, J., & Döring, N. (1995). Forschungsmethoden und Evaluation. Springer-Verlag.
  • Kuckartz, W., Rädiker, S., Ebert, T. & Schehl, J. (2013). Statistik. Eine verständliche Einführung. (2. Auflage). Wiesbaden: Springer.
  • Siebertz, K., van Bebber, D. T., & Hochkirchen, T. (2010). Statistische Versuchsplanung: Design of Experiments (DoE). Springer-Verlag.


free hits

fm/stat/stat06.txt · Zuletzt geändert: 16.06.2016 09:28 von Christian Schumacher
GNU Free Documentation License 1.3
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0