Willkommen bei Stats by Randolph. Hier geht es zur Hauptseite mit weiteren Informationen und Inhalten.

Autor:innen dieser Seite: An den Inhalten dieser Seite haben mitgearbeitet: Valentin Koob, Eva Röttger und Markus Janczyk. Der Inhalt dieser Seite wird in der Lehre in den Studiengängen Psychologie von der AG Forschungsmethoden und Kognitive Psychologie an der Universität Bremen verwendet, steht aber allen Interessierten zur Verfügung. Rückmeldungen/Fehler/Vorschläge können gesendet werden an .

Versionshistory:

  • v1.1: sprachlich korrigierte und leicht überarbeitete Version (14.9.2023)
  • v1.0: erste online-gestellte Version (31.8.2023)

7 Einführung in die Inferenzstatistik

7.1 Stichprobe vs. Population

In den bisherigen Kapiteln haben wir uns mit der sog. deskriptiven Statistik beschäftigt, also mit der “reinen” Beschreibung vorliegender Daten. Dabei haben wir mit (bedingten) Häufigkeiten in Form von Kontigenztabellen angefangen und uns über Lage bzw. Variabilität bis hin zur Quantifizierung von Zusammenhängen gearbeitet. Das Problem ist aber, dass wir stets nur eine Stichprobe aus der gesamten Population beschrieben haben, deren Zusammensetzung natürlich dem Zufall unterliegt. Zwangsläufig gilt somit, dass auch die Stichprobenkennwerte (wie Mittelwerte, Varianzen, Korrelation etc.) abhängig von der Zufallsauswahl sind: Wäre nur eine Person in unserer Stichprobe anders, wären auch die Kennwerte anders.

Idealerweise sollen die gezogenen Schlussfolgerungen aus den berechneten Kennwerten aber für die gesamte dahinter stehende Population gelten, nicht nur für die eine spezielle Stichprobe. Hierin liegt nun aber eine grundsätzliche “Problematik”: Obwohl zwar theoretisch exakte Kennwerte (wie Mittelwert, Varianz, Zusammenhänge etc.) auf Populationsebene vorliegen, können wir diese praktisch nie bestimmen, ohne dabei jede Person der Population zu erheben. Die wahren Kennwerte einer Population sind und bleiben also unbekannt.

Eine mögliche Lösung bietet allerdings die Inferenzstatistik. Diese beschäftigt sich damit, wie wir auf Basis einer Stichprobe mit Hilfe der Stochastik dennoch etwas über die Eigenschaften von Populationen erfahren können. Kernthemen der Inferenzstatistik sind einerseits das “Schätzen” der unbekannten Populationskennwerte, welche wir im Folgenden Parameter nennen (bspw. den Populationsmittelwert), andererseits das Testen von Hypothesen über solche Parameter der Population(en).

7.2 Das Verhältnis von Stichprobe und Population: Statistiken vs. Parameter

Bevor wir uns näher mit der Inferenzstatistik beschäftigen, müssen wir einige Grundlagen klären. Beginnen wir mit der Terminologie. Als (Stichproben-)Statistik bezeichnen wir alle Kennwerte, welche auf Basis von Stichproben berechnet werden können (bspw. der Mittelwert und die Varianz). Sie werden mit einem lateinischen Buchstaben bezeichnet. (Populations-)Parameter sind hingegen unbekannt und werden mittels Stichprobenstatistiken “geschätzt”. Sie werden mit griechischen Buchstaben bezeichnet. Die für uns zunächst wichtigsten Statistiken und Parameter sind:

Die Statistiken wurden bereits in den Kapiteln 3 bis 6 behandelt.

Die folgende Grafik soll die Beziehung zwischen Population und Stichprobe noch einmal verdeutlichen.

Eine Population besitzt unbekannte Parameter wie einen Populationsmittelwert \(\mu\) oder eine Populationsstandardabweichung \(\sigma\). Eine Stichprobe ist ein zufällig gezogener Teil der Population. Auf Basis der Stichprobe berechnen wir Stichprobenkennwerte bzw. Statistiken wie den Mittelwert \(M\) oder die Standardabweichung \(S\). Diese Statistiken bilden dann die Grundlage zur (bestmöglichen) Schätzung der entsprechenden Populationsparameter.

7.3 Statistische Hypothesen: Einführung

Statistische Hypothesen bilden die Grundlage statistischer Tests über Populationsparameter und werden uns im Zuge der Inferenzstatistik immer wieder begegnen. Auch im Alltag bildet man selbst ständig eine Vielzahl von Hypothesen, ohne sich dessen bewusst zu sein.

Die generelle Idee statistischer Tests ist wie folgt:

  • Wir haben eine inhaltliche Hypothese und…
  • …überführen diese in zwei (sich ausschließende) statistische Hypothesen.
  • Dann wird ein statistischer Test durchgeführt, an dessen Ende eine Entscheidung zwischen den beiden statistischen Hypothesen nahegelegt wird.
  • Am Ende des Prozesses können wir also eine begründete Entscheidung für eine der beiden statistischen Hypothesen treffen…
  • …und die Bedeutung für die inhaltliche Hypothese angeben.

Eine inhaltliche Hypothese ist hierbei eine vermutete Antwort auf die inhaltliche Frage.

Beispiel:

  • Frage: Ist Therapie X bei einer bestimmten Störung besser als Therapie Y?
  • Hypothese: Therapie X ist besser: Betroffene erleben nach Therapie X mehr Wohlbefinden als nach Therapie Y.

Um eine solche inhaltliche Hypothese zu überprüfen, werden i.d.R. eine bzw. mehrere Stichproben gezogen. Im hier vorliegenden Beispiel könnten wir z.B. Personen, die mit der Therapie X behandelt werden, mit Personen, die mit der Therapie Y behandelt werden, bzgl. ihres Wohlbefindens auf einem Fragebogen (= Indikator) vergleichen. Dabei ist es für das Verständnis des inferenzstatistischen Vorgehens hilfreich, sich modellhaft vorzustellen, dass alle Personen mit Therapie X aus einer Population \(A\) kommen, während Personen mit Therapie Y aus einer Population \(B\) stammen. Jede Person in der Population besitzt einen (unbekannten) Wert auf dem Fragebogen zum Wohlbefinden.

Inhaltliche Hypothesen werden im Zuge der Inferenzstatistik in statistische Hypothesen überführt: Diese statistischen Hypothesen werden über Parameter von Populationen formuliert und betreffen

  • …entweder Beziehungen zwischen Parametern, \(\mu_A > \mu_B\), \(\mu_A \neq \mu_B\), …

  • …oder Beziehungen zu spezifischen Werten, \(\mu_A > 8\), \(\rho > 0\).

Die statistische Hypothese zur inhaltlichen Hypothese von oben lautet \[\mu_A > \mu_B\] und beschreibt, dass die Population \(A\) mit Therapieform X im Mittel ein höheres Wohlbefinden besitzt als die Population \(B\) mit Therapieform Y.

Bei statistischen Hypothesen unterscheiden wir im Zuge der Inferenzstatistik immer zwischen einer Alternativhypothese \(H_1\) und einer Nullhypothese \(H_0\) – das sog. Hypothesenpaar. Die Alternativhypothese beschreibt i.d.R. (wenn auch nicht immer) den erwarteten Ausgang einer Studie. Die Nullhypothese \(H_0\) bildet das logische Gegenteil zur \(H_1\), wobei es wichtig ist zu betonen, dass die Nullhypothese \(H_0\) immer eine exakte numerische Beziehung über Parameter beinhalten muss. Das bedeutet, dass ein Parameter in der Regel entweder mit anderen Parametern oder einem exakten Wert gleichgesetzt werden muss. Im Therapiebeispiel werden Hypothesen über zwei Parameter aufgestellt. Hier lautet das Hypothesenpaar:

  • Alternativhypothese \(H_1\): \(\mu_A > \mu_B\) (Population \(A\) hat einen größeren Mittelwert als Population \(B\))
  • Nullhypothese \(H_0\): \(\mu_A \leq \mu_B\) (Population \(A\) hat einen kleineren oder den gleichen Mittelwert wie Population \(B\))

Besitzt man eine Vermutung über eine spezifische Größe eines Parameters, könnte ein weiteres Beispiel für ein Hypothesenpaar lauten:

  • Alternativhypothese \(H_1\): \(\mu_A>8\) (Population \(A\) hat einen Mittelwert größer 8)
  • Nullhypothese \(H_0\): \(\mu_A \leq 8\) (Population \(A\) hat einen Mittelwert kleiner oder gleich 8)

7.4 Zusammenfassung und Ausblick

Die Methoden der Inferenzstatistik helfen dabei, etwas über die unbekannten Populationsparameter zu erfahren. Auf Basis von (Stichproben-)Statistiken versucht sie…

  • …einen “wahrscheinlichen Wert” für den Populationsparameter zu schätzen: Punktschätzung
  • …einen plausiblen Wertebereich für den unbekannten Populationsparameter anzugeben: Intervallschätzung
  • …oder eine Entscheidung zwischen der Null- und der Alternativhypothese zu treffen, welche Ausgangspunkt für die Bewertung einer inhaltlichen Hypothese ist.

Dabei ist die Inferenzstatistik ein nützliches mathematisches Werkzeug. Sie kann aber nicht…

  • …die Angemessenheit der statistischen Auswertung beurteilen.
  • …gute Theoriebildung ersetzen (sie hilft aber dabei, Theorien zu testen).
  • …fehlerfreie Entscheidungen treffen: Auch mit Inferenzstatistik können wir nie “sicher” sein, wir können aber vieles dafür tun, Fehlentscheidungen zu vermeiden (bzw. das Risko einer Fehlentscheidung verringern).

Das aktuelle Kapitel war eine grobe inhaltliche Einführung in die Inferenzstatistik, welche in den folgenden Kapiteln (inklusive Statisitk II) bzgl. der zugrunde liegenden Mathematik und Anwendung ausgebaut wird. Da sich die Inferenzstatistik mit dem Zufall von Stichprobenziehungen beschäftigt, fußt sie methodisch stark auf der Wahrscheinlichkeitstheorie. Um die Inferenzstatistik fundamental zu verstehen, benötigen wir somit noch die Grundlagen der Stochastik, die in den Teilen 8 und 9 eingeführt werden.