Willkommen bei Stats by Randolph. Hier geht es zur Hauptseite mit weiteren Informationen und Inhalten.

Autor:innen dieser Seite: An den Inhalten dieser Seite haben mitgearbeitet: Valentin Koob, Eva Röttger und Markus Janczyk. Der Inhalt dieser Seite wird in der Lehre in den Studiengängen Psychologie von der AG Forschungsmethoden und Kognitive Psychologie an der Universität Bremen verwendet, steht aber allen Interessierten zur Verfügung. Rückmeldungen/Fehler/Vorschläge können gesendet werden an .

Versionshistory:

  • v1.1: sprachlich korrigierte und leicht überarbeitete Version (14.9.2023)
  • v1.0: erste online-gestellte Version (31.8.2023)

7 Einführung in die Inferenzstatistik

7.1 Stichprobe vs. Population

In den bisherigen Kapiteln haben wir uns mit der sog. deskriptiven Statistik beschäftigt, also mit der “reinen” Beschreibung vorliegender Daten. Dabei haben wir mit (bedingten) Häufigkeiten in Form von Kontigenztabellen angefangen und uns über Lage bzw. Variabilität bis hin zur Quantifizierung von Zusammenhängen gearbeitet. Das Problem ist aber, dass wir stets nur eine Stichprobe aus der gesamten Population beschrieben haben, deren Zusammensetzung natürlich dem Zufall unterliegt. Zwangsläufig gilt somit, dass auch die Stichprobenkennwerte (wie Mittelwerte, Varianzen, Korrelation etc.) abhängig von der Zufallsauswahl sind: Wäre nur eine Person in unserer Stichprobe anders, wären auch die Kennwerte anders.

Idealerweise sollen die gezogenen Schlussfolgerungen aus den berechneten Kennwerten aber für die gesamte dahinter stehende Population gelten, nicht nur für die eine spezielle Stichprobe. Hierin liegt nun aber eine grundsätzliche “Problematik”: Obwohl zwar theoretisch exakte Kennwerte (wie Mittelwert, Varianz, Zusammenhänge etc.) auf Populationsebene vorliegen, können wir diese praktisch nie bestimmen, ohne dabei jede Person der Population zu erheben. Die wahren Kennwerte einer Population sind und bleiben also unbekannt.

Eine mögliche Lösung bietet allerdings die Inferenzstatistik. Diese beschäftigt sich damit, wie wir auf Basis einer Stichprobe mit Hilfe der Stochastik dennoch etwas über die Eigenschaften von Populationen erfahren können. Kernthemen der Inferenzstatistik sind einerseits das “Schätzen” der unbekannten Populationskennwerte, welche wir im Folgenden Parameter nennen (bspw. den Populationsmittelwert), andererseits das Testen von Hypothesen über solche Parameter der Population(en).

7.2 Das Verhältnis von Stichprobe und Population: Statistiken vs. Parameter

Bevor wir uns näher mit der Inferenzstatistik beschäftigen, müssen wir einige Grundlagen klären. Beginnen wir mit der Terminologie. Als (Stichproben-)Statistik bezeichnen wir alle Kennwerte, welche auf Basis von Stichproben berechnet werden können (bspw. der Mittelwert und die Varianz). Sie werden mit einem lateinischen Buchstaben bezeichnet. (Populations-)Parameter sind hingegen unbekannt und werden mittels Stichprobenstatistiken “geschätzt”. Sie werden mit griechischen Buchstaben bezeichnet. Die für uns zunächst wichtigsten Statistiken und Parameter sind: