Willkommen bei Stats by Randolph. Hier geht es zur Hauptseite mit weiteren Informationen und Inhalten.

Autor:innen dieser Seite: An den Inhalten dieser Seite haben mitgearbeitet: Valentin Koob, Eva Röttger und Markus Janczyk. Der Inhalt dieser Seite wird in der Lehre in den Studiengängen Psychologie von der AG Forschungsmethoden und Kognitive Psychologie an der Universität Bremen verwendet, steht aber allen Interessierten zur Verfügung. Rückmeldungen/Fehler/Vorschläge können gesendet werden an .

Versionshistory:

  • v1.1: sprachlich korrigierte und leicht überarbeitete Version (14.9.2023)
  • v1.0: erste online-gestellte Version (31.8.2023)

10 Punktschätzung

Das Problem, welches die Inferenzstatistik lösen soll, ist, dass wir i.d.R. an sog. Populationen oder Grundgesamheiten interessiert sind, aber nur die Daten einer Stichprobe aus dieser Population vorliegen haben (siehe dazu auch Teil 7). Sowohl die Population als auch die Stichprobe haben aber Kennwerte, die etwas über die Lage und Verteilung der Werte einer Variablen aussagen:

  • (Stichproben-)Statistiken können auf Basis von Stichproben tatsächlich berechnet werden (siehe Deskriptive Statistik) und werden üblicherweise mit lateinischen Buchstaben bezeichnet.

  • Die eigentlich interessanten (Populations-)Parameter sind hingegen unbekannt und werden i.d.R. mit griechischen Buchstaben bezeichnet.

Da wir also die Populationsparameter nicht kennen, wollen wir aus den Stichprobenstatistiken etwas über sie “lernen”. Dies wird dann als “Schätzen der Parameter mit den Stichprobenstatistiken” bezeichnet, oder kurz als Parameterschätzung. Wir fokussieren hier auf die beiden Parameter \(\mu\) und \(\sigma^2\), also Mittelwert und Varianz einer (normalverteilten) Variablen in der Population und klären dabei zwei Fragen:

  • Welche Statistiken eignen sich, um \(\mu\) und \(\sigma^2\) “möglichst gut” zu schätzen?
  • Welche Kriterien muss ein Schätzer erfüllen, um als “möglichst gut” zu gelten?

10.1 Der Populationsparameter \(\mu\)

Wir beginnen die Betrachtungen mit einem vereinfachten Beispiel und stellen uns vor, wir würden die Population tatsächlich kennen.

10.1.1 Ein vereinfachtes (aber illustratives) Beispiel

Dazu betrachten wir zur Illustration eine Population, die nur aus 4 Elementen besteht und die wir–etwas unrealistisch–alle kennen: \[x_1=2,\hspace{.3cm}x_2=4,\hspace{.3cm}x_3=6,\hspace{.3cm}x_4=8\]

In diesem Fall können wir die Parameter \(\mu\) und \(\sigma^2\) einfach mit den aus der Deskriptiven Statistik bekannten Formeln berechnen. Als Mittelwert bzw. Erwartungswert ergibt sich \[\mu=\frac{1}{4}\cdot(2+4+6+8)=5\] und als Varianz ergibt sich \[\sigma^2=\frac{1}{4}\cdot ((2-5)^2 + (4-5)^2 + (6-5)^2 + (8-5)^2) = 5. \]

Nun führen wir eine Zufallsvariable ein (vgl. Teil 9). Bisher hatten wir das zufällige Ziehen einer Person als ein Zufallsexperiment aufgefasst. In gewisser Weise entspricht dies einer Stichprobe vom Umfang \(n=1\) und es entsprechen sich Population und \(\Omega\), da jedes Mitglied der Population Ausgang des Zufallsexperiments sein kann.

Nun erlauben wir allgemeiner Stichproben vom Umfang \(n\geq 1\). Das Zufallsexperiment ist dann also das Ziehen einer Stichprobe vom Umfang \(n\) und die Menge der möglichen Ausgänge umfasst nun alle möglichen Stichproben dieses Umfangs. Diese Menge nennen wir \(\Omega^n\) und sie ergibt sich indem wir alle \(n\)-Kombinationen (mit Zurücklegen) der Elemente \(\omega_i\in\Omega\) bilden. Formal ergibt sich \(\Omega^n\) als sog. kartesisches Produkt oder Mengenprodukt. Die Elemente eines Mengenprodukts werden als geordnete Paare oder Tupel bezeichnet und bestehen jeweils aus Elementen der Ausgangsmengen, wobei das erste Element eines Tupels aus der ersten Menge stammt und das zweite Element aus der zweiten Menge. Wenn z.B. die Mengen \(X\) und \(Y\) gegeben sind, dann ist die Ergebnismenge des kartesischen Produkts \[X\times Y=\{(x,y)|x\in X, y\in Y\}\] Für ein Beispiel mit \(X={1,2,3}\) und \(Y={8,9}\) ergibt sich also \[X\times Y=\{(1,8), (1,9), (2,8), (2,9), (3,8), (3,9)\}\] Kommen wir nun zur Menge \(\Omega\) zurück, dann bedeutet \(\Omega^n\) nichts anderes als \[\Omega^n = \underbrace{\Omega \times \Omega \times \ldots \times \Omega}_{n\text{-mal}}\] Die Elemente der Menge \(\Omega^n\) sind sog. \(n\)-Tupel, wobei je ein solches \(n\)-Tupel eine Zusammenfassung einer Stichprobe aus \(\Omega\) vom Umfang \(n\) beschreibt.

Wir beginnen mit Stichproben vom Umfang \(n=2\), d.h. die Menge \(\Omega^2\) beinhaltet alle möglichen Zweierstichproben der Population. Die Zufallsvariable \(\bar{\mathbf{X}}\) ordnet nun jeder Zweierstichprobe den Mittelwert ihrer Elemente zu. Formal ist die Zufallsvariable also eine Abbildung von \(\Omega^2\) nach \(\Omega'\subseteq\mathbb{R}\):

\[\begin{equation*} \boldsymbol{\bar{X}}\colon \Omega^n\rightarrow\mathbb{R}\qquad\text{mit}\qquad \underset{n\text{-Tupel}}{\underbrace{(\omega_1,\ldots,\omega_n)}}\rightarrow \underset{M}{\underbrace{\frac{1}{n}\sum_{i=1}^n X_{\omega_i}}}\;. \end{equation*}\] Die Abbildung weist also jedem der \(n\)-Tupel den Mittelwert \(M\) seiner Bestandteile \(\omega_i\) zu.

Nehmen wir an, wir würden mit Zurücklegen ziehen, dann sind also 16 verschiedene Zweierstichproben möglich und die folgende Tabelle fasst die Mittelwerte dieser Zweierstichproben zusammen: