Willkommen bei Stats by Randolph. Hier geht es zur Hauptseite mit weiteren Informationen und Inhalten.

Autor:innen dieser Seite: An den Inhalten dieser Seite haben mitgearbeitet: Valentin Koob, Eva Röttger und Markus Janczyk. Der Inhalt dieser Seite wird in der Lehre in den Studiengängen Psychologie von der AG Forschungsmethoden und Kognitive Psychologie an der Universität Bremen verwendet, steht aber allen Interessierten zur Verfügung. Rückmeldungen/Fehler/Vorschläge können gesendet werden an .

Versionshistory:

  • v1.0: erste online-gestellte Version (14.9.2023)

14 Fehlertypen, Effektstärken, Power

Ausgangspunkt unserer Überlgungen in den Teilen 11 und 12 war in der Regel die Annahme, die (spezifische) Nullhypothese würde gelten, und darauf aufbauend haben wir dann die Entscheidungsregeln definiert. Nun gehen wir einen letzten Schritt weiter und betrachten die Situation, wenn eine bestimmte Alternativhypothese gelten würde. Dies haben wir in Teil 11 zwar bereits einmal kurz angedeutet, aber an dortiger Stelle uns primär mit Fehlertypen befasst, die beim Entscheiden auftreten können.

Wir werden diese Fehlertypen hier kurz wiederholen, bevor wir dann Effektstärken und die sog. Power bzw. Teststärke einführen. Dies alles erlaubt uns schließlich die Berechnung einer optimalen Stichprobengröße vor Durchführung einer Studie.

14.1 Fehlertypen

In Teil 11 hatten wir Simulationen betrachtet, bei denen zwei Stichproben entweder aus der gleichen Population (Annahme der Gültigkeit der Nullhypothese \(H_0\)) oder aus verschiedenen Populationen (Annahme der Gültigkeit einer bestimmten Alternativhypothese \(H_1\)) gezogen wurden. Wir haben die relative Häufigkeit der dabei auftretenden Mittelwertdifferenzen \(D=M_A-M_B\) betrachtet.

Der linke Teil der folgenden Abbildung war das Ergebnis, wenn die \(H_0\) angenommen wird. Auf dieser Basis haben wir den kritischen Wert \(D_\text{krit} = 3\) berechnet, der etwa 5% aller auftretenden \(D\)-Werte rechts abschneidet (rote Balken). Solche \(D\)-Werte \(\geq D_\text{krit}\) treten zwar auch unter der \(H_0\)-Annahme auf, aber nur sehr selten. Haben wir in unserer einen Studie allerdings einen solchen Wert erhalten und uns für die \(H_1\) entschieden, obwohl in der Population die \(H_0\) gilt (was wir ja wissen, da wir es in der Simulation so implementiert haben), dann haben wir einen Fehler 1. Art bzw. einen \(\alpha\)-Fehler begangen. Ein \(D\)-Wert kleiner als \(D_\text{krit}\) wäre in diesem Fall eine richtige Entscheidung.

Wir haben am Ende von Teil 11 aber auch bereits eine Simulation angeschaut, in der beide Stichproben aus verschiedenen Populationen (mit einer Differenz von \(\mu_A-\mu_B = 3\)) stammten. Das Ergebnis ist im rechten Teil der folgenden Abbildung dargestellt. Nun sind etwa 25% der Differenzwerte \(D\geq D_\text{krit}\) (die blauen Balken). Deren relative Häufigkeit entspricht (approximativ) also der Wahrscheinlichkeit, bei Gültigkeit der angenommenen Alternativhypothese, ein signifikantes Ergebnis zu erhalten. In diesem Fall würden wir eine richtige Entscheidung treffen. Allerdings können wir selbst dann einen kleinen \(D\)-Wert erhalten (die orangenen Balken) und uns dann für die Beibehaltung der Nullhypothese entscheiden. Diese falsche Entscheidung wäre dann ein Fehler 2. Art oder \(\beta\)-Fehler.