Willkommen bei Stats by Randolph. Hier geht es zur Hauptseite mit weiteren Informationen und Inhalten.

Autor:innen dieser Seite: An den Inhalten dieser Seite haben mitgearbeitet: Markus Janczyk, Eva Röttger und Valentin Koob. Der Inhalt dieser Seite wird in der Lehre in den Studiengängen Psychologie von der AG Forschungsmethoden und Kognitive Psychologie an der Universität Bremen verwendet, steht aber allen Interessierten zur Verfügung. Rückmeldungen/Fehler/Vorschläge können gesendet werden an .

Versionshistory:

  • v1.2: leichte Modifizierung der Herleitung von \(r_{xy}^2\) als Güte der Regression (30.11.2023)
  • v1.1: sprachlich korrigierte und leicht überarbeitete Version (14.9.2023)
  • v1.0: erste online-gestellte Version (21.4.2023)

6 Einfache lineare Regression

Das Ziel der Regressionsrechnung ist es, eine mathematische Gleichung zu finden, die auf kompakte Art und Weise empirische Daten “bestmöglich” beschreibt. Dazu betrachten wir die Beispiele der nächsten Abbildung, in der die Daten von \(n=5\) Personen dargestellt sind, von denen das Alter und die Größe gemessen wurden.

Im linken Teil ist die Korrelation der beiden Variablen mit \(r=1.0\) angegeben und alle Punkte liegen klar auf einer Geraden. Diese Gerade hat die allgemeine Form

\[\text{Größe}=b\cdot\text{Alter}+a\] wobei \(b\) die Steigung und \(a\) der Achsenabschnitt ist. Im rechten Teil der Abbildung ist die die Korrelation der beiden Variablen \(r=0.95\) und natürlich liegen dann nicht mehr alle Daten auf einer Geraden. Dennoch scheint ein linearer Zusammenhang vorzuliegen und die eingezeichnete gestrichelte Gerade scheint eine intuitiv gute und kompakte Zusammenfassung der Daten zu sein, von der manche Datenpunkte nach oben und andere nach unten abweichen. Die Frage, wie \(b\) und \(a\) dieser Geraden gewählt werden müssen, um die Daten “möglichst gut” zu beschreiben, ist Thema dieses Kapitels.