1 Einleitung

Für die Statistik und Datenanalyse stellt die lineare Regression ein fundamentales Werkzeug dar, um Beziehungen zwischen Variablen zu modellieren und zu verstehen. Während die einfache lineare Regression sich auf die Beziehung zwischen einer abhängigen und einer unabhängigen Variablen konzentriert, werden in der multiple lineare Regression (MR) mehrere unabhängige Variablen in ein Modell aufgenommen.

Die multiple lineare Regression erweitert daher das Konzept der einfachen linearen Regression, indem sie die Möglichkeit bietet, mehrere unabhängige Variablen gleichzeitig in die Analyse einzubeziehen. Dies ermöglicht es, komplexere Zusammenhänge zu quantifizieren und genauer zu verstehen, wie verschiedene Faktoren gleichzeitig Einfluss auf eine Zielvariable ausüben.

In der MR können wir nicht nur die individuellen Effekte verschiedener Prädiktoren analysieren, sondern auch deren Wechselwirkungen und kollektiven Beiträge zur Vorhersage der abhängigen Variable untersuchen. Darüber hinaus bietet die Methode die Möglichkeit zur Modellanpassung und Diagnose, um sicherzustellen, dass die Ergebnisse zuverlässig und aussagekräftig sind.

1.1 Formale Definitionen der linearen Modelle

1.1.1 Einfaches lineares Modell

Das einfache lineare Regressionsmodell beschreibt die Beziehung zwischen einer abhängigen Variable \(Y\) und einer einzigen unabhängigen Variable \(X\). Es wird durch die Gleichung definiert:

\[ Y = \beta_0 + \beta_1 X + \varepsilon \]

wobei: - \(Y\) die abhängige Variable ist, - \(\beta_0\) der Achsenabschnitt ist, - \(\beta_1\) der Koeffizient der unabhängigen Variable \(X\) ist, der die Steigung der Regressionslinie darstellt, - \(\varepsilon\) der Fehlerterm ist, der die Abweichung der tatsächlichen Beobachtungen von der vorhergesagten Linie darstellt.

Häufig verwendet man für die Koeffizienten auch die Bezeichnung Parameter der Gleichung. Durch die Angabe der Parameter ist das Modell eindeutig bestimmt. Im vorliegenden Fall bestimmen die zwei Parameter \(\beta_0\) und \(\beta_1 \forall X \in \mathbb{R}\) die Gerade.

Zur Erinnerung an das einfache lineare Modell betrachten wir nochmals die OLS{:target=“_blank”} Animation!

1.1.2 Erweitertes lineares Modell (Multiple Regression)

Das Multiple-Regression-Modell erweitert dieses Konzept und betrachtet mehrere unabhängige Variablen \(X_1, X_2, \ldots, X_p\). Das Modell wird wie folgt formuliert:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_p X_p + \varepsilon \]

wobei: - \(Y\) weiterhin die abhängige Variable ist, - \(\beta_0\) der Achsenabschnitt ist, - \(\beta_1, \beta_2, \ldots, \beta_p\) die Koeffizienten sind, die den Einfluss jeder unabhängigen Variable \(X_1, X_2, \ldots, X_p\) auf \(Y\) quantifizieren, - \(\varepsilon\) der Fehlerterm ist, der die unerklärte Variation oder Störgrößen umfasst.

In der multiple linearen Regression analysieren wir, wie jede unabhängige Variable \(X_i\) (für \(i = 1, 2, \ldots, p\)) zum Gesamtmodell beiträgt, sowie deren kollektive Wirkung auf die Zielvariable \(Y\).


Diese Modelle sind zentrale Werkzeuge zur Analyse von Zusammenhängen in Daten und finden in zahlreichen Anwendungsbereichen Verwendung von den Naturwissenschaften bis zur Wirtschaftsforschung.

1.2 Voraussetzungen für die Durchführung einer MR

Bei der Prüfung der Voraussetzungen der Modellierung von Daten durch ein (multiples) lineares Modell geht es im Prinzip nicht um die Durchführbarkeit der Berechnung

  • linearer Zusammenhang zwischen den \(x\)-Variablen und der \(y\)-Variable:
    • grafische Prüfung
    • Berechnung einer Korrelation \(r(x,y)\)
  • Metrisch skalierte \(y\)-Variable
  • Normalverteilte Fehlerterme
  • Homoskedastizität durch
    • grafische Prüfung
    • analytische Prüfung
  • Unabhängigkeit der Fehlerterme
    • keine Autokorrelation
      • Durbin-Watson-Tests
  • Multikollinearität
    • keine übermäßige Korrelation zwischen den unabhängigen Variablen.
  • Umgang mit fehlenden Werten
    • Fehlende Werte definieren, identifizieren und nach Möglichkeit ersetzen.
  • Kontrolle für einflussreiche Fälle bzw. “Ausreißer”