2 Datensatz

In einer Erhebung wurde von N = 200 Personen der “Lernaufwand” in Stunden, die Anwesenheit in den relevanten LVs (“Anwesenheit_LVs” in Prozent), die Einschätzung der “Wichtigkeit” des entsprechenden Faches (1 = unwichtig, 10 = wichtig) und die Anwesenheit zu den Tutoriumseinheiten (“Anwesenheit_Tut”) erhoben. Das “Ergebnis” jeder Person liegt als erreichte Prozentpunkte bei der Klausur vor. Des weiteren sind noch die Probandennumer (“PNr”) und das “Geschlecht” (0 = M, 1 = W) gegeben.

PNr Geschlecht Ergebnis Lernaufwand Anwesenheit_LVs Anwesenheit_Tut Wichtigkeit
1 M 16.67 0.507 44.44 7.72 1
2 M 19.44 7.864 31.75 7.14 1
3 F 19.44 2.984 30.16 6.79 1
4 F 19.44 10.191 31.75 6.89 2
5 F 8.33 8.463 14.29 3.94 3
6 M 16.67 5.609 31.75 5.76 4
7 F 19.44 4.282 1.59 3.90 4
8 F 25.00 3.948 30.16 8.32 4
9 M 52.78 6.765 19.05 5.75 4
10 F 19.44 12.082 12.70 5.02 5

2.1 Modellvorstellung - Graphisch

2.2 Modellberechnung

2.2.1 Modell 1

Nachfolgend die Ergebnisse der einfachen linearen Regression des Modells:

\(\hat{y} = b_0 + b_1 \times x_1\)

Aufruf in R:

  model1 <- lm(Ergebnis ~ Lernaufwand, data = LV)
  Res    <- summary(model1)

Ergebnistabellen:

(#tab:Modell1_Ausgabe)Modellzusammenfassung
R_SE R2 AdjR2 FVal df1 df2 N pVal
value 18.3 0.335 0.331 99.6 1 198 200 0
(#tab:Modell1_Ausgabe)Koeffizienten
term estimate std.error statistic p.value
(Intercept) 37.3 2.093 17.80 0
Lernaufwand 1.6 0.161 9.98 0
(#tab:Modell1_Ausgabe)Residuen
Min 1Q.25% Median 3Q.75% Max
-42.5 -12.2 -0.109 10.3 58.9

2.2.2 Modell 2

Nachfolgend die Ergebnisse der einfachen linearen Regression des Modells:

\(\hat{y} = b_0 + b_2 \times x_2\)

Aufruf in R:

  model2 <- lm(Ergebnis ~ Anwesenheit_Tut, data = LV)
  Res2   <- summary(model2)

Ergebnistabellen:

(#tab:Modell2_Ausgabe)Modellzusammenfassung
R_SE R2 AdjR2 FVal df1 df2 N pVal
value 18.1 0.352 0.348 107 1 198 200 0
(#tab:Modell2_Ausgabe)Koeffizienten
term estimate std.error statistic p.value
(Intercept) 3.05 5.050 0.603 0.547
Anwesenheit_Tut 6.11 0.589 10.362 0.000
(#tab:Modell2_Ausgabe)Residuen
Min 1Q.25% Median 3Q.75% Max
-52.3 -11.2 -0.941 11.9 42.6

2.2.3 Modell 3

Nachfolgend die Ergebnisse der einfachen linearen Regression des Modells:

\(\hat{y} = b_0 + b_1 \times x_1 + b_2 \times x_2\)

Aufruf in R:

  model3 <- lm(Ergebnis ~ Lernaufwand + Anwesenheit_Tut, data = LV)
  Res3   <- summary(model3)

Ergebnistabellen:

(#tab:Modell3_Ausgabe)Modellzusammenfassung
R_SE R2 AdjR2 FVal df1 df2 N pVal
value 14.1 0.608 0.604 153 2 197 200 0
(#tab:Modell3_Ausgabe)Koeffizienten
term estimate std.error statistic p.value
(Intercept) -5.84 4.013 -1.46 0.147
Lernaufwand 1.41 0.125 11.36 0.000
Anwesenheit_Tut 5.43 0.463 11.73 0.000
(#tab:Modell3_Ausgabe)Residuen
Min 1Q.25% Median 3Q.75% Max
-37.1 -9.86 0.982 8.44 50.3

2.2.4 Standardisierte Koeffizienten

Bei den Ergebnissen im Modell 3 werden die Koeffizienten zwar auf statistische Signifikanz geprüft werden, aber eine Vergleichbarkeit zwischen der Gewichtung eines Koeffizienten zu den anderen im Modell befindlichen Koeffizienten ist nicht gegeben.

Um das zu erreichen, muss man einfach nur die standardisierten Koeffizienten berechnen. Nachfolgende Tabelle zeigt die standardisierten Werte für den jeweiligen Paramater:

Table 2.1: Standardisierte Koeffizienten
Parameter Std_Coefficient CI CI_low CI_high
(Intercept) 0.000 0.95 -0.088 0.088
Lernaufwand 0.511 0.95 0.422 0.599
Anwesenheit_Tut 0.527 0.95 0.439 0.616

Die Ergebnisse lassen nun den Vergleich der beiden verwendeten Prädiktoren über die standardisierten Koeffizienten zu.