[Courtesy of pxhere](https://pxhere.com/en/photo/449195) Courtesy of pxhere

Tests für abhängige Stichproben - Lösungen

Vorbereitung

Laden Sie zunächst den Datensatz fb23 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht entnehmen.

Aufgabe 1

Zu Beginn und nach der ersten Pratikumssitzung wurden Sie als Studierende nach Ihrem Befinden zum Zeitpunkt der Umfrage befragt. Hierbei wurde unteranderem erhoben, wie wach (hohe Werte) oder müde (niedrige Werte) Sie sich zu beiden Zeitpunkten gefühlt haben (Variable wm_pre und wm_post). Nun wollen Sie untersuchen, ob die Teilnahme am Statistikpraktikum einen Einfluss auf das Befinden der Studierenden hat. Sie gehen davon aus, dass sich die Angaben zu Wach vor und nach dem Praktikum unterscheidet ohne eine Richtung anzunehmen.

  • Stellen Sie zunächst das Hypothesenpaar der Testung inhaltich und auch mathematisch auf. Spezifizieren Sie das Signifikanzniveau. Dieses soll so gewählt werden, dass wir die Nullhypothese in 1 von 20 Fällen fälschlicherweise verwerfen würden.
Lösung

Hypothesen

  • Art des Effekts: Unterschiedshypothese
  • Richtung des Effekts: ungerichtete Hypothese
  • Größe des Effekts: Unspezifisch

Hypothesenpaar (inhaltlich):
H0: Die Teilnahme am Statistikpraktikum wirkt sich nicht auf das Wachempfinden der Studierenden aus. H1: Die Teilnahme am Statistikpraktikum wirkt sich auf das Wachempfinden der Studierenden aus.

Hypothesenpaar (statistisch):

  • $H_0$: $\eta_\text{nachher} = \eta_\text{vorher}$ bzw. $\mu_{d} = 0$
  • $H_1$: $\eta_\text{nachher} \neq \eta_\text{vorher}$ bzw. $\mu_{d} \neq 0$

Spezifikation des Signifikanzniveaus

$\alpha = .05$

  • Bestimmen Sie die deskriptivstatistischen Maße und bewerten Sie diese im Hinblick auf die Hypothesen. Beachten Sie, dass bei der späteren inferenzstatistischen Testung nur Personen eingehen, die zu beiden Messzeitpunkten Angaben gemacht haben. Schließen Sie also Personen mit fehlenden Werten auf einer (oder beiden) Variablen vor der Berechnung der deskriptivstatistischen Maße aus.
Lösung

Bevor es weiter geht:

Ein Blick in den fb23-Datensatz verrät, dass auf dem Skalenwert wm_post, der Messung des Wachempfindens zum zweiten Zeitpunkt, Werte fehlen. Diese fehlenden Werte werden als NA abgebildet.

Um verfälschte deskriptiv- und inferenzstatistische Ergebnisse zu vermeiden, werden alle Personen aus der weiteren Berechung ausgeschlossen, die einen fehlenden Wert auf wm_post (oder wm_pre) aufweisen. Damit wir den Datensatz fb23 aber nicht generell verändern, legen wir estmal einen neuen Datesatz an, der nur die beiden interessierenden Variablen enthält.

wach <- fb23[, c("wm_pre", "wm_post")] #Erstellung eines neuen Datensatzes, welcher nur die für uns wichtigen Variablen enthält

wach <- na.omit(wach) #Entfernt alle Beobachtungen, die auf einer der beiden Variable einen fehlenden Wert haben

str(wach) #Ablesen der finalen Stichprobengröße
## 'data.frame':	146 obs. of  2 variables:
##  $ wm_pre : num  2.5 2.25 2.75 3 2.25 2.25 2.5 1.75 3.25 2.5 ...
##  $ wm_post: num  2 1 3.75 3 3.25 2 3.25 2 1.5 3 ...
##  - attr(*, "na.action")= 'omit' Named int [1:33] 4 6 14 15 17 24 25 28 44 47 ...
##   ..- attr(*, "names")= chr [1:33] "4" "7" "15" "16" ...

Nach dem Entfernen der fehlenden Werte haben wir eine Stichprobengröße von $n = 147$.

Deskriptivstatistische Überprüfung der Hypothesen: grafisch

Histogramme (weil die Skalenwerte Intervallskalenqualität haben): Je ein Histogramm pro Gruppe, untereinander dargestellt, vertikale Linie für den jeweiligen Mittelwert.

par(mfrow=c(2,1), mar=c(3,2,2,0)) # Zusammenfügen der zwei Histogramme in eine Plot-Datei und ändern der Ränder (margins) des Plot-Fensters

hist(wach[, "wm_pre"], xlim=c(0,5), ylim=c(1,50), main="Wachempfinden vor der Sitzung", xlab="", ylab="", las=1)
abline(v=mean(wach[, "wm_pre"]), lty=2, lwd=2)

hist(wach[, "wm_post"], xlim=c(0,5), ylim=c(1,50), main="Wachempfinden nach der Sitzung", xlab="", ylab="", las=1)
abline(v=mean(wach[, "wm_post"]), lty=2, lwd=2)

par(mfrow=c(1,1)) #Zurücksetzen auf default

Deskriptivstatistische Beantwortung der Fragestellung: statistisch

summary(wach[, "wm_pre"])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    2.25    2.75    2.63    3.00    4.00
summary(wach[, "wm_post"])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    2.00    2.50    2.58    3.00    4.00
# aus dem Paket psych, das wir bereits installiert haben
library(psych)
describe(wach[, "wm_pre"])
##    vars   n mean   sd median trimmed  mad min max range  skew kurtosis   se
## X1    1 146 2.63 0.59   2.75    2.64 0.74   1   4     3 -0.19    -0.29 0.05
describe(wach[, "wm_post"])
##    vars   n mean   sd median trimmed  mad min max range  skew kurtosis   se
## X1    1 146 2.58 0.69    2.5    2.59 0.74   1   4     3 -0.15    -0.41 0.06

Der Mittelwert vorher ($M$ = 2.63, $SD$ = 0.59) ist deskriptiv niedriger als Mittelwert nachher ($M$ = 2.58, $SD$ = 0.69).

Die deskriptivstatistischen Maße unterscheiden sich.

  • Welcher inferenzstatistische Test ist zur Überprüfung der Hypothesen am geeignetsten? Prüfen Sie die Voraussetzungen dieses Tests.
Lösung

Voraussetzungen für t-Test für abhängige Stichproben

  1. Die abhängige Variable ist intervallskaliert $\rightarrow$ ok

  2. Die Messwerte innerhalb der Paare dürfen sich gegenseitig beeinflussen/voneinander abhängig sein; keine Abhängigkeiten zwischen den Messwertpaaren $\rightarrow$ ok

  3. Die Stichprobenkennwerteverteilung der mittleren Mittelwertsdifferenz muss in der Population normalverteilt sein (ist gegeben, wenn die Verteilung der Mittelwertsdifferenzen in der Stichprobe normalverteilt ist) $\rightarrow$ ab $n > 30$ ist Normalverteilung der Stichprobenkennwerteverteilung durch zetralen Grenzwertsatz gegeben, ansonsten grafische Prüfung oder Hintergrundwissen $\rightarrow$ mit $n = 147$ erfüllt; Überprüfung der Normalverteilung von d wird hier aus Übungszwecken trotzdem mit aufgeführt.

Grafische Voraussetzungsprüfung: Normalverteilung von d

par(mar=c(3,3,3,0)) #ändern der Ränder (margins) des Plot-Fensters
difference <- wach[, "wm_pre"]-wach[, "wm_post"]
hist(difference, xlim=c(-4,4), main="Verteilung der Differenzen", xlab="Differenzen", ylab="", las=1,freq=F)
curve(dnorm(x, mean=mean(difference), sd=sd(difference)), col="blue", lwd=2, add=T)

par(mfrow=c(1,1)) #Zurücksetzen auf default
qqnorm(difference,las=1)
qqline(difference, col="blue")

$\Rightarrow$ Differenzen weisen leichte bis mittlere Abweichungen zur Normalverteilung auf. Symmetrie trotzdem gegeben und auf Grund des zentralen Grenzwertsatzes und der Stichprobengröße $\Rightarrow$ Durchführung des t-Tests für abhängige Stichproben

  • Führen Sie die inferenzstatistische Testung durch.
Lösung

Durchführung des t-Tests für abhängige Stichproben in R

t.test(x = wach[, "wm_pre"], y  = wach[, "wm_post"], # die Werte vorher und nachher
       paired = T,                                   # Stichproben sind abhängig
       alternative = "two.sided",                    # unggerichtete Hypothese -> zweiseitig Testung
       conf.level = .95)                             # alpha = .05
## 
## 	Paired t-test
## 
## data:  wach[, "wm_pre"] and wach[, "wm_post"]
## t = 1.0791, df = 145, p-value = 0.2823
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -0.04129183  0.14060690
## sample estimates:
## mean difference 
##      0.04965753
# Alternative Schreibweise
t.test(x = wach$wm_pre, y = wach$wm_post, 
       paired = T,
       alternative = "two.sided",
       conf.level = .95)
  • Zur Erinnerung: $df$ bei $t$-test mit abhängigen Stichproben: $n - 1$ (wobei $n$ die Anzahl der Paare darstellt)
  • t(145) = 1.079, $p =$ 0.282 $\rightarrow$ nicht signifikant, H0 wird beibehalten.
  • Bestimmen Sie unabhängig von der Signifikanzentscheidung die zugehörige Effektstärke.
Lösung

Schätzung des standardisierten Populationseffekts

mean_d <- mean(difference) # Mittelwert der Differenzen
sd.d.est <- sd(difference) # geschätzte Populationsstandardabweichung der Differenzen
d <- mean_d/sd.d.est
d
## [1] 0.08930936

$\Rightarrow$ Der standardisierte Populationseffekt beträgt d2’’ = 0.09 und ist laut Konventionen nach Cohen (1988) klein.

Zu beachten ist, dass der standardisierte Populationseffekt auf der vorher berechneten Differenzvariable basiert. Aus diesem Grund hat der Effekt ein negatives Vorzeichen.

Zur Berechnung der Differenzvariable wurden von den Prä-Messungen die Post-Messungen abgezogen. Ein negatives Vorzeichen des standardisierten Populationseffektes deutet also, wie auch unsere deskriptivstatistischen Ergebnisse, darauf hin, dass die Teilnahme am Statistikpraktikum einen positiven Effekt auf das Wachempfinden haben könnte. Dies könnte man in einer weiteren Studie inferenzstatistisch überprüfen.

  • Berichten Sie die Ergebnisse formal (in schriftlicher Form).
Lösung

Formales Berichten des Ergebnisses

Es wurde in einer Wiederholungsmessung untersucht, ob sich die Teilnahme am Statistikpraktikum auf das Wachempfinden auswirkt. Zunächst findet sich deskriptiv folgender Unterschied: Vor der Praktikumssitzung liegt der durchschnittliche Zufriedenheitswert bei 2.63 (SD = 0.59), während er nach der Praktikumssitzung bei 2.58 (SD = 0.69) liegt.

Zur Beantwortung der Fragestellung wurde ein ungerichteter $t$-Test für abhängige Stichproben durchgeführt. Der Gruppenunterschied ist nicht signifikant ($t$(145) = 1.079, $p =$ 0.282), somit wird die Nullhypothese beibehalten. Wir gehen davon aus, dass sich die Teilnahme am Statistikpraktikum nicht auf das Wachempfinden auswirkt.

Der standardisierte Populationseffekt von d’’ = 0.09 ist laut Konventionen nach Cohen (1988) klein.

Kai J. Nehler
Kai J. Nehler
Teammitglied