[Courtesy of pxhere](https://pxhere.com/en/photo/449195)

Tests für abhängige Stichproben

Kai J. Nehler, Carmen Köhler, Janine Buchholz, Julien P. Irmer, Tuo Liu, Talha Sajjad

Zuletzt aktualisiert am 3. Juli. 2025 Statistik I

Kernfragen dieser Lehreinheit über Gruppenvergleiche

Wie fertige ich Deskriptivstatistiken (Grafiken, Kennwerte) zur Veranschaulichung des Unterschieds zwischen zwei Gruppen an?
Was sind Voraussetzungen des abhängigen t-Tests und wie prüfe ich sie?
Wie führe ich einen abhängigen t-Test in R durch?
Wie berechne ich den standardisierten Populationseffekt für abhängige Stichproben?
Wie führe ich einen abhängigen Wilcoxon-Test in R durch?
Wie berichte ich statistische Ergebnisse formal?

Vorbereitende Schritte

Den Datensatz fb24 haben wir bereits über diesen Link heruntergeladen und können ihn über den lokalen Speicherort einladen oder Sie können Ihn direkt mittels des folgenden Befehls aus dem Internet in das Environment bekommen. In den vorherigen Tutorials und den dazugehörigen Aufgaben haben wir bereits Änderungen am Datensatz durchgeführt, die hier nochmal aufgeführt sind, um den Datensatz auf dem aktuellen Stand zu haben:

#### Was bisher geschah: ----

# Daten laden
load(url('https://pandar.netlify.app/daten/fb24.rda'))

# Nominalskalierte Variablen in Faktoren verwandeln
fb24$hand_factor <- factor(fb24$hand,
                             levels = 1:2,
                             labels = c("links", "rechts"))
fb24$fach <- factor(fb24$fach,
                    levels = 1:5,
                    labels = c('Allgemeine', 'Biologische', 'Entwicklung', 'Klinische', 'Diag./Meth.'))
fb24$ziel <- factor(fb24$ziel,
                        levels = 1:4,
                        labels = c("Wirtschaft", "Therapie", "Forschung", "Andere"))
fb24$wohnen <- factor(fb24$wohnen, 
                      levels = 1:4, 
                      labels = c("WG", "bei Eltern", "alleine", "sonstiges"))

# Rekodierung invertierter Items
fb24$mdbf4_r <- -1 * (fb24$mdbf4 - 5)
fb24$mdbf11_r <- -1 * (fb24$mdbf11 - 5)
fb24$mdbf3_r <- -1 * (fb24$mdbf3 - 5)
fb24$mdbf9_r <- -1 * (fb24$mdbf9 - 5)

# Berechnung von Skalenwerten
fb24$gs_pre  <- fb24[, c('mdbf1', 'mdbf4_r', 
                        'mdbf8', 'mdbf11_r')] |> rowMeans()
fb24$ru_pre <-  fb24[, c("mdbf3_r", "mdbf6", 
                         "mdbf9_r", "mdbf12")] |> rowMeans()

# z-Standardisierung
fb24$ru_pre_zstd <- scale(fb24$ru_pre, center = TRUE, scale = TRUE)

Nachdem wir uns mit unabhängige Stichproben in der letzten Sitzung beschäftigt haben, wollen wir uns diesmal mit abhängigen Stichproben beschäftigen. Abhängige Stichproben können in diversen Kontexten entstehen, beispielsweise wenn man Zwillinge und Paare untersucht oder wenn man Messwiederholungen durchführt. Im vorliegenden Beitrag werden die Fragestellungen an abhängigen Stichproben aufgrund von Messwiederholungen dargestellt. Die Methoden sind aber auf andere Arten abhängiger Stichproben übertragbar.

Mittelwertvergleich für abhängige Stichproben

Für den ersten Teil des Tutorials beschäftigen wir uns mit folgender Fragestellung: Gibt es einen Unterschied in den Werten der Subskalen ‘Ruhige vs. Unruhige Stimmung’ bei Psychologiestudierenden vor und nach der ersten Sitzung des Kurses? Wir geben in der Fragestellung keine Richtung des Effekts vor, da wir für Unterschiede in beide Richtungen uns Erklärungen vorstellen können. Ist nach dem Praktikum die Stimmung ruhiger, weil die Aufregung von der ersten Veranstaltung verflogen ist? Oder ist die Stimmung unruhiger, weil der erste Kontakt mit R stattgefunden hat?

Die Werte dieser Variablen zum zweiten Messzeitpunkt sind insofern voneinander abhängig, als dass jede Person dieselben Fragen zweimal beantwortet hat (Messwiederholung). Es gibt daher Faktoren innerhalb der Person, die einen gemeinsamen Teil der Varianz erzeugen. Im Datensatz fb24 ist der Skalenwert zur Ruhigen vs. Unruhigen Stimmung für den zweiten Messzeitpunkt bereits als ru_post hinterlegt. Den Skalenwert für die Ruhig vs. Unruhig Skala haben wir bereits bei den Aufgaben zur Deskriptivstatistik für Intervallskalen gebildet und passenderweise ru_pre genannt.

Deskriptivstatistik

Wie immer beginnen wir mit der deskriptivstatistischen Analyse unserer Daten. Die beiden Variablen können wir bspw. mit dem summary()-Befehl näher betrachten.

summary(fb24$ru_pre)

##    Min. 1st Qu.  Median    Mean 
##   1.000   2.250   2.750   2.777 
## 3rd Qu.    Max.    NA's 
##   3.250   4.000       1

summary(fb24$ru_post)

##    Min. 1st Qu.  Median    Mean 
##   1.500   2.250   2.500   2.472 
## 3rd Qu.    Max.    NA's 
##   2.750   3.500      58

Zunächst einmal ist offensichtlich, dass sich die Mittelwerte vor und nach der Sitzung unterscheiden. Die Frage bleibt aber bestehen, ob sich dieser Unterschied auf die Population verallgemeinern lässt. Weiterhin sticht hier direkt ins Auge, dass es in der Post-Variable fehlende Werte (58) gibt. Diese Personen können in die abhängige Testung nicht einbezogen werden, was im Folgenden berücksichtigt werden muss.

Mithilfe von Histogrammen stellen wir jeweils die Verteilungen der Werte vor und nach der Sitzung dar, wobei in den Histogrammen eine vertikale Linie eingefügt wird, die den jeweiligen Mittelwert anzeigt.

# Je ein Histogramm pro Werte, untereinander dargestellt, vertikale Linie für den jeweiligen Mittelwert
par(mfrow=c(2,1), mar=c(3,3,2,0))
hist(fb24$ru_pre, 
     xlim=c(1,5),
     ylim = c(0,80),
     main="Subskalen 'Ruhig vs. Unruhig' vor der Sitzung", 
     xlab="", 
     ylab="", 
     las=1)
abline(v=mean(fb24$ru_pre, na.rm = T), 
       lwd=3,
       col="aquamarine3")

hist(fb24$ru_post, 
     xlim=c(1,5),
     ylim = c(0,80),
     main="Subskalen 'Ruhig vs. Unruhig' nach der Sitzung", 
     xlab="", 
     ylab="", 
     las=1)
abline(v=mean(fb24$ru_post, na.rm = T), 
       lwd=3,
       col="darksalmon")

par(mfrow=c(1,1)) #Zurücksetzen des Plotfensters, zuvor hatten wir "dev.off()" kennengelernt

Die Funktion abline() fügt diese zusätzliche Linie in die Grafik ein. Mit dem Zusatzargument v geben wir an, dass es sich um eine vertikale Linie handeln soll. Der Ort der vertikalen Linie wird auch direkt über das Argumen v gesteuert. In dem Code soll diese jeweils den Mittelwert der beiden Gruppen kennzeichnen. Insgesamt scheinen sich die beiden Verteilungen zu unterscheiden: Der Mittelwert der Skala vor der Sitzung liegt höher als der nach der Sitzung. Beachten Sie jedoch, dass hier Personen mit fehlenden Werten auf der Post-Variable noch nicht ausgeschlossen sind, wodurch die späteren Ergebnisse anders ausfallen könnten.

Voraussetzungsprüfung

Um unsere inferenzstistische Entscheidung mittels der $t$ -Verteilung abzusichern, müssen dessen Voraussetzungen erfüllt sein:

Voraussetzungen für die Durchführung des t-Tests für abhängige Stichproben:

Die abhängige Variable ist intervallskaliert $\to$ ok
Die Messwerte innerhalb der Paare dürfen sich gegenseitig beeinflussen/voneinander abhängig sein; keine Abhängigkeiten zwischen den Messwertpaaren $\to$ ok
Die Differenzvariable $d$ muss in der Population normalverteilt sein $\to$ ggf. grafische Prüfung

Wir müssen also nur die Voraussetzung der Normalverteilung der Differenzvariable $d$ zusätzlich prüfen. Analog zu den unabhängigen Tests ist es üblich, diese Annahme grafisch basierend auf der Stichprobe zu testen. Da wir hier die Differenzvariable betrachten wollen, müssen wir diese zunächst erstellen. Dies geht zum Glück sehr einfach, indem wir die Werte aller Personen auf ru_pre jeweils von ihren ru_post Werten abziehen. Personen mit einem fehlenden Wert auf einer der beien Variable erhalten auf difference jetzt automatisch ein NA. Somit sind alle Werte in den Grafiken diejenigen, die dann auch in unsere inferenzstatistische Prüfung eingehen. Daraufhin schauen wir uns das Histogramm der Differenzvariable und den QQ-Plot an:

difference <- fb24$ru_post-fb24$ru_pre
hist(difference, 
     xlim=c(-3,3), 
     ylim = c(0,1),
     main="Verteilung der Differenzen", 
     xlab="Differenzen", 
     ylab="", 
     las=1, 
     freq = F)
curve(dnorm(x, mean=mean(difference, na.rm = T), sd=sd(difference, na.rm = T)), 
      col="blue", 
      lwd=2, 
      add=T)

qqnorm(difference)
qqline(difference, col="blue")

Auf den Abbildungen sind kleine Abweichungen der Differenzen von der Normalverteilung zu sehen. Allerdings gilt (analog zu den Einstichproben- und unabhängigen Tests) der zentrale Grenzwertsatz. In Fällen, in denen die Stichprobe (also die Anzahl an Messwertpaaren) ausreichend groß ist, folgt die Stichprobenkennwerteverteilung auch unabhängig von der Verteilung der Differenzen in der Population der $t$ -Verteilung. “Ausreichend groß” ist natürlich Auslegungssache, aber nochmal zur Erinnerung: Bei Stichproben ab $n \geq 30$ greift der Effekt, wenn das Merkmal zumindest symmetrisch verteilt ist. Andere Empfehlungen gehen besonders bei sehr schiefen Verteilungen in Richtung von 80 Messwertpaaren. Die kleinen Abweichungen von der Normalverteilung und die große Stichproben sprechen also dafür, dass unsere Stichprobenkennwerteverteilung der $t$ -Verteilung folgt. Wir können also mit der inferenzstatistischen Überprüfung starten.

Durchführung des $t$ -Test für abhängige Stichproben

Aus der Fragestellung lässt sich ableiten, dass es sich bei unserer Untersuchung um eine Unterschiedshypothese handelt, in der wir keine Richtung angenommen haben. Beginnen wir also damit, das Hypothesenpaar auszuarbeiten.

$H_{0}$ : Studierende sind vor und nach dem Praktikum gleich ruhig.
$H_{1}$ : Studierende sind vor und nach dem Praktikum unterschiedlich ruhig.

Etwas formaler ausgedrückt:

$H_{0}$ : $μ_{vor} = μ_{nach}$ bzw. $μ_{d} = 0$
$H_{1}$ : $μ_{vor} \neq μ_{nach}$ bzw. $μ_{d} \neq 0$

Bevor wir jetzt die Rechnungen durchführen, sollten wir noch das Signifikanzniveau der Untersuchung festlegen. Es soll hier 5% betragen. $\to$ $α = .05$

Wir verwenden hier die Funktion t.test(). Diesmal müssen wir allerdings die beiden Variablen einzeln der Funktion übergeben. Dies geschieht über die Argumente x und y. Das Argument paired = T führt dazu, dass der t-Test für abhängige (gepaarte) Stichproben durchgeführt wird.

t.test(x = fb24$ru_post, y = fb24$ru_pre, # die beiden abhaengigen Variablen
      paired = T,                      # Stichproben sind abhaengig
      conf.level = .95)

## 
## 	Paired t-test
## 
## data:  fb24$ru_post and fb24$ru_pre
## t = -3.5338, df = 133, p-value =
## 0.000564
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -0.4481323 -0.1264946
## sample estimates:
## mean difference 
##      -0.2873134

Auf den ursprünglichen Variablen sind immer noch die Personen mit fehlenden Werten enthalten. Trotzdem meldet die Funktion t.test() kein Problem. Was passiert hier also? Ein Indiz können uns die Freiheitsgrade bieten, die mit $n - 1$ bestimmt werden. Hier wird deutlich, dass Personen mit fehlenden Werten auf einer der beiden Variablen einfach ignoriert werden. Aber man bekommt (außer der überraschend kleinen Freiheitsgrade im Vergleich zur Größe des Datensatzes) keine Warnung oder Fehlermeldung dazu. Hinsichtlich der Interpretation können wir aus dem Befehl folgende Ergebnisse entnehmen: $t$ (133) = -3.53 mit einem zugehörigen p-Wert ( $p < .01$ ). Da unser p-Wert unter dem festgelegten $α$ -Fehlerniveau liegt, verwerfen wir die $H_{0}$ und nehmen die $H_{1}$ an.

Schätzung des standardisierten Populationseffekts

Formel: $Cohen’s d^{″} = \frac{\bar{d}}{{\hat{s d}}_{d}}$ wobei

$\bar{d}$ : Mittelwert der Differenz aller Wertepaare
${\hat{s d}}_{d}$ : geschätzte SD der Differenzen

Wir führen die Berechnung von Cohen’s $d$ für abhängige Stichproben zunächst händisch durch. Dafür speichern wir die nötigen Größen ab und wenden dann die präsentierte Formel an:

mean_d <- mean(difference, na.rm = T)
sd.d.est <- sd(difference, na.rm = T)
d_Wert <- mean_d/sd.d.est
d_Wert

## [1] -0.3052702

Berechnung mit Funktion cohen.d()

if (!requireNamespace("effsize", quietly = TRUE)) {
  install.packages("effsize")
}
library("effsize")

d2 <- cohen.d(fb24$ru_post, fb24$ru_pre, 
      paired = TRUE,  #paired steht fuer 'abhaengig'
      within = FALSE, #wir brauchen nicht die Varianz innerhalb
      na.rm = TRUE)   
d2

## 
## Cohen's d
## 
## d estimate: -0.3052702 (small)
## 95 percent confidence interval:
##      lower      upper 
## -0.4792767 -0.1312636

Mit dem Argument within = T, was der Default ist, wird für die Varianzberechnung die Varianz innerhalb der Gruppen herangezogen (vergleiche Formel Cohen’s $d$ für unanghängige Stichproben). Neben der Punktschätzung der Effektstärke erhalten wir auch eine Einordnung über die Größe (medium) und ein Konfidenzintervall.

Die Einordnung durch das Paket unterscheidet sich aber teils von den Konventionen nach Cohen (1988), die es auch für abhängige Stichproben gibt (Konventionen für den abhängigen und unabhängigen $t$ -Test unterscheiden sich auch!). Die unterschiedlich Einordnung des Paketes zu der Tabelle macht nochmal deutlich, dass diese Konventionen nur grobe Orientierungen sind, die nur bei völliger Ahnungslosigkeit genutzt werden sollten und sonst Effekstärken im Rahmen des Anwendungsgebietes eingeordnet werden sollten.

d’’	Interpretation
~ .14	kleiner Effekt
~ .35	mittlerer Effekt
~ .57	großer Effekt

Zusammenfassend lässt sich sagen: Der standardisierte Populationseffekt beträgt $d_{2}^{″}$ = -0.31 und ist laut Konventionen groß, laut der Aussage des Paketes aber medium.

Ergebnisinterpretation

Bereits auf deskriptivstatistischer Ebene stellen wir einen Unterschied fest: Der Mittelwert der Differenzen zwischen ruhig und unruhig beträgt -0.29. Zur Beantwortung der Fragestellung wurde ein ungerichteter $t$ -Test für abhängige Stichproben durchgeführt. Der Unterschied zwischen den beiden Messzeitpunkten ist signifikant ( $t$ (133) = -3.53, $p < .01$ ), somit wird die Nullhypothese verworfen. Dieser Unterschied ist nach dem standardisierten Populationseffekt von $d_{2}^{″}$ = -0.31 mittel bis groß.

Medianvergleich für abhängige Stichprobe

Auch für die abhängigen Stichproben lernen wir wieder einen Test kennen, bei den es uns um den Vergleich von Medianen anstatt Mittelwerten gehen. Der präsentierte Wilcoxon-Vorzeichen-Rangtest ist eine Option, wenn wir eine stetige Variable haben, für die der Mittelwert keine sinnvolle Repräsentation der zentralen Tendenz darstellt. Ein häufiges Anwendungsbeispiel ist dabei die Antwortzeit von Proband:innen. Spezifisch haben wir sowohl bei der ersten Erhebung vor dem Praktikum als auch bei der zweiten Erhebung nach dem Praktikum die Zeit gemessen, die Sie für das Ausfüllen des MDBF benötigt haben. Wir möchten der Fragestellung, ob die Bearbeitungszeit sich zwischen den beiden Zeitpunkten unterscheidet nachgehen. Waren Sie bei der zweiten Erhebung schneller - bspw. weil Sie die Fragen schon kannten? Oder waren Sie bei der ersten Erhebung schneller, da Sie dort noch Energie hatten?

Deskriptivstatistik

Schauen wir uns zunächst in der deskriptivstatistischen Betrachtung an, warum wir für die Bearbeitungszeit des MDBF einen Median- und keinen Mittelwertvergleich durchführen wollen. Dafür erstellen wir ein Histogramm für die Bearbeitungszeit vor und nach dem Praktikum.

par(mfrow=c(1,2), mar=c(3,3,2,0))
hist(fb24$time_pre, 
     main="Bearbeitungszeit \nvor dem Praktikum", 
     breaks = 10)


hist(fb24$time_post, 
     main="Bearbeitungszeit \nnach dem Praktikum",
     breaks = 10)

par(mfrow=c(1,1)) #Zurücksetzen des Plotfensters

Die hier gefundenen Bearbeiungszeiten stellen ein typisches Bild für das Verhalten von Antwortzeiten dar. Es gibt eine große Anzahl an Personen, die relativ schnell antworten, aber auch einige Personen, die sehr lange brauchen. Die Verteilung ist daher linkssteil und rechtsschief. Der Median wird als besserer Repräsentant für die mittlere Ausprägung angesehen, da er weniger anfällig für die Schiefe ist.

Den Median und weitere deskriptive Statistiken können wir uns mit dem summary()-Befehl anzeigen lassen.

summary(fb24$time_pre)

##    Min. 1st Qu.  Median    Mean 
##   12.00   34.00   42.00   47.85 
## 3rd Qu.    Max. 
##   58.00  131.00

summary(fb24$time_post)

##    Min. 1st Qu.  Median    Mean 
##   14.00   27.00   35.50   41.87 
## 3rd Qu.    Max.    NA's 
##   52.75  159.00      58

Es zeigt sich auch hier wieder, dass es nach dem Praktikum einige fehlende Werte gibt. Das heißt, dass unsere deskriptiven Betrachtungen nicht so aussagekräftig sind an dieser Stelle. Diese würde eine Veränderung in der mittleren Ausprägung der Bearbeitungszeit zeigen, da die Mediane sich unterscheiden.

Voraussetzungsprüfung

Bevor wir aber in die inferenzstatistische Betrachtung gehen, prüfen wir, ob wir zur Beantwortung der Fragestellung einen Wilcoxon-Vorzeichen-Rangtest verwenden können anhand der Voraussetzungen:

die Messwerte innerhalb der Paare dürfen sich gegenseitig beeinflussen/voneinander abhängig sein; keine Abhängigkeiten zwischen den Messwertpaaren $\to$ ok
die Variable ist stetig $\to$ ok
die Differenzvariable ist hinsichtlich der Größe reliabel $\to$ bedeutet für uns, dass wir eine Intervallskalierung brauchen, damit die Differenzen zweier Messwertpaare vergleichbar sind
die Differenzvariable ist symmetrisch verteilt (nicht notwendigerweise normalverteilt; ggf. grafische Prüfung oder Hintergrundwissen)

Die erste Voraussetzung nehmen wir, wie beschrieben, als gegeben an, da die Messwerte Prä und Post einer Messwiederholung entsprechen und zwischen den einzelnen Personen keine Abhängigkeiten bestehen sollten. Durch die Verwendung der Reaktionszeiten handelt es sich um eine stetige Variable. Hinsichtlich der Skalierung unserer Variable gehen wir davon aus, dass sie mindestens intervallskaliert ist. Diese Skalierung wird benötigt, da im ersten Schritt die Differenzen zwischen dem Prä- und dem Post-Wert berechnet wird.

Zuletzt bleibt noch die Voraussetzung, dass die Differenzvariable symmetrisch verteilt ist. Wir betrachten die Differenzwerte, indem wir zunächst einen Vektor mit dem Namen dif_time definieren, der die Differenzen aller Personen enthält. Anschließend schauen wir uns auch zu diesem Vektor das Histogramm an.

dif_time <- fb24$time_post - fb24$time_pre
hist(dif_time,
     main="Differenzen Bearbeitungszeiten",
     breaks = 10)

Die Differenzen weisen Abweichungen von der Symmetrie-Annahme vor, die vor allem von Ausreißern bestimmt wird. Jedoch sind dies nur einzelne, wenige Fälle, weshalb wir die inferenzstatistische Testung trotzdem durchführen. Mehr Informationen zu Ausreißern und deren Behandlung erhalten Sie im nächsten Semester hier.

Durchführung des Wilcoxon-Vorzeichen-Rangtest für abhängige Stichproben

Aus unserer Fragestellung wird eine Unterschiedsyhpothese deutlich, die keine Richtung vorgibt - schließlich haben wir Überlegungen in beide Richtungen anstellen können. Das Hypothesenpaar sieht folgendermaßen aus:

$H_{0}$ : $η_{nach} = η_{vor}$
$H_{1}$ : $η_{nach} \neq η_{vor}$

Weiterhin muss das Signifikanzniveau vor der Untersuchung festgelegt werden. Es soll hier 5% betragen. $\to$ $α = .05$ .

Die Argumente der Funktion für den Wilcoxon-Vorzeichen-Rangsummentest für abhängige Stichproben sehen dem des $t$ -Tests für abhängige Stichproben sehr ähnlich.

wilcox.test(x = fb24$time_pre, 
            y = fb24$time_post,          # die beiden abhängigen Gruppen
            paired = T,                  # Stichproben sind abhängig
            alternative = "two.sided",   # ungerichtete Hypothese
            exact = F,                   # Approximation?
            conf.level = .95)            # alpha = .05

## 
## 	Wilcoxon signed rank test with
## 	continuity correction
## 
## data:  fb24$time_pre and fb24$time_post
## V = 5608.5, p-value = 0.0008746
## alternative hypothesis: true location shift is not equal to 0

Durch das Argument exact kann angegeben werden, ob man einen exakten p-Wert oder eine Approximation ausgeben lassen will – in spezifischen Konstellationen kann man diese Wahl treffen. Für Fälle mit Rangbindungen und Differenzen von 0 wird eine Approximation genutzt, die wir hier auch uns anzeigen lassen. Hinsichtlich der Signifikanzentscheidung ist aus dem Output ersichtlich, dass der empirische Wert bei V = 5608.5 liegt und der zugehörige p-Wert bei $p < .01$ . Wir würden dementsprechend die H0 verwerfen. Im Gegensatz zum $t$ -Test fällt uns auch auf, dass kein Konfidenzintervall ausgegeben wird, was uns aber nicht weiter stört, da wir unsere Hypothesen prüfen konnten.

Ergebnisinterpretation

Da der Mittelwert für die Bearbeitungszeiten kein sinnvolles Maß für die zentrale Tendenz darstellt, wurde ein Wilcoxon-Vorzeichen-Rangtest für abhängige Stichproben durchgeführt, um die Mediane zu vergleichen. Zunächst findet sich deskriptiv ein Unterschied: Vor der Praktikum ist der Median der Bearbeiungszeit (42) anders als nach der Therapie (35.5). Der Unterschied wurde bei einem Signifikanzniveau von $α = .05$ signifikant (V = 5608.5, $p$ < .01). Somit wird die Nullhypothese verworfen und es wird angenommen, dass sich die mittlere Bearbeitungszeit vor und nach dem Praktikum unterscheidet.

Abhängige Stichproben T-Test Wilcoxon-Test Voraussetzungsprüfung

Tests für abhängige Stichproben

Vorbereitende Schritte

Mittelwertvergleich für abhängige Stichproben

Deskriptivstatistik

Voraussetzungsprüfung

Durchführung des $t$ -Test für abhängige Stichproben

Schätzung des standardisierten Populationseffekts

Ergebnisinterpretation

Medianvergleich für abhängige Stichprobe

Deskriptivstatistik

Voraussetzungsprüfung

Durchführung des Wilcoxon-Vorzeichen-Rangtest für abhängige Stichproben

Ergebnisinterpretation

Kai J. Nehler

Teammitglied

Carmen Köhler

Autorin

Janine Buchholz

Autorin

Julien P. Irmer

Teammitglied

Tuo Liu

Autor

Talha Sajjad

Autor

Tests für abhängige Stichproben

Vorbereitende Schritte

Mittelwertvergleich für abhängige Stichproben

Deskriptivstatistik

Voraussetzungsprüfung

Durchführung des t-Test für abhängige Stichproben

Schätzung des standardisierten Populationseffekts

Ergebnisinterpretation

Medianvergleich für abhängige Stichprobe

Deskriptivstatistik

Voraussetzungsprüfung

Durchführung des Wilcoxon-Vorzeichen-Rangtest für abhängige Stichproben

Ergebnisinterpretation

Kai J. Nehler

Teammitglied

Carmen Köhler

Autorin

Janine Buchholz

Autorin

Julien P. Irmer

Teammitglied

Tuo Liu

Autor

Talha Sajjad

Autor

Durchführung des $t$ -Test für abhängige Stichproben