Vorbereitung
Laden Sie zunächst den Datensatz
fb24
von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht entnehmen.
Prüfen Sie zur Sicherheit, ob alles funktioniert hat:
dim(fb24)
## [1] 192 50
Der Datensatz besteht aus 192 Zeilen (Beobachtungen) und mindestens (unter Einbeziehung der Ergänzungen) 50 Spalten (Variablen). Falls Sie bereits weitere eigene Variablen erstellt haben, kann die Spaltenzahl natürlich abweichen.
Aufgabe 1
Im Laufe der Aufgaben sollen Sie auch Funktionen aus Paketen nutzen, die nicht standardmäßig aktiviert und auch eventuell noch nicht installiert sind. Sorgen Sie in dieser Aufgabe zunächst dafür, dass Funktionen aus den Paketen psych
und car
nutzbar sind. Denken Sie an die beiden dargestellten Schritte aus dem Tutorial und auch daran, dass eine Installation nur einmalig notwendig ist.
Aufgabe 2
Die mittlere Lebenszufriedenheit (lz
) in Deutschland liegt bei
2.1 Was ist der Mittelwert der Stichprobe (
2.2 Sind die Lebenszufriedenheitswerte normalverteilt? Veranschaulichen Sie dies mit einer geeigneten optischen Prüfung. Benutzen Sie außerdem die qqPlot
-Funktion aus dem car
-Paket. Wann kann man in diesem Fall von einer Normalverteilung ausgehen?
2.3 Unterscheidet sich die Lebenszufriedenheit der Psychologie-Studierenden von der Lebenszufriedenheit der Gesamtbevölkerung (wie bereits geschrieben
Aufgabe 3
3.1 Unterscheidet sich der Mittelwert der Extraversionswerte (extra
) der Studierenden der Psychologie (1. Semester) von dem der Gesamtbevölkerung (
3.2 Sind die Offenheits-Werte (offen
) der Psychologie-Studierenden (1. Semester) größer als die Offenheits-Werte der Gesamtbevölkerung (
3.3 Überprüfen Sie Ihre Entscheidung aus 3.2 erneut, indem sie händisch ihren empirischen t-Wert ermittlen und mit dem entsprechenden kritischen t-Wert vergleichen.
3.4 Zeigen die Psychologie-Studierenden (1. Semester) höhere Werte auf der Verträglichkeits-Skala (vertr
) als die Grundgesamtheit (
Aufgabe 4
Folgende Aufgaben haben ein erhöhtes Schwierigkeitsniveau.
Nehmen Sie für die weiteren Aufgaben den Datensatz fb24
als Grundgesamtheit (Population) an.
4.1 Sie haben eine Stichprobe mit gewis
) von der Grundgesamtheit?
Berechnen Sie den angemessenen Test und bestimmen Sie das 95%ige Konfidenzintervall.
4.2 Ziehen Sie nun selbst eine Stichprobe mit set.seed(1234)
-Funktion. Versuchen Sie zunächst selbst mit Hilfe der sample()
-Funktion eine Stichprobe (
Code
anyNA(fb24$gewis) #NA's vorhanden
## [1] TRUE
set.seed(1234) #erlaubt Reproduzierbarkeit
fb24_sample <- fb24[sample(nrow(fb24), size = 31), ] #zieht eine Stichprobe mit n = 31
mean_gewis_pop <- mean(fb24$gewis, na.rm = TRUE) #Mittelwert der Population
sd_gewis_pop <- sd(fb24$gewis, na.rm = TRUE) * sqrt((length(na.omit(fb24$gewis)) - 1) / length(na.omit(fb24$gewis))) #empirische Standardabweichung der Population
se_gewis <- sd_gewis_pop / sqrt(length(na.omit(fb24$gewis))) #Standardfehler
mean_gewis_smpl2 <- mean(fb24_sample$gewis, na.rm = TRUE) #Mittelwert der Stichprobe
z_gewis2 <- (mean_gewis_smpl2 - mean_gewis_pop) / se_gewis #empirischer z-Wert
z_krit <- qnorm(1 - 0.05/2) #kritischer z-Wert, zweiseitig
abs(z_gewis2) > z_krit #signifikant
## [1] TRUE
2 * pnorm(z_gewis2) #p < .05, signifikant
## [1] 0.03659774
Untersuchen Sie erneut, ob sich die Stichprobe von der Grundgesamtheit (Population) in ihren Gewissenhaftigkeits-Werten unterscheidet. Berechnen Sie den angemessenen Test.