[Courtesy of pxhere](https://pxhere.com/en/photo/1217289)

Korrelation - Aufgaben

Kai J. Nehler, Anna Winkler, Tobias Vogler, Marvin Schröder

Zuletzt aktualisiert am 11. Dez.. 2024 Statistik I Übungen

Vorbereitung

Laden Sie zunächst den Datensatz fb24 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht entnehmen.

Prüfen Sie zur Sicherheit, ob alles funktioniert hat:

dim(fb24)

## [1] 192  55

names(fb24)

##  [1] "mdbf1"      
##  [2] "mdbf2"      
##  [3] "mdbf3"      
##  [4] "mdbf4"      
##  [5] "mdbf5"      
##  [6] "mdbf6"      
##  [7] "mdbf7"      
##  [8] "mdbf8"      
##  [9] "mdbf9"      
## [10] "mdbf10"     
## [11] "mdbf11"     
## [12] "mdbf12"     
## [13] "time_pre"   
## [14] "lz"         
## [15] "extra"      
## [16] "vertr"      
## [17] "gewis"      
## [18] "neuro"      
## [19] "offen"      
## [20] "prok"       
## [21] "nerd"       
## [22] "uni1"       
## [23] "uni2"       
## [24] "uni3"       
## [25] "uni4"       
## [26] "grund"      
## [27] "fach"       
## [28] "ziel"       
## [29] "wissen"     
## [30] "therap"     
## [31] "lerntyp"    
## [32] "hand"       
## [33] "job"        
## [34] "ort"        
## [35] "ort12"      
## [36] "wohnen"     
## [37] "attent"     
## [38] "gs_post"    
## [39] "wm_post"    
## [40] "ru_post"    
## [41] "time_post"  
## [42] "attent_post"
## [43] "hand_factor"
## [44] "fach_klin"  
## [45] "unipartys"  
## [46] "mdbf4_r"    
## [47] "mdbf11_r"   
## [48] "mdbf3_r"    
## [49] "mdbf9_r"    
## [50] "mdbf5_r"    
## [51] "mdbf7_r"    
## [52] "wm_pre"     
## [53] "gs_pre"     
## [54] "ru_pre"     
## [55] "ru_pre_zstd"

Der Datensatz besteht aus 192 Zeilen (Beobachtungen) und 55 Spalten (Variablen). Falls Sie bereits eigene Variablen erstellt haben, kann die Spaltenzahl natürlich abweichen.

Aufgabe 1

Das Paket psych enthält vielerlei Funktionen, die für die Analyse von Datensätzen aus psychologischer Forschung praktisch sind. Eine von ihnen (describe()) erlaubt es, gleichzeitig verschiedene Deskriptivstatistiken für Variablen zu erstellen.

Installieren (falls noch nicht geschehen) und laden Sie das Paket psych.
Nutzen Sie den neugewonnen Befehl describe(), um sich gleichzeitig die verschiedenen Deskriptivstatistiken für Lebenszufriedenheit (lz) ausgeben zu lassen.
Die Funktion describeBy() ermöglicht außerdem Deskriptivstatistiken in Abhängigkeit einer gruppierenden Variable auszugeben. Machen Sie sich diesen Befehl zunutze, um sich die Lebenszufriedenheit (lz) abhängig von der derzeitigen Wohnsituation (wohnen) anzeigen zu lassen.
describe() kann auch genutzt werden, um gleichzeitig Deskriptivstatistiken für verschiedene Variablen zu berechnen. Nutzen Sie diese Funktionalität, um sich gleichzeitg die univariaten Deskriptivstatistiken für die fünf Persönlichkeitsdimensionen ausgeben zu lassen.

Aufgabe 2

In der Befragung am Anfang des Semesters wurde gefragt, ob Sie neben der Uni einen Nebenjob (job) ausüben und mit welcher Hand sie primär schreiben (hand). Erstellen Sie für diese beiden Variablen eine Kreuztabelle mit Randsummen.

Stellen Sie zunächst sicher, dass die Variablen als Faktoren vorliegen und die Kategorien beider Variablen korrekt bezeichnet sind.
Wie viele Personen sind Linkshänder und haben keinen Nebenjob?
Was ist der relative Anteil aller Teilnehmenden, die einem Nebenjob nachgehen?
Berechnen Sie nun mit Hilfe des psych-Pakets die Korrelationskoeffizienten Phi ($\phi$) und Yules Q für das oben genannte Beispiel.

Aufgabe 3

Welche der fünf Persönlichkeitsdimensionen Extraversion (extra), Verträglichkeit (vertr), Gewissenhaftigkeit (gewis), Neurotizismus (neuro) und Offenheit für neue Erfahrungen (offen) ist am stärksten mit der Lebenszufriedenheit korreliert (lz)?

Überprüfen Sie die Voraussetzungen für die Pearson-Korrelation.
Erstellen Sie für diese Frage eine Korrelationsmatrix, die alle Korrelationen enthält. Verwenden Sie die Funktion round() (unter Betrachtung der Hilfe), um die Werte auf zwei Nachkommastellen zu runden und die Tabelle dadurch übersichtlicher darzustellen.
Wie würden Sie das Ausmaß der betragsmäßig größten Korrelation mit der Lebenszufriedenheit nach den Richtlinien von Cohen (1988) einschätzen?
Ist der Korrelationskoeffizient von Neurotizismus und Lebenszufriedenheit statistisch bedeutsam?

Aufgabe 4

Untersuchen Sie die Korrelation zwischen Nerdiness (nerd) und Prokrastinationstendenz (prok). Berechnen Sie dafür ein geeignetes Korrelationsmaß und testen Sie dieses auf Signifikanz.

Aufgabe 5 Bonus

Im vorherigen Kapitel haben wir die Poweranalyse behandelt. Solche Analysen kann man auch für Korrelationen verwirklichen. Frischen Sie gerne Ihren Wissensstand hier noch einmal auf. Daher, führen sie mit Hilfe des Pakets WebPower eine Sensitivitätsanalyse für den Datensatz fb24 unter folgenden Parametern durch:

Fehler 1. Art ($\alpha = 5%$)
Fehler 2. Art ($\beta = 20%$)
Alternativhypothese ($H_1$: $\rho_1 \neq 0$)

Korrelation - Aufgaben

Vorbereitung

Aufgabe 1

Aufgabe 2

Aufgabe 3

Aufgabe 4

Aufgabe 5 Bonus

Kai J. Nehler

Teammitglied

Anna Winkler

Autorin

Tobias Vogler

Autor

Marvin Schröder

Autor