BSc2

Tests für abhängige Stichproben - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Tests für abhängige Stichproben - Lösungen

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Tests für unabhängige Stichproben - Aufgaben

Untersuchen Sie folgende Fragestellungen anhand des fb22-Datensatzes Denken Sie dabei an Folgendes: Deskriptivstatistische Beantwortung der Fragestellung Voraussetzungsprüfungen (Normalverteilung bitte optisch überprüfen und den Test dementsprechend wählen - auch wenn n > 30 gegeben ist) Spezifikation der Hypothesen und des Signifikanzniveaus Ggf. Berechnung der Effektstärke Formales Berichten des Ergebnisses Aufgabe 1 Unterscheiden sich Studierende, die sich für Allgemeine Psychologie (Variable “fach”) interessieren, im Persönlichkeitsmerkmal Intellekt (auch: Offenheit für neue Erfahrungen, “intel”) von Studierenden, die sich für Klinische Psychologie interessieren?

Tests für unabhängige Stichproben - Lösungen

Daten einlesen setwd("...") load("fb22.rda") Daten aufbereiten Prüfe zunächst, ob die Variablen Faktoren sind. is.factor(fb22$fach) ## [1] FALSE is.factor(fb22$ort) ## [1] FALSE is.factor(fb22$geschl) ## [1] FALSE Falls nicht: # Lieblingsfach als Faktor - falls es noch keiner war fb22$fach <- factor(fb22$fach, levels = 1:5, labels = c('Allgemeine', 'Biologische', 'Entwicklung', 'Klinische', 'Diag./Meth.')) # Wohnort als Faktor - falls es noch keiner war fb22$ort <- factor(fb22$ort, levels = c(1, 2), labels = c('Frankfurt', 'anderer')) # Geschlecht als Faktor - falls es noch keiner war fb22$geschl <- factor(fb22$geschl, levels=c(1,2,3), labels=c('weiblich', 'maennlich', 'anderes')) Aufgabe 1 Unterscheiden sich Studierende, die sich für Allgemeine Psychologie (Variable “fach”) interessieren, im Persönlichkeitsmerkmal Intellekt (auch: Offenheit für neue Erfahrungen, “intel”) von Studierenden, die sich für Klinische Psychologie interessieren?

Tests für abhängige Stichproben

Nachdem wir uns mit unabhängige Stichproben in der (letzten Sitzung) beschäftigt haben wollen wir diesmal mit abhängigen Stichproben beschäftigen. Anwendungen dafür in der Praxis sind beispielsweise Zwillinge, Paare oder auch Messwiederholungen. Kernfragen der Lehreinheiten über Gruppenvergleiche Wie fertige ich Deskriptivstatistiken (Grafiken, Kennwerte) zur Veranschaulichung des Unterschieds zwischen zwei Gruppen an? Was sind Voraussetzungen des abhängigen t-Tests und wie prüfe ich sie? Wie führe ich einen abhängigen t-Test in R durch?

Tests für unabhängige Stichproben

Kernfragen der Lehreinheiten über Gruppenvergleiche Wie fertige ich Deskriptivstatistiken (Grafiken, Kennwerte) zur Veranschaulichung des Unterschieds zwischen zwei Gruppen an? Was sind Voraussetzungen des t-Tests und wie prüfe ich sie? Wie führe ich einen t-Test in R durch? Wie berechne ich die Effektstärke Cohen’s d? Wie führe ich den Wilcoxon-Test (auch “Mann-Whitney-Test”, “U-Test”, “Mann-Whitney-U-Test”, “Wilcoxon-Rangsummentest”) in R durch? Wie führe ich den Vierfelder-Chi-Quadrat-Test in R durch? Was erwartet Sie? Nachdem wir uns zuletzt mit dem Unterschied zwischen dem Mittelwert einer Stichprobe und dem Mittelwert der dazugehörigen Population, aus der die Stichprobe stammt, auseinandergesetzt haben, fokussieren wir uns nun auf Unterschiede zwischen zwei Gruppen (also zwei Stichproben).

Datensätze

Auf der folgenden Seite werden alle Datensätze aufgeführt, mit denen in den verschiedenen Tutorials auf pandaR gearbeitet wird. Die Datensätze sind alphabetisch sortiert und können teilweise direkt über diese Seite heruntergeladen werden. Hier eine Übersicht: Beschreibung Direkter Download Achtsamkeit und Depression OSF Alkoholkonsum von Jugendlichen alc Arbeitsstress bei Call-Center-Mitarbeiter:innen StressAtWork Vergleich von Behandlungsformen Behandlungsform Die Big Five Persönlichkeitsdimensionen Big5 Interozeptive Aufmerksamkeit und Genauigkeit OSF Bildungsinvestitionen auf der Welt edu_exp Bullyingprävention bei Jugendlichen fairplayer Quasi-Experimentelle Therapiestudie CBTdata Depressivität Depression Effektivität der CBT bei Depression Teil des Pakets metafor Entwicklung der Weltbevölkerung WorldPopulation Fragebogendaten aus dem ersten Semester fb22 Gender, Drug, and Depression OSF Skalenwerte der Generic Conspiracist Beliefs Scale conspiracy Items der Generic Conspiracist Beliefs Scale) conspiracy_cfa Gewissenhaftigkeit und Medikamenteneinnahme Teil des Pakets metafor Internetintervention für psychische Störungen OSF Kooperationsbereitschaft von Geschwistern via Syntax erstellt Machiavellismus-Fragebogen mach Major Depression OSF Mehrdimensionaler Befindlichkeitsfragebogen mdbf Mental Health and Social Contact During the COVID-19 Pandemic OSF Naturverbundenheit nature Lesekompetenz in der PISA-Erhebung PISA2009 Parental Burnout OSF Hauptkomponentenanalyse PCA Psychisches Wohlbefinden von Individuen während des Lockdowns in Frankreich OSF Kulturelle Unterschiede in Korruptionsbestrafung OSF Schulleistungen Schulleistungen Therapieerfolg Therapy Titanic Titanic Traumatische Erlebnisse und psychische Störungen OSF Achtsamkeit und Depression (raw_data) Beschreibung Beim Datensatz stammt von Rubin (2020) und ist auf dem Open Science Framework zu finden.

formr - FAQ

In diesem Tutorial soll gezeigt werden, wie ihr mit Hilfe von formr Umfragen erstellen können. Das Tutorial soll Sie dabei speziell auf die Anforderungen vorbereiten, die sich Ihnen im Rahmen eurer Gruppenarbeit in PsyBSc2 stellen werden. Das bedeutet, dass ihr lernt, wie ihr euren Fragebögen für formr erstellen könnte. Weiterhin wird gezeigt, wie diese Umfrage mit dem von uns bereit gestellten Teil zu Versuchspersonenminuten-Abfrage verbunden werden kann. Auch die Einwilligung in Teilnahmebedinungen und Datenschutz sowie die Auswirkungen deren Ablehnung sind essentielle Bestandteile der Beschreibung.

Zusatz - Aufgaben

Wie angekündigt finden Sie im Folgenden nun nochmal Aufgaben, die sich auf die Tutorials 1 bis 3 beziehen. Zunächst wollen wir nochmal Übungen mit einem kleinen, ausgedachten Datensatz durchführen. Stellen Sie sich dafür vor, dass Sie im Rahmen Ihres Studiums haben eine Untersuchung mit 10 Studierenden durchgeführt. Dabei haben Sie das Alter (in ganzen Zahlen), das Geschlecht (weiblich, männlich, divers), die deutsche Lieblingsstadt (Berlin, Hamburg, München, Frankfurt, Dresden), sowie die generelle Lebenszufriedenheit, gemessen mit 5 Items, erhoben.

Zusatz - Lösungen

Hier finden Sie die Lösungen zu den Zusatzaufgaben! Zunächst wollen wir nochmal Übungen mit einem kleinen, ausgedachten Datensatz durchführen. Stellen Sie sich dafür vor, dass Sie im Rahmen Ihres Studiums haben eine Untersuchung mit 10 Studierenden durchgeführt. Dabei haben Sie das Alter (in ganzen Zahlen), das Geschlecht (weiblich, männlich, divers), die deutsche Lieblingsstadt (Berlin, Hamburg, München, Frankfurt, Dresden), sowie die generelle Lebenszufriedenheit, gemessen mit 5 Items, erhoben. Aufgabe 1 Laden Sie die folgenden 3 Vektoren und den Datensatz in Ihr Environment.

Korrelation - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Regression

Kernfragen dieser Lehreinheit Wie kann ein Modell für den Zusammenhang von zwei Variablen erstellt werden? Wie können Streudiagramme in R erstellt werden? Wie kann die Regressionsgerade in den Plot eingefügt werden? Wie können standardisierte Regressionsgewichte geschätzt werden? Was ist der Unterschied zu nicht-standardisierten Regressionsgewichten? Wie wird der Determinationskoeffizient \(R^2\) berechnet und was sagt er aus? Wie werden der Determinationskoeffizient \(R^2\) und der Regressionsparameter b inferenzstatistisch überprüft? Vorbereitende Schritte Zu Beginn laden wir wie gewohnt den Datensatz und verteilen die relevanten Labels.

Simulation und Poweranalyse

Kernfragen dieser Lehreinheit Wie können Variablen und ganze Modelle simuliert werden? Wie lassen sich der \(\alpha\)-Fehler (Type I-Error, Fehler erster Art) und die Power (Testmacht, Teststärke) empirisch bestimmen? Welche anderen Möglichkeiten, den \(\alpha\)-Fehler und die Power zu bestimmen, gibt es? Wie lassen sich Power-Plots erstellen und was bedeuten sie? Einleitung In den vergangenen Sitzungen haben wir verschiedene Tests für unterschiedliche Fragestellungen kennengelernt: \(t\)-Test und Wilcoxon-Test für Mittelwertsvergleiche zweier Gruppen sowie den Korrelationstest, um die Beziehung zweier Variablen zu untersuchen.

Simulation und Poweranalyse - Aufgaben

Aufgabe 1 Lineare Beziehungen zwischen Variablen: Korrelationstest unter \(H_1\) Wir wollen uns ebenfalls die Power für den Korrelationstest ansehen. Dazu müssen wir allerdings korrelierte Variablen generieren. Um das hinzubekommen, müssen wir einige Eigenschaften der Normalverteilung ausnutzen: bspw. dass die Summe zweier normalverteilter Zufallsvariablen wieder normalverteilt ist. Für zwei unabhängige (unkorrelierte) standard-normalverteilte Zufallsvariablen \(X\) und \(Z\), ist die Zufallsvariable \(Y\), die folgendermaßen gebildet wird: \[Y:= \rho X + \sqrt{1-\rho^2}Z,\] wieder standard-normalverteilt und um den Korrelationskoeffizienten \(\rho\) korreliert mit \(X\).

Simulation und Poweranalyse - Lösungen

Aufgabe 1 Lineare Beziehungen zwischen Variablen: Korrelationstest unter \(H_1\) Wir wollen uns ebenfalls die Power für den Korrelationstest ansehen. Dazu müssen wir allerdings korrelierte Variablen generieren. Um das hinzubekommen, müssen wir einige Eigenschaften der Normalverteilung ausnutzen: bspw. dass die Summe zweier normalverteilter Zufallsvariablen wieder normalverteilt ist. Für zwei unabhängige (unkorrelierte) standard-normalverteilte Zufallsvariablen \(X\) und \(Z\), ist die Zufallsvariable \(Y\), die folgendermaßen gebildet wird: \[Y:= \rho X + \sqrt{1-\rho^2}Z,\] wieder standard-normalverteilt und um den Korrelationskoeffizienten \(\rho\) korreliert mit \(X\).

Hinweise zum Ergebnisbericht

Allgemeine Hinweise Pro Gruppe Abgabe eines Berichts über die eigene empirische Untersuchung Umfang: ca. 5 Seiten (entscheidend ist aber, dass der Inhalt vollständig ist) Zeilenabstand: 1,5 cm, Seitenabstand an allen Rändern: mindestens 2,6 cm Schriftart: Times New Roman Abgabe des Berichts (PDF-Dokument), des Arbeitsdatensatzes (.rda) und des Auswertungsskripts (.R) Abgabe bis zum 06.02.2023 23:59 Uhr Aufbau des Berichts Kursive Teile sind üblicherweise Teil eines Berichts, werden aber im Rahmen dieses Praktikums nicht erwartet.

Korrelation

Kernfragen dieser Lehreinheit Wie können Kreuztabellen in R erstellt werden? Welche Varianten gibt es, relative Häufigkeitstabellen zu erstellen? Wie kann ein gemeinsames Balkendiagramm für zwei Variablen erstellt werden? Welche zwei Varianten gibt es, Varianzen und Kovarianzen zu bestimmen? Wie kann die Produkt-Moment-Korrelation, die Rang-Korrelation nach Spearman und Kendalls \(\tau\) bestimmt werden? Wie wird bei der Berechnung von Korrelationen mit fehlenden Werten umgegangen? Vorbereitende Schritte Zu Beginn laden wir wie gewohnt den Datensatz und verteilen die relevanten Labels.

Korrelation - Lösungen

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Regression - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Regression - Lösungen

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Tests und Konfidenzintervalle

Kernfragen dieser Lehreinheit Wie berechne ich, ob es einen Unterschied zwischen einer Stichprobe und der dazugehörigen Population gibt? Wann und wie rechne ich einen z-Test (Einstichproben-Gauss-Test)? Wie interpretiere ich die Ergebnisse? Wie bestimme ich das Konfidenzintervall des wahren Werts \(\mu\)? Wann und wie rechne ich einen t-Test? Welche Voraussetzungen hat dieser? Wie interpretiere ich die Ergebnisse? Wie gehe ich mit gerichteten vs. ungerichteten Hypothesen um? Was ist Cohen’s d und wie berechne ich es?

Tests und Konfidenzintervalle - Aufgaben

Vorbereitung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Tests und Konfidenzintervalle - Lösungen

Vorbereitung Lösung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Prüfen Sie zur Sicherheit, ob alles funktioniert hat: dim(fb22) ## [1] 159 47 str(fb22) ## 'data.frame': 159 obs. of 47 variables: ## $ prok1 : int 1 4 3 1 2 2 2 3 2 4 .

Deskriptivstatistik für Intervallskalen - Lösungen

Vorbereitung Lösung Laden Sie zunächst den Datensatz fb22 von der pandar-Website. Alternativ können Sie die fertige R-Daten-Datei hier herunterladen. Beachten Sie in jedem Fall, dass die Ergänzungen im Datensatz vorausgesetzt werden. Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument Variablenübersicht.docx entnehmen. Aufgabe 1 Erstellen Sie im Datensatz fb22 die Skalenwerte für die Naturverbundenheit, die mit den Items nr1 bis nr6 gemessen wurde. Keines der Items ist invertiert.

Deskriptivstatistik für Nominal- und Ordinalskalen - Lösungen

Die Lösungen sind exemplarische Möglichkeiten. In R gibt es immer viele Wege ans Ziel. Wenn Sie einen anderen mit dem korrekten Ergebnis gewählt haben, kann dieser genauso richtig sein wie die hier präsentierten Ansätze. Vorbereitung Lösung Laden Sie zunächst den Datensatz fb22 von der pandar-Website herunter und dann ein. load(url('https://pandar.netlify.app/post/fb22.rda')) # Daten laden Die Bedeutung der einzelnen Variablen und ihre Antwortkategorien können Sie dem Dokument variablen.pdf entnehmen. Verschaffen Sie sich nun einen Überblick über den Datensatz: