Datensätze
Übersicht über alle verwendeten Datensätze auf pandaR
2022-04-11
Auf der folgenden Seite werden alle Datensätze aufgeführt, mit denen
in den verschiedenen Tutorials auf pandaR gearbeitet wird.
Die Datensätze sind alphabetisch sortiert und können teilweise direkt
über diese Seite heruntergeladen werden. Hier eine Übersicht:
Achtsamkeit und Depression (raw_data)
Beschreibung
Beim Datensatz stammt von Rubin (2020) und ist auf dem
Open Science Framework zu finden. Er beschäftigt sich mit
der Untersuchung von Variablen, die den Zusammenhang zwischen
Achtsamkeit und Depression mithilfe einer Netzwerkanalyse untersuchen
wollen.
Auf pandaR wird der Datensatz in dem Tutorial Netzwerkanalyse im
Querschnitt für PsyMSc5a verwendet.
Datensatz laden
raw_data <- readRDS(url("https://osf.io/awz3d/download"))names(raw_data) <- c("observe", "describe", "awaren.", "nonjudg.",
"nonreact.", "interest", "emotions", "sleep",
"tired", "appetite", "selfim.",
"concentr.", "speed")Größe
Der Datensatz besteht aus 384 Beobachtungen auf 13 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
observe | Wahrnehmen | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
describe | Beschreiben | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
awaren. | Bewusst handeln | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
nonjudg. | Nichturteilen | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
nonreact. | Nichtreagieren | 1 = Nie oder selten zutreffend, 5 = Sehr oft oder immer zutreffend |
interest | Interessensverlust | standardisierter Skalenwert |
emotions | anhaltende gedrückte Stimmung | standardisierter Skalenwert |
sleep | Schlaflosigkeit | standardisierter Skalenwert |
tired | Müdigkeit | standardisierter Skalenwert |
appetite | Appetitstörung | standardisierter Skalenwert |
selfim. | negatives Selbstbild | standardisierter Skalenwert |
concentr. | Konzentrationsschwierigkeiten | standardisierter Skalenwert |
speed | Hemmung von Antrieb und Denken | standardisierter Skalenwert |
Die Variablen observe, describe, awareness, nonjudging und nonreactivity bezeichnen die fünf Facetten der Achtsamkeit von Baer et al. (2006). Die 8 weiteren Variablen beschreiben eine dysfunktionale, meist negative Veränderung in dem bezeichneten Lebensaspekt im Zuge einer Depression.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Alkoholkonsum von Jugendlichen (alc)
Beschreibung
Der Datensatz stammt aus einer Erhebung von Curran, Stice und Chassin (1997) in der der Alkoholkonsum von Jugendlichen längsschnittlich untersucht wurde. Dazu wurde der Selbstbericht über den eigenen Alkoholkonsum mit 14, 15 und 16 Jahren, sowie die Trinkgewohnheiten der Eltern und Peers erfragt. Zusätzlich wurden demografische Variablen erhoben.
Auf pandaR wird der Datensatz in dem Tutorial ANOVA III und Quiz 6 für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/alc.rda"))Größe
Der Datensatz besteht aus 82 Beobachtungen auf 7 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
id | Personenidentifikator | Nummer |
male | Geschlecht | 0 = weiblich, 1 = männlich |
peer | berichtetes Ausmaß, in dem Peers Alkohol konsumieren | 0 = keine, 5 = alle |
coa | Kind eines/einer Alkoholiker:in (“child of alcoholic”) | 0 = nein, 1 = ja |
alcuse.14 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 14 Jahren konsumiert wird | 0 = nie, 7 = täglich |
alcuse.15 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 15 Jahren konsumiert wird | 0 = nie, 7 = täglich |
alcuse.16 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 16 Jahren konsumiert wird | 0 = nie, 7 = täglich |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Erweiterung
Für das Quiz ANOVA III in PsyBSc7 wurde der Datensatz nochmal in zwei getrennten Formaten erweitert. Die erweiterten Daten sind simulationsbasiert. Die Daten können mit folgendem Befehl eingeladen werden:
load(url("https://pandar.netlify.app/post/alc_extended.rda"))Im Environment erscheinen zwei Datensätze. Der Datensatz
alc17 hat eine Variable mehr (alcuse.17),
während alc18 nochmal 2 weitere zusätzliche Variablen
(treat und alcuse.18) hat.
Hier folgt nochmal eine genauere Aufstellung der simulierten Variablen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
alcuse.17 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 17 Jahren konsumiert wird | 0 = nie, 7 = täglich |
treat | Behandlung | 0 = nein, 1 = ja |
alcuse.18 | selbstberichtete Häufigkeit, mit der Alkohol im Alter von 18 Jahren konsumiert wird | 0 = nie, 7 = täglich |
Arbeitsstress bei Call-Center-Mitarbeiter:innen
(StressAtWork)
Beschreibung
Der Datensatz ist eine Zusammenstellung aus mehreren Studien der Arbeits- und Organisationspsychologie-Abteilung der Goethe-Universität, in welchem Call-Center-Mitarbeiter:innen untersucht wurden. Der Datensatz enthält das Geschlecht der Proband:innen, sowie ausgewählte Messungen der Variablen Zeitdruck und Arbeitsorganisationale Probleme aus dem Instrument zur stressbezogenen Tätigkeitsanalyse (ISTA) von Semmer, Zapf und Dunckel (1999), Psychosomatische Beschwerden (auch “Befindlichkeit”) aus der Psychosomatischen Beschwerdenliste von Mohr (1986), sowie Messungen zu Subskalen von Burnout: Emotionale Erschöpfung und Leistungserfüllung aus Maslachs Burnout-Inventar (Maslach & Jackson, 1986) in der deutschen Übersetzung von Büssing und Perrar (1992).
Auf pandaR wird der Datensatz in den Tutorials Pfadanalysen und Strukturgleichungsmodelle und Modelle für Gruppenvergleiche für PsyMSc1
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/StressAtWork.rda"))Größe
Der Datensatz besteht aus 305 Beobachtungen auf 34 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
sex | Geschlecht der Proband:innen | 1 = weiblich, 2 = männlich |
zd1, zd2 & zd6 | Zeitdruck | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
aop3, aop4 & aop8 | Arbeitsorganisationale Probleme | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
bf1-bf20 | Psychosomatische Beschwerden | 1 = Trifft nicht zu, 5 = Trifft voll und ganz zu |
bo1, bo6, b19 &
b12 | Emotionale Erschöpfung | 1 = Trifft nicht zu, 7 = Trifft voll und ganz zu |
bo7, bo8& bo21 | Leistungserfüllung | 1 = Trifft nicht zu, 7 = Trifft voll und ganz zu |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Vergleich von Behandlungsformen Behandlungsform
Beschreibung
Der Datensatz enthält Ausprägungen von Patient:innen auf verschiedenen psychotherapeutischen Variablen sowie demografische Informationen. Dabei gibt es zwei kategoriale Variablen: Auf Geschlecht gibt es hier die Ausprägungen männlich und weiblich, während die Therapieform zwischen Kontrollgruppe, KVT und einer Kombination auf KVT und Blended Care unterscheidet. Alle anderen Variablen können als intervallskaliert angenommen werden.
Auf pandaR wird der Datensatz in dem Quiz 5 für PsyBsc7 und in Block 1 der Quizze für PsyMSc5a
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Behandlungsform.rda"))Größe
Der Datensatz besteht aus 100 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Kodierung |
|---|---|
Depression | Skalenwert |
Therapeutische_Allianz | Skalenwert |
Gesundheitszustand | Skalenwert |
Interpersonelle_Probleme | Skalenwert |
Therapieform | 1 = Kontrolle, 2 = KVT, 3 = blended Care KVT |
Geschlecht | 1 = männlich, 2 = weiblich |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Die Big Five Persönlichkeitsdimensionen Big5
Beschreibung
Der Originaldatensatz ist ein Onlinedatensatz, wird seit 2012 erfasst und ist auf openpsychometrics.org als .zip downloadbar. Bisher haben über 19700 Probanden aus der ganzen Welt teilgenommen. Zu jeder der fünf Facetten gibt es 10 Fragen. Der Fragebogen ist auf personality-testing.info einzusehen. Um das Ganze etwas übersichtlicher zu gestalten, betrachten wir einen gekürzten Datensatz. Im Datensatz Big5_EFA.rda befinden sich 15 Items aus dem Big-5 Persönlichkeitsfragebogen. Hier werden von den 10 Items pro Facette jeweils die ersten drei verwendet.
Auf pandaR wird der Datensatz in dem Tutorial Exploratorische Faktorenanalyse für PsyMSc1
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Big5_EFA.rda"))Größe
Der Datensatz besteht aus 19711 Beobachtungen auf 19 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen. Die jeweiligen Items sind von 1 bis 5 skaliert.
| Variable | Itemwortlaut |
|---|---|
E1 | “I am the life of the party.” |
E2 | “I don’t talk a lot.” |
E3 | “I feel comfortable around people.” |
N1 | “I get stressed out easily.” |
N2 | “I am relaxed most of the time.” |
N3 | “I worry about things.” |
A1 | “I feel little concern for others.” |
A2 | “I am interested in people.” |
A3 | “I insult people.” |
C1 | “I am always prepared.” |
C2 | “I leave my belongings around.” |
C3 | “I pay attention to details.” |
O1 | “I have a rich vocabulary.” |
O2 | “I have difficulty understanding abstract ideas.” |
O3 | “I have a vivid imagination.” |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Interozeptive Aufmerksamkeit und Genauigkeit body
Beschreibung
Der Datensatz liegt auf dem Open Science Framework und
stammt aus einer Untersuchung von Campos,
Barbosa Rocha und Barbosa (2022), in der es um die Abgrenzung von
interozeptiver (die Wahrnehmung der vegetativen Prozesse des eigenen
Körpers) Aufmerksamkeit und Genauigkeit geht.
Auf pandaR wird der Datensatz in dem Tutorial Regression mit
nominalskalierten Prädiktoren für PsyBSc7 verwendet.
Datensatz laden
Der Datensatz liegt im OSF im .sav Dateiformat (dem
Datenformat in dem SPSS seine Daten abspeichert) vor. Daher müssen die
Daten mithilfe einer der vielen verschiedenen Import-Funktionen
eingelesen werden. Hier nutzen wir dafür die Funktion
read_sav aus dem Paket haven, welches R-Studio
primär nutzt, um Daten zu importieren und daher bereits installiert sein
sollte.
library(haven)
body <- haven::read_sav(file = url('https://osf.io/43xv5/download'))Der Datensatz enthält neben den zusammengefassten Skalenwerten auch die einzelnen Items der beiden zentralen Skalen (IAS und BPQ), welche wir für diese Anwendung entfernen, um die Daten etwas übersichtlicher zu gestalten. Wir beschränken uns also auf die ersten 27 Variablen im Datensatz:
body <- body[, 1:27]Größe
Der eingeschränkte Datensatz besteht aus 134 Beobachtungen auf 27 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
id | Probanden-ID | |
Age | Alter | Alter in Jahren |
Sex | Geschlecht | 0 = weiblich, 1 = männlich |
Nationality | Nationalität | 0 = andere, 1 = Portugiesisch |
PortugueseFirstLanguage | Muttersprache | 0 = andere, 1 = Portugiesisch |
EducationCategorical | Höchster Bildungsabschluss | 0 = kein Abschluss, 1 = Grundschule, 2 = mittlere Reife, 3 = Abitur/High School, 4 = Bachelor, 5 = Master, 6 = Doktorgrad |
EducationYears | Jahre im Bildungssystem | |
Student | Schüler*in oder Student*in? | 0 = nein, 1 = ja |
Employed | Angestelltenverhältnis? | 0 = nein, 1 = ja |
Unemployed | Arbeitslos? | 0 = nein, 1 = ja |
StayAtHome | Hausfrau/-mann? | 0 = nein, 1 = ja |
Retired | Im Ruhestand? | 0 = nein, 1 = ja |
OccupationalStatusOther | Anderes Beschäftigungsverhältnis? | 0 = nein, 1 = ja |
UniversityStudent | Student*in? | 0 = nein, 1 = ja ( fehlerhafte Kopie der Variable
Student ) |
PsychiatricHistory | Psychische Störung in der Vergangenheit? | 0 = nein, 1 = ja |
NeurologicalHistory | Neurologische Störung in der Vergangenheit? | 0 = nein, 1 = ja |
ChronicCondition | Chronische Krankheiten? | 0 = nein, 1 = ja |
Medication | Aktuell Medikamenteneinnahme? | 0 = nein, 1 = ja |
Device | Gerät an dem Fragebogen ausgefüllt wird | 0 = Computer, 1 = Smartphone, 2 = Tablet, 3 = anderes |
IAS_TotalScore | Interoceptive Accuracy Scale | Skalenwert |
IAS_TotalScore_Retest | Interoceptive Accuracy Scale, 2. Erhebung | Skalenwert |
BPQ_BodyAwareness | Body Perception Questionnaire, Aufmerksamkeits-Dimension | Skalenwert |
BPQ_BodyAwareness_Retest | Body Perception Questionnaire, Aufmerksamkeits-Dimension, 2. Erhebung | Skalenwert |
BPQ_AutonomicReactivity | Body Perception Questionnaire, Reaktivitäts-Dimension | Skalenwert |
BPQ_AutonomicReactivity_Retest | Body Perception Questionnaire, Reaktivitäts-Dimension, 2. Erhebung | Skalenwert |
BPQ_Time_Retest | Zeit um BPQ auszufüllen, 2. Erhebung | in Sekunden |
IAS_Time_Retest | Zeit um IAS auszufüllen, 2. Erhebung | in Sekunden |
Fehlende Werte
In dem Datensatz liegen 92 fehlende Werte vor. Diese sind allesamt
auf der fehlerhaft kodierten Variablen UniversityStudent zu
finden.
Bildungsinvestitionen auf der Welt (edu_exp)
Beschreibung
Wir benutzen für unsere Interaktion mit ggplot2
öffentlich zugängliche Daten aus verschiedenen Quellen, die
dankenswerterweise von Gapminder zusammengetragen werden.
Für diesen Abschnitt gucken wir uns dafür mal an, wie viele verschiedene
Länder in die Bildung investieren - diese Daten stammen ursprünglich von
der Weltbank.
Auf pandaR wird der Datensatz für den DigiGEBF Workshop ggplotting und in dem
Tutorial Grafiken mit ggplot2
für PsyBSc7 verwendet.
Datensatz laden
load(url('https://pandar.netlify.com/post/edu_exp.rda'))Größe
Der Datensatz besteht aus 4137 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt |
|---|---|
geo | Länderkürzel, das zur Identifikation der Länder über verschiedene Datenquellen hinweg genutzt wird |
Country | der Ländername im Englischen |
Wealth | Wohlstandseinschätzung des Landes, unterteilt in fünf Gruppen |
Region | Einteilung der Länder in die vier groben Regionen
africa, americas, asia und
europe |
Year | Jahreszahl |
Population | Bevölkerung |
Expectancy | Lebenserwartung eines Neugeborenen, sollten die Lebensumstände stabil bleiben |
Income | Stetiger Wohlstandsindikator für das Land (GDP pro Person) |
Primary | Staatliche Ausgaben pro Schüler:in in der primären Bildung als
Prozent des income (GDP pro Person) |
Secondary | Staatliche Ausgaben pro Schüler:in in der sekundären Bildung als
Prozent des income (GDP pro Person) |
Tertiary | Staatliche Ausgaben pro Schüler:in oder Student:in in der tertiären
Bildung als Prozent des income (GDP pro Person) |
Index | Education Index des United Nations Development Programme |
Fehlende Werte
Insgesamt liegen im Datensatz 8714 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
geoCountryWealthRegionYearPopulation
Bullyingprävention bei Jugendlichen (fairplayer)
Beschreibung
Der Datensatz stammt aus einer Studie von Bull, Schultze & Scheithauer (2009), in der die Effektivität eines Interventionsprogramms zur Bullyingprävention bei Jugendlichen untersucht wurde.
Auf pandaR wird der Datensatz in dem Tutorial Einführung in lavaan für PsyMSc1
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/fairplayer.rda"))Größe
Der Datensatz besteht aus 155 Beobachtungen auf 31 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
id | Personenidentifikator | Nummerierung |
class | Klasse | Zahl |
grp | Interventionsgruppe | 1 = CG, 2 = IGS, 3 = IGL |
sex | Geschlecht | 1 = weiblich, 2 = männlich |
ra1t1-ra1t3 | 1. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
ra2t1-ra2t3 | 2. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
ra3t1-ra3t3 | 3. Item zur relationalen Aggression zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em1t1-em1t3 | 1. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em2t1-em2t3 | 2. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
em3t1-em3t3 | 3. Item zur Empathie zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si1t1-si1t3 | 1. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si2t1-si2t3 | 2. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
si3t1-si3t3 | 3. Item zur Sozialen Intelligenz zu drei Messzeitpunkten | 1 = trifft nicht zu, 5 = trifft voll und ganz zu |
Fehlende Werte
In dem Datensatz liegen 830 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
id
Quasi-Experimentelle Therapiestudie CBTdata
Beschreibung
Beim Datensatz handelt es sich um ein fiktives Datenbeispiel, bei dem Patient:innen, die an einer Depression oder einer Angststörung leiden, entweder mit einer kognitiven Verhaltenstherapie (CBT) behandelt oder in einer Wartekontrollgruppe belassen wurden. Eine zufällige Zuordnung war nicht vollständig möglich, da die Zuordnung von überweisenden Hausarzt-Praxen der Patient:innen mit beeinflusst werden konnte (z.B. durch Geltendmachung einer besonderen Dringlichkeit der Therapie).
Auf pandaR wird der Datensatz in dem Tutorial Schätzung von Kausaleffekten 1 und Schätzung von Kausaleffekten 2 für PsyMSc5a
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/CBTdata.rda"))Größe
Der Datensatz besteht aus 326 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
Age | Alter | Alter |
Gender | Geschlecht | female = weiblich, male = männlich |
Treatment | Behandlungsgruppenzugehörigkeit | CBT = kognitive Verhaltenstherapie, WL = Wartekontrolle |
Disorder | psychische Störung | ANX = Angststörung, DEP = Depression |
BDI_pre | Depressionswert gemessen mit Beck Depressions-Inventar vor Therapie | 0 - 63 |
SWL_pre | Lebenszufriedenheit gemessen mit Satisfaction With Life Screening vor Therapie | 5 - 35 |
BDI_post | Depressionswert gemessen mit Beck Depressions-Inventar nach Therapie | 0 - 63 |
SWL_post | Lebenszufriedenheit gemessen mit Satisfaction With Life Screening nach Therapie | 5 - 35 |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Depressivität Depression
Beschreibung
Beim Datensatz handelt es sich um fiktive Daten bezüglich Depressionswerten in Beziehung zu einigen weiteren Variablen.
Auf pandaR wird der Datensatz in den Tutorials Einleitung und Wiederholung KliPPs
und Multiple Regression
und Ausreißerdiagnostik für PsyMSc5a verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Depression.rda"))Größe
Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Kodierung |
|---|---|
Lebenszufriedenheit | 1 - 10 |
Episodenanzahl | 1 - 10 |
Depressivitaet | 1 - 10 |
Neurotizismus | 1 - 10 |
Intervention | 1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung |
Geschlecht | 0 = männlich, 1 = weiblich |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Effektivität der CBT bei Depression (F2F_CBT)
Beschreibung
Der Datensatz ist R-eigenen Paket metafor
von Viechtbauer (2010) enthalten und stammt von einer Studie von
López-López et al. (2019). Die Autor:innen haben die Effektivität der
CBT (cognitive behavioural therapy [kognitive Verhaltenstherapie]) bei
Depression untersucht und diese mit verschiedenen Kontrollbedingungen
und unterschiedlichen Arten der CBT verglichen.
Auf pandaR wird der Datensatz in dem Tutorial Metaanalysen in R für PsyMSc5a
verwendet.
Datensatz laden
library(metafor)## Loading required package: Matrix## Loading required package: metadat## Loading required package: numDeriv##
## Loading the 'metafor' package (version 4.2-0). For an
## introduction to the package please type: help(metafor)F2F_CBT <- dat.lopez2019[dat.lopez2019$treatment == "F2F CBT",] # wähle nur Fälle mit F2F CBTGröße
Der Datensatz besteht aus 71 Beobachtungen auf 23 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
study | verwendete Studie | Autor:innen |
treatment | verwendete Therapieart oder Kontrollgruppe | “F2F CBT” = “Angesicht zu Angesicht”-CBT, “Multimedia CBT” = Online-CBT, “Placebo” = Placebo-Kontrollgruppe, “Wait list” = Wartelistenkontrollgruppe, “Hybrid CBT” = Mischung aus F2F und Multimedia, “No treatment” = klassische Kontrollgruppw, “TAU” = Treatment as Usual [Standardtherapie] |
scale | Messinstrument Depression | BDI = Beck’s Depressionsinventar, HAM-24 = Hamilton Rating Scale for Depression-24, PHQ-9 = Patient Health Questionnaire-9, HAM-17 = Hamilton Rating Scale for Depression-17, CES-D = Center for Epidemiologic Studies Depression Scale, BSI = Brief Symptom Inventory, SDS = Sheehan Disability Scale |
n | Stichprobengröße | n |
diff | standardisierte Differenz zwischen vor und nach der Intervention | Cohen’s d |
se | Standardfehler von diff | se |
group | Dummy-Variable | 0 = Einzeltherapie, 1 = Gruppentherapie |
tailored | gibt an, ob die Therapie individuell auf Patient:in zugeschnitten wurde | 0 = nein, 1 = ja |
sessions | Anzahl der Therapiesitzungen | Anzahl |
length | durchschnittliche Sitzungslänge | Länge |
intensity | Intensität der Therapie | Produkt aus session und length |
multi | Intervention enthielt Multimedia-Elemente | 0 = nein, 1 = ja |
cog | Intervention enthielt kognitive Techniken | 0 = nein, 1 = ja |
ba | Intervention enthielt behaviorale Aktivierung | 0 = nein, 1 = ja |
psed | Intervention enthielt Psychoedukation | 0 = nein, 1 = ja |
home | Intervention enthielt Hausaufgaben | 0 = nein, 1 = ja |
prob | Intervention enthielt Problemlösen | 0 = nein, 1 = ja |
soc | Intervention enthielt Training sozialer Kompetenzen | 0 = nein, 1 = ja |
relax | Intervention enthielt Entspannungstechniken | 0 = nein, 1 = ja |
goal | Intervention enthielt Zielsetzung | 0 = nein, 1 = ja |
final | Intervention enthielt Abschlussgespräch | 0 = nein, 1 = ja |
mind | Intervention enthielt Achtsamkeit | 0 = nein, 1 = ja |
act | Intervention enthielt Acceptance and Commitment Therapy | 0 = nein, 1 = ja |
Fehlende Werte
Im Datensatz liegen 20 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
authorsyearniricontrolsdesigna_measurec_measuremeanagequality
Entwicklung der Weltbevölkerung (WorldPopulation)
Beschreibung
Der Datensatz stammt von Gapminder und enthält Daten zur
Entwicklung der Weltbevölkerung. Die Dokumentation des Datensatzes sowie
seine Datenquellen sind hier einzusehen: gapminder.org-Dokumentationen.
Auf pandaR wird der Datensatz in dem Tutorial Regression V und dem Zusatzquiz für nichtlineare
Regression für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/WorldPopulation.rda"))Größe
Der Datensatz besteht aus 221 Beobachtungen auf 2 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung |
|---|---|
Year | Jahreszahl |
Population | Weltbevölkerung |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Fragebogendaten aus dem ersten Semester fb22
Beschreibung
Der Datensatz fb22 besteht aus Daten, die von den
Studierenden selbst in den ersten Wochen der Veranstaltung PsyBSc2
erhoben wurden. Hierbei wurden eine Reihe von Variablen via eines
Fragebogens auf formr.org erfragt und anschließend zu einem
Datensatz zusammengefügt. Die Daten basieren somit auf wahren -
anonymisierten - Werten der Studierenden. Der Fragebogen erfasst Daten
zur Prokastinationstendenz, Naturverbundenheit, Persönlichkeit (gemessen
an den Big5), dem Studium sowie demografische Daten.
Auf pandaR wird der Datensatz in fast allen Tutorials
von PsyBsc2 verwendet.
Datensatz laden
load(url('https://pandar.netlify.app/post/fb22.rda'))Größe
Der Datensatz besteht aus 159 Beobachtungen auf 36 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
prok1 - prok10 | Items zur Prokrastinationstendenz (Items 2,3,5,7 & 8 sind invertiert) | 1 = “stimmt nicht”, 4 = “stimmt genau” |
nr1 - nr6 | Items zur Naturverbundenheit | 1 = “stimme nicht zu”, 5 = “stimme zu” |
lz | Lebenszufriedenheit | Skalenwert |
extra | Extraversion | Skalenwert |
vertr | Verträglichkeit | Skalenwert |
gewis | Gewissenhaftigkeit | Skalenwert |
neuro | Neurotizismus | Skalenwert |
intel | Intellekt | Skalenwert |
nerd | Nerdiness Personality Attributes | Skalenwert |
grund | Gründe für das Psychologiestudium | Freitext |
fach | Interessenfach | 1 = Allgemeine, 2 = Biologische, 3 = Entwicklung, 4 = Klinische, 5 = Diag./Meth. |
ziel | Arbeitsbranche nach Abschluss | 1 = Wirtschaft, 2 = Therapie, 3 = Forschung, 4 = Andere |
lerntyp | Lerntyp | 1 = alleine, 2 = Gruppe, 3 = Mischtyp |
geschl | Geschlecht | 1 = weiblich, 2 = männlich, 3 = anderes |
job | Nebentätigkeit | 1 = nein, 2 = ja |
ort | Derzeitiger Wohnort | 1 = Frankfurt, 2 = anderer |
ort12 | Wohnort vor 12 Monaten | 1 = Hessen, 2 = Deutschland, 3 = Ausland |
wohnen | Aktuelle Wohnsituation | 1 = WG, 2 = bei Eltern, 3 = alleine, 4 = sonstiges |
uni1 - uni4 | In Anspruch genommene Uni-Angebote | 0 = nein, 1 = ja |
Fehlende Werte
Insgesamt liegen im Datensatz 102 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
prok1prok2prok3prok5prok6prok7prok8prok9prok10nr1nr2nr4nr5nr6vertrextragewisneurointelnerduni1uni2uni3uni4
Gender, Drug, and Depression (osf)
Beschreibung
Der Datensatz liegt auf dem Open Science Framework und
stammt aus einer Untersuchung von Jing,
Page-Gould & Iankilevitch (2019), die den Effekt einer
Drogenabhängigkeit auf das individuelle Depressionslevel einer Person
untersucht haben.
Auf pandaR wird der Datensatz in dem Tutorial Logistische Regression
für PsyMSc5a verwendet.
Datensatz laden
library(haven)
osf <- read_sav(file = url("https://osf.io/prc92/download"))Größe
Der Datensatz besteht aus 55602 Beobachtungen auf 38 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
ANYDUMMY | Drogenabhängigkeit | 0 = nicht vorhanden, 1 = vorhanden |
GENDER_R | Geschlecht | 0 = weiblich, 1 = männlich |
Depression_lvl | Depressionswert | 0 - 9 |
Fehlende Werte
In dem Datensatz liegen 184784 fehlende Werte vor. Auf folgenden der für die Untersuchungen relevanten Variablen liegen keine fehlenden Werte vor:
GENDER_R
Skalenwerte der Generic Conspiracist Beliefs Scale
(conspiracy)
Beschreibung
Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen. Bei dieser Version des Datensatzes wurden die verschiedenen Items bereits zu Skalenwerten zusammengerechnet.
Auf pandaR wird der Datensatz in den Tutorials ANOVA I und ANOVA II
für PsyBSc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/conspiracy.rda"))Größe
Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
edu | höchster Bildungsabschluss | 1 = not highschool, 2 = highschool, 3 = college |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
gender | Geschlecht | 1 = male, 2 = female, 3 = other |
age | Alter | Freitext |
GM | Government malfeasance | Skalenwert |
MG | Malevolent global conspiracies | Skalenwert |
ET | Extraterrestrial cover-up | Skalenwert |
PW | Personal well-being | Skalenwert |
CI | Control of information | Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Items der Generic Conspiracist Beliefs Scale
(conspiracy)
Beschreibung
Die Daten stammen aus der Erhebung zur Validierung der Generic Conspiracist Beliefs Scale (GCBS; Brotherton, French, & Pickering, 2013). Die Daten finden Sie öffentlich zugänglich auf der Open Psychometrics Website. Der Fragebogen besteht aus insgesamt 15 Aussagen, die die Proband:innen jeweils von 1 (“definitely not true”) bis 5 (“definitely true”) hinsichtlich ihres Wahrheitsgehalts einschätzen sollen.
Auf pandaR wird der Datensatz in dem Tutorial Konfirmatorische Faktorenanalyse für PsyMSc1
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/conspiracy_cfa.rda"))Größe
Der Datensatz besteht aus 2451 Beobachtungen auf 9 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
edu | höchster Bildungsabschluss | 1 = not highschool, 2 = highschool, 3 = college |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
gender | Geschlecht | 1 = male, 2 = female, 3 = other |
age | Alter | Freitext |
| Variable | Facette | Itemwortlaut |
|---|---|---|
Q1 | GM | The government is involved in the murder of innocent citizens and/or well-known public figures, and keeps this a secret |
Q2 | GC | The power held by heads of state is second to that of small unknown groups who really control world politics |
Q3 | EC | Secret organizations communicate with extraterrestrials, but keep this fact from the public |
Q4 | PW | The spread of certain viruses and/or diseases is the result of the deliberate, concealed efforts of some organization |
Q5 | CI | Groups of scientists manipulate, fabricate, or suppress evidence in order to deceive the public |
Q6 | GM | The government permits or perpetrates acts of terrorism on its own soil, disguising its involvement |
Q7 | GC | A small, secret group of people is responsible for making all major world decisions, such as going to war |
Q8 | EC | Evidence of alien contact is being concealed from the public |
Q9 | PW | Technology with mind-control capacities is used on people without their knowledge |
Q10 | CI | New and advanced technology which would harm current industry is being suppressed |
Q11 | GM | The government uses people as patsies to hide its involvement in criminal activity |
Q12 | GC | Certain significant events have been the result of the activity of a small group who secretly manipulate world events |
Q13 | EC | Some UFO sightings and rumors are planned or staged in order to distract the public from real alien contact |
Q14 | PW | Experiments involving new drugs or technologies are routinely carried out on the public without their knowledge or consent |
Q15 | CI | A lot of important information is deliberately concealed from the public out of self-interest |
Fehlende Werte
Im Datensatz liegen 186 fehlende Werte vor. Die folgenden Variablen enthalten keine fehlenden Werte:
eduageQ10
Gewissenhaftigkeit und Medikamenteneinnahme
(data_combined)
Beschreibung
Der Datensatz stammt aus dem R-eigenen Paket
metafor von Viechtbauer (2010) und beinhaltet Variablen,
die im Zusammenhang mit Gewissenhaftigkeit und der Einnahme von
Medikamenten stehen. Es handelt sich hierbei um eine Meta-Analyse
mehrerer Studien:
Molloy, G. J., O’Carroll, R. E., & Ferguson, E. (2014). Conscientiousness and medication adherence: A meta-analysis. Annals of Behavioral Medicine, 47(1), 92–101. https://doi.org/10.1007/s12160-013-9524-4
Auf pandaR wird der Datensatz in dem Tutorial Metaanalysen in R und Block 4 der Quizze für PsyMSc5a
verwendet.
Datensatz laden
library(metafor)
load(url('https://pandar.netlify.app/post/preprocessing/reliabilites.molloy2014.rda'))Im nächsten Schritt sollte der Datensatz mit den Reliabilitäten und der ursprüngliche Datensatz zusammen gefasst werden. Dafür gibt es einige Möglichkeiten. Hier ist ein Beispiel aufgeführt:
data_combined <- dat.molloy2014
data_combined$rel1 <- reliabilites.molloy2014$RelGewissenhaftigkeit
data_combined$rel2 <- reliabilites.molloy2014$RelCondition
head(data_combined)Größe
Der Datensatz besteht aus 16 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
authors | Autor:innen der Studie | Skalenwert |
year | Jahr der Veröffentlichung | Jahreszahl |
ni | Stichprobengröße | n |
ri | Korrelationskoeffizient | r |
controls | Kontrollgruppe | none = nicht vorhanden, multiple = mehrere Gruppen vorhanden |
design | Studiendesign | prospective = Prospektive Studie, cross-sectional = Querschnittstudie |
a_measure | Methodik zur Messung der medication adherence (Medikamenteneinnahme) | self-report = Selbstbericht, other = andere |
c_measure | Methodik zur Messung der conscientiousness (Gewissenhaftigkeit) | NEO = NEO-Persönlichkeits-Inventar, other = andere |
meanage | Altersmittelwert der Stichprobe | Arithmetisches Mittel |
quality | Qualitätsindex der Studie | 0 - 4 |
rel1 | Reliabilität Gewissenhaftigkeit | Reliabilitätskoeffizient |
rel2 | Reliabilität Condition | Reliabilitätskoeffizient |
Fehlende Werte
Im Datensatz liegen 4 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
studytreatmentscalendiffsegrouptailoredcogbapsedhomeprobsocrelaxgoalfinalmindact
Internetintervention für psychische Störungen
(osf)
Beschreibung
Der Datensatz liegt auf dem Open Science Framework und
stammt aus einer Untersuchung von Schaeuffele et al. (2020), die
den Effekt des Unified Protocol (UP) als Internetintervention für
bestimmte psychische Störungen untersucht haben. In der Untersuchung
wurden psychopathologische Symptome und therapiebezogene Variablen über
einen Zeitraum von 6 Monaten erhoben.
Auf pandaR wird der Datensatz in den Tutorials ANOVA vs. Regression und ANCOVA und moderierte
Regression für PsyMSc5a verwendet.
Datensatz laden
osf <- read.csv(file = url("https://osf.io/zc8ut/download"))
osf <- osf[, c("ID", "group", "stratum", "bsi_post", "swls_post", "pas_post")]Größe
Der Datensatz besteht aus 129 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
ID | Personenidentifikator | Nummer |
group | Gruppenzugehörigkeit | Treatment = Treatmentgruppe, Waitlist = Wartelistenkontrollgruppe |
stratum | Krankheitsbild | ANX = Angststörung, DEP = Depression, SOM = somatische Belastungsstörung |
bsi_post | Symptomschwere | 0 - 212 |
swls_post | Satisfaction with Life Scale (Lebenszufriedenheit) | 5 - 35 |
pas_post | Panic and Agoraphobia Screening (Panikstörung & Agoraphobie) | 0 - 52 |
Fehlende Werte
In dem Datensatz liegen 96 fehlende Werte vor. Auf folgenden Variablen liegen keine fehlenden Werte vor:
IDgroupstratum
Kooperationsbereitschaft von Geschwistern
(dataKooperation)
Beschreibung
Der Datensatz stammt aus Eid, Gollwitzer & Schmitt: “Statistik und Forschungsmethoden” (4. Auflage, S.370). Es wurde die Kooperationsbereitschaft von verschiedenen Geschwisterteilen innerhalb einer Familie erhoben. Die Paare bestehen hierbei aus beiden Geschwisterteilen, von denen jeweils die Kooperationsbereitschaft gemessen wurde.
Auf pandaR wird der Datensatz in dem Tutorial Tests für abhängige
Stichproben für PsyBsc2 verwendet.
Datensatz laden
dataKooperation <- data.frame(Paar = 1:10, Juenger = c(0.49,0.25,0.51,0.55,0.35,0.54,0.24,0.49,0.38,0.50), Aelter = c(0.4,0.25,0.31,0.44,0.25,0.33,0.26,0.38,0.23,0.35))Größe
Der Datensatz besteht aus 10 Beobachtungen auf 3 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt |
|---|---|
Paar | Nummer des Geschwisterpaares |
Juenger | Kooperationsbereitschaft des jüngeren Geschwisterteils |
Aelter | Kooperationsbereitschaft des älteren Geschwisterteils |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Machiavellismus-Fragebogen (mach)
Beschreibung
Die hier verwendeten Daten stammen aus dem “Open-Source Psychometrics Project”, einer Online-Plattform, die eine Sammlung an Daten aus verschiedensten Persönlichkeitstests zur Verfügung stellt. Wir haben bereits eine kleine Aufbereitung der Daten durchgeführt, damit wir leichter in die Analysen starten können. Auf der genannten Seite kann man Fragebögen selbst ausfüllen, und so zum Datenpool beitragen. Der hier verwendete Datensatz enthält Items aus einem Machiavellismus-Fragebogen, den Sie bei Interesse hier selbst ausfüllen können. Der Datensatz erhält viele Angaben zur Persönlichkeit und demografischen Daten. Kern ist aber der 20 Items umfassende Machiavellismusfragebogen von Christie und Geis (1970) und daraus ableitbare 4-faktorielle Struktur des Konzepts (Corral & Calvete, 2000). Die Skalenwerte dieser vier Faktoren haben wir bereits im Datensatz angelegt.
Auf pandaR wird der Datensatz in dem Tutorial Wiederholung von Grundlagen in
R und Quiz 1 für PsyBSc7
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/mach.rda"))Größe
Der Datensatz besteht aus 65151 Beobachtungen auf 26 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
TIPI1 - TIPI10 | Persönlichkeitseigenschaften | 1 = “Stimme gar nicht zu”, 7 = “Stimme voll und ganz zu” |
education | How much education have you completed? | 1 = Less than High School, 2 = High School, 3 = University degree, 4 = Graduate degree |
urban | What type of area did you live when you were a child? | 1 = Rural (country side), 2 = Suburban, 3 = Urban (city, town) |
gender | What is your gender? | 1 = Male, 2 = Female, 3 = Other |
engnat | Is English your native language? | 1 = Yes, 2 = No |
age | How many years old are you? | Freitext |
hand | What hand do you use to write with? | 1 = Left, 2 = Right, 3 = Both |
religion | What is your religion? | 1 = Agnostic, 2 = Atheist, 3 = Buddhist, 4 = Christian(Catholic), 5 = Christian(Mormon), 6 = Christian(Protestant), 7 = Christian(Other), 8 = Hindu, 9 = Jewish, 10 = Muslim, 11 = Sikh, 12 = Other |
orientation | What is your sexual orientation? | 1 = Heterosexual, 2 = Bisexual, 3 = Homosexual, 4 = Asexual, 5 = Other |
race | What is your race? | 1 = Asian, 2 = Arab, 3 = Black, 4 = Indigenous Australian, 5 = Native American, 6 = White/European, 7 = Other |
voted | Have you voted in a national election in the past year? | 1 = Yes, 2 = No |
married | What is your marital status? | 1 = Never married, 2 = Currently married, 3 = Previously married |
familysize | Including you, how many children did your mother have? | Freitext |
nit | Negative interpersonal tactics | Skalenwert |
pit | Positive interpersonal tactics | Skalenwert |
cvhn | Cynical view of human nature | Skalenwert |
pvhn | Positive view of human nature | Skalenwert |
Fehlende Werte
Insgesamt liegen im Datensatz 19 fehlende Werte vor. Diese liegen
ausschließlich auf der Variable familysize vor. Alle
restlichen Variablen enthalten keine fehlenden Werte.
Major Depression (data)
Beschreibung
Der Datensatz stammt aus einer Erhebung von Epskamp et al. (2018a),
welche auf dem Open Science Framework zu finden ist. Die
Daten befassen sich mit einer einzelnen Person. Dabei handelt es sich
laut der Autor:innen um eine Person, die sich nach einer
Major-Depression-Diagnose in der Behandlung befand. Die Fragen wurden
von der teilnehmenden Person 5 Mal am Tag über 14 Tage hinweg
ausgefüllt. Es wurden psychopathologische Symptome erfasst und
untersucht, wie diese miteinander in Verbindung stehen könnten.
Publiziert wurden die Ergebnisse der Studie in folgendem Paper:
Epskamp, S., van Borkulo, C. D., van der Veen, D. C., Servaas, M., Isvoranu, A.-M., Riese, H., & Cramer, A. O. J. (2020, September 21). Personalized Network Modeling in Psychopathology: The Importance of Contemporaneous and Temporal Connections. https://doi.org/10.17605/OSF.IO/C8WJZ
Auf pandaR wird der Datensatz in dem Tutorial Dynamische Netzwerkanalyse für
PsyMSc5a verwendet.
Datensatz laden
data <- read.csv(url("https://osf.io/g6ya4/download"))Größe
Der Datensatz besteht aus 70 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen. Die untersuchte Person sollte bei jeder der folgenden Symptome angeben, inwiefern sie auf sie zutreffen.
| Variable | Inhalt | Kodierung |
|---|---|---|
relaxed | entspannt | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
sad | traurig | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
nervous | nervös | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
concentration | konzentriert | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
tired | müde | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
rumination | ruminierend | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
bodily.discomfort | körperlich wohl | 1 = Trifft überhaupt nicht zu, 7 = Trifft voll und ganz zu |
time | Zeitpunkt der Erfassung | Datum & Uhrzeit |
Fehlende Werte
In dem Datensatz liegen 35 fehlende Werte vor. Folgende Variablen enthalten keine fehlenden Werte:
time
Mehrdimensionaler Befindlichkeitsfragebogen (mdbf)
Beschreibung
Beim Datensatz handelt es sich um eine Erhebung, die 2017 an der Freien Universität Berlin durchgeführt wurde. Die Items stammten dabei aus dem Mehrdimensionalen Befindlichkeitsfragebogen von Steyer et al. (1997). In diesem Fragebogen werden Adjektive zur Beschreibung der aktuellen Stimmung genutzt, um die drei Dimensionen der Stimmung - Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig - zu erheben.
Auf pandaR wird der Datensatz in dem Tutorial Loops und Funktionen für PsyBsc7
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/mdbf.rda"))Größe
Der Datensatz besteht aus 98 Beobachtungen auf 12 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Adjektiv | Richtung | Dimension |
|---|---|---|---|
stim1 | zufrieden | positiv | Gut vs. Schlecht |
stim2 | ausgeruht | positiv | Wach vs. Müde |
stim3 | ruhelos | negativ | Ruhig vs. Unruhig |
stim4 | schlecht | negativ | Gut vs. Schlecht |
stim5 | schlapp | negativ | Wach vs. Müde |
stim6 | gelassen | positiv | Ruhig vs. Unruhig |
stim7 | müde | negativ | Wach vs. Müde |
stim8 | gut | positiv | Gut vs. Schlecht |
stim9 | unruhig | negativ | Ruhig vs. Unruhig |
stim10 | munter | positiv | Wach vs. Müde |
stim11 | unwohl | negativ | Gut vs. Schlecht |
stim12 | entspannt | positiv | Ruhig vs. Unruhig |
In der Spalte Dimension sehen wir, dass die Items 3 verschiedene Dimensionen abbilden: Gut vs. Schlecht, Wach vs. Müde und Ruhig vs. Unruhig. Die Items sind dabei unterschiedlich gepolt - die Adjektive “ausgeruht” und “schlapp” erfasst beide die Dimension Wach vs. Müde, jedoch in unterschiedlicher Ausrichtung.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Naturverbundenheit (nature)
Beschreibung
Der Datensatz behandelt die Naturverbundenheit, welche anhand von 6 Items gemessen wurde. Weiterhin sind Informationen hinsichtlich des Wohnortes vorhanden.
Auf pandaR wird der Datensatz in dem Quiz 5 für PsyBsc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/nature.rda"))Größe
Der Datensatz besteht aus 490 Beobachtungen auf 8 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
Q1A - Q6A | Items zur Naturverbundenheit | Skalenwert |
urban | Typ des Wohnortes | 1 = rural, 2 = suburban, 3 = urban |
continent | Kontinent des Wohnortes | 1 = Americas, 2 = Europe |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Lesekompetenz in der PISA-Erhebung (PISA2009)
Beschreibung
Der Beispieldatensatz enthält Daten zur Lesekompetenz aus der deutschen Stichprobe der PISA-Erhebung in Deutschland 2009. Im Datensatz sind viele Variablen der pädagogischen Forschung enthalten, die im Folgenden erklärt werden.
Auf pandaR wird der Datensatz in dem Tutorial Regression IV:
quadratische und moderierte Regression, Quiz 2 und Quiz 3 für PsyBSc7 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/PISA2009.rda"))Größe
Der Datensatz besteht aus 150 Beobachtungen auf 15 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung |
|---|---|
Grade | Klassenstufe |
Age | Alter in Jahren |
Female | Geschlecht (0 = m, 1 = w) |
Reading | Lesekompetenz |
JoyRead | Lesefreude |
LearnMins | Lernzeit in Minuten für Deutsch |
HISEI | Sozialstatus (Highest International Socio-Economic Index of occupational status) |
CultPoss | Fragebogen-Score für kulturelle Besitztümer zu Hause (z. B. klassische Literatur, Kunstwerke) |
Books | Anzahl Bücher zu Hause |
TVs | Anzahl Fernseher zu Hause |
Computers | Anzahl Computer zu Hause |
Cars | Anzahl Autos zu Hause |
MigHintergrund | Migrationshintergrund (0 = beide Eltern in D geboren, 1 = min. 1 Elternteil im Ausland geboren) |
FatherEdu | Bildungsabschluss des Vaters (International Standard Classification of Education) |
MotherEdu | Bildungsabschluss der Mutter (International Standard Classification of Education) |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Parental Burnout (burnout)
Beschreibung
Die Daten stammen vom Open Science Framework und wurden
im Rahmen dieses Papers erhoben:
Blanchard, M. A., Roskam, I., Mikolajczak, M., & Heeren, A. (2021). A network approach to parental burnout. Child Abuse & Neglect, 111, 104826. https://doi.org/10.1016/j.chiabu.2020.104826
In der Untersuchung wurden charakteristische Merkmale von Parental Burnout untersucht und anhand einer Netzwerkanalyse ihre Zusammenhänge untersucht.
Auf pandaR wird der Datensatz in Block 5b der Quizze für PsyMSc5a
verwendet.
Datensatz laden
burnout <- read.csv(file = url("https://osf.io/qev5n/download"))
burnout <- burnout[2:8]Größe
Der Datensatz besteht aus 1551 Beobachtungen auf 7 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der wichtigsten Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
Exhaust | Emotional exhaustion | 0 - 48 |
Distan | Emotional distancing | 0 - 48 |
Ineffic | Parental accomplishment and efficacy | 0 - 36 |
Neglect | Neglectful behaviors toward children | 17 - 136 |
Violence | Violent behaviors toward children | 15 - 120 |
PartEstrang | Partner Estrangement | 5 - 40 |
PartConfl | Conflicts with partner | 2 - 14 |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Hauptkomponentenanalyse (PCA)
Beschreibung
Der Beispieldatensatz enthält simulierte Daten zu unbekannten Variablen. Eine abhängige und sechs unabhängige Variablen liegen vor.
Auf pandaR wird der Datensatz in dem Tutorial Hauptkomponentenanalyse für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/PCA.RData"))Größe
Der Datensatz besteht aus 36 Beobachtungen auf 7 Variablen.
Variablen
Die Namen der Variablen sind nichtssagend, um Untersuchereffekte bei der Analyse auszuschließen.
| Variable | Kodierung |
|---|---|
x1 | Standardisierter Skalenwert |
x2 | Standardisierter Skalenwert |
x3 | Standardisierter Skalenwert |
x4 | Standardisierter Skalenwert |
x5 | Standardisierter Skalenwert |
x6 | Standardisierter Skalenwert |
y | Standardisierter Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Psychisches Wohlbefinden von Individuen während des Lockdowns in
Frankreich (lockdown)
Beschreibung
Die Daten stammen aus einer Studie zum psychischen Wohlbefinden von Individuen während des pandemie-bedingten Lockdowns in Frankreich. Es handelt sich um hierarchische Daten mit Messzeitpunkten auf Ebene 1 und Individuen auf Ebene 2.
Auf pandaR wird der Datensatz in dem Tutorial Hierarchische Regression sowie in Block 3 der Quizze für PsyMSc5a
verwendet.
Datensatz laden
library(dplyr)##
## Attaching package: 'dplyr'## The following objects are masked from 'package:stats':
##
## filter, lag## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, unionlibrary(ICC)
library(lme4)
library(interactions)# Daten einlesen und vorbereiten ----
lockdown <- read.csv(url("https://osf.io/dc6me/download"))
# Entfernen der Personen, für die weniger als zwei Messpunkte vorhanden sind
# (Auschluss von Fällen, deren ID nur einmal vorkommt)
lockdown <- lockdown[-which(lockdown$ID %in% names(which(table(lockdown$ID)==1))),]
# Daten aufbereiten, Variablen auswählen extrahieren und in Nummern umwandeln
# Entfernen von Minderjährigen & unbestimmtes Gender mit den Funktionen filter() & select () aus dplyr.
lockdown <- lockdown %>%
filter(Age > 18 & Gender == 1 | Gender == 2) %>%
select(c("ID", "Wave", "Age", "Gender", "Income", "EWB","PWB","SWB",
"IWB","E.threat","H.threat", "Optimism",
"Self.efficacy","Hope","P.Wisdom","ST.Wisdom","Grat.being",
"Grat.world","PD","Acc","Time","EWB.baseline","PWB.baseline",
"SWB.baseline","IWB.baseline"))
# Standardisieren der AVs
lockdown[,c("EWB", "PWB", "SWB", "IWB")] <- scale(lockdown[,c("EWB", "PWB", "SWB", "IWB")])
# Standardisieren möglicher Prädiktoren
lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom",
"ST.Wisdom", "Grat.being", "Grat.world")] <-
scale(lockdown[,c("E.threat", "H.threat", "Optimism", "Self.efficacy", "Hope", "P.Wisdom",
"ST.Wisdom", "Grat.being", "Grat.world")])Größe
Der Datensatz besteht aus 2192 Beobachtungen auf 25 Variablen.
Variablen
In diesem Datensatz stehen die Daten eines Messzeitpunktes in je einer Zeile, d.h. die Daten einer Person stehen in mehreren Zeilen (diese Struktur wird oft auch als long format bezeichtet - im Kontrast zum wide format, bei dem die Daten jeder Person in einer Zeile in verschiedenen Variablen stehen). In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
ID | Personenidentifikator | ID |
Wave | Erhebungswelle, zu der die Befragung erfolgt ist | 0 - 5 |
Gender | Geschlecht | 1 = männlich, 2 = weiblich |
Income | Jährliches Einkommen | |
EWB | Emotional Well-Being | standardisierter Skalenwert |
PWB | Psychological Well-Being | standardisierter Skalenwert |
SWB | Social Well-Being | standardisierter Skalenwert |
E.threat | Economic threat | standardisierter Skalenwert |
H.threat | Health threat | standardisierter Skalenwert |
Optimism | Optimismus | standardisierter Skalenwert |
Self.efficacy | Selbstwirksamkeit | standardisierter Skalenwert |
Hope | Hoffnung | standardisierter Skalenwert |
P.Wisdom | Personal Wisdom | standardisierter Skalenwert |
ST.Wisdom | Self-transcendent Wisdom | standardisierter Skalenwert |
Grat.being | Gratitude of Being | standardisierter Skalenwert |
Grat.world | Gratitude toward the World | standardisierter Skalenwert |
PD | Peaceful disengagement | standardisierter Skalenwert |
Acc | Akzeptanz | standardisierter Skalenwert |
Time | Dauer, die sich eine Person zum jeweiligen Zeitpunkt bereits im Lockdown befindet | Zeit in Wochen |
EWB.baseline | Baseline Emotional Well-Being | standardisierter Skalenwert |
PWB.baseline | Baseline Psychological Well-Being | standardisierter Skalenwert |
SWB.baseline | Baseline Social Well-Being | standardisierter Skalenwert |
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Kulturelle Unterschiede in Korruptionsbestrafung
punish
Beschreibung
Die Daten stammen aus einer kuturellen Unterschieden in der Einschätzung von verschiedenen Aspekten der Bestechung. Die hier genutzten Daten sind ein Auszug aus den im Artikel von Hong-Zhi et al., 2021 für Studie 1 genutzten Daten.
Auf pandaR wird der Datensatz in dem Tutorial Regression mit
nominalskalierten Prädiktoren für PsyBSc7 verwendet.
Datensatz laden
Die Daten können direkt vom {{< icon name=“download” pack=“fas” >}} OSF heruntergeladen werden. Allerdings werden einige Schritte durchlaufe, um die Daten auf die nötigen Variablen zu reduzieren, welche mit
source("https://pandar.netlify.app/post/Preprocessing/Data_Processing_punish.R")direkt durchgeführt werden können. Zur Nachvollziehbarkeit, hier noch einmal der Inhalt dieses Skripts:
#### Data preparation file for punishment severity evaluation ----
# for the paper see: https://onlinelibrary.wiley.com/doi/10.1111/ajsp.12509
punish <- foreign::read.spss('https://osf.io/4wypx/download', use.value.labels = TRUE,
to.data.frame = TRUE)
punish <- punish[, c('culture_group', 'bribery_type', 'age', 'gender',
'gains_everage', 'difficulties_everage', 'noticed_probability_everage',
'punishment_probability_everage', 'punishment_severity_everage')]
names(punish) <- c('country', 'bribe', 'age', 'gender', 'gains', 'difficult',
'notice', 'probable', 'severe')
levels(punish$age) <- c(levels(punish$age), 'over 50')
punish$age[punish$age %in% c('51-60', '61-70', 'over 70')] <- 'over 50'
punish$age <- droplevels(punish$age)Größe
Der Datensatz besteht aus 174 Beobachtungen auf 9 Variablen.
Variablen
Der Datensatz enthält (in reduzierter Fassung) folgende Variablen:
| Variable | Inhalt | Kodierung |
|---|---|---|
country | Land | 1 = China, 2 = U.S |
bribe | Ebene der beurteilten Bestechungssituation (experimentelle Kondition) | |
age | Alter in vier Kategorien | 1 = 21 - 30, 2 = 31 - 40, 3 = 41 - 50, 4 = over 50 |
gender | Geschlecht | 1 = female, 2 = male |
gains | Gewinn durch Bestechung | Mittelwert über fünf Situationen (1 bis 10) |
difficult | Schwierigkeit in der Umsetzung der Handlung, die durch Bestechung erwirkt werden soll | Mittelwert über fünf Situationen (1 bis 10) |
notice | Wahrscheinlichkeit mit der Bestechung entdeckt wird | Mittelwert über fünf Situationen (1 bis 10) |
probable | Wahrscheinlichkeit mit der es zur Bestrafung kommt | Mittelwert über fünf Situationen (1 bis 10) |
severe | Schweregrad der erwarteten Bestrafung | Mittelwert über fünf Situationen (1 bis 10) |
Bei den Variablen gains bis severe handelt
es sich um individuelle Einschätzungen, die für fünf verschiedene
schriftlich dargestellte Situationen eingeschätzt werden sollten. Hier
werden die Mittelwerte über die fünf Situationen genutzt.
Fehlende Werte
Im Datensatz liegen keine fehlenden Werte vor.
Schulleistungen
Beschreibung
Auf pandaR wird der Datensatz in den Tutorials Partial- & Semipartialkorrelation, Regressionsanalyse I, Regressionsanalyse II und Regressionsanalyse III für PsyBSc7 sowie in den
Tutorials Einleitung und
Wiederholung und Regression und
Ausreißerdiagnostik für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Schulleistungen.rda"))Größe
Der Datensatz besteht aus 100 Beobachtungen auf 4 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt | Kodierung |
|---|---|---|
female | Geschlecht | 0 = Männlich (Nein), 1 = Weiblich (Ja) |
IQ | Intelligenzquotient | IQ-Wert |
reading | Leseleistung | Skalenwert |
math | Matheleistung | Skalenwert |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Therapieerfolg (Therapy)
Beschreibung
Beim Datensatz handelt es sich um ein fiktives Datenbeispiel mit simulierten Daten, in welchem der Therapieerfolg auf mehreren abhängigen Variablen untersucht werden sollen.
Auf pandaR wird der Datensatz in den Tutorials Multivariate Varianzanalyse und Diskriminanzanalyse für PsyMSc1
verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Therapy.rda"))Größe
Der Datensatz besteht aus 90 Beobachtungen auf 6 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt |
|---|---|
Lebenszufriedenheit | Skalenwert |
Arbeitsbeanspruchung | Skalenwert |
Depressivität | Skalenwert |
Arbeitszufriedenheit | Skalenwert |
Intervention | 1 = Kontrollgruppe, 2 = verhaltenstherapiebasiertes Coaching, 3 = verhaltenstherapiebasiertes Coaching inklusive Gruppenübung |
Geschlecht | 0 = männlich, 1 = weiblich |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Titanic
Beschreibung
Bei dem Datensatz handelt es sich um ein reales Beispiel des Titanicunglücks, in welchem demografische Variablen der Personen erfasst wurden, die sich 1912 an Bord der Titanic befanden. Er ist öffentlich zugänglich auf Open-Daten-Soft zu finden. Der vollständige Datensatz kann hier angesehen werden.
Auf pandaR wird der Datensatz in dem Tutorial Logistische Regressionsanalyse
für PsyMSc1 verwendet.
Datensatz laden
load(url("https://pandar.netlify.app/post/Titanic.rda"))Größe
Der Datensatz besteht aus 714 Beobachtungen auf 4 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Inhalt |
|---|---|
survived | gibt an, ob eine Person das Unglück überlebt hat |
pclass | Klasse, in der die Person reiste (1. bis 3. Klasse) |
sex | Geschlecht der Person (1 = weiblich, 2 = männlich) |
age | Alter der Person |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.
Traumatische Erlebnisse und psychische Störungen
(trauma)
Beschreibung
Die Daten stammen aus einer echten Untersuchung, deren Datensatz hier im
Open Science Framework abgelegt ist. In dem Datensatz wurde
bspw. erhoben, was für potenziell traumatischen Erlebnissen eine Person
ausgesetzt war und zu welchem Grad mittels der Live Event Checklist
(LEC). Weiterhin wurden die Depressionswerte anhand des
Becks-Depression-Inventar (BDI) und die Anxiety-Werte durch die Zung
Self-Rating Anxiety Scale (SAS) erhoben. Für unsere Berechnungen
brauchen wir nur einen Ausschnitt der Vielzahl an Variablen. Diesen
extrahieren wir aus dem originalen Datensatz und erstellen damit einen
neuen. Da das Processing in diesem Fall sehr komplex ist, haben wir das
für Sie übernommen.
Auf pandaR wird der Datensatz in Block 2 der Quizze für PsyMSc5a
verwendet.
Datensatz laden
source(url("https://pandar.netlify.app/post/Preprocessing/Data_Processing_Quiz1.R"))Größe
Der Datensatz besteht aus 470 Beobachtungen auf 11 Variablen.
Variablen
In der folgenden Tabelle erfolgt eine Übersicht der erhobenen Variablen und ihre Bedeutungen.
| Variable | Bedeutung | Kodierung |
|---|---|---|
gender | Geschlecht | w = weiblich, m = männlich |
bdi | Depressions-Werte | kumulierte Werte aus BDI |
bdi_group | Gruppierung der BDI-Scores | 1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome |
sas | Anxiety-Werte | kumulierte Werte aus SAS |
sas_group | Gruppierung der SAS-Scores | 1 = keine auffällige Symptomatik, 2 = milde bis moderate Symptome, 3 = moderate bis schwere Symptome, 4 = schwere Symptome |
future | Einstellung gegenüber der Zukunft | Skalenwert: 5-Punkt-Likert-Skala |
past_neg | Skala Past Negative des ZTPI | Skalenwert: 5-Punkt-Likert-Skala |
dissociation | Gesamtwert der Dissociative Experiences Scale | Skalenwert: 11-Punkt-Likert-Skala |
sexual_assault | Erfahrungen mit sexueller Gewalt | 0 = vorhanden, 1 = nicht vorhanden |
trauma_exp_kind | Art des Traumaerlebnisses | 1 = keine Art eines Traumas erlebt, 2 = schwere Krankheiten, 3 = sexuelle Gewalt, 4 = schwere Unfälle, 5 = körperliche Gewalt, 6 = Krieg/Naturkatastrophen |
trauma_exp_form | Form des Traumaerlebnisses | direct experience = als Opfer, indirect experience = als Zeug:in |
Fehlende Werte
In dem Datensatz liegen keine fehlenden Werte vor.