Regression

Einführung in lavaan

Einleitung Im Verlauf dieses Seminars soll neben der Einführung in die Theorie und die Hintergründe multivariater Verfahren auch eine Einführung in deren Umsetzung gegeben werden, sodass Sie in der Lage sind, diese Verfahren in Ihrem zukünftigen akademischen und beruflichen Werdegang zu nutzen.

Martin Schultze, Julien P. Irmer

Zuletzt aktualisiert am 11. Apr.. 2024 FuE II

Einführung in lineare Modelle in R

Vorbereitung Zunächst müssen wir das haven-Paket wieder aktivieren und einen Teil des Code aus dem letzten Tutorial wieder durchführen. library(haven) setwd("~/Pfad/zu/Ordner") data <- read_sav(file = "fb22_mod.sav") data$geschl_faktor <- factor(data$geschl, # Ausgangsvariable levels = c(1, 2, 3), # Faktorstufen labels = c("weiblich", "männlich", "anderes")) # Label für Faktorstufen data$nr_ges <- rowMeans(data[,c("nr1", "nr2", "nr3", "nr4", "nr5", "nr6")]) data$prok <- rowMeans(data[,c("prok1", "prok4", "prok6", "prok9", "prok10")]) data$wohnen_faktor <- factor(data$wohnen, levels = c(1, 2, 3, 4), labels = c("WG", "bei Eltern", "alleine", "sonstiges")) lineare Modellierung Die Grundlage für die spätere hierarchische Ansetzung ist das lineares Modell ohne Hierarchie, dem wir uns demnach im Folgenden widmen werden.

Kai J. Nehler, Zarah Schreiner

Zuletzt aktualisiert am 12. Jan.. 2024 KiJu

Multiple Regression und Ausreißerdiagnostik

In diesem Beitrag wird eine multiple Regression in R exemplarisch durchgeführt. Dabei wird erläutert, wie ein Regressionsmodell in R erstellt und der entsprechende R-Output interpretiert werden kann. Außerdem werden die Voraussetzungen für die multiple Regression behandelt. Der Fokus liegt dabei auf der Prüfung der Multikollinearität sowie der Identifikation möglicher Ausreißern und einflussreicher Datenpunkte.

Kai J. Nehler, Julien P. Irmer, Johannes Hartig

Zuletzt aktualisiert am 6. Mai. 2024 KliPPs

Regression und Ausreißerdiagnostik

Einleitung In der Einführungssitzung hatten wir etwas über das Einlesen von Datensätzen, einfache Deskriptivstatistiken und den $t$-Test gelernt und in diesem Rahmen einige Grundlagen der Statistik wiederholt. Nun wollen wir mit etwas komplexeren, aber bereits bekannten, Methoden weitermachen und eine multiple Regression in R durchführen.

Julien P. Irmer, Johannes Hartig

Zuletzt aktualisiert am 12. März. 2024 FuE I

Einführung in gemischte Modelle mit lme4

Vorbereitung Datenbeispiel International College Survey (Diener, Kim-Pietro, Scollon, et al., 2001) Wohlbefinden in unterschiedlichen Ländern load(url('https://pandar.netlify.app/post/kultur.rda')) head(kultur)[, 1:8] # alle Zeilen und Spalten 1-8 für die ersten 6 Personen ## nation female auf_e kla_e lezu pa na bal ## 1 Turkey male 3.

Martin Schultze

Zuletzt aktualisiert am 12. Jan.. 2024 KiJu

ANOVA vs. Regression

In diesem Beitrag geht es um den Zusammenhang von ANOVA und Regression. Zunächst wird gezeigt, wie man Regressionsmodelle miteinander vergleicht. Dann betrachten wir die einfaktorielle und die zweifaktorielle ANOVA genauer an. Dabei gehen wir auf die verschiedenen Typen von Quadratsummen ein, die bei der zweifaktoriellen ANOVA zur Überprüfung unterschiedlicher Hypothesen verwendet werden. Der Beitrag verdeutlicht, dass Regression und ANOVA zu denselben Ergebnis kommen, wenn dieselben Hypothesen geprüft werden.

Julien P. Irmer

Zuletzt aktualisiert am 6. Mai. 2024 KliPPs

Gemischte Modelle für den Längsschnitt

Abschnitte: Vorbereitung LST-Grundmodell Wachstumskurven Vorhersagen von Veränderung Autoregressive Modelle Vorbereitung Kontinuierliche vs. diskrete Zeit Kontinuierliche Zeit Zeit wird in “natürlichen” Einheiten (Millisekunden, Stunden, Tage, …) abgebildet Veränderung ist eine (stetige) Funktion der Zeit Eine funktionale Form wird vorgegeben (linear, quadratisch, logarithmisch) Aus der Funktion wird auf alle zeitlichen Abstände generalisiert Abstände zwischen Messungen können intra- und interindividuell variieren Diskrete Zeit Zeit wird in künstlichen Einheiten (meist Messzeitpunkten) angegeben Veränderung findet in Intervallen statt Die Form der Veränderung ist unbekannt Abstände zwischen Messungen müssen interindividuell identisch sein Datenbeispiel load(url('https://pandar.

Martin Schultze

Zuletzt aktualisiert am 12. Jan.. 2024 KiJu

ANCOVA und moderierte Regression

In diesem Beitrag werden die Kovarianzanalayse (ANCOVA) und die moderierte Regressionsanalyse behandelt. Zuerst wird die ANCOVA vorgeführt, bei der eine nominalskalierte Gruppierungsvariable in ein einfaches Regressionsmodell einbezogen wird, um Gruppenunterschiede zu berücksichtigen. Dann wird die moderierte Regression erläutert, bei der ein zusätzlicher kontinuierlicher Prädiktor, der Moderator genannt wird, in ein Regressionsmodell aufgenommen wird, um zu untersuchen, ob er die Beziehung zwischen Prädiktor und Kriterium beeinflusst. Zuletzt wird gezeigt, wie man sich gegen quadratische Effekte und Multikollinearität absichert.

Julien P. Irmer

Zuletzt aktualisiert am 6. Mai. 2024 KliPPs

Inferenz und Modellauswahl in der multiplen Regression

Einleitung Im letzten Semester haben wir uns bereits mit der Analyse von Zusammenhängen beschäftigt. Dabei haben wir zunächst lineare Modelle mit einem Prädiktor, genannt einfache lineare Regression, und anschließend lineare Modelle mit mehreren Prädiktoren (multiple Regression) kennengelernt.

Kai J. Nehler, Julien P. Irmer, Johanna Schüller, Johannes Hartig

Zuletzt aktualisiert am 6. Mai. 2024 Statistik II

Regressionsanalyse I

Einleitung In der letzten Sitzung haben wir unter anderem Korrelationen zwischen zwei Variablen behandelt. Zur Wiederholung: Mithilfe einer Korrelation kann die Stärke des Zusammenhangs zwischen zwei Variablen quantifiziert werden. Dabei haben beide Variablen den gleichen Stellenwert, d.

Kai J. Nehler, Marvin Schröder, Luisa Grützmacher

Zuletzt aktualisiert am 12. Apr.. 2024 Deprecated

Pfadanalysen und Strukturgleichungsmodelle

In dieser Sitzung beschäftigen wir uns mit Pfadanalysen und Strukturgleichungsmodellen (engl. Structural Equation Modeling, SEM). Diese werden beispielsweise in Werner, Schermelleh-Engel, Gerhard und Gäde (2016, Kapitel 17 in Döring & Bortz, 2016) oder Eid, Gollwitzer und Schmitt (2017) in Kapitel 26 ausführlich beschrieben.

Julien P. Irmer, Martin Schultze

Zuletzt aktualisiert am 16. März. 2024 FuE II

Logistische Regression

Einleitung In dieser Sitzung wollen wir dichotome abhängige Variablen mit der logistischen Regression (vgl. bspw. Eid, Gollwitzer & Schmitt, 2017, Kapitel 22 und Pituch und Stevens, 2016, Kapitel 11) analysieren. Diese Daten sind dahingehend speziell, dass die abhängige Variable nur zwei Ausprägungen hat, welche in der Regel mit $0$ und $1$ kodiert werden.

Julien P. Irmer

Zuletzt aktualisiert am 12. März. 2024 FuE I

Modelle für Gruppenvergleiche

In einer Multi-Sample-Analysis wird in mehreren Gruppen gleichzeitig ein Strukturgleichungsmodell geschätzt. Wir könnten uns bspw. fragen, ob die gleichen Beziehungen zwischen Zeitdruck, Emotionaler Erschöpfung und psychosomatischen Beschwerden, wie wir sie in der letzten Sitzung zu SEM beobachtet haben, gleichermaßen für Männer und Frauen gelten.

Julien P. Irmer, Martin Schultze

Zuletzt aktualisiert am 16. März. 2024 FuE II

Hauptkomponentenanalyse

Einleitung In dieser Sitzung wollen wir uns die Hauptkomponentenanalyse (im Folgenden PCA, engl. Principal Component Analysis, vgl. Eid, Gollwitzer & Schmitt, 2017, Kapitel 25 und insbesondere Kapitel 25.3, Brandt, 2020, Kapitel 23 und insbesondere 23.

Julien P. Irmer

Zuletzt aktualisiert am 12. März. 2024 FuE I

Loops und Funktionen

In diesem Block werden wir verschiedene Arten von Loops (Schleifen) kennenlernen und lernen, vertieft mit Funktionen zu arbeiten. Dieses Wissen wollen wir dann nutzen, um nochmals Power- bzw. Simulationsanalysen durchzuführen, welche wir in der Sitzung zu Simulationsstudien und Poweranalysen bereits kennengelernt haben.

Julien P. Irmer, Johanna Schüller, Sebastian Wallot

Zuletzt aktualisiert am 12. Apr.. 2024 Statistik II

Regression mit nominalskalierten Prädiktoren

In den bisherigen Sitzungen zur multiplen Regression haben wir als Prädiktoren hauptsächlich intervallskalierte Variablen betrachtet. In einigen Beispielen ist aber z.B. das Geschlecht aufgetaucht. In diesem Beitrag gucken wir uns etwas genauer an, was passiert, wenn Prädiktoren nominalskaliert sind.

Martin Schultze

Zuletzt aktualisiert am 12. Apr.. 2024 Statistik II

Einfache Lineare Regression

In diesem Beitrag werden die einfache lineare Regression vorgestellt. Außerdem soll der Unterschied zwischen standardisierten und nicht-standardisierten Regressionsgewichten deutlich werden sowie die Berechnung des Determinationskoeffizienten R² und dessen Bedeutung geklärt werden.

Anna Winkler, Andreas Neubauer, Kai J. Nehler, Julia Beitner

Zuletzt aktualisiert am 2. Apr.. 2024 Statistik I

Multiple Regression

In diesem Beitrag wird die einfache lineare Regression zur multiplen Regression erweitert, indem mehrere Prädiktoren genuzt werden. Deskriptiv werden die einzelnen Parameter der Regression dargestellt und die gemeinsam erklärte Varianz erläutert. Aus inferenzstatistischer Sicht beschäftigen wir uns mit einem globalen Modelltest und Modellvergleichstests. Auch die Annahmen der multiplen Regression werden besprochen.

Martin Schultze

Zuletzt aktualisiert am 2. Apr.. 2024 Statistik I

Regression V: nichtlineare Regression - exponentielles Wachstum

Bisher hatten wir mittels Regressionsanalysen lineare Beziehungen modelliert. In der Sitzung zur quadratischen und moderierte Regresssion kamen dann im Grunde quadratische Effekte mit hinzu. Wir können unser Wissen über Regressionen allerdings auch nutzen um nichtlineare Effekte zu modellieren.

Julien P. Irmer, Martin Schultze

Zuletzt aktualisiert am 12. Apr.. 2024 Deprecated

Regressionsanalyse II

Modelloptimierung Bei der Regressionsanalyse hat die Modelloptimierung zum Ziel, ein Regresionsmodell zu verbessern - das heißt, möglichst viel Varianz der abhängigen Variable zu erklären. Dadurch wird die “Vorhersage” der abhängigen Variable genauer (die Streuung der Werte um die Regressionsgerade/-hyperebene ist kleiner).

Julien P. Irmer, Johannes Hartig, Johanna Schüller, Kai J. Nehler

Zuletzt aktualisiert am 12. Apr.. 2024 Deprecated

Regression IV: quadratische und moderierte Regression

Einleitung und Datensatz In dieser Sitzung werden wir uns mit weiteren nichtlinearen Effekte in Regressionsmodellen beschäftigen. Diese Sitzung basiert zum Teil auf der Literatur aus Eid et al. (2017) Kapitel 19 (insbesondere 19.

Julien P. Irmer, Johannes Hartig

Zuletzt aktualisiert am 12. Apr.. 2024 Deprecated

Regressionsanalyse III

Übersicht und Vorbereitung In den letzten Sitzungen haben wir gesehen, wie wir ein Modell für eine Multiple Regression in R aufstellen und verschiedene Modelle gegeneinander testen können. Besonders bei der Nutzung von Inferenzstatistik wissen wir aber auch, dass genutzte statistische Verfahren häufig Voraussetzungen an die Daten mitbringen.

Julien P. Irmer, Johannes Hartig, Kai J. Nehler

Zuletzt aktualisiert am 12. Apr.. 2024 Deprecated