Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Multivariate Regression
- 31. Mai 2017
- Posted by: Mika
Im Gegensatz zur multiplen Regression, bei der mehrere unabhängige Variablen (UV) bzw. Prädiktoren in ein Modell einbezogen werden, testet die multivariate Regression mehrere abhängige Variablen (AV) bzw. Outcomes gleichzeitig. Wenn Du alle AVs einzeln analysierst, entgehen Dir möglichweise interessante Zusammenhänge oder Abhängigkeiten.
Mit Hilfe der multivariaten Regression kannst prüfen, wie gut das von Dir formulierte Regressionsmodell zu der Struktur Deines Datensatz passt. D. h. dieses Verfahren ermöglicht es Dir Muster in Deinen Daten zu finden, die bspw. mit der univariaten linearen Regression nicht ausfindig zu machen wären. Bei Recherchen zur multivariaten Regression kann es schnell zu Verwirrungen kommen, da Sie oft fälschlicherweise mit der multivariablen/multiplen (mehrere UVs) oder der multinomialen logistischen Regression gleichgesetzt wird.
Unterschied zur multinomialen logistischen Regression
Bezüglich der multinomialen logistischen Regression besteht besonders große Verwechslungsgefahr, da bei diesem Verfahren das Verhältnis mehrerer Antwortkategorien untersucht wird. Diese Kategorien gehören jedoch alle zu derselben AV, d. h. die multinomiale logistische Regression ist kein multivariates Modell, wenn lediglich verschiedene Kategorien einer Variablen zueinander in Bezug gesetzt werden. Sei also vorsichtig und aufmerksam, wenn Du nach weiteren Informationen zu diesem Thema suchst. Solltest Du bspw. mehrere AVs und mehrere UVs mit Hilfe von Regression untersuchen, berechnest du eine multivariate multiple Regression.
Wann verwendet man eine multivariate Regression?
Ob es Sinn macht eine multivariate Regression zu berechnen hängt wie immer von Deiner Fragestellung ab. Vor allem bei longitudinalen Studien, also Studien mit mehreren Erhebungszeitpunkten, kann es interessant sein, mehrere AVs in einem Modell zu berücksichtigen. Allerdings macht es keinen Sinn, eine multivariate Regression für kleine Stichproben zu berechnen, da es eine große Anzahl an Datenfällen braucht, um komplexe Strukturen abzubilden. Zudem sollten Deine AVs zumindest moderat miteinander korrelieren, sonst ist eine Analyse mittels multivariater Regression in der Regel überflüssig.
Diese Methode macht also vor allem bei groß angelegten Studien, wie soziodemografischen Erhebungen Sinn. Es könnte z. B. für Versicherungen von Interesse sein, verschiedene Variablen zu untersuchen, die mit Gesundheit und Lebensstil in Zusammenhang stehen (bspw. Alkoholkonsum, Blutdruck, Lebenszufriedenheit, Gewicht etc.) und deren Ausprägung anhand von einem (simpel) oder mehrerer (multipel/multivariabel) Parameter vorherzusagen (bspw. Einkommen, Alter, Körpergröße, etc.). Zieht man z. B. Blutdruck und Gewicht als AVs heran, wird klar, dass Information verloren gehen kann, wenn die Beziehung zwischen AVs außer Acht gelassen wird.
Welche Aussagen triffst Du mit der multivariaten Regression?
Mit Hilfe der multivariaten Regression kannst Du verschiedene Aussagen treffen. Einerseits prüfst Du das Gesamtmodell hinsichtlich Signifikanz, wodurch widergespiegelt wird, wie gut das von Dir aufgestellte Modell generell zur Datenstruktur passt. Andererseits erhältst Du, wie bei der univariaten (multiplen) Regression, eine eigene Gleichung für jede AV.
Diese Gleichungen sind ident zu dem Resultat, das Du erhalten würdest, wenn Du alle AVs einzeln analysiert hättest. Allerdings liefert Dir die multivariate Regression zusätzlich noch Informationen über die partiellen Korrelationen der AVs (also über den Zusammenhang, der übrigbleibt, wenn Du den Einfluss der UVs ausgeschaltet hast) und darüber, ob die AVs alle von den UVs abhängen bzw. welche AVs in Kombination von welchen UVs unabhängig sind.