Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Variablentypen
- 20. Juli 2018
- Posted by: Mika
Variablen sind das täglich Brot für die Statistik. Variablen sind das Resultat der Operationalisierung und Messung von Merkmalen (Verweis) und weisen verschiedene Skalenniveaus auf. Davon hängt wieder ab, für welche statistischen Verfahren die Variablen geeignet sind.
In diesem Artikel sollen verschiedene Begrifflichkeiten geklärt werden, da Variablen in Untersuchungsdesigns verschiedene Rollen oder Funktionen haben können.
Zunächst wird zwischen der abhängigen und den (üblicherweise mehreren) unabhängigen Variablen unterschieden. Im Kontext von Regressionsanalysen sagt man statt unabhängig und abhängig auch Prädiktor- und Kriteriumsvariable. Im Zusammenhang mit Strukturgleichungsmodellen oder Pfadanalysen nennt man die unabhängige Variablen auch exogen und die abhängigen Variablen endogen.
Der Sprachgebrauch kommt aus experimentellen Untersuchungsdesigns: und zwar werden dort die unabhängigen Variablen gezielt im Versuch manipuliert und die Auswirkungen dieser Manipulation auf die abhängige Variable gemessen.
Die in Experimenten untersuchten Zusammenhänge können natürlich auch komplexer sein als in der einfachen Grundform eines Ursache-Wirkungs-Modells mit nur zwei Variablen.
Mediation
Wird der Zusammenhang zwischen der Variable A und B über eine dritte Variable vermittelt, so nennt man diese Mediatorvariable. Sie befindet sich in der Mitte der Kausalkette. Zum Beispiel könntest Du in einer experimentellen Studie herausfinden, dass ein unsicheres Bindungsmuster eines Partners in einer romantischen Beziehung dazu führt, dass er sich aggressiver in Konflikten verhält. Dieser Zusammenhang könnte dadurch mediiert sein, dass der Partner aufgrund seiner unsicheren Bindung (und damit einhergehenden Verlassensängsten) den Konflikt als Bedrohung wahrnimmt.
Verliert der direkte Effekt, der in der Graphik durch eine gestrichelte Linie dargestellt ist, unter Berücksichtigung der Mediation die Signifikanz, spricht man von einer vollständigen Mediation. Das bedeutet, dass der gesamte Einfluss der unabhängigen auf die abhängige Variable mithilfe des Mediatoreffekts erklärt werden kann.
Bleibt hingegen auch nach Kontrolle um den indirekten Mediationseffekt ein statistisch signifikanter direkter Effekt bestehen, handelt es sich um eine teilweise oder unvollständige Mediation: Ein Teil des Einflusses der unabhängigen Variablen auf die abhängige lässt sich mithilfe der Mediation erklären, aber es gibt noch einen darüber hinausgehenden, direkten Einfluss.
Moderation
Im Gegensatz zur Mediatorvariable beeinflusst eine Moderatorvariable nicht die abhängige Variable unmittelbar, sondern wirkt sich auf die Art oder die Stärke des Zusammenhanges aus. Angenommen, man findet einen positiven Zusammenhang zwischen zwei Variablen, kann dieser aber für unterschiedliche Ausprägungen der unabhängigen Variable unterschiedlich geartet sein.
Eine Moderation ist mathematisch und konzeptuell das gleiche wie ein Interaktionseffekt. Es beeinflussen also die unabhängigen Variablen die abhängige Variable nicht nur einzeln, sondern deren Zusammenwirken ist für den Zusammenhang entscheidend.
Der Zusammenhang zwischen zwei Variablen hängt von einer dritten Variable, der Moderatorvariable ab. Im Durchschnitt kann sich dieser Effekt ausmitteln, sodass sich insgesamt ein nicht signifikanter Haupteffekt ergibt. Haupteffekte sind Effekte über alle Variablen hinweg, und deuten auf Niveauunterschiede hin, Nehmen wir das Bespiel, dass an einer Universität Studierende verschiedene Kurse, Seminare und Vorlesungen bewerten. Du wertest die Daten aus und möchtest untersuchen, ob anspruchsvollere Kurse im Durchschnitt besser bewertet werden als Veranstaltungen mit niedrigerem Niveau. Das Ergebnis ist nicht signifikant. Es gibt also keinen Haupteffekt vom Anspruch auf die Bewertung. Anders ausgedrückt, anspruchsvolle Kurse werden nicht besser oder schlechter bewertet als einfache Kurse.
Bei weiterer Analyse fällt dir aber eine Interaktion auf: es gibt eine Moderatorvariable, die den Zusammenhang zwischen Anspruch und Beliebtheit des Kurses deutlich moderiert, und zwar die Motivation der Studierenden. Hoch motivierte Studierende bewerten anspruchsvolle Kurse als sehr gut und wenig anspruchsvolle Kurse als umso schlechter (rote Linie in der Graphik). Bei weniger motivierten Studierenden dreht sich der Effekt um (die blaue Linie). Für die Motivation gibt es noch einen Haupteffekt: und zwar bewerten motivierte Studierende Kurse im Gesamtdurchschnitt besser als wenig motivierte.
Nehmen wir nochmal obiges Beispiel, in dem der Grad an Bindungsunsicherheit negatives Konfliktverhalten vorhersagt. Dieser Zusammenhang könnte durch die Variable „Wahrgenommenes Verhalten des Partners“ moderiert werden. Wird der Partner beispielsweise im Konflikt als liebevoll oder besorgt wahrgenommen, ist das Konfliktverhalten weniger negativ als wenn dieser als unbeteiligt, kalt oder abweisend wahrgenommen wird.
Der Zusammenhang kann sich durch die Moderatorvariable nicht nur in der Stärke, sondern auch im Vorzeichen verändern. Beispielsweise könntest Du einen generellen Zusammenhang finden, dass diejenigen Supermärkte die meisten Besucher haben, deren durchschnittliche Produktpreise am niedrigsten sind. Aber je nach Stadtteil könnte der Zusammenhang unterschiedlich ausfallen, in ärmeren Stadtteilen könnte der Zusammenhang stärker ausgeprägt sein und in sehr reichen Stadtteilen könnte es sogar andersherum sein, dass die preiswerteren Supermärkte weniger häufig frequentiert werden als sehr exklusive Supermärkte.
Moderatorvariablen sind oft kategorial, können aber auch metrisch sein. Eine metrische Moderatorvariable könnte beispielsweise das Alter sein, das den Zusammenhang zwischen Anzahl der besuchten Parties und Einsamkeit moderiert.
Der Moderatoreffekt ist ein multiplikativer. Wie hoch der Zusammenhang zwischen der unabhängigen und der abhängigen Variable ausfällt, hängt von der Ausprägung der Moderatorvariablen ab.
Störvariablen
Schließlich gibt es noch eine Reihe von Störvariablen. Diese sind, wie der Name schon sagt, unerwünschte Einflüsse auf die abhängige Variable und sollten dadurch möglichst vermieden werden oder konstant gehalten werden.
Das Problem mit Störvariablen ist oft, dass man sie entweder gar nicht kennt, oder sie theoretisch denkbar sind, aber keine Daten vorliegen oder dass man nicht weiß, wie der Einfluss der Störvariable ist. Beispielsweise könnten bei einem Rechentest, den abwechselnd zwei verschiedene Versuchsleiter durchführen, die Probanden in der Gruppe des ersten Versuchsleiters deutlich besser abschneiden, wenn er sehr attraktiv ist und daher die Personen motivierter sind, ihr Bestes zu geben.
Umgekehrt könnte die hohe Attraktivität natürlich auch ablenkend wirken und die Aufmerksamkeit mindern, oder nur manche Probanden könnten die Attraktivität des Versuchsleiters bemerken und andere bleiben davon unbeeindruckt. Grundsätzlich ist davon auszugehen, dass es etliche Faktoren gibt, die gezeigtes Verhalten beeinflussen, auch die Tagesform (also ob man ausgeschlafen oder gut gelaunt ist) könnte sich im Testergebnis niederschlagen. Oft sind die Auswirkungen dieser Vielzahl an Einflüssen aber nicht so gravierend und mitteln sich im Durchschnitt über alle Probanden aus.
Ergebnisse sind immer messfehlerbehaftet. Es gehen also auch Einflüsse in das Ergebnis ein, die nichts mit dem zu messenden Konstrukt zu tun haben. Forscher sollten demnach immer bemüht sein, diese Messfehler durch gute Messinstrumente und standardisierte Bedingungen möglichst klein zu halten.
Es gibt allerdings auch Beispiele, in denen auch sehr kleine Veränderungen des Versuchsdesigns bedeutsam in das Ergebnis einfließen. Ein prominentes Beispiel aus der Sozialpsychologie ist der Stereotype Threat (Steele, 1995). Wenn man Frauen vor einem Mathematiktest mit dem Stereotyp konfrontiert, dass Frauen geringere mathematische Fähigkeiten haben als Männer, wird sich dieser Stereotyp gewissermaßen selbst bewahrheiten: Über viele Studien hinweg konnte der robuste Effekt nachgewiesen werden, dass Frauen in einer Stereotypbedingung schlechter abschneiden.
Der Stereotyp kann aber auch viel subtiler als durch offenes Erwähnen aktiviert werden. Der gleiche Effekt zeigte sich bei Collegeauswahltests in den USA, als man die Testteilnehmer vor dem Test ankreuzen ließ, zu welcher ethnischen Gruppe sie gehören. Aufgrund (des nicht explizit erwähnten) Stereotyps, dass Schwarze akademisch weniger erfolgreich sind als kaukasische oder asiatische Personen, schnitten schwarze Personen in diesen Testbedingungen schlechter ab, als wenn sie den Fragebogen zu demographischen Angaben erst nach dem Test ausfüllen mussten.
Wenn man eine Störvariable kennt und weiß, dass sie sich auf die abhängige Variable auswirkt, kann man diese statistisch kontrollieren. Das ist im Übersichtsartikel zur Versuchsplanung schon beschrieben und kann im Abschnitt Kovarianzanalyse genauer nachgelesen werden. Das Problem hierbei ist allerdings die Annahme, dass sich die Störvariable auf alle Teilnehmenden gleichermaßen auswirkt. Außerdem kommen durch die Kovariate mehr zu schätzende Parameter hinzu; das Modell wird also komplexer. Statistische Modelle sollten aber möglichst sparsam sein, deswegen ist es meist nicht sinnvoll, eine ganze Batterie von Störvariablen mit aufzunehmen, sondern höchstens einzelne, bei denen man begründet von einem bedeutsamen Einfluss ausgehen kann. Außerdem benötigt man bei komplexeren Modellen auch immer größere Stichproben.