Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Paneldatenanalyse
- 5. Februar 2018
- Posted by: Mika
Dieser Artikel erklärt die Anwendung einer Paneldatenanalyse. In Paneldaten liegen zum gleichen Individuum verschiedene Informationen zu verschiedenen Zeitpunkten vor. Das kann zum Beispiel der selbe Haushalt, das selbe Unternehmen oder der selbe Staat sein. Dies kann zum Beispiel das Einkaufsverhalten einer Person oder der Stromverbrauch eines Haushalts sein. Auch die Verkaufszahlen eines Unternehmens oder das Bruttoinlandsprodukt eines Landes sind Beispiel.
Pooled Cross Sections
In Querschnittsdaten können uns zwar auch zu verschiedenen Zeitpunkten Informationen vorliegen, aber eben nicht zur gleichen Untersuchungseinheit. Diese Art von Daten nennt man auch Pooled Cross Sections. Damit sind genauso Analysen über die Zeit möglich, jedoch kannst Du nur Veränderungen zwischen den Individuen analysieren.
Der Vorteil von Pooled Cross Sections gegenüber einfachen Querschnittsdaten ist, dass mehrere Stichproben zur Analyse zur Verfügung stehen. Die Stichprobengröße nimmt über die Zeit zu, sodass sich Deine Schätzungen verbessern. Sie nähern sich also dem wahren Wert in der Grundgesamtheit. Genauso kann in gepoolten Modellen der Einfluss der Zeit auf wichtige, erklärende Variablen berücksichtigt werden.
Der Vorteil von Paneldaten gegenüber Pooled Cross Sections ist wiederum, dass wir nun auch Veränderungen innerhalb der einzelnen Individuen über die Zeit beobachten können. Es können nicht nur inter- (between), sondern auch intraindividuelle Veränderungen analysiert werden (within). Dadurch sind gegenüber Pooled Cross Sections bessere Schätzmodelle möglich, die die individuelle Heterogenität berücksichtigen.
Fixed Effects Modelle
In Fixed Effects-Modellen die individuelle, unbeobachtete Heterogenität wie bspw. Geschlecht, Intelligenz oder Präferenzen als fix und über die Zeit konstant betrachtet. Damit spielt der Einfluss jener Variablen aber auch keine Rolle mehr und kann nicht direkt geschätzt werden. Fixed Effects-Modelle konzentrieren sich daher auf die Veränderungen innerhalb der Individuen (within) über die Zeit. Sie versuchen diese möglichst gut zu erklären. Dies erreichen Fixed Effects-Modelle damit, dass sie den Einfluss fixer Effekte eliminieren und so automatisch kontrollieren ohne diese messen zu müssen.
Bei der Analyse von Pooled Cross Sections ist es dagegen wichtig, möglichst alle relevante Drittvariablen zu kontrollieren, um die Verzerrung der Schätzung aufgrund weggelassener Drittvariablen zu minimieren.
Random Effects Modelle
Random Effects-Modelle sind wiederum eine Mischung aus Pooled Cross Sections und Fixed Effects-Modellen. In Random Effects-Modellen wird sowohl der Einfluss von Variablen, die sich zwischen den Individuen (aber nicht über die Zeit) als auch der Einfluss von Variablen, die sich Innerhalb von Individuen (aber nicht über die Zeit) verändern. Sie werden daher auch als Mixed Effects-Modelle bezeichnet.
Ob man sich für eine Analyse von Pooled Cross Sections oder Paneldaten entscheidet, hängt also in erster Linie von der Datensorte ab. Liegen Querschnittsdaten für unterschiedlichen Individuen zu unterschiedlichen Jahren vor, ist eine gepoolte Analyse, aber keine Panelanalyse möglich.
Liegen Paneldaten dergleichen Individuen zu unterschiedlichen Jahren vor, ist eine Paneldatenanalyse möglich. Ob Du dich für ein Fixed Effects- oder Random Effects-Modell entscheidest, hängt vor allem davon ob, ob Du annimmst, dass die individuelle, unbeobachtete Heterogenität ein konstanter (fixer) oder ein zufälliger Effekt ist. Prinzipiell ist aber der große Vorteil von Fixed Effects-Modellen, dass unbeobachtete, individuelle Effekte wie Intelligenz, Präferenzen oder des Geschlechts kontrolliert werden können. Du musst sie also nicht direkt messen. Der große Vorteil von Random Effects-Modellen ist, dass Du die Unterschiede zwischen und innerhalb der Individuen berücksichtigt kannst. Auch den Einfluss fixer Effekte kannst Du explizit schätzen. Das Random Effects-Modell wird deshalb oft auch als Mischung aus Pooled Cross Sections und Fixed Effects-Modell beschrieben (Mixed Effects-Modell). Um Random Effects-Modelle zu verstehen, empfehlen wir Dir deshalb, Du siehst Dir vorher die Beispiele zu Pooled Cross Sections und Fixed Effects-Modell an.
Vereinfacht kannst Du eine Paneldatenanalyse folgendermaßen untergliedern:
Modell | Daten | Analyse |
Pooled Cross Sections | Querschnittsdaten | Unterschiede zwischen Individuen |
Fixed Effects | Paneldaten | Unterschiede innerhalb Individuen |
Random Effects | Paneldaten | Unterschiede zwischen als auch innerhalb Individuen |