Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Konfidenzintervall für Erwartungswert, Varianz und Median
- 16. November 2016
- Posted by: Mika
Hast Du für Deine Schätzung der Grundgesamtheit eine geeignete Stichprobe erhoben, so kannst Du daraus Schätzungen für die Parameter der Grundgesamtheit vornehmen. Solche Parameter sind z. B. der Erwartungswert, die Varianz oder der Median.
Diese Werte sind Punktschätzungen. Sie stimmen mit nur sehr geringer Wahrscheinlichkeit exakt mit den Parametern der Grundgesamtheit überein. Dies gilt selbst dann wenn sie alle statistisch wünschenswerten Eigenschaften aufweisen. Es ist daher interessant zu ermitteln, in welchem Zahlenbereich sich der wahre Parameter befindet.
Was ist ein Konfidenzintervall?
Ein Konfidenzintervall oder auch Vertrauensintervall ist ein aus einer Stichprobe mithilfe der Schätztheorie bestimmter Intervallbereich. In diesem Bereich liegen die Parameter der Grundgesamtheit dann mit einer bestimmten Wahrscheinlichkeit. Dabei sind die Grenzen des Intervalls Zufallsvariablen.
Im Zuge einer Untersuchung des Ausgabeverhaltens von Studenten in Deutschland hast Du beispielsweise eine geeignete Stichprobe vom Umfang n=200 gezogen. Die Ausgaben für Nahrungsmittel hast Du dabei wie folgt erfragt: „Wieviel Euro gibst Du im Monat für Nahrungsmittel aus?“
Die Auswertung der Antworten ergaben dann die folgenden Schätzwerte für die wahren Parameter:
- Mittlere Ausgaben als Schätzwert für den Erwartungswert
- Stichprobenvarianz: , Standardabweichung: als Schätzwerte für die Varianz bzw. der Standardabweichung σ der Grundgesamtheit
- Median: 185
Um diese Schätzwerte suchst Du nun symmetrische Intervalle, in denen die wahren Parameterwerte mit einer Wahrscheinlichkeit von 95% liegen.
Konfidenzintervall für den Erwartungswert E(X)
Bei großen Stichproben, etwa ab n=100, kannst Du E(X) gemäß dem Zentralen Grenzwertsatz als normalverteilt ansehen. Du transformierst dann alles in standardnormalverteilte Werte.
Die standardisierten Grenzen des 95%-Konfidenzintervalls ergeben sich dann als z-Werte der Standardnormalverteilung an den Stellen 2,5% und 97,5%:
Aus diesen standardisierten Werten kannst Du die anschließend die Intervallgrenzen durch Rückgängigmachen der Standardisierung berechnen:
Einsetzen der Zahlen ergibt dann die untere und obere Grenze Deines Konfidenzintervalls.
Mit einer Wahrscheinlichkeit von 95% haben die Daten ein Konfidenzintervall geliefert, das den wahren Mittelwert enthält. Der Erwartungswert der monatlichen Ausgaben von Studenten für Nahrungsmittel liegt also zwischen 147,80 € und 226,20 €.
Für kleine Stichproben mit n < 100 kannst Du dagegen keine Normalverteilung annehmen. Dann folgt die standardisierte Zufallsvariable einer t-Verteilung mit Freiheitsgraden. Für die Berechnung der Grenzen des Konfidenzintervalls tritt dann an die Stelle der z-Werte die entsprechenden Werte der t-Verteilung.
Konfidenzintervall für die Varianz
Hier nutzt Du anstelle der Normalverteilung aus, dass der Quotient aus Stichprobenvarianz und Varianz der Grundgesamtheit einer -Verteilung mit Freiheitsgraden folgt.
Es ergibt sich also:
Du settzt in diese allgemeine Formel Deine Stichprobenschätzwerte und die Werte der Verteilung ein. Damit erhältst Du als untere und obere Grenzen des Konfidenzintervalls für die Varianz:
Das Konfidenzintervall mit den Grenzen 331,72 und 491,87, das die Stichprobe geliefert hat, enthält folglich Deine wahre Varianz mit einer Wahrscheinlichkeit von 95%.
Konfidenzintervall für den Median
Im Fall einer großen Stichprobe mit kann die Verteilung von X und E(X) als asymptotisch normalverteilt angesehen werden. Die Normalverteilung ist symmetrisch. Das bedeutet, dass Erwartungswert und Median zusammenfallen. Das Konfidenzintervall für den Median ist dann identisch mit dem für den Erwartungswert.
Im Fall einer kleinen Stichprobe und unbekannter Verteilung der Grundgesamtheit bieten Statistikprogramme dennoch Optionen an. Du kannst so mittels Bootstrapping-Verfahren meist asymmetrische Konfidenzintervalle für den Median ermitteln.
Induktive Statistik
- Schätzen von Parametern
- Konfidenzintervall für Erwartungswert, Varianz und Median
- Hypothesentests / Signifikanztests
- Testtheorie
- Alphafehler-Kumulierung (Multiple Testing, Bonferroni-Korrektur)
- Nullhypothese, Alternativhypothese (Gegenhypothese), Gerichtete Hypothese, Ungerichtete Hypothese
- Alphafehler (Fehler 1. Art), Signifikanzniveau
- Teststatistik
- p-Wert, kritischer Wert
- Poweranalyse: Betafehler (Fehler 2. Art), Effekt, Teststärke, Optimaler Stichprobenumfang
- Prüfung auf Unabhängigkeit
- Anpassungstests / Prüfung auf Verteilung
- Prüfung auf Mitte
- Prüfung auf Streuung
- Prüfung von Zusammenhängen
- Verteilungsunabhängige Tests / nichtparametrische Tests
- Testtheorie
- Statistische Modelle und Methoden