Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Boxplot
- 19. Juni 2017
- Posted by: Mika
Unter einem Boxplot oder einer Kastengrafik versteht man die grafische Darstellung der Beobachtungswerte eines mindestens ordinalskalierten Merkmals, mit der Du Dir sehr schnell einen Überblick über dieses Merkmal verschaffen kannst.
Stell Dir beispielsweise vor, Du möchtest die Umsatzzahlen Deiner Vertreter im Monat Mai analysieren und hast die folgenden, der Größe nach sortierten, Werte erhoben:
Vertreter | V 1 | V 2 | V 3 | V 4 | V 5 | V 6 | V 7 | V 8 | V 9 | V 10 | V 11 | V 12 | V 13 | V 14 | V 15 |
Umsatz | 5.123 € | 18.254 € | 18.943 € | 21.364 € | 23.215 € | 23.514 € | 23.564 € | 25.466 € | 25.642 € | 26.235 € | 26.842 € | 35.689 € | 37.568 € | 43.561 € | 72.564 € |
Welche statistischen Größen fließen in den Boxplot ein?
- Den Medianwert als den mittleren der aufsteigend geordneten Beobachtungswerte: unterhalb und oberhalb dieses Wertes liegen dann je Deiner Beobachtungen.
- Das untere Quartil als den Wert, unterhalb dem der Werte liegen,
- Das obere Quartil als den Wert, unterhalb dem der Werte liegen.
- Die Differenz zwischen oberem und unteren Quartil, den Wertebereich also, in dem die mittleren der Daten liegen, bezeichnet man als Interquartilsabstand (IQR).
Für Deine Daten ergibt sich dementsprechend:
Median (V 8) | 25.466 € |
---|---|
Unteres Quartil (V 4) | 21.364 € |
Oberes Quartil (V 12) | 35.689 € |
Interquartilsabstand (IQR) | 14.325 € |
(Mittelwert) | 28.503 € |
Aus diesen Informationen wird die Box der Grafik, in der der Daten liegen, erstellt. Zusammen mit den Antennen oder Whiskern legt sie den „Normalbereich“ Deiner Daten fest.
Die Länge der Antennen bemisst sich üblicherweise als das Eineinhalbfache des Interquartilsabstandes, gekürzt auf den „nächst-inneren“ vorkommenden Wert.
Antennnenlänge | berechnete Werte | angepasste Werte: äußerste Beobachtungswerte, die innerhalb dieser Grenzen |
---|---|---|
Median + 1,5 * IQR | 46.954 € | 43.561€ |
Median – 1,5 * IQR | -44.964 € | 5.123 € |
Datenwerte, die außerhalb der Antennen liegen, kannst Du als Ausreißer bezeichnen.
Aus diesen Informationen erstellst Du Deinen Boxplot zu:
Aus der Grafik kannst Du viele Informationen visuell entnehmen: der „Normalbereich“ der Umsätze liegt zwischen 5.123 € und 43.561 €. Der Median von 25.466 € wird vom -Bereich der Daten zwischen 21.364 € und 35.689 € umgeben. Nicht zum „Normalbereich“ gehört schließlich der Umsatzwert von 72.564 €: er ist als Ausreißer zu bewerten.