Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Empirische Verteilungsfunktion
- 19. Juni 2017
- Posted by: Mika
Hast Du ein oder mehrere mindestens ordinalskalierte Merkmale erhoben, kannst Du die empirisch Verteilungsfunktion berechnen. Diese ergeben sich direkt aus den relativen Häufigkeiten der Ausprägungen Deiner Erhebung. Sie gibt für die i-te Ausprägung eines Merkmals die Häufigkeiten an, mit der Du diese oder eine kleinere Ausprägung des Merkmals beobachtet hast. Rechnerisch ergibt sie sich folglich als Summe aller relativen Häufigkeiten von Merkmalsausprägungen, die kleiner oder gleich der i-ten Ausprägung sind. Für den eindimensionalen Fall heißt das:
Die Teilnehmer einer Bildungsmaßnahme wurden nach ihrem höchsten Bildungsabschluss befragt und es ergaben sich die folgenden Häufigkeiten:
lfd. Nummer | Schulabschluss | absolute Häufigkeit | relative Häufigkeit | empirische Verteilungsfunktion |
---|---|---|---|---|
i | ||||
1 | Hochschulabschluss | 3 | 0,0811 | 0,0811 |
2 | Abitur | 15 | 0,4054 | 0,4865 |
3 | Realschulabschluss | 12 | 0,3243 | 0,8108 |
4 | Hauptschulabschluss | 5 | 0,1351 | 0,9459 |
5 | ohne Abschluss | 2 | 0,0541 | 1,0000 |
Summe | 37 | 1,0000 |
Die absoluten und relativen Häufigkeiten lassen sich einfach interpretieren. Von den 37 Befragten gaben beispielsweise 15 Personen an, als höchsten Schulabschluss das Abitur erworben zu haben. Das ist ein Anteil von 0,4054 bzw. .
Empirische Verteilungsfunktion
Die empirische Verteilungsfunktion kumuliert die relativen Häufigkeiten bis zu der gerade betrachteten Ausprägung. So besagt Ihr Wert in der Zeile der Merkmalsausprägung „3“, dass der Befragten angaben, mindestens einen Realschulabschluss zu haben.
Betrachtest Du mehr als zwei Merkmale, so kannst Du die empirische Verteilungsfunktion aus den mehrdimensionalen Häufigkeitsverteilungen entsprechend berechnen:
Ein Arzt betreut eine Gruppe von Patienten mit ähnlichem Krankheitsbild und erhebt an ihnen die beiden Merkmale Körpergröße und Gewicht. Er klassifiziert beide Merkmale und erhält die folgende absolute bzw. relative Häufigkeitsverteilung:
Absolute und relative Häufigkeiten einer zweidimensionalen Häufigkeitsverteilung | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
i | Körpergröße Intervall |
unter 1,55 m | 1,55m bis 1,70 m | ab 1,71 m | Summe | |||||
1 | bis 60 kg | 10 | 0,1887 | 3 | 0,0566 | 1 | 0,0189 | 14 | 0,2642 | |
2 | 61 bis 70 kg | 5 | 0,0943 | 9 | 0,1698 | 6 | 0,1132 | 20 | 0,3774 | |
3 | 71 bis 80 kg | 1 | 0,0189 | 4 | 0,0755 | 11 | 0,2075 | 16 | 0,3019 | |
4 | über 80 kg | 0 | – | 1 | 0,0189 | 2 | 0,0377 | 3 | 0,0566 | |
Summe | 16 | 0,3019 | 17 | 0,3208 | 20 | 0,3774 | 53 | 1,0000 |
Durch Kumulieren der relativen Häufigkeiten gelangst Du zur zweidimensionalen empirischen Verteilungsfunktion:
Empirische Verteilungsfunktion einer zweidimensionalen Häufigkeitsverteilung | |||||
---|---|---|---|---|---|
i | Körpergröße Gewicht |
unter 1,55 m | 1,55m bis 1,70 m | ab 1,71 m | |
1 | bis 60 kg | 0,1887 | 0,2453 | 0,2642 | |
2 | 61 bis 70 kg | 0,2830 | 0,5094 | 0,6415 | |
3 | 71 bis 80 kg | 0,3019 | 0,6038 | 0,9434 | |
4 | über 80 kg | 0,3019 | 0,6226 | 1,0000 |
Die zweidimensionale empirische Verteilungsfunktion besagt etwa, dass ein Anteil von 0,5094 oder der untersuchten Personen höchstens 1,70 m groß und 70 kg schwer sind. Zudem sind von den Patienten unter 1,55 m groß und wiegen höchstes 70 kg.