Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Kendalls Tau
- 30. Oktober 2017
- Posted by: Mika
Ähnlich wie der Rangkorrelationskoeffizient ist Kendalls Tau ein Maß für den Zusammenhang zwischen den Beobachtungen zweier mindestens ordinalskalierter Merkmale x und y, der auf Ausreißer robust reagiert. Es geht von der nach dem Merkmal x sortierten Rangfolge aus. Er misst, wie oft die Rangfolge der Beobachtungen von y diese Rangfolge durchbrechen. Diese Anzahl wird durch die Anzahl der prinzipiell möglichen Rangfolgen dividiert. Dadurch ist er auf das Intervall von minus Eins bis plus Eins beschränkt. Sind die beiden Rangfolgen identisch so gibt es einen vollkommenen Zusammenhang und der Koeffizient nimmt den Wert Eins an.
Angenommen, Du möchtest den Zusammenhang zwischen dem höchsten Schulabschluss 25-jähriger Stadtbewohner und dem Ihrer Eltern messen. Dazu erhebst Du diese Informationen bei fünf willkürlich ausgewählten Personen:
Person i | 1 | 2 | 3 | 4 | 5 |
x: höchster Schulabschluss |
Abitur | Studium | Hauptschule | ohne Abschluss | Realschule |
y: höchster Schulabschluss der Eltern |
Realschule | Studium | ohne Abschluss | Abitur | Hauptschule |
Erstellung der Rangfolge
Die Angaben des ersten Merkmals werden in ihre natürliche Rangfolge von 1: „Studium“ bis 5: „ohne Abschluss“ gebracht. Die zugehörigen Rangwerte des zweiten Merkmals notierst Du ebenfalls:
Person i | 2 | 1 | 5 | 3 | 4 |
x: höchster Schulabschluss |
1 | 2 | 3 | 4 | 5 |
y: höchster Schulabschluss der Eltern |
1 | 3 | 4 | 5 | 2 |
Du beginnst mit der Person 2, die für x den besten Rangwert erhalten hat. Für y wurde hier ebenfalls 1 beobachtet. Prinzipiell möglich wären aber auch die Ränge 2, 3, 4 oder 5 gewesen.
Bei der Person 1, die bei x den Rangwert 2 errungen hat, weist y den Rang 3 aus: Du bestimmst alle Ränge, die für diese Person möglich wären, weil sie bezüglich des Merkmals y noch nicht vergeben sind: Für Person 1 kämen zusätzlich zum Rang 3 also die Ränge 2, 4 und 5 in Frage, Rang 1 ist bereits für Person 2 vergeben.
Bei Person 5 mit dem für y beobachteten Rangwert von 4 sind außerdem die Ränge 2 und 5 möglich und bei Person 3 bleibt zusätzlich zum beobachteten Rangwert der Rang 2 als weitere Alternative übrig.
Allgemein kannst Du bei n Objekten von möglichen nicht übereinstimmenden Anordnungen ausgehen, hier sind es $\frac {5 \cdot 4} 2=10} Möglichkeiten.
Vergleich der tatsächlichen und möglichen Rangwerte
Jeden beobachteten Rangwert von y vergleichst Du jetzt mit den theoretisch möglichen anderen Rangwerten und versiehst solche Paare mit einem Plus, bei denen der realisierte Rangwert kleiner als der mögliche Wert ist (Proversion) bzw. mit einem Minus, wenn der erste Wert größer als der auch noch mögliche Wert ist (Inversion). Falls die Anordnung rein zufällig wäre, sollten sich die Anzahlen von „Plus“ und „Minus“ nur zufällig unterscheiden.
1-2 | 1-3 | 1-4 | 1-5 | 3-2 | 3-4 | 3-5 | 4-2 | 4-5 | 5-2 |
+ | + | + | + | – | + | + | – | + | – |
Du bestimmst die Differenz zwischen der Häufigkeit des Auftretens von „Plus“ und der von „Minus“ als S (hier: S = 7 – 3 = 4). Kendalls Tau bestimmt sich dann durch Division dieser Differenz durch die Anzahl der möglichen Rangfolgen:
Kendalls Tau gibt für Deine Beobachtungen also einen leicht positiven Zusammenhang zwischen dem höchsten Schulabschluss der Eltern und dem der Kinder aus.
Für den Fall, dass Bindungen auftreten, d.h. wenn der gleiche Rang mehrmals bei einem oder beiden Merkmalen auftritt, ist die Formel zu modifizieren.