Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Diskriminanzanalyse
- 26. April 2018
- Posted by: Mika
Die Diskriminanzanalyse umfasst statistische Verfahren, mit denen Du eine abhängige nominalskalierte Variable aufgrund von metrisch-skalierten unabhängigen Variablen erklären und prognostizieren kannst.
Stell Dir vor, die Käufer Deines Produktes gliedern sich in die Gruppen markentreue Kunden (M) und Markenwechsler (W), die Du jeweils mit speziellen Marketinginstrumenten ansprechen möchtest. Aus vorherigen Analysen weißt Du, dass sich die beiden Gruppen bezüglich Einkommen () und durchschnittlicher Einkaufszeit pro Woche () unterscheiden.
Du suchst nun eine Funktion als Kombination von und , die Diskriminanzfunktion, die eine möglichst scharfe Trennung zwischen den Gruppen M und W ermöglicht: Danach, in welches Intervall der Diskriminanzwert eines Käufers fällt, erfolgt seine Zuordnung.
Am Ende bestimmst Du die Trennschärfe Deiner Funktion.
Für obiges Beispiel hast Du Einkommen und durchschnittliche wöchentliche Einkaufszeit von 22 Testkäufern ermittelt:
Markentreue Kunden | ||||||||||||
lfd. Nr. | i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Einkommen in T€ |
3,2 | 2,5 | 1,5 | 3,5 | 2,5 | 3,5 | 3,0 | 1,0 | 3,5 | 2,5 | 3,5 | |
Wöchentliche Einkaufszeit in Std. |
0,5 | 0,5 | 0,5 | 1,0 | 1,0 | 1,5 | 1,5 | 1,5 | 2,0 | 2,0 | 2,5 | |
Zuordnung nach dem Diskriminanzwert | M | M | M | M | M | M | M | W | M | W | M | |
Markenwechsler | ||||||||||||
lfd. Nr. | i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Einkommen in T€ |
1,0 | 2,0 | 1,5 | 0,8 | 2,5 | 2,0 | 1,0 | 3,0 | 1,5 | 1,5 | 2,2 | |
Wöchentliche Einkaufszeit in Std. |
0,7 | 1,0 | 2,0 | 2,0 | 2,5 | 2,5 | 2,5 | 3,0 | 3,0 | 2,5 | 3,0 | |
Zuordnung nach dem Diskriminanzwert | W | M | W | W | W | W | W | W | W | W | W |
Die Grafik zeigt die Testkäufer im Koordinatensystem mit den Achsen „Einkommen“ und „Wöchentliche Einkaufszeit“:
Gesucht ist nun als erstes eine Linie, die die blaue Punktwolke (Markentreue Kunden) möglichst gut von der roten Punktwolke (Markenwechsler) trennt: diese hast Du mit der schwarzen gestrichelten Linie in der Grafik gegeben. Deren Senkrechte ist dann Deine Diskriminanzachse: Projizierst Du einen Käufer-Punkt senkrecht auf die Diskriminanzachse, so erhältst Du seinen Diskriminanzwert, aus dem ermittelt wird, welcher Gruppe er zugeteilt wird: Liegt ein Diskriminanzwert oberhalb des Schnittpunktes, erfolgt eine Klassifizierung zu W, anderenfalls zu M.
Auf diese Weise kannst Du die Informationen aus den unabhängigen Variablen auf einen einzigen Wert verdichten; eine entsprechende Klassifizierung ist in der obigen Tabelle jeweils in der unteren Zeile erfolgt.
Allgemein lautet Deine lineare Diskriminanzachse:
Die Koeffizienten und werden so bestimmt, dass der Quotient aus den quadratischen Abweichungen zwischen den Gruppen M und W und der Summe der quadratischen Abweichungen innerhalb der Gruppen maximal wird:
Bewertung Deiner Analyse:
Für die Bewertung Deiner Diskriminanzanalyse stehen verschiedenen Varianten zur Verfügung.
Zum einen kannst Du die Fehlklassifikationsrate berechnen: Die letzte Zeile der obigen Tabelle zeigt die Zuordnung der einzelnen Testkäufer nach der Diskriminanzfunktion, die Du auch in der Grafik erkennen kannst: In jeder Gruppe gibt es eine Fehlzuordnung, alle übrigen Käufer wurden durch Deine Diskriminanzfunktion richtig klassifiziert.
Für Dein Beispiel lautet damit die Fehlklassifikationsrate
was angesichts der kleinen Stichprobe kein schlechtes Ergebnis darstellt.
Wilks´Lambda als Quotient der Determinaten von
- W (Matrix der Quadratsummen von Abweichungen innerhalb der Gruppen) und
- T (Matrix der Qudratsummen der Gesamtabweichungen)
stellt ein Maß für die Unterschiedlichkeit der beiden Gruppen dar:
kann Werte zwischen Null und Eins annehmen. Je kleiner \Lambda, umso geringer ist der Anteil der durch Abweichungen innerhalb der Gruppen erklärte Teil der Gesamtabweichungen und umso größer ist der durch die Gruppenbildung erklärte Anteil: Umso besser vermag also die Diskriminanzfunktion die Gruppen zu trennen.
Mithilfe eines -Tests kannst du prüfen, ob die mit Deiner Diskriminanzfunktion erreichte Trennung signifikant ist, ob also signifikante Mittelwertunterschiede zwischen den Gruppen bestehen.
Wobei n die Anzahl der Testpersonen, m die Anzahl der unabhängigen Variablen und k die Anzahl der Gruppen darstellt. Für die Durchführung des Tests vergleichst Du mit bei Freiheitsgraden.
Den kanonische Korrelationskoeffizienten CR als Maß für die Stärke der Beziehungen erhältst Du als
Sein Quadrat, das kanonische Bestimmtheitsmaß, gibt den Streuungsanteil der Diskriminanzwerte an, der durch die Gruppenzugehörigkeit erklärt wird.