Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Nominalskala
- 23. Januar 2018
- Posted by: Mika
Die Nominalskala ist das niedrigste Skalenniveau, sie differenziert Gleichheit und Verschiedenheit bezüglich des Merkmals zwischen zwei Merkmalsträgern. Merkmalsträger werden genau einer Kategorie zugeordnet, eine Anordnung oder ein Vergleich der Kategorien ist nicht möglich.
Nominalskalierte Daten können z. B. verschiedene Zulieferungsfirmen für Fahrradteile oder die botanische Einteilung in Nadel- und Laubbäume sein, der Wohnort oder ob eine bestimmte Eigenschaft vorliegt oder nicht. Als graphische Darstellung nominalverteilter Daten bietet sich z. B. ein gestapeltes Balkendiagramm an, in dem ersichtlich wird, wie sich die Merkmalsträger auf die verschiedenen Kategorien aufteilen.
Was zeichnet die Nominalskala aus?
In nominalskalierten Daten gibt es keine natürliche Reihenfolge zwischen den Kategorien, man kann sie also nicht systematisch anordnen. Nominale Kategorien müssen dem Prinzip der Exklusivität und Exhaustivität folgen: letzteres bedeutet, dass jedes Merkmal einer Kategorie zugehörig ist, z. B. dass jeder literarische Text einer
der drei Gattungen Epik, Lyrik oder Drama zugeordnet wird. Exklusivität meint die Forderung, dass unterschiedliche Merkmalsausprägungen durch unterschiedliche Kategorien abgebildet werden, also kein Text etwa zwei Gattungen zuordnet wird.
Kategorien nummeriert man mit Zahlwerten. Eine Veränderung der Zahlwerte nennt man Transformation. Als Transformationen sind alle bijektiven (auch eineindeutig genannt) Abbildungen der Daten erlaubt. Das bedeutet, dass die Zahlwerte für die Kategorien beliebig verändert werden können, solange jeder Kategorie genau eine und verschiedenen Kategorien zwei unterschiedliche Zahlen zugeordnet werden.
Hast Du die literarischen Gattungen bspw. als 1 (episch), 2 (lyrisch) oder 3 (dramatisch) kodiert, ist die jede alternative Nummerierung (etwa, 7, 13 und 2) erlaubt, jedoch nicht (7, 7 und 13), da dann die Unterscheidbarkeit zwischen den Kategorien episch und lyrisch verloren ginge. Der Informationsgehalt und die Messgenauigkeit würden sich dann also verringern.
Passende Maßzahlen
Als Maß der zentralen Tendenz kann nur der Modus angegeben werden. Das ist die Kategorie, in der sich die meisten Merkmalsträger befinden. Ein Dispersionsmaß lässt sich nicht sinnvollerweise bestimmen, aber es ist möglich, die Anzahl der Kategorien zu benennen.
Manchmal ist die Anzahl der Kategorien willkürlich gewählt, je nachdem, welchen Auflösungsgrad die Daten haben sollen. Zum Beispiel könntest Du das Merkmal Gebäudetyp in Ein- oder Mehrfamilienhaus unterscheiden, aber spezifischere Klassifizierungen mit mehr Kategorien sind denkbar. In diesem Fall ist die Anzahl der verschiedenen Kategorien keine aussagekräftige Größe. Möchtest Du hingegen die Parteienlandschaft eines Landes beschreiben, ist die Anzahl der verschiedenen im Parlament vertretenen Parteien möglicherweise ein Hinweis für die Streuung der politisch vertretenen Interessen.
Lässt man im Fragebogen keine Abstufungen wie in der Likert-Skala, sondern nur ja-nein-Antworten zu, erhält man eine Dichotome Variable. Eine dichotome Variable ist ein Spezialfall einer kategorialen Variable mit nur zwei Ausprägungen (wahr/falsch; vorhanden/nicht vorhanden). Zum Beispiel „Kunde kauft das Produkt (nicht)“, oder bei binären Entscheidungen „Person wählt Option A vs. B“, „Person hat (k)ein Haustier“ oder „Geht gerne auf Parties (ja/nein)“.
Da die Zahlwerte der Kategorien nominal skalierter Daten beliebig gewählt werden können, sind für nominalskalierte Daten spezielle statistische Testverfahren notwendig.
Dazu gehört der Chi-Quadrat-Test, in eine Regression können nominalskalierte Daten mithilfe verschiedener Kodierungen (Effekt- oder Dummykodierung) als Prädiktoren eingehen. Ist die Kriteriumsvariable nominalskaliert, bietet sich eine logistische Regression an.