Druckversion: | Nach dem Drucken: | und zurück zum Dokument |
Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken
ViLeS 1 > IX Zusammenhangsmaße für nominalskalierte Daten (Kontingenzanalyse) > IX-1 Die Maßzahl Chi-Quadrat > Konzepte und Definitionen |
Im vorangegangenen Kapitel hatten wir einer zweidimensionale Häufigkeitstabelle realer Beobachtungen, der sog. Kontingenztabelle eine (aus deren Randverteilungen abgeleitete) Tabelle der bei Unabhängigkeit der beiden Variablen zu erwartenden Häufigkeiten, der sog. Indifferenztabelle gegenüber gestellt.
Es ist nun naheliegend, eine Maßzahl für die Stärke des Zusammenhanges zwischen zwei nominal skalierten Variablen zu konstruieren, die auf den Abweichungen der empirisch in der Kontingenztabelle vorgefundenen Häufigkeiten von den bei Unabhängigkeit erwarteten Häufigkeiten in der Indifferenztabelle basiert.
Diese Überlegungen sollen nochmals anhand der fiktiven Betrachtung des Rauchverhaltens nach Geschlecht veranschaulicht werden:
Abbildung 9-1: Gegenüberstellung von Kontingez- und Indiffernztabelle zum Rauchverhalten
Logischerweise differieren die Werte beider Tabellenkerne umso weniger je geringer das Rauchverhalten durch das Geschlecht bestimmt ist, und umso mehr je stärker sich das Rauchverhalten der Geschlechter unterscheidet.
Es ist also schlüssig, die Differenz (fb - fe) zwischen der Werten der Kontingenz- und der Indifferenztabelle zum Ausgangspunkt eines konstruktiven Ansatzes zu wählen.
Allerdings führt eine erste Überlegung, die Differenzen über die Tabellenfelder aufzusummieren, nicht weiter, weil sich die positiven und negativen Abweichungen gegenseitig aufheben:
Hilfsweise werden die Differenzen quadriert, mittels einer Division durch fe relativiert und schließlich aufsummiert.
Somit lautet die Formel für Chi-Quadrat:
χ2 ergibt sich also als Summe der Terme , die für jedes Feld der Kontingenztabelle berechnet werden.
Dies sei für das obige Beispiel demonstriert:
Abbildung 9-2: χ2-Wert für den Zusammenhang zwischen Geschlecht und Rauchverhalten
Eine Formel eines verkürzten Rechenverfahrens für χ2 auf der Basis einer 2 x 2 Felder-Tabelle findet sich hier
χ2 ist eine Funktion der Stärke des Zusammenhangs zwischen zwei Variablen.
χ2 lässt sich für alle Skalenniveaus berechnen.
χ2 ist unabhängig von der Richtung des Zusammenhangs.
χ2 kann Werte > 1 annehmen.
Bei Unabhängigkeit der Variablen (fb = fe) nimmt χ2 den Wert "0" an, d.h.:
0 ≤ χ2 ≤ χ2max
Aus der Formel ergibt sich, dass χ2 von der Anzahl der Beobachtungen abhängt, d.h.:
χ2 = f(N) .
Ebenso variiert χ2 mit der Tabellengröße, d.h.:
χ2 = f(Z,S).
Da sowohl von der Fallzahl N als auch der Form der Tabelle beeinflusst wird, ermöglicht es nur tendenzielle Rückschlüsse auf die Stärke des Zusammenhanges.
Lediglich wenn den Wert Null annimmt, kann die völlige statistische Unabhängigkeit von X und Y diagnostiziert werden.
In der induktiven Statistik wird allerdings ein Verfahren eingeführt - der -Unabhängigkeitstest - mit dem geprüft werden kann, ob ein signifikanter (mehr als zufälliger) Zusammenhang zwischen den Variablen besteht.
Im Modul IX-2 werden deshalb weitere Maßzahlen auf der Basis von vorgestellt, die Modelle für die Stärke des Zusammenhanges beinhalten und weitgehend unabhängig von Tabellenform, Tabellengröße und zahlenmäßiger Größenordnung des beobachteten Merkmals sind.
Diese Maßzahlen bewegen sich in einem Bereich zwischen 0 und 1, wobei 0 Unabhängigkeit und 1 einen vollständigen Zusammenhang bedeuten.
letzte Änderung am 28.2.2020 um 7:49 Uhr.
Adresse dieser Seite (evtl. in mehrere Zeilen zerteilt)
http://viles.uni-oldenburg.de/navtest/viles1/kapitel09_Zusammenhangsma~~sze~~lf~~uer~~lnominalskalierte~~lDaten/modul01_Die~~lMa~~szzahl~~lChi-Quadrat/ebene01_K
onzepte~~lund~~lDefinitionen/09__01__01__01.php3