Druckversion: | Nach dem Drucken: | und zurück zum Dokument |
Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken
ViLeS 1 > XI Regressions- und Korrelationsanalysen |
In diesem Kapitel werden Methoden zur statistischen Analyse von Zusammenhängen zwischen zwei metrischen Variablen behandelt. Dabei stellen wir wieder die tabellarische und graphische Aufbereitung der Verteilungen der Berechnung von Zusammenhängen zwischen den Variablen voraus.
Für Variablen auf nominalem und ordinalem Skalenniveau waren bei der Darstellung und Analyse von Zusammenhängen jeweils die sich aus dem Skalenniveau ergebenden Beschränkungen zu berücksichtigen.
Metrische Daten erlauben hingegen eine Vielzahl von Rechenoperationen und lassen sich gut durch mathematische Funktionen ausdrücken und in Koordinatensystemen graphisch zu veranschaulichen.
Während wir für Variablen auf nominalem und ordinalem Skalenniveau nur die Stärke eines Zusammenhangs bestimmen konnten, Richtungsangaben waren allenfalls für ordinale Variablen über das Vorzeichen der Koeffizienten zu erschließen, erlauben es metrische Daten, mit der Regressionsanalyse die Richtung der Abhängigkeit und mit der Korrelationsanalyse die Stärke des Zusammenhangs zu quantifizieren.
Die Präsentation zweidimensionaler metrischer Daten in Tabellen stößt wegen der vielen unterschiedlichen Einzelbeobachtungen sehr schnell an ihre Grenzen. Weil für jede einzelne Ausprägung einer Variablen eine eigene Zeile resp. Spalte vorzusehen ist, führt dies dazu, dass sich in einer Zeile bzw. Spalte meist nur eine einzige Beobachtung befindet und deshalb fast alle Zellen leer bleiben.
Die Klassierung der Ausgangsvariablen führt zwar zu überschaubareren Tabellen. Will man allerdings den Informationsgehalt der Aufbereitung nicht zu sehr einschränken, führt auch diese Maßnahme, vor allem bei deutlichen Zusammenhängen zwischen den Variablen, zu vielen leeren Tabellenfeldern.
Die graphische Darstellung einer zweidimensionalen Häufigkeitsverteilung metrischer Daten im X,Y - Koordinatensystem ist deshalb die Präsentation-Methode der Wahl. In einer sog. Punktwolke wird jedes Wertepaar(Xi, Yi) als Punkt im Koordinatensystem abgebildet, so dass es zu keinem Informationsverlust kommt.
Bei der statistischen Aufbereitung ist es also sinnvoll, einer Kreuz-Tabelle der klassierten Häufigkeiten das Streuungsdiagramm der Originaldaten zu Seite zu stellen.
Die graphisch Darstellung der Daten erlaubt bereits erste Schlüsse auf die Stärke des Zusammenhangs und dessen Richtung. Auf ihrer Basis werden in den folgenden Modulen auch die rechnerischen Analysen veranschaulicht.
Im Modul XI - 1 analysieren wir im einfachen linearen Regressionsmodell die funktionale Form des Zusammenhangs. Dies bedeutet zum einen, dass nur eine abhängige und eine unabhängige Variable und nur ein linearer Zusammenhang zwischen den Variablen unterstellt wird.
Dabei betrachten wir die abhängige Variable als Funktion der unabhängigen Variablen und suchen nach einer linearen Regressions-Funktion Yic = a + bXi , die diesen Zusammenhang beschreibt.
In Modul XI - 2 entwickeln mit dem einfachen linearen Korrelationsmodell die entsprechenden Methoden zur Ermittlung der Stärke des Zusammenhangs.
Dieses resultieren einerseits im Korrelationskoeffizienten R nach Bravais-Pearson der die gewünschten Eigenschaften:
R = - 1, bei vollständigem negativen Zusammenhang,
R = 0 , bei Unabhängigkeit und
R = + 1, bei vollständigem positiven Zusammenhang
besitzt.
Dessen Quadrat, der Determinationskoeffizient R2 erfasst die Stärke des Zusammenhangs, in dem er angibt, wie weit die Varianz der abhängigen Variablen durch die Varianz der unabhängigen Variablen bestimmt wird.
Übersicht 11-1: Aufbereitung und Analyse zweidimensionaler metrischer Verteilungen
Das Kapitel besteht somit aus den folgenden Modulen:
In diesem Modul wird, nach der Präsentation einer Kreuztabelle für klassierte metrische Variablen, das lineare Regressionsmodell an einem Streuungsdiagramm veranschaulicht und daraus mit der Methode der kleinsten Quadrate die lineare Regressionsfunktion bestimmt.
In diesem Modul werden R und R2 aus der Kovarianz der beiden Variablen X,Y bzw. als Verhältnis von erklärter Varianz der Variablen Y zu ihrer Gesamtvarianz abgeleitet.
Schließlich werden im Modul XI - 3 die Durchführung von Regressions- und Korrelationsanalysen mit SPSS an Hand des Beispieldatensatzes demonstriert. Dabei werden:
die Berechnung der Parameter der Regressionsfunktion sowie
die Ermittlung des Korrelations- und Determinationskoeffizienten
Anschließend können diese Regressions- und Korrelationsanalysen wieder anhand eigener Ausgabenstellungen und Datensätzen durchgeführt werden.
Wählen Sie ein Modul:
letzte Änderung am 28.2.2020 um 7:49 Uhr.
Adresse dieser Seite (evtl. in mehrere Zeilen zerteilt)
http://viles.uni-oldenburg.de/navtest/viles1/kapitel11_Regression~~lund~~lKorrelation/index.php3