Druckversion: | Nach dem Drucken: | und zurück zum Dokument |
Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken
ViLeS 1 > II Tabellarische und graphische Aufbereitung eindimensionaler statistischer Daten > II-2 Die tabellarische Darstellung eindimensionaler Häufigkeitstabellen > Beispiele und Aufgaben |
Im Folgenden behandeln wir das Problem der Datenaufbereitung am Beispiel metrischer Daten. Als Beispiel wählen wir eine fiktive Untersuchung. Dabei wurden die jährlichen Urlaubsausgaben von N=100 Studenten an der Universität Oldenburg ermittelt.
Die in der Reihenfolge der Dateneingabe erstellte Urliste sieht wie folgt aus:
Tabelle 2-5: Urliste der fiktiven Urlaubsausgaben Oldenburger Studierender in EUR
Dieses Beispiel verdeutlicht sehr anschaulich den großen Nachteil einer
Urliste: Ihre Unübersichtlichkeit!
Aus diesem Grund soll nun versucht werden, die
Daten in einem ersten Schritt zu ordnen.
Wir erhalten folgende Primärtabelle:
Tabelle 2-6: Geordnete Primärtabelle der Urlaubsausgaben in EUR
Bei der geordneten Einkommenstabelle sieht man, dass die Fälle 1 bis 12 kein Geld für Urlaub ausgegeben haben. Diese werden bei der Gruppierung in die Gruppe "0 €" übernommen. Das gleiche geschieht mit den anderen €-Nennungen, die mehr als einmal vorkommen.
Nach der Gruppierung sollten die Daten wie folgt aussehen:
Tabelle 2-7: Gruppierte Häufigkeitstabelle der Urlaubsausgaben in €
Einkommen |
prozentuale Häufigkeit |
0-1000 |
13 |
1000-1500 |
19 |
1500-2000 |
25 |
2000-3000 |
37 |
3000-5000 |
6 |
Summe: |
100 |
Beim Aufkumulieren werden die Häufigkeiten zeilenweise addiert. D.h. für die erste Klasse ergibt sich eine aufkumulierte Häufigkeit von 13%, in der Klasse "bis unter 2000 €" finden sich 32% der Einkommensbezieher (13 + 19), so dass in der Klasse "bis unter 5000 €" die Gesamtzahl der Befragten - hier N=100 % - erscheint. Aus der oben gegebenen Tabelle resultiert also folgende Tabelle der aufkumulierten prozentualen Einkommen:
Tabelle 2-9: Aufkumulierte prozentuale Einkommen
Einkommen |
Aufkumulierte prozentuale Häufigkeiten
|
1000 |
13 |
1500 |
32 |
2000 |
57 |
3000 |
94 |
5000 |
100 |
- |
- |
Welche Aussagen lassen sich aus dieser Tabelle gewinnen? Mit der sog. "bis-unter"-Methode können erste Aussagen über nicht erreichte Einkommenshöhen gemacht werden. Wird z.B. die dritte Klasse betrachtet, lässt sich sagen, dass 57% der Leute bis unter (nicht einmal) 2000 € verdienen. Analog dazu beziehen 94% ein Einkommen bis unter 5000 €.
Beim Abkumulieren werden die Häufigkeiten beginnend mit der ersten Zeile zeilenweise von der Gesamtzahl der Beobachtungen abgezogen. Die entsprechende Tabelle der abkumulierten prozentualen Häufigkeiten sieht danach wie folgt aus:
Tabelle 2-10: Abkumulierte prozentuale Häufigkeiten
Einkommen |
Abkumulierte prozentuale Häufigkeiten
|
1000 |
87 |
1500 |
68 |
2000 |
43 |
3000 |
6 |
5000 |
0 |
Welche Aussage erlaubt diese Tabelle? Bei der Abkumulation werden die überschrittenen Einkommensgrenzen ausgewiesen "mindestens ... € oder mehr". Die Tabelle informiert dann darüber, dass 43% der Personen mindestens 2000 € und 6% mindestens 3000 € verdienen.
Vergleicht man die Ergebnisse der beiden Kumulationen, so sieht man, dass sich die Werte in den Ergebnisspalten zu 100% aufaddieren. Die beiden Kumulationen dienen somit auch der gegenseitigen Kontrolle der Rechnung.
Im folgenden Screenshot wird am Beispiel der Datei Partizipation.sav eine Tabelle der absoluten, prozentualen und aufkumulierten prozentualen Häufigkeiten mit SPSS erzeugt.
Screenshot 2-18: Erstellung einer Häufigkeitstabelle mit SPSS für das Merkmal "Status"
1.)
"Analysieren" in Funktionsleiste aufrufen.
2.) "Deskriptive Statistik" markieren.
3.) "Häufigkeiten" wählen.
Der nächste Screenshot zeigt, wie die darzustellende Variable bestimmt wird:
Screenshot 2-19: Spezifizierung des Merkmals "Status"
1.) Aus der Variablenliste links die gesuchte Variable markieren und mit dem Pfeil rechts neben der Liste aufrufen. Dabei können ganze Variablenblöcke ausgewählt werden.
2.) Bei sehr umfangreichen Häufigkeitsverteilungen kann das Häkchen entfernt werden, um etwa nur eine Grafik oder Statistiken anzufordern.
Mit diesen Prozeduren erhalten Sie folgendes Ergebnis:
Tabelle 2-11: Häufigkeitsverteilung des Merkmals "Status"
Die kumulierten prozentualen Häufigkeiten zeigen, dass 74% der Befragten keine Leitungspositionen einnehmen.
Da die Ordnung und Gruppierung von Daten, die sich als Datei auf eine Rechner befinden, i.A. von Programmen erledigt werden, sei hier auf eine entsprechende Aufgabe verzichtet. Auch die folgende Aufgabe zur Bestimmung von relativen und %.ualen Häufigkeiten ist eher trivial und kann auch übersprungen werden.
Als Rechenbeispiel zur tabellarischen und graphischen Aufbereitung von statistischen Daten beziehen wir uns auf folgende Vorgaben. In einem Unternehmen mit N=92 Beschäftigten wurde die Anzahl der Kinder pro Mitarbeiter ermittelt.
Tabelle 2-12: Beschäftigte nach Kinderzahl
Anzahl der Kinder Xi |
absolute |
0 |
10 |
1 |
22 |
2 |
25 |
3 |
18 |
4 |
11 |
5 |
6 |
Berechnen Sie daraus die relativen und prozentualen Häufigkeiten. Kommentieren Sie Ihre Ergebnisse.
Eine Musterlösung finden Sie nachfolgend:
Tabelle 2-13: Absolute, relative und prozentuale Häufigkeiten der Kinderzahl
Anzahl der Kinder |
absolute |
relative |
prozentuale |
0 |
10 |
0,1087 |
10,8696 % |
1 |
22 |
0,2391 |
23,9130 % |
2 |
25 |
0,2717 |
27,1739 % |
3 |
18 |
0,1957 |
19,5652 % |
4 |
11 |
0,1196 |
11,9565 % |
5 |
6 |
0,0652 |
6,5217 % |
Summe: (Werte gerundet) |
92 |
1 |
100 % |
Wie ersichtlich, sind die prozentualen Angaben wesentlich griffiger als die absoluten und die relativen.
Im Folgenden finden Sie zwei Aufgaben anhand derer Sie die Rechenschritte der Auf- und Ab-Kumulation noch einmal einüben können.
Sie können dabei die Berechnungen mehrfach mit jeweils anderen Werten wiederholen!
Ermitteln Sie für den Datensatz Partizipation.sav die für die folgenden Variablen:
Geschlecht,
Ausbildung,
Partizipationsprofil und
Partizipationspotential.
Interpretieren Sie Ihre Ergebnisse und vergleichen Sie die beiden zuletzt ermittelten Verteilungen!
letzte Änderung am 28.2.2020 um 7:49 Uhr.
Adresse dieser Seite (evtl. in mehrere Zeilen zerteilt)
http://viles.uni-oldenburg.de/navtest/viles1/kapitel02_Tabellarische~~lund~~lgraphische~~lAufbereitung~~lstatistischer~~lDaten/modul02_Die~~lKlassierung~~lstati
stischer~~lDaten/ebene02_Beispiele~~lund~~lAufgaben/02__02__02__01.php3