Level 3 Level 5
Level 4

4 Univariate Häufigkeitsverteilungen


36 words 0 ignored

Ready to learn       Ready to review

Ignore words

Check the boxes below to ignore/unignore words, then click save at the bottom. Ignored words will never appear in any learning session.

All None

Ignore?
X
Merkmal (z.B. Studienfach)
n
Anzahl der Merkmalsträger (z.B. 3.000 befragte Studierende)
x1, ..., xn
Beobachtete Merkmalswerte (Psychologie, Mathematik, Informatik, Psychologie ...)
z.B. x1=x4
Mehrere xi könnten den gleichen Merkmalswert, z.B. Psychologie, haben.
a1, ..., ak
(Verschiedene) Merkmalsausprägungen (wenn k < n). Es kann ai jeweils nur einmal vorkommen.
k
Anzahl der verschiedenen Merkmalswerte
Arten von Datenanalysen
univariate, bivariate, multivariate
Univariate Datenanalyse
Daten für ein Merkmal werden ausgewertet
Multivariate Datenanalyse
Daten für mehrere Merkmale werden ausgewertet (Analyse von Zusammenhängen zwischen den Merkmalen)
Gruppierte oder klassierte Daten
In Intervalle geteilte Urliste mit stetigen Merkmalen
k = n
Alle Werte der Merkmalsausprägungen sind verschieden.
hi = n
Spezialfall, wenn alle Stichprobenwerte identisch sind.
Summe aller absoluten Häufigkeiten
Gesamtzahl aller Stichprobenwerte n
Absolute Häufigkeit für ein diskretes Merkmal
hi := h(ai) i=1,2,…,k. Anzahl der k verschiedenen Werte ai des Stichprobenwertes xi. h1 = Häufigkeit für die erste Merkmalsausprägung, h2 für die zweite usw. In n Stichprobenwerten treten k verschiedene Werte, a1, a2, ..., ak auf.
Relative Häufigkeit für ein diskretes Mermal
fi := f(ai) = h(ai) / n i=1,2,…,k. Absolute Häufigkeit bezogen auf die Anzahl der Merkmalsträger. Wert liegt immer zwischen 0 und 1. Prozentuale Interpretation üblich, d.h. 0.074 wird als 7.4% betrachtet.
Vorteil relativer Häufigkeiten
Es können Grundgesamtheiten oder Stichproben unterschiedlicher Größe verglichen werden.
Prozentuale Häufigkeit
Relative Häufigkeit mit 100 multipliziert.
Häufigkeitsverteilung
Darstellung, wie oft eine bestimmte Merkmalsausprägung in einer Stichprobe auftritt. Tabellenform.
Empirische Verteilung
Anderer Ausdruck für Häufigkeitsverteilung.
Klasseneinteilung
Bei hoher Anzahl von verschiedenen Ausprägungen zur Vereinfachung. Zusammenfassen verschiedener ähnlicher bzw. benachbarter Ausprägungen. Verlust von Detaildaten.
Beachtung bei der Bildung von Klassen
Sollten die gleiche Breite haben. Vermeidung von offenen. Nur verwenden, wenn Minimum oder Maximum unbekannt (z.B. Erdbeben nach oben). Müssen eindeutig definiert sein und sich gegenseitig ausschließen.
Absolute Klassenhäufigkeit
Die Anzahl der Merkmalsausprägungen zwischen den Intervallgrenzen. Bezieht sich nicht auf einzelne Werte, sondern auf ein Intervall, das eine Klasse definiert, ansonsten vergleichbar.
Relative Klassenhäufigkeit
Ergebnis der absoluten Klassenhäufigkeit geteilt durch den Stichprobenumfang. Bezieht sich nicht auf einzelne Werte, sondern auf ein Intervall, das eine Klasse definiert, ansonsten vergleichbar.
Grafische Darstellung der Häufigkeitstabellen
Kreisdiagramm, Stabdiagramm, Säulendiagramm (Balkendiagramm)
Säulendiagramm
Meist senkrecht, einzelne berühren sich nicht.
Balkendiagramm
Meist waagerecht, einzelne berühren sich nicht.
Stabdiagramm
Schmales Säulen- oder Balkendiagramm, berühren sich nicht.
Gestapeltes Säulen- oder Balkendiagramm
In zwei oder mehr Teile zerlegt und übereinander bzw. aneinander dargestellt.
Nachteile des Kreisdiagramms
Ähnlich große Teilmengen schwer zu unterscheiden. Mit zunehmender Anzahl an Merkmalsausprägungen unübersichtlich. Je nach Farbgestaltung ungewollte Betonung eines Teils.
Histogramm
Besteht aus Rechtecken der Fläche hi (absolut) bzw. fi (relativ), die sich berühren. Bei klassierten Daten. Auf der horizontalen Achse sind die Klassengrenzen (Intervallgrenzen) und auf der vertikalen Achse die Häufigkeiten.
Empirische Dichte
Mathematische Beschreibung eines Histogramms.
Summenhäufigkeit
Auch kumulierte Häufigkeit. Häufigkeiten werden beginnend mit der kleinsten Ausprägung in aufsteigender Reihenfolge aufaddiert, sprich kumuliert. Absolute und relative.
Summenhäufigkeitsfunktion
Summe der absoluten bzw. relativen Häufigkeiten aller Stichprobenwerte, die kleiner oder gleich einem Wert xk sind.
Treppenfunktion
Grafische Darstellung der Summenhäufigkeit über den Klassen.
Empirische Verteilungsfunktion
F(x) = H(x) / n
Formel F(x) oder H(x)
∑ i=1 bis k von f(xi) bzw. h(xi)