Level 4 Level 6
Level 5

5 Kenngrößen empirischer Verteilungen


51 words 0 ignored

Ready to learn       Ready to review

Ignore words

Check the boxes below to ignore/unignore words, then click save at the bottom. Ignored words will never appear in any learning session.

All None

Ignore?
Häufigkeitsverteilungen für ungruppierte oder gruppierte Daten
Vermitteln einen Eindruck von der Gestalt der Verteilung eines Datensatzes.
Lage- und Streuungsparameter
Zentrum, Schwerpunkt, Streuung und Schiefe
Modus oder Modalwert x-mod
Häufigste Merkmalsausprägung. Charakterisiert das Zentrum einer Verteilung. Kann nicht eindeutig bestimmt werden, wenn mehrere Modalwerte existieren.
Median x-schlange, x-med oder Zentralwert
Mittlerer Wert eines geordneten Datensatzes. Trennt die unteren 50% von den oberen 50%.
Mindestanforderung für x-schlange
Ordinalskalierte Merkmale.
x-schlange bei ungeradem n
x((n+1)/2)
x-schlange bei geradem n (ordinalskaliert)
x(n/2) und x((n/2)+1)
x-schlange bei geradem n (metrisch skaliert)
1/2 • {x(n/2) + x(n/2+1)}
Mittelwert (arithmetisches Mittel) oder x-quer
x-quer := 1/n • (x1+x2+...+xn) oder 1/n • ∑ xi
Mindestanforderung für x-quer
Metrisch skalierte Merkmale
Nachteil des Mittelwerts
Höhere Sensitivität oder geringere Robustheit gegenüber Ausreißern/Extremwerten.
Mittelwert lässt sich als Schwerpunkt des Datensatzes interpretieren.
∑ (xi - x-quer) = 0
Berechnung von x-quer mithilfe der relativen Häufigkeitsverteilung
x-quer := a1•f1 + a2•f2 + … + ak•fk
Der Mittelwert minimiert die Summe der quadrierten Abweichungen
z = x-quer: ∑ (xi-z)² ➛ Min.
Der Median minimiert die Summe der absoluten Abweichungen
z = x-schlange: ∑ |xi-z| ➛ Min.
Aspekte für die Wahl des Lagemaßes
Skalierung des Merkmals. Jeweilige Fragestellung. Extremwerte.
Weitere Lageparameter
Gewichtetes x-quer. Getrimmtes x-quer(𝛼). Geometrisches x-quer(xg).
Streuungsmaße
Spannweite, Varianz, Standardabweichung, z-Transformation, Variationskoeffizient
Spannweite (engl. range)
R := x(n) - x(1) eines nach aufsteigender Größe geordneten Datensatzes.
Nachteil der Spannweite R
Hohe Empfindlichkeit bzw. geringe Robustheit gegenüber Ausreißern.
Varianz / Stichprobenvarianz / empirische Varianz - Formel
s² := 1/n • [(x1 - x-quer)²+(x2 - x-quer)² + … + (xn - x-quer)²)]
Berechnung der s² mit Summe
s² := 1/n •∑ (xi - x-quer)²
Berechnung der s² mit quadriertem arithmetischen Mittel
s² = 1/n • ∑ xi² - x-quer² = x²-quer - x-quer²
Varianz (s-Quadrat)
Mittlere, quadratische Abweichung einer Datenmenge vom arithmetischen Mittel.
(Empirische) Standardabweichung - Definition
Streuung der Einzelwerte um den Erwartungswert. Wurzel aus der Varianz s-quadrat.
Standardabweichung - Formel
s := √s² = √1/n • ∑(xi - x-quer)² = √x²-quer - x-quer²
korrigierte Varianz s*²
s*² := 1/(n-1) • ∑(xi-q-quer)² = n/(n-1) • s²
korrigierte Standardabweichung s*
Wurzel aus s*²
Im Falle mehrmals auftretender Werte
kann man bei der Berechnung der Varianz auf relative Häufigkeiten zurückgreifen
s² für relative Häufigkeiten
s² = ∑(ai-x-quer)² • fi
z-Transformation
Von jedem Element eines Datensatzes jeweils dessen x-quer abziehen und die Differenz durch s oder s* dividieren.
Verwendung der z-Transformation
Intelligenzmessungen in verschiedenen Grundgesamtheiten. Messung schulischer Leistungen anhand unterschiedlicher Fragebögen.
Mittlere absolute Abweichung vom Median d
Mittelwert aus den Absolutbeträgen der Abweichungen xi - x-quer.
Formel für d
d := 1/n ∑ |xi - x-quer|
Variationskoeffizient v
Für quantitative Merkmale mit nicht-negativen Ausprägungen. Maßstabsunabhängiges Streuungsmaß.
Formel für v (Variationskoeffizient)
v := s/x-quer
p-Quantil xp
Verallgemeinerung des Medians x-schlange. Setzt metrisches (zumindest ordinalskaliertes) Merkmal voraus.
Eigenschaften von xp
mindestens p*100% ≤ xp ≤ (1-p)*100%
Gauß-Klammer-Funktion [np]
Die größte ganze Zahl, die kleiner oder gleich np ist.
Formel [np] wenn np nicht ganzzahlig
xp = x([np]+1)
Formel [np] wenn np ganzzahlig
xp = 1/2 * (x(np) + x(np+1))
Unteres Quartil
0,25-Quantil (1-p = 0,75)
Oberes Quartil
0,75-Quantil (1-p = 0,25)
Quartilsabstand Q
Differenz zwischen den Quartilen (Interquartilsabstand IQR).
Formel Interquartilsabstand
Q := x0,75 - x0,25
Dezile D1, D2, …, D9
p=0,1, p=0,2, …, p=0,9
Linkssteile oder rechtsschiefen Verteilung
Überwiegender Teil der Daten ist linksseitig konzentriert.
Rechtssteile oder linksschiefe Verteilung
Überwiegender Teil der Daten ist rechtsseitig konzentriert.
Asymmetrische Verteilung
Nicht-Übereinstimmung von Median und Mittelwert einer empirischen Verteilung.
Boxplot (Schachtelzeichnung)
Grafisches Instrument zur Beurteilung einer empirischen Verteilung
Boxplot fasst fünf Charakteristika eines Datensatzes zusammen
x-min, x-max, x0,25, x0,75, x0,5