1 statisik lv nr.: 1852 ws 2005/06 1.dezember 2005
Post on 06-Apr-2015
113 Views
Preview:
TRANSCRIPT
1
STATISIK
LV Nr 1852
WS 200506
1Dezember 2005
2
Inhalt
bull Deskriptive Statistik
bull Einfache Kennzahlenndash Lagemaszligendash Streuungsmaszligendash Konzentrationsmaszligendash Verhaumlltniszahlenndash Indexzahlen
3
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
4
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
5
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
2
Inhalt
bull Deskriptive Statistik
bull Einfache Kennzahlenndash Lagemaszligendash Streuungsmaszligendash Konzentrationsmaszligendash Verhaumlltniszahlenndash Indexzahlen
3
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
4
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
5
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
3
Maszligzahlen
bull Parameter Kollektivmaszligzahlen
bull Lageparameter (Mittelwerte)
bull Streuungsparameter (Variabilitaumltsmaszlige Variationsmaszlige)
bull Schiefe
bull Woumllbung
4
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
5
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
4
Lagemaszlige und Mittelwerte
bull Eigenschaftenndash Liegen zwischen Minimum und Maximum der
Datenndash Wenn alle Daten derselben linearen
Transformation unterworfen werden macht auch das Lagemaszlig diese Transformation mit
5
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
5
Lagemaszlige und Mittelwerte
bull Arithmetisches Mittel
bull Median
bull Modus
bull Geometrisches Mittel
bull Harmonisches Mittel
bull Quantile
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
6
Arithmetisches Mittel
bull Mittelwert durchschnittlicher Wert
bull Fuumlr metrisch skalierte Merkmale
bull a1an beobachtete Merkmalswerte eines Merkmals X
k
1iii
k
1iii fxhx
n
1x
n
1iia
n
1a
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
7
Arithmetisches Mittel
bull Bsp Merkmal X Koumlrpergroumlszlige in cm
bull Merkmalswerte (a1an n = 5)
162 170 155 187 179
bull ā = 15 middot (162+170+155+187+179) = 1706
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
8
Arithmetisches Mittel
Eigenschaften (Betrachte Einzelwerte ai i=1n)
bull Summe der Abweichungen der Einzelwerte von ihrem arithmetischen Mittel = 0
bull Summe der quadrierten Abweichungen der Einzelwerte von ihrem arithmetischen Mittel ist kleiner als von einem beliebigen anderen Wert
n
1ii 0)a(a
)a(MM)(a)a(an
1i
n
1i
2i
2i
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
9
Arithmetisches Mittel
bull Das arithmetische Mittel unterliegt der gleichen linearen Transformation wie die Einzelwerte
Lineare Transformation
bull Bsp Koumlrpergroumlszlige ai = 001middotai
ndash Transformierte Werte 162 170 155 187 179ndash ā = 15 middot (162+170+155+187+179) = 1706ndash ā = 001 middot ā = 001 middot 1706 = 1706
n)1(iβaαa ii
aβαa
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
10
Arithmetisches Mittel
bull Arithmetische Mittel von zwei oder mehr Teilgesamtheiten
bull Bsp Koumlrpergroumlszlige 2 Stpr mit n1=n2=5ndash Stpr 1 162 170 155 187 179 mit ā1 = 1706
ndash Stpr 2 172 159 193 184 168 mit ā2 = 1752
ndash ā = 1(5+5) middot (853+876) = 1729 = (5middot1706+5middot1752) (5+5) = 1729
21
2211n
1i
n
2i1i21 nn
ananaa
nn
1a
1 2
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
11
Arithmetisches Mittel
bull Gewogenes (gewichtetes) arithmetische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1 = = wn = 1n ergibt sich das gewoumlhnliche arithmetische Mittel
n
1iii
w awa
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
12
Median
bull Median (Zentralwert) mindestens 50 der Beobachtungen ai nehmen eine Wert groumlszliger oder gleich bzw kleiner oder gleich dem Median an
bull Sind x1 xn der Groumlszlige nach geordnet ist der Median x05
x((n+1)2) n ungerade
x05 = frac12(x(n2)+x(n2+1)) n gerade
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
13
Median
bull Haumlufigkeitsverteilung
Median ist diejenige Merkmalsauspraumlgung bei der die Summenhaumlufigkeitsfunktion den Wert 05 uumlberschreitet
bull Klassifizierte Daten
Der Median liegt in der Klasse in der die Summenhaumlufigkeitsfunktion den Wert 05 erreicht
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
14
Median
bull Bsp Koumlrpergroumlszlige in cm n = 10 ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187 193
ndash Median x05 = frac12(x(n2)+x(n2+1)) = frac12(x5+x6) = frac12(170+172) = 171
bull Bsp Koumlrpergroumlszlige in cm n = 9ndash Merkmalswerte der Groumlszlige nach geordnet
155 159 162 168 170 172 179 184 187
ndash Median x05 = x((n+1)2) = x5 = 170
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
15
Quantile
bull Geordnete Beobachtungsreihe x(1)x(n)
bull α-Quantil x(k) falls nα keine ganze Zahl (k ist
die auf nα folgende ganze Zahl)xα= 12 (x(k)+x(k+1)) falls nα ganze Zahl k=nα
bull Spezielle Quantile ndash Median = 05-Quantilndash Unteres Quartil = 025-Quantilndash Oberes Quartil = 075-Quantil
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
16
Quantile
bull Bsp Koumlrpergroumlszlige in cm ndash Merkmalswerte der Groumlszlige nach geordnet (n=10)
155 159 162 168 170 172 179 184 187 193ndash Unteres Quartil = 025-Quantil n 025 = 25
also x025 = x(k) = x(3) = 162
ndash Oberes Quartil = 075-Quantil n 075 = 75 also x075 = x(k) = x(8) = 184
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
17
Modalwert
bull Modalwert (Modus haumlufigster Wert dichtester Wert) Gibt die Auspraumlgung an die die groumlszligte Haumlufigkeit in der Beobachtungsreihe besitzt
bull Fuumlr nominal skalierte Daten geeignet bull Es gilt h(xmod) h(xi) fuumlr alle
Merkmalsauspraumlgungen xixkbull Klassifizierte Daten Modalwert ist definiert
als Klassenmitte der am dichtesten besetzten Klasse
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
18
Geometrisches Mittel
bull Voraussetzung Daten verhaumlltnisskaliert
bull n Einzelwerte a1 an
bull Merkmalsauspraumlgungen relative Aumlnderungen (zB Lohnerhoumlhung in )
bull Geometrisches Mitteln
n21g aaaa
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
19
Geometrisches Mittel
bull Bsp Produktionssteigerung eines Betriebes pro Jahr
bull 4 Jahre mit Produktionssteigerungen von 2 11 4 7
bull Durchschnittliche Steigerung
bull Durchschnittliche Produktionssteigerung ~6
0571261071041111102a 44g
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
20
Geometrisches Mittel
bull Gewogenes (gewichtetes) geometrische Mittel
bull Gewichte w1 wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche geometrische Mittel
n21 wn
w2
w1
wg aaaa
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
21
Harmonisches Mittel
bull Nur positive od negative Beobachtungswerte a1an
bull Gewogenes harmonisches Mittel Gewichte w1wn mit 0wi1 und Σiwi=1
bull Fuumlr w1== wn=1n ergibt sich das gewoumlhnliche harmonische Mittel
n
1i i
h
a
1n
a
n
1i i
i
wh
a
w1
a
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
22
Harmonisches Mittel
bull Bsp Hat man etwa die Beziehung U = P middot M und gilt ui = ximiddotmi und ist ui = U und mi = M ergibt sich P = U M
bull P ist das mit wi gewogene harmonische Mittel der xi
ndash U = Gesamtumsatz ui = Einzelumsatz des i-ten Gutes
ndash P = durchschnittlicher Preis pro Mengeneinheit
ndash xi = Einzelpreis pro Mengeneinheit des i-ten Gutes
ndash M = Gesamtmenge mi = umgesetzte Menge des i-ten Gutes
iii
iiii
i
i
i uuwmit)x(w
1
)xu(
u
m
u
M
UP
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
23
Mittel
bull Vergleich arithmetische- geometrisches- und harmonisches Mittel
bull Bei positiven Beobachtungswerten a1an gilt stets die Beziehung
bull Bei identischen Beobachtungen a1==an sind die Mittel gleich
aaa gh
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
24
Streuungsmaszlige
bull Varianz
bull Standardabweichung
bull Variationskoeffizient
bull Mittlere absolute Abweichung
bull Spannweite
bull Quartilsabstand
bull Schiefe
bull Woumllbung
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
25
Varianz
bull Beobachtungswerte a1an (metrisch skaliert)
bull Streuungsmaszlig Arithmetische Mittel der Abweichungsquadrate der Einzelwerte ai von ihrem arithmetischen Mittel
bull Varianz (Mittlere quadratische Abweichung)
n
1i
2i
2 )a(an
1σ
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
26
Varianz
bull Bsp Koumlrpergroumlszlige von 5 Personen 162 170 155 187 179
bull Arithmetisches Mittel = 1706
bull Varianz (Mittlere quadratische Abweichung) σsup2 = 15 middot [(162-1706)sup2 + hellip + (179-1706)sup2 ] σsup2 = 13144
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
27
Streuungsmaszlig
bull Streuungsmaszlig Summe der quadrierten Abweichungen - nicht Summe der Abweichungen von ai von ihrem arithm Mittel da gilt
bull Mittlere quadratische Abweichung bezogen auf einen beliebigen Wert M
n
1ii 0)a(a
n
1i
2i M)(a
n
1MQ(M)
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
28
Varianz
bull Verschiebungssatz (Beziehung zw MQ(M) und Varianz)
bull Das bedeutet ndash MQ(M) Varianzndash MQ(M) = σsup2 wenn M = arithm Mittel ndash Minimumeigenschaft des arithm Mittels
22 M)a(σMQ(M)
)a(MM)(a)a(an
1i
n
1i
2i
2i
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
29
Varianz
bull Rechenvereinfachung
bull Liegt eine Haumlufigkeitsverteilung vork Merkmalswerte x1xk mit abs Haumlufigkeiten hi bzw rel Haumlufigkeiten fi (i=1k)
bull Varianz
n
1i
22i
n
1i
2i
2 aan
1)a(a
n
1σ
i
n
1i
2i
2 h)x(xn
1σ
n2 2
i ii 1
σ (x x) f
n
1iii
n
1iii fxhx
n
1xmit
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
30
Varianz
bull Varianz einer Grundgesamtheit die aus 2 Teilgesamtheiten (n1 n2) besteht
mit 21
222
211
21
222
2112
nn
)aa(n)aa(n
nn
σnσnσ
21
2211
nn
anana
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
31
Varianz
bull Klassifizierte Daten Haumlufigkeitsverteilung
bull Varianz naumlherungsweise berechnen statt der Merkmalswerte xi werden die Klassenmitten xiacute verwendet
i
n
1i
2i
2 h)xx(n
1σ
i
n
1i
2i
2 f)xx(n
1σ
n
1iii
n
1iii fxhx
n
1xmit
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
32
Varianz
bull Bei unimodalen Verteilungen ist die Varianz die aus den klassifizierten Daten berechnet wird groumlszliger als die Varianz die aus den Einzelwerten berechnet wird
bull Bei konstanten Klasseneinteilungen (Δx) Sheppardsche Korrektur
σsup2 die aus den klassifizierten Daten naumlherungsweise bestimmte Varianz
12
x)(Δσσ
222
corr
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
33
Varianz
bull Dimension Quadrat der Dimension der einzelnen Beobachtungen
bull Eigenschaft Varianz immer 0
bull Ist Varianz = 0 liegt keine Streuung vor alle Beobachtungswerte sind gleich und somit auch gleich dem arithmetischen Mittel
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
34
Standardabweichung
bull Standardabweichung = Quadratwurzel der Varianz
n
1i
2i
2 )a(an
1σσ
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
35
Varianz amp Standardabweichung
Eigenschaften
bull Lineare Transformation der Einzelwerte ai ai = α + βai (i=1n)
bull Dann Varianz σsup2 = βsup2σsup2 Standardabweichung σ = |β| σ
bull Sonderfall β=1 Transformation ai = α + ai
σsup2 = σsup2 und σ = σ
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
36
Standardisierung
bull Standardisierungndash Spezielle lineare Transformationndash Bildet aus Einzelwerten ai standardisierte
Werte zi indem von jedem ai das arithm Mittel μ abgezogen wird und durch die Standardabweichung dividiert wird
bull Arithm Mittel der zi immer 0 bull Varianz der zi immer 1
σ
μaz i
i
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
37
Variationskoeffizient
bull Streuung zweier oder mehrerer Verteilungen mit sich stark voneinander unterscheidenden Mittelwerten vergleichen
bull Relatives Streuungsmaszlig (fuumlr verhaumlltnis-skalierte Merkmale mit ausschlieszliglich positiven Merkmalswerten) bezieht die Standardabweichung σ (absolutes Streuungsmaszlig) auf das arithm Mittel μ
μ
σVC
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
38
MAD Mittlere absolute Abw
bull Arithmetisches Mittel der absoluten Abweichungen der einzelnen Merkmalswerte vom Mittelwert (zB arithm Mittel oder Median)
bull Minimumeigenschaft des Medians
M beliebiger Wert
n
1ii |Ma|
n
1MAD
n
1ii
n
1ii |Ma|
n
1|Mea|
n
1
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
39
MAD
bull Haumlufigkeitsverteilung der Datenbull MAD bezogen auf Mittelwert μ
bull MAD aus Haumlufigkeitsverteilung von klassifizierte Daten ndash Merkmalswerte xi durch Klassenmitten xiacute
ersetzen
i
n
1ii h|μx|
n
1MAD
i
n
1ii f|μx|MAD
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
40
Spannweite (Range)
bull Abstand zw dem groumlszligten und dem kleinsten Wert
bull Einzelwerte der Groumlszlige nach ordnen a[1]hellipa[n]
R = a[n] - a[1]
bull Haumlufigkeitsverteilung von k Merkmalsauspraumlgungen
R = xk - x1
bull Haumlufigkeitsverteilung von klassifizierten Daten
R = xko - x1
u
bull Spannweite ist instabil gegenuumlber Ausreiszligern
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
41
Quartilsabstand
bull Quartile Q1 Q2 (=Median) Q3 teilen die Gesamtheit in 4 gleich groszlige Teile
bull α-Quantil
a(k) falls nα keine ganze Zahl (k die auf nα folgende ganze Zahl)
aα= 12 (a(k)+a(k+1)) falls nα ganze Zahl k=nα
bull Quartilsabstand (Interquartile Range) definiert als Spannweite der 50 mittleren Werte
QA = Q3 ndash Q1
bull Eigenschaft stabil gegenuumlber Ausreiszligern
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
42
38N =
GEWICHT
110
100
90
80
70
60
50
40
937
Box-Plot
bull Box-Plot grafische Darstellung einer Beobachtungsreihe (Verteilung und Struktur)
38N =
GROEszligE
210
200
190
180
170
160
150
140
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
43
Box-Plot
bull Box-Plot fuumlr Vergleich von 2 Messreihen
1820N =
SEX
mw
GR
OE
szligE
210
200
190
180
170
160
150
140
28
9
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
44
Box-Plot
bull Box-Plot ndash Box beinhaltet 50 der Daten (Grenzen 1
und 3 Quartil) Darstellung des Medians ndash Whiskers maximal 15-mal die Laumlnge der Boxndash Ausreiszliger Werte auszligerhalb der Whiskers
bull Ausreiszliger
bull Krasse Ausreiszliger
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
45
Schiefe
bull Gibt Richtung (rechts- oder linksschief) und Groumlszligenordnung der Schiefe einer unimodalen Haumlufigkeitsverteilung an
lt 0 linksschiefe
g1 = 0 symmetrisch
gt 0 rechtsschiefebull Kein direkter Streuungsparameter
3n
1i
2i
n
1i
3i
1
)a(an1
)a(an1
g
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
46
Schiefe
bull Schiefe einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
bull Berechnung mit Klassenmittel und Klassenmitte kann zu unterschiedlichen Ergebnissen fuumlhren
3k
1ii
2i
i
k
1i
3i
1
h)aa(n1
h)aa(n1
g
3k
1ii
2i
i
k
1i
3i
1
h)a(mn1
h)a(mn1
g
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
47
Schiefe
bull Linksschiefe Verteilung g1 lt 0Linksschiefe Verteilung
Auspraumlgung
Hauml
ufi
gke
it
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
48
Schiefe
bull Symmetrische Verteilung g1 = 0Symmetrische Verteilung
Auspraumlgung
Hauml
ufi
gke
it
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
49
Schiefe
bull Rechtschiefe Verteilung g1 gt 0Rechtsschiefe Verteilung
Auspraumlgung
Haumlu
fig
keit
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
50
Woumllbung
bull Woumllbung od Kurtosis od Exzeszlig Maszligzahl fuumlr unimodale Haumlufigkeitsverteilungen
bull Gibt an ob (bei gleicher Varianz) das absolute Maximum der Haumlufigkeitsvt groumlszliger als bei der Dichte der Normalvt ist
3
)a(an1
)a(an1
g 2n
1i
2i
n
1i
4i
2
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
51
Woumllbung
lt 0 abs Max kleiner als bei N-Vt
g2 = 0 Normalverteilung
gt 0 abs Max groumlszliger als bei N-Vt
bull Woumllbung einer Haumlufigkeitsverteilung aus gruppierten Daten (k Klassen) Verwendung der Klassenmittel od der Klassenmitten
3
h)aa(n1
h)aa(n1
g 2n
1ii
2i
k
1ii
4i
2
3
h)a(mn1
h)a(mn1
g 2n
1ii
2i
k
1ii
4i
2
- STATISIK
- Inhalt
- Maszligzahlen
- Lagemaszlige und Mittelwerte
- Slide 5
- Arithmetisches Mittel
- Slide 7
- Slide 8
- Slide 9
- Slide 10
- Slide 11
- Median
- Slide 13
- Slide 14
- Quantile
- Slide 16
- Modalwert
- Geometrisches Mittel
- Slide 19
- Slide 20
- Harmonisches Mittel
- Slide 22
- Mittel
- Streuungsmaszlige
- Varianz
- Slide 26
- Streuungsmaszlig
- Slide 28
- Slide 29
- Slide 30
- Slide 31
- Slide 32
- Slide 33
- Standardabweichung
- Varianz amp Standardabweichung
- Standardisierung
- Variationskoeffizient
- MAD Mittlere absolute Abw
- MAD
- Spannweite (Range)
- Quartilsabstand
- Box-Plot
- Slide 43
- Slide 44
- Schiefe
- Slide 46
- Slide 47
- Slide 48
- Slide 49
- Woumllbung
- Slide 51
-
top related