![Page 1: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/1.jpg)
Biostatistik, WS 2017/18
Grundlagen aus derWahrscheinlichkeitstheorie
Matthias Birkner
http://www.staff.uni-mainz.de/birkner/Biostatistik1718/
1.12.2017 und 8.12.2017
1/84
![Page 2: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/2.jpg)
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
2/84
![Page 3: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/3.jpg)
Deterministische und zufallige Vorgange
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
3/84
![Page 4: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/4.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
(c) by Michael Maggs
Freier Fall: Falldauer eines Objektes beigegebener Fallhohe laßt sichvorhersagen (falls Luftwiderstandvernachlassigbar)
Deterministische Vorgange laufen immergleich ab. Aus Beobachtungen lassensich kunftige Versuche vorhersagen.
4/84
![Page 5: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/5.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
(c) by Michael Maggs
Freier Fall: Falldauer eines Objektes beigegebener Fallhohe laßt sichvorhersagen (falls Luftwiderstandvernachlassigbar)
Deterministische Vorgange laufen immergleich ab. Aus Beobachtungen lassensich kunftige Versuche vorhersagen.
4/84
![Page 6: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/6.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
Wurfelwurf: Das Ergebnis eineseinzelnen Wurfelwurfes lasstsich nicht vorhersagen.
(c) public domain
Wiederholter Wurfelwurf:Wurfelt man 600 mal, so wurde man gerne darauf wetten,dass die Anzahl an Einsern zwischen 85 und 115 liegt.
Die genaue Anzahl lasst sich wieder nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten.)
5/84
![Page 7: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/7.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
Wurfelwurf: Das Ergebnis eineseinzelnen Wurfelwurfes lasstsich nicht vorhersagen.
(c) public domain
Wiederholter Wurfelwurf:Wurfelt man 600 mal, so wurde man gerne darauf wetten,dass die Anzahl an Einsern zwischen 85 und 115 liegt.
Die genaue Anzahl lasst sich wieder nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten.)
5/84
![Page 8: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/8.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
Wurfelwurf: Das Ergebnis eineseinzelnen Wurfelwurfes lasstsich nicht vorhersagen.
(c) public domain
Wiederholter Wurfelwurf:Wurfelt man 600 mal, so wurde man gerne darauf wetten,dass die Anzahl an Einsern zwischen 85 und 115 liegt.
Die genaue Anzahl lasst sich wieder nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten.)
5/84
![Page 9: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/9.jpg)
Deterministische und zufallige Vorgange
Was konnen wir vorhersagen?
Wurfelwurf: Das Ergebnis eineseinzelnen Wurfelwurfes lasstsich nicht vorhersagen.
(c) public domain
Wiederholter Wurfelwurf:Wurfelt man 600 mal, so wurde man gerne darauf wetten,dass die Anzahl an Einsern zwischen 85 und 115 liegt.
Die genaue Anzahl lasst sich wieder nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten.)
5/84
![Page 10: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/10.jpg)
Deterministische und zufallige Vorgange
Empirisch stellt man fest:
Bei Wiederholung eines Zufallsexperiments stabilisieren sichdie relativen Haufigkeiten der moglichen Ergebnisse.
Beispiel:
Beim Wurfelwurfstabilisiert sich die relative Haufigkeitjeder der Zahlen 1,2, . . . ,6 bei 1
6 .
Fazit:
Das Ergebnis eines einzelnen zufalligen Vorgangslaßt sich nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten).
6/84
![Page 11: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/11.jpg)
Deterministische und zufallige Vorgange
Empirisch stellt man fest:
Bei Wiederholung eines Zufallsexperiments stabilisieren sichdie relativen Haufigkeiten der moglichen Ergebnisse.
Beispiel:
Beim Wurfelwurfstabilisiert sich die relative Haufigkeitjeder der Zahlen 1,2, . . . ,6 bei 1
6 .
Fazit:
Das Ergebnis eines einzelnen zufalligen Vorgangslaßt sich nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten).
6/84
![Page 12: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/12.jpg)
Deterministische und zufallige Vorgange
Empirisch stellt man fest:
Bei Wiederholung eines Zufallsexperiments stabilisieren sichdie relativen Haufigkeiten der moglichen Ergebnisse.
Beispiel:
Beim Wurfelwurfstabilisiert sich die relative Haufigkeitjeder der Zahlen 1,2, . . . ,6 bei 1
6 .
Fazit:
Das Ergebnis eines einzelnen zufalligen Vorgangslaßt sich nicht vorhersagen.
Aber: Eine Aussage uber die Verteilung ist moglich(die besser ist als reines Raten).
6/84
![Page 13: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/13.jpg)
Deterministische und zufallige Vorgange
Abstraktionsschritt:
Verwende empirisch ermittelte Verteilungals Verteilung jedes Einzelexperiments!
Beispiel:
Wir nehmen an,daß bei einem einzelnen Wurfelwurf
jede der Zahlen 1,2, . . . ,6die Wahrscheinlichkeit 1
6 hat.
7/84
![Page 14: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/14.jpg)
Deterministische und zufallige Vorgange
Abstraktionsschritt:
Verwende empirisch ermittelte Verteilungals Verteilung jedes Einzelexperiments!
Beispiel:
Wir nehmen an,daß bei einem einzelnen Wurfelwurf
jede der Zahlen 1,2, . . . ,6die Wahrscheinlichkeit 1
6 hat.
7/84
![Page 15: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/15.jpg)
Zufallsvariablen und Verteilung
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
8/84
![Page 16: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/16.jpg)
Zufallsvariablen und Verteilung
Als Zufallsgroße oder Zufallsvariable bezeichnet mandas (Mess-)Ergebnis eines zufalligen Vorgangs.
Der Wertebereich S (engl. state space)einer Zufallsgroße ist die Menge aller moglichen Werte.
Die Verteilung einer Zufallsgroße Xweist jeder Menge A ⊆ S
die Wahrscheinlichkeit P(X ∈ A) zu,dass X einen Wert in A annimmt
Fur Zufallsgroßen werden ublicherweiseGroßbuchstaben verwendet (z.B. X ,Y ,Z ),
fur konkrete Werte Kleinbuchstaben.
9/84
![Page 17: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/17.jpg)
Zufallsvariablen und Verteilung
Als Zufallsgroße oder Zufallsvariable bezeichnet mandas (Mess-)Ergebnis eines zufalligen Vorgangs.
Der Wertebereich S (engl. state space)einer Zufallsgroße ist die Menge aller moglichen Werte.
Die Verteilung einer Zufallsgroße Xweist jeder Menge A ⊆ S
die Wahrscheinlichkeit P(X ∈ A) zu,dass X einen Wert in A annimmt
Fur Zufallsgroßen werden ublicherweiseGroßbuchstaben verwendet (z.B. X ,Y ,Z ),
fur konkrete Werte Kleinbuchstaben.
9/84
![Page 18: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/18.jpg)
Zufallsvariablen und Verteilung
Als Zufallsgroße oder Zufallsvariable bezeichnet mandas (Mess-)Ergebnis eines zufalligen Vorgangs.
Der Wertebereich S (engl. state space)einer Zufallsgroße ist die Menge aller moglichen Werte.
Die Verteilung einer Zufallsgroße Xweist jeder Menge A ⊆ S
die Wahrscheinlichkeit P(X ∈ A) zu,dass X einen Wert in A annimmt
Fur Zufallsgroßen werden ublicherweiseGroßbuchstaben verwendet (z.B. X ,Y ,Z ),
fur konkrete Werte Kleinbuchstaben.
9/84
![Page 19: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/19.jpg)
Zufallsvariablen und Verteilung
Als Zufallsgroße oder Zufallsvariable bezeichnet mandas (Mess-)Ergebnis eines zufalligen Vorgangs.
Der Wertebereich S (engl. state space)einer Zufallsgroße ist die Menge aller moglichen Werte.
Die Verteilung einer Zufallsgroße Xweist jeder Menge A ⊆ S
die Wahrscheinlichkeit P(X ∈ A) zu,dass X einen Wert in A annimmt
Fur Zufallsgroßen werden ublicherweiseGroßbuchstaben verwendet (z.B. X ,Y ,Z ),
fur konkrete Werte Kleinbuchstaben.
9/84
![Page 20: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/20.jpg)
Zufallsvariablen und Verteilung
Beispiel: Wurfelwurf W = Augenzahl des nachsten Wurfelwurfs.
S = 1,2, . . . ,6P(W = 1) = · · · = P(W = 6) = 1
6( P(W = x) = 1
6 fur alle x ∈ 1, . . . ,6 )Die Verteilung erhalt man aus einer Symmetrieuberlegung
oder aus einer langen Wurfelreihe.
Beispiel: Geschlecht X bei Neugeborenen.
S = ”mannlich“,”weiblich“Die Verteilung erhalt man aus einer langen Beobachtungsreihe.
Beispiel: Korpergroßenverteilung in Deutschland.
Die Verteilung erhalt man aus einer langen Messreihe.
10/84
![Page 21: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/21.jpg)
Zufallsvariablen und Verteilung
Beispiel: Wurfelwurf W = Augenzahl des nachsten Wurfelwurfs.
S = 1,2, . . . ,6P(W = 1) = · · · = P(W = 6) = 1
6( P(W = x) = 1
6 fur alle x ∈ 1, . . . ,6 )Die Verteilung erhalt man aus einer Symmetrieuberlegung
oder aus einer langen Wurfelreihe.
Beispiel: Geschlecht X bei Neugeborenen.
S = ”mannlich“,”weiblich“Die Verteilung erhalt man aus einer langen Beobachtungsreihe.
Beispiel: Korpergroßenverteilung in Deutschland.
Die Verteilung erhalt man aus einer langen Messreihe.
10/84
![Page 22: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/22.jpg)
Zufallsvariablen und Verteilung
Beispiel: Wurfelwurf W = Augenzahl des nachsten Wurfelwurfs.
S = 1,2, . . . ,6P(W = 1) = · · · = P(W = 6) = 1
6( P(W = x) = 1
6 fur alle x ∈ 1, . . . ,6 )Die Verteilung erhalt man aus einer Symmetrieuberlegung
oder aus einer langen Wurfelreihe.
Beispiel: Geschlecht X bei Neugeborenen.
S = ”mannlich“,”weiblich“Die Verteilung erhalt man aus einer langen Beobachtungsreihe.
Beispiel: Korpergroßenverteilung in Deutschland.
Die Verteilung erhalt man aus einer langen Messreihe.
10/84
![Page 23: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/23.jpg)
Zufallsvariablen und Verteilung
Rechenregeln:
Beispiel Wurfelwurf W :
P(W = 2 ∪ W = 3) = P(W ∈ 2,3)= 2
6 = 16 + 1
6 = P(W = 2) + P(W = 3)
P(W ∈ 1,2 ∪ 3,4) = 46 = 2
6 + 26
= P(W ∈ 1,2) + P(W ∈ 3,4)
Vorsicht:
P(W ∈ 2,3) + P(W ∈ 3,4) 6= P(W ∈ 2,3,4)
11/84
![Page 24: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/24.jpg)
Zufallsvariablen und Verteilung
Beispiel zweifacher Wurfelwurf (W1,W2):Sei W1 (bzw W2) die Augenzahl des ersten (bzw zweiten)Wurfels.
P(W1 ∈ 4,W2 ∈ 2,3,4)= P((W1,W2) ∈ (4,2), (4,3), (4,4))
=3
36=
16· 3
6= P(W1 ∈ 4) · P(W2 ∈ 2,3,4)
12/84
![Page 25: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/25.jpg)
Zufallsvariablen und Verteilung
Sei S die Summe der Augenzahlen, d.h. S = W1 + W2.Was ist die Wahrscheinlichkeit, daß S = 5 ist,wenn der erste Wurfel die Augenzahl W1 = 2 zeigt?
P(S = 5|W1 = 2)!
= P(W2 = 3)
=16
=1/361/6
=P(S = 5,W1 = 2)
P(W1 = 2)
Was ist die Ws von S ∈ 4,5 unter der Bedingung W1 ∈ 1,6?
P(S ∈ 4,5|W1 ∈ 1,6) =P(S ∈ 4,5,W1 ∈ 1,6)
P(W1 ∈ 1,6)
=P(W2 ∈ 3,4,W1 ∈ 1)
P(W1 ∈ 1,6)=
P((W1,W2) ∈ (1,3), (1,4))P(W1 ∈ 1,6)
=2
3626
=16(6= 2
6= P(W2 ∈ 3,4)
)(Bem.: Es ist P(S ∈ 4, 5|W1 = 1) =
P(S∈4,5,W1=1)P(W1=1) =
P((W1,W2)∈(1,3),(1,4))P(W1=1) =
2/361/6 = 2
6 und
P(S ∈ 4, 5|W1 = 6) =P((W1,W2)∈(1,−2),(1,−1))
P(W1=6) = 01/6 = 0 sowie
P(W1 = 1 |W1 ∈ 1, 6) =1/62/6 = 1
2 = P(W1 = 6 |W1 ∈ 1, 6), d.h. man kann durch Bedingen in zwei Schritten sehen:
P(S ∈ 4, 5|W1 ∈ 1, 6)
= P(W1 = 1 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 1) + P(W1 = 6 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 6).)
13/84
![Page 26: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/26.jpg)
Zufallsvariablen und Verteilung
Sei S die Summe der Augenzahlen, d.h. S = W1 + W2.Was ist die Wahrscheinlichkeit, daß S = 5 ist,wenn der erste Wurfel die Augenzahl W1 = 2 zeigt?
P(S = 5|W1 = 2)!
= P(W2 = 3)
=16
=1/361/6
=P(S = 5,W1 = 2)
P(W1 = 2)
Was ist die Ws von S ∈ 4,5 unter der Bedingung W1 ∈ 1,6?
P(S ∈ 4,5|W1 ∈ 1,6) =P(S ∈ 4,5,W1 ∈ 1,6)
P(W1 ∈ 1,6)
=P(W2 ∈ 3,4,W1 ∈ 1)
P(W1 ∈ 1,6)=
P((W1,W2) ∈ (1,3), (1,4))P(W1 ∈ 1,6)
=2
3626
=16(6= 2
6= P(W2 ∈ 3,4)
)
(Bem.: Es ist P(S ∈ 4, 5|W1 = 1) =P(S∈4,5,W1=1)
P(W1=1) =P((W1,W2)∈(1,3),(1,4))
P(W1=1) =2/361/6 = 2
6 und
P(S ∈ 4, 5|W1 = 6) =P((W1,W2)∈(1,−2),(1,−1))
P(W1=6) = 01/6 = 0 sowie
P(W1 = 1 |W1 ∈ 1, 6) =1/62/6 = 1
2 = P(W1 = 6 |W1 ∈ 1, 6), d.h. man kann durch Bedingen in zwei Schritten sehen:
P(S ∈ 4, 5|W1 ∈ 1, 6)
= P(W1 = 1 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 1) + P(W1 = 6 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 6).)
13/84
![Page 27: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/27.jpg)
Zufallsvariablen und Verteilung
Sei S die Summe der Augenzahlen, d.h. S = W1 + W2.Was ist die Wahrscheinlichkeit, daß S = 5 ist,wenn der erste Wurfel die Augenzahl W1 = 2 zeigt?
P(S = 5|W1 = 2)!
= P(W2 = 3)
=16
=1/361/6
=P(S = 5,W1 = 2)
P(W1 = 2)
Was ist die Ws von S ∈ 4,5 unter der Bedingung W1 ∈ 1,6?
P(S ∈ 4,5|W1 ∈ 1,6) =P(S ∈ 4,5,W1 ∈ 1,6)
P(W1 ∈ 1,6)
=P(W2 ∈ 3,4,W1 ∈ 1)
P(W1 ∈ 1,6)=
P((W1,W2) ∈ (1,3), (1,4))P(W1 ∈ 1,6)
=2
3626
=16(6= 2
6= P(W2 ∈ 3,4)
)(Bem.: Es ist P(S ∈ 4, 5|W1 = 1) =
P(S∈4,5,W1=1)P(W1=1) =
P((W1,W2)∈(1,3),(1,4))P(W1=1) =
2/361/6 = 2
6 und
P(S ∈ 4, 5|W1 = 6) =P((W1,W2)∈(1,−2),(1,−1))
P(W1=6) = 01/6 = 0 sowie
P(W1 = 1 |W1 ∈ 1, 6) =1/62/6 = 1
2 = P(W1 = 6 |W1 ∈ 1, 6), d.h. man kann durch Bedingen in zwei Schritten sehen:
P(S ∈ 4, 5|W1 ∈ 1, 6)
= P(W1 = 1 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 1) + P(W1 = 6 |W1 ∈ 1, 6) · P(S ∈ 4, 5|W1 = 6).)
13/84
![Page 28: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/28.jpg)
Zufallsvariablen und Verteilung
Rechenregeln:
Sei X Zufallsgroße mit Wertebereich S.0 ≤ P(X ∈ A) ≤ 1 fur jede Teilmenge A ⊆ S
P(X ∈ S) = 1Sind A,B ⊆ S disjunkt, d.h. A ∩ B = ∅,
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B),
insbesondere P(X ∈ Ac) = 1− P(X ∈ A) mit Ac = S \ A
Allgemein gilt
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B)− P(X ∈ A ∩ B)
(”Einschluss-Ausschluss-Formel“)
14/84
![Page 29: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/29.jpg)
Zufallsvariablen und Verteilung
Rechenregeln:
Sei X Zufallsgroße mit Wertebereich S.0 ≤ P(X ∈ A) ≤ 1 fur jede Teilmenge A ⊆ SP(X ∈ S) = 1
Sind A,B ⊆ S disjunkt, d.h. A ∩ B = ∅,
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B),
insbesondere P(X ∈ Ac) = 1− P(X ∈ A) mit Ac = S \ A
Allgemein gilt
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B)− P(X ∈ A ∩ B)
(”Einschluss-Ausschluss-Formel“)
14/84
![Page 30: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/30.jpg)
Zufallsvariablen und Verteilung
Rechenregeln:
Sei X Zufallsgroße mit Wertebereich S.0 ≤ P(X ∈ A) ≤ 1 fur jede Teilmenge A ⊆ SP(X ∈ S) = 1Sind A,B ⊆ S disjunkt, d.h. A ∩ B = ∅,
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B),
insbesondere P(X ∈ Ac) = 1− P(X ∈ A) mit Ac = S \ A
Allgemein gilt
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B)− P(X ∈ A ∩ B)
(”Einschluss-Ausschluss-Formel“)
14/84
![Page 31: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/31.jpg)
Zufallsvariablen und Verteilung
Rechenregeln:
Sei X Zufallsgroße mit Wertebereich S.0 ≤ P(X ∈ A) ≤ 1 fur jede Teilmenge A ⊆ SP(X ∈ S) = 1Sind A,B ⊆ S disjunkt, d.h. A ∩ B = ∅,
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B),
insbesondere P(X ∈ Ac) = 1− P(X ∈ A) mit Ac = S \ A
Allgemein gilt
P(X ∈ A ∪ B) = P(X ∈ A) + P(X ∈ B)− P(X ∈ A ∩ B)
(”Einschluss-Ausschluss-Formel“)
14/84
![Page 32: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/32.jpg)
Zufallsvariablen und Verteilung
Bedingte WahrscheinlichkeitWs des Ereignisses Y ∈ B unter der Bedingung X ∈ A
P(Y ∈ B|X ∈ A) :=P(Y ∈ B,X ∈ A)
P(X ∈ A)
(∗)
”bedingte Ws von Y ∈ B gegeben X ∈ A“
Beachte:
P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B | X ∈ A)
(∗) in Worten ausgedruckt:
Die Ws des Ereignisses X ∈ A, Y ∈ B laßt sich in zweiSchritten berechnen:
Zunachst muss das Ereignis X ∈ A eintreten.Die Ws hiervon wird multipliziert mit der Ws von Y ∈ B,wenn man schon weiß, daß X ∈ A eintritt.
15/84
![Page 33: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/33.jpg)
Zufallsvariablen und Verteilung
Bedingte WahrscheinlichkeitWs des Ereignisses Y ∈ B unter der Bedingung X ∈ A
P(Y ∈ B|X ∈ A) :=P(Y ∈ B,X ∈ A)
P(X ∈ A)
(∗)
”bedingte Ws von Y ∈ B gegeben X ∈ A“Beachte:
P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B | X ∈ A)
(∗) in Worten ausgedruckt:
Die Ws des Ereignisses X ∈ A, Y ∈ B laßt sich in zweiSchritten berechnen:
Zunachst muss das Ereignis X ∈ A eintreten.Die Ws hiervon wird multipliziert mit der Ws von Y ∈ B,wenn man schon weiß, daß X ∈ A eintritt.
15/84
![Page 34: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/34.jpg)
Zufallsvariablen und Verteilung
Bedingte WahrscheinlichkeitWs des Ereignisses Y ∈ B unter der Bedingung X ∈ A
P(Y ∈ B|X ∈ A) :=P(Y ∈ B,X ∈ A)
P(X ∈ A)(∗)
”bedingte Ws von Y ∈ B gegeben X ∈ A“Beachte:
P(X ∈ A, Y ∈ B) = P(X ∈ A) · P(Y ∈ B | X ∈ A)
(∗) in Worten ausgedruckt:
Die Ws des Ereignisses X ∈ A, Y ∈ B laßt sich in zweiSchritten berechnen:
Zunachst muss das Ereignis X ∈ A eintreten.Die Ws hiervon wird multipliziert mit der Ws von Y ∈ B,wenn man schon weiß, daß X ∈ A eintritt.
15/84
![Page 35: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/35.jpg)
Zufallsvariablen und Verteilung
Die Formel von BayesSeien X ,Y Zufallsgroßen mit Wertebereichen SX bzw. SY ,A ⊂ SX , B ⊂ SY , dann gilt
P(Y ∈ B | X ∈ A)
=P(X ∈ A | Y ∈ B) · P(Y ∈ B)
P(X ∈ A | Y ∈ B) · P(Y ∈ B) + P(X ∈ A | Y ∈ Bc) · P(Y ∈ Bc)
Denn
Zahler = P(X ∈ A,Y ∈ B)
Nenner = P(X ∈ A,Y ∈ B) + P(X ∈ A,Y ∈ Bc)
= P(X ∈ A,Y ∈ B ∪ Bc) = P(X ∈ A)
16/84
![Page 36: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/36.jpg)
Zufallsvariablen und Verteilung
Die Formel von BayesSeien X ,Y Zufallsgroßen mit Wertebereichen SX bzw. SY ,A ⊂ SX , B ⊂ SY , dann gilt
P(Y ∈ B | X ∈ A)
=P(X ∈ A | Y ∈ B) · P(Y ∈ B)
P(X ∈ A | Y ∈ B) · P(Y ∈ B) + P(X ∈ A | Y ∈ Bc) · P(Y ∈ Bc)
Denn
Zahler = P(X ∈ A,Y ∈ B)
Nenner = P(X ∈ A,Y ∈ B) + P(X ∈ A,Y ∈ Bc)
= P(X ∈ A,Y ∈ B ∪ Bc) = P(X ∈ A)
16/84
![Page 37: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/37.jpg)
Zufallsvariablen und Verteilung
Beispiel: Medizinische ReihenuntersuchungEine Krankheit komme bei 2% der Bevolkerung vor (”Pravalenz2%“),ein Test schlage bei 95% der Kranken an (”Sensitivitat 95%“),aber auch bei 10% der Gesunden (”Spezifitat 90%“)
Eine zufallig gewahlte Person werde mit positivem Resultatgetestet.Wie wahrscheinlich ist es, dass sie tatsachlich krank ist?Modell: X =Testergebnis (SX = positiv,negativ),Y =Gesundheitszustand (SY = gesund, krank) der PersonGesucht P(Y = krank | X = positiv) =?
Wir wissen: P(Y = krank) = 0.02, P(Y = gesund) = 0.98,P(X = positiv | Y = krank) = 0.95,P(X = positiv | Y = gesund) = 0.1,also P(Y = krank | X = positiv) = 0.02·0.95
0.02·0.95+0.98·0.1·
= 0.162
17/84
![Page 38: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/38.jpg)
Zufallsvariablen und Verteilung
Beispiel: Medizinische ReihenuntersuchungEine Krankheit komme bei 2% der Bevolkerung vor (”Pravalenz2%“),ein Test schlage bei 95% der Kranken an (”Sensitivitat 95%“),aber auch bei 10% der Gesunden (”Spezifitat 90%“)Eine zufallig gewahlte Person werde mit positivem Resultatgetestet.Wie wahrscheinlich ist es, dass sie tatsachlich krank ist?
Modell: X =Testergebnis (SX = positiv,negativ),Y =Gesundheitszustand (SY = gesund, krank) der PersonGesucht P(Y = krank | X = positiv) =?
Wir wissen: P(Y = krank) = 0.02, P(Y = gesund) = 0.98,P(X = positiv | Y = krank) = 0.95,P(X = positiv | Y = gesund) = 0.1,also P(Y = krank | X = positiv) = 0.02·0.95
0.02·0.95+0.98·0.1·
= 0.162
17/84
![Page 39: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/39.jpg)
Zufallsvariablen und Verteilung
Beispiel: Medizinische ReihenuntersuchungEine Krankheit komme bei 2% der Bevolkerung vor (”Pravalenz2%“),ein Test schlage bei 95% der Kranken an (”Sensitivitat 95%“),aber auch bei 10% der Gesunden (”Spezifitat 90%“)Eine zufallig gewahlte Person werde mit positivem Resultatgetestet.Wie wahrscheinlich ist es, dass sie tatsachlich krank ist?Modell: X =Testergebnis (SX = positiv,negativ),Y =Gesundheitszustand (SY = gesund, krank) der PersonGesucht P(Y = krank | X = positiv) =?
Wir wissen: P(Y = krank) = 0.02, P(Y = gesund) = 0.98,P(X = positiv | Y = krank) = 0.95,P(X = positiv | Y = gesund) = 0.1,also P(Y = krank | X = positiv) = 0.02·0.95
0.02·0.95+0.98·0.1·
= 0.162
17/84
![Page 40: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/40.jpg)
Zufallsvariablen und Verteilung
Beispiel: Medizinische ReihenuntersuchungEine Krankheit komme bei 2% der Bevolkerung vor (”Pravalenz2%“),ein Test schlage bei 95% der Kranken an (”Sensitivitat 95%“),aber auch bei 10% der Gesunden (”Spezifitat 90%“)Eine zufallig gewahlte Person werde mit positivem Resultatgetestet.Wie wahrscheinlich ist es, dass sie tatsachlich krank ist?Modell: X =Testergebnis (SX = positiv,negativ),Y =Gesundheitszustand (SY = gesund, krank) der PersonGesucht P(Y = krank | X = positiv) =?
Wir wissen: P(Y = krank) = 0.02, P(Y = gesund) = 0.98,P(X = positiv | Y = krank) = 0.95,P(X = positiv | Y = gesund) = 0.1
,also P(Y = krank | X = positiv) = 0.02·0.95
0.02·0.95+0.98·0.1·
= 0.162
17/84
![Page 41: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/41.jpg)
Zufallsvariablen und Verteilung
Beispiel: Medizinische ReihenuntersuchungEine Krankheit komme bei 2% der Bevolkerung vor (”Pravalenz2%“),ein Test schlage bei 95% der Kranken an (”Sensitivitat 95%“),aber auch bei 10% der Gesunden (”Spezifitat 90%“)Eine zufallig gewahlte Person werde mit positivem Resultatgetestet.Wie wahrscheinlich ist es, dass sie tatsachlich krank ist?Modell: X =Testergebnis (SX = positiv,negativ),Y =Gesundheitszustand (SY = gesund, krank) der PersonGesucht P(Y = krank | X = positiv) =?
Wir wissen: P(Y = krank) = 0.02, P(Y = gesund) = 0.98,P(X = positiv | Y = krank) = 0.95,P(X = positiv | Y = gesund) = 0.1,also P(Y = krank | X = positiv) = 0.02·0.95
0.02·0.95+0.98·0.1·
= 0.16217/84
![Page 42: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/42.jpg)
Zufallsvariablen und Verteilung
Stochastische Unabhangigkeit
DefinitionZwei Zufallsgroßen X und Y heißen (stochastisch) unabhangig,wenn fur alle Ereignisse X ∈ A, Y ∈ B gilt
P(X ∈ A,Y ∈ B) = P(X ∈ A) · P(Y ∈ B)
Beispiel:Werfen zweier Wurfel:X = Augenzahl Wurfel 1, Y = Augenzahl Wurfel 2.
P(X = 2, Y = 5) =1
36=
16· 1
6= P(X = 2) · P(Y = 5)
18/84
![Page 43: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/43.jpg)
Zufallsvariablen und Verteilung
Stochastische Unabhangigkeit
DefinitionZwei Zufallsgroßen X und Y heißen (stochastisch) unabhangig,wenn fur alle Ereignisse X ∈ A, Y ∈ B gilt
P(X ∈ A,Y ∈ B) = P(X ∈ A) · P(Y ∈ B)
Beispiel:Werfen zweier Wurfel:X = Augenzahl Wurfel 1, Y = Augenzahl Wurfel 2.
P(X = 2, Y = 5) =1
36=
16· 1
6= P(X = 2) · P(Y = 5)
18/84
![Page 44: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/44.jpg)
Zufallsvariablen und Verteilung
Stochastische Unabhangigkeit
In der Praxis wendet man haufig Resultate an, dieUnabhangigkeit einer Stichprobe voraussetzen.
Beispiele:Fur eine Studie wird eine zufallige Person in Munchen undeine zufallige Person in Hamburg befragt. Die Antwortendurfen als unabhangig voneinander angenommen werden.Befragt man zwei Schwestern oder nahe Verwandte(getrennt voneinander), so werden die Antworten nichtunabhangig voneinander sein.
19/84
![Page 45: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/45.jpg)
Zufallsvariablen und Verteilung
Stochastische Unabhangigkeit
In der Praxis wendet man haufig Resultate an, dieUnabhangigkeit einer Stichprobe voraussetzen.
Beispiele:Fur eine Studie wird eine zufallige Person in Munchen undeine zufallige Person in Hamburg befragt. Die Antwortendurfen als unabhangig voneinander angenommen werden.
Befragt man zwei Schwestern oder nahe Verwandte(getrennt voneinander), so werden die Antworten nichtunabhangig voneinander sein.
19/84
![Page 46: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/46.jpg)
Zufallsvariablen und Verteilung
Stochastische Unabhangigkeit
In der Praxis wendet man haufig Resultate an, dieUnabhangigkeit einer Stichprobe voraussetzen.
Beispiele:Fur eine Studie wird eine zufallige Person in Munchen undeine zufallige Person in Hamburg befragt. Die Antwortendurfen als unabhangig voneinander angenommen werden.Befragt man zwei Schwestern oder nahe Verwandte(getrennt voneinander), so werden die Antworten nichtunabhangig voneinander sein.
19/84
![Page 47: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/47.jpg)
Die Binomialverteilung
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
20/84
![Page 48: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/48.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Als Bernoulli-Experiment bezeichnet man jeden zufalligenVorgang mit exakt zwei moglichen Werten.
Diese werden ublicherweise mit 1 und 0 bezeichnet ,beziehungsweise als ”Erfolg“ und ”Misserfolg“.
Bernoulli-Zufallsgroße X :Zustandsraum S = 0,1.Verteilung:
P(X = 1) = pP(X = 0) = 1− p
Der Parameter p ∈ [0,1] heißt Erfolgswahrscheinlichkeit.
21/84
![Page 49: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/49.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Als Bernoulli-Experiment bezeichnet man jeden zufalligenVorgang mit exakt zwei moglichen Werten.
Diese werden ublicherweise mit 1 und 0 bezeichnet
,beziehungsweise als ”Erfolg“ und ”Misserfolg“.
Bernoulli-Zufallsgroße X :Zustandsraum S = 0,1.Verteilung:
P(X = 1) = pP(X = 0) = 1− p
Der Parameter p ∈ [0,1] heißt Erfolgswahrscheinlichkeit.
21/84
![Page 50: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/50.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Als Bernoulli-Experiment bezeichnet man jeden zufalligenVorgang mit exakt zwei moglichen Werten.
Diese werden ublicherweise mit 1 und 0 bezeichnet ,beziehungsweise als ”Erfolg“ und ”Misserfolg“.
Bernoulli-Zufallsgroße X :Zustandsraum S = 0,1.Verteilung:
P(X = 1) = pP(X = 0) = 1− p
Der Parameter p ∈ [0,1] heißt Erfolgswahrscheinlichkeit.
21/84
![Page 51: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/51.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Als Bernoulli-Experiment bezeichnet man jeden zufalligenVorgang mit exakt zwei moglichen Werten.
Diese werden ublicherweise mit 1 und 0 bezeichnet ,beziehungsweise als ”Erfolg“ und ”Misserfolg“.
Bernoulli-Zufallsgroße X :Zustandsraum S = 0,1.Verteilung:
P(X = 1) = pP(X = 0) = 1− p
Der Parameter p ∈ [0,1] heißt Erfolgswahrscheinlichkeit.
21/84
![Page 52: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/52.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Beispiele:Munzwurf: mogliche Werte sind ”Kopf“ und ”Zahl“.
Hat die gesampelte Drosophila eine Mutation, die weißeAugen verursacht?Mogliche Antworten sind ”Ja“ und ”Nein“.Das Geschlecht einer Person hat die moglichen Werte
”mannlich“ und ”weiblich“.
22/84
![Page 53: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/53.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Beispiele:Munzwurf: mogliche Werte sind ”Kopf“ und ”Zahl“.Hat die gesampelte Drosophila eine Mutation, die weißeAugen verursacht?Mogliche Antworten sind ”Ja“ und ”Nein“.
Das Geschlecht einer Person hat die moglichen Werte
”mannlich“ und ”weiblich“.
22/84
![Page 54: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/54.jpg)
Die Binomialverteilung
Bernoulli-Verteilung
Beispiele:Munzwurf: mogliche Werte sind ”Kopf“ und ”Zahl“.Hat die gesampelte Drosophila eine Mutation, die weißeAugen verursacht?Mogliche Antworten sind ”Ja“ und ”Nein“.Das Geschlecht einer Person hat die moglichen Werte
”mannlich“ und ”weiblich“.
22/84
![Page 55: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/55.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.
Wie groß ist die Wahrscheinlichkeit, dass es...1 ...immer gelingt?
p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 56: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/56.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?
p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 57: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/57.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 58: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/58.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 59: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/59.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 60: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/60.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 61: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/61.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?
(nk
)· pk · (1− p)n−k
23/84
![Page 62: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/62.jpg)
Die Binomialverteilung
Angenommen, ein Bernoulli-Experiment (z.B. Munzwurf zeigtKopf) mit Erfolgsws p, wird n mal unabhangig wiederholt.Wie groß ist die Wahrscheinlichkeit, dass es...
1 ...immer gelingt?p · p · p · · · p = pn
2 ...immer scheitert?
(1− p) · (1− p) · · · (1− p) = (1− p)n
3 ...erst k mal gelingt und dann n − k mal scheitert?
pk · (1− p)n−k
4 ...insgesamt k mal gelingt und n − k mal scheitert?(nk
)· pk · (1− p)n−k
23/84
![Page 63: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/63.jpg)
Die Binomialverteilung
Erlauterung(nk
)= n!
k!·(n−k)! ist die Anzahl der Moglichkeiten, die k Erfolge indie n Versuche einzusortieren.
24/84
![Page 64: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/64.jpg)
Die Binomialverteilung
Binomialverteilung
Sei X die Anzahl der Erfolge bei n unabhangigen Versuchen mitErfolgswahrscheinlichkeit von jeweils p. Dann gilt furk ∈ 0,1, . . . ,n
P(X = k) =
(nk
)pk · (1− p)n−k
und X heißt binomialverteilt, kurz:
X ∼ bin(n,p).
25/84
![Page 65: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/65.jpg)
Die Binomialverteilung
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
0.30
probabilities of bin(n=10,p=0.2)
k
26/84
![Page 66: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/66.jpg)
Die Binomialverteilung
0 20 40 60 80 100
0.00
0.02
0.04
0.06
0.08
0.10
probabilities of bin(n=100,p=0.2)
k
26/84
![Page 67: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/67.jpg)
Erwartungswert
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
27/84
![Page 68: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/68.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R.
Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Manchmal schreibt man auch µX statt EX .Ersetzt man in der Definition die Wahrscheinlichkeit durch relativeHaufigkeiten, so erhalt man die bekannte Formel
Erwartungswert =Summe der WerteAnzahl der Werte
:
Sei ka die Haufigkeit des Wertes a in einer Gesamtheit der Große n,so schreibt sich der Erwartungswert als
EX =∑
a
a · ka
n=
∑a a · ka
n=
Summe der WerteAnzahl der Werte
.
28/84
![Page 69: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/69.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Manchmal schreibt man auch µX statt EX .Ersetzt man in der Definition die Wahrscheinlichkeit durch relativeHaufigkeiten, so erhalt man die bekannte Formel
Erwartungswert =Summe der WerteAnzahl der Werte
:
Sei ka die Haufigkeit des Wertes a in einer Gesamtheit der Große n,so schreibt sich der Erwartungswert als
EX =∑
a
a · ka
n=
∑a a · ka
n=
Summe der WerteAnzahl der Werte
.
28/84
![Page 70: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/70.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Manchmal schreibt man auch µX statt EX .
Ersetzt man in der Definition die Wahrscheinlichkeit durch relativeHaufigkeiten, so erhalt man die bekannte Formel
Erwartungswert =Summe der WerteAnzahl der Werte
:
Sei ka die Haufigkeit des Wertes a in einer Gesamtheit der Große n,so schreibt sich der Erwartungswert als
EX =∑
a
a · ka
n=
∑a a · ka
n=
Summe der WerteAnzahl der Werte
.
28/84
![Page 71: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/71.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Manchmal schreibt man auch µX statt EX .Ersetzt man in der Definition die Wahrscheinlichkeit durch relativeHaufigkeiten, so erhalt man die bekannte Formel
Erwartungswert =Summe der WerteAnzahl der Werte
:
Sei ka die Haufigkeit des Wertes a in einer Gesamtheit der Große n,so schreibt sich der Erwartungswert als
EX =∑
a
a · ka
n=
∑a a · ka
n=
Summe der WerteAnzahl der Werte
.
28/84
![Page 72: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/72.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Manchmal schreibt man auch µX statt EX .Ersetzt man in der Definition die Wahrscheinlichkeit durch relativeHaufigkeiten, so erhalt man die bekannte Formel
Erwartungswert =Summe der WerteAnzahl der Werte
:
Sei ka die Haufigkeit des Wertes a in einer Gesamtheit der Große n,so schreibt sich der Erwartungswert als
EX =∑
a
a · ka
n=
∑a a · ka
n=
Summe der WerteAnzahl der Werte
.
28/84
![Page 73: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/73.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Beispiele:Sei X Bernoulli-verteilt mit Erfolgswahrscheinlichkeitp ∈ [0,1]. Dann gilt
EX = 1 · P(X = 1) + 0 · P(X = 0) = P(X = 1) = p
Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
EW = 1 · P(W = 1) + 2 · P(W = 2) + · · ·+ 6 · P(W = 6)
=1 + · · ·+ 6
6=
216
= 3.5
29/84
![Page 74: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/74.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Beispiele:Sei X Bernoulli-verteilt mit Erfolgswahrscheinlichkeitp ∈ [0,1]. Dann gilt
EX = 1 · P(X = 1) + 0 · P(X = 0) = P(X = 1) = p
Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
EW = 1 · P(W = 1) + 2 · P(W = 2) + · · ·+ 6 · P(W = 6)
=1 + · · ·+ 6
6=
216
= 3.5
29/84
![Page 75: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/75.jpg)
Erwartungswert
Definition (Erwartungswert)Sei X eine Zufallsvariable mit endlichem oder aufzahlbaremWertebereich S = a1,a2,a3 . . . ⊆ R. Dann ist derErwartungswert von X definiert durch
EX =∑a∈S
a · P(X = a)
Beispiele:Sei X Bernoulli-verteilt mit Erfolgswahrscheinlichkeitp ∈ [0,1]. Dann gilt
EX = 1 · P(X = 1) + 0 · P(X = 0) = P(X = 1) = p
Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
EW = 1 · P(W = 1) + 2 · P(W = 2) + · · ·+ 6 · P(W = 6)
=1 + · · ·+ 6
6=
216
= 3.529/84
![Page 76: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/76.jpg)
Erwartungswert
Erwartungswert und FunktionenSei X eine Zufallsvariable mit endlichem Wertebereich S ⊆ R.Sei f : S → R eine Funktion.
Dann ist der Erwartungswert vonf (X ) gegeben durch
E[f (X )] =∑a∈S
f (a) · P(X = a)
(Details ggfs. an der Tafel)Beispiel:Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
E[W 2] = 12 · P(W = 1) + 22 · P(W = 2) + · · ·+ 62 · P(W = 6)
=12 + · · ·+ 62
6=
916
= 15.16
30/84
![Page 77: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/77.jpg)
Erwartungswert
Erwartungswert und FunktionenSei X eine Zufallsvariable mit endlichem Wertebereich S ⊆ R.Sei f : S → R eine Funktion. Dann ist der Erwartungswert vonf (X ) gegeben durch
E[f (X )] =∑a∈S
f (a) · P(X = a)
(Details ggfs. an der Tafel)
Beispiel:Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
E[W 2] = 12 · P(W = 1) + 22 · P(W = 2) + · · ·+ 62 · P(W = 6)
=12 + · · ·+ 62
6=
916
= 15.16
30/84
![Page 78: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/78.jpg)
Erwartungswert
Erwartungswert und FunktionenSei X eine Zufallsvariable mit endlichem Wertebereich S ⊆ R.Sei f : S → R eine Funktion. Dann ist der Erwartungswert vonf (X ) gegeben durch
E[f (X )] =∑a∈S
f (a) · P(X = a)
(Details ggfs. an der Tafel)Beispiel:Sei W die Augenzahl bei einem Wurfelwurf. Dann gilt
E[W 2] = 12 · P(W = 1) + 22 · P(W = 2) + · · ·+ 62 · P(W = 6)
=12 + · · ·+ 62
6=
916
= 15.16
30/84
![Page 79: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/79.jpg)
Erwartungswert
Rechnen mit Erwartungswerten
Satz (Linearitat der Erwartung)Sind X und Y Zufallsvariablen mit Werten in R und ist a ∈ R, sogilt:
E(a · X ) = a · EXE(X + Y ) = EX + EY
Satz (Nur fur Unabhangige!)Sind X und Y stochastisch unabhangige Zufallsvariablen mitWerten in R, so gilt
E(X · Y ) = EX · EY.
(Beweise ggfs. an der Tafel.)
31/84
![Page 80: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/80.jpg)
Erwartungswert
Rechnen mit Erwartungswerten
Satz (Linearitat der Erwartung)Sind X und Y Zufallsvariablen mit Werten in R und ist a ∈ R, sogilt:
E(a · X ) = a · EXE(X + Y ) = EX + EY
Satz (Nur fur Unabhangige!)Sind X und Y stochastisch unabhangige Zufallsvariablen mitWerten in R, so gilt
E(X · Y ) = EX · EY.
(Beweise ggfs. an der Tafel.)
31/84
![Page 81: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/81.jpg)
Erwartungswert
Rechnen mit Erwartungswerten
Satz (Linearitat der Erwartung)Sind X und Y Zufallsvariablen mit Werten in R und ist a ∈ R, sogilt:
E(a · X ) = a · EXE(X + Y ) = EX + EY
Satz (Nur fur Unabhangige!)Sind X und Y stochastisch unabhangige Zufallsvariablen mitWerten in R, so gilt
E(X · Y ) = EX · EY.
(Beweise ggfs. an der Tafel.)
31/84
![Page 82: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/82.jpg)
Erwartungswert
Erwartungswert der BinomialverteilungSeien Y1,Y2, . . . ,Yn die Indikatorvariablen der n unabhangigenVersuche d.h.
Yi =
1 falls der i − te Versuch gelingt0 falls der i − te Versuch scheitert
Dann ist X = Y1 + · · ·+ Yn binomialverteilt mit Parametern(n,p), wobei p die Erfolgswahrscheinlichkeit der Versuche ist.
Wegen der Linearitat der Erwartung gilt
EX = E(Y1 + · · ·+ Yn)
= EY1 + · · ·+ EYn
= p + · · ·+ p = np
32/84
![Page 83: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/83.jpg)
Erwartungswert
Erwartungswert der BinomialverteilungSeien Y1,Y2, . . . ,Yn die Indikatorvariablen der n unabhangigenVersuche d.h.
Yi =
1 falls der i − te Versuch gelingt0 falls der i − te Versuch scheitert
Dann ist X = Y1 + · · ·+ Yn binomialverteilt mit Parametern(n,p), wobei p die Erfolgswahrscheinlichkeit der Versuche ist.
Wegen der Linearitat der Erwartung gilt
EX = E(Y1 + · · ·+ Yn)
= EY1 + · · ·+ EYn
= p + · · ·+ p = np
32/84
![Page 84: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/84.jpg)
Erwartungswert
Erwartungswert der BinomialverteilungSeien Y1,Y2, . . . ,Yn die Indikatorvariablen der n unabhangigenVersuche d.h.
Yi =
1 falls der i − te Versuch gelingt0 falls der i − te Versuch scheitert
Dann ist X = Y1 + · · ·+ Yn binomialverteilt mit Parametern(n,p), wobei p die Erfolgswahrscheinlichkeit der Versuche ist.
Wegen der Linearitat der Erwartung gilt
EX = E(Y1 + · · ·+ Yn)
= EY1 + · · ·+ EYn
= p + · · ·+ p = np
32/84
![Page 85: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/85.jpg)
Erwartungswert
Erwartungswert der BinomialverteilungSeien Y1,Y2, . . . ,Yn die Indikatorvariablen der n unabhangigenVersuche d.h.
Yi =
1 falls der i − te Versuch gelingt0 falls der i − te Versuch scheitert
Dann ist X = Y1 + · · ·+ Yn binomialverteilt mit Parametern(n,p), wobei p die Erfolgswahrscheinlichkeit der Versuche ist.
Wegen der Linearitat der Erwartung gilt
EX = E(Y1 + · · ·+ Yn)
= EY1 + · · ·+ EYn
= p + · · ·+ p = np
32/84
![Page 86: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/86.jpg)
Erwartungswert
Erwartungswert der Binomialverteilung
Wir halten fest:
X ∼ bin(n,p)⇒ EX = n · p
33/84
![Page 87: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/87.jpg)
Varianz und Korrelation
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
34/84
![Page 88: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/88.jpg)
Varianz und Korrelation
Definition (Varianz, Kovarianz und Korrelation)Die Varianz einer R-wertigen Zufallsgroße X ist
VarX = σ2X = E
[(X − EX )2] .
σX =√
Var X ist die Standardabweichung.Ist Y eine weitere reellwertige Zufallsvariable, so ist
Cov(X ,Y ) = E [(X − EX ) · (Y − EY )]
die Kovarianz von X und Y .Die Korrelation von X und Y ist
Cor(X ,Y ) =Cov(X ,Y )
σX · σY.
35/84
![Page 89: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/89.jpg)
Varianz und Korrelation
Definition (Varianz, Kovarianz und Korrelation)Die Varianz einer R-wertigen Zufallsgroße X ist
VarX = σ2X = E
[(X − EX )2] .
σX =√
Var X ist die Standardabweichung.
Ist Y eine weitere reellwertige Zufallsvariable, so ist
Cov(X ,Y ) = E [(X − EX ) · (Y − EY )]
die Kovarianz von X und Y .Die Korrelation von X und Y ist
Cor(X ,Y ) =Cov(X ,Y )
σX · σY.
35/84
![Page 90: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/90.jpg)
Varianz und Korrelation
Definition (Varianz, Kovarianz und Korrelation)Die Varianz einer R-wertigen Zufallsgroße X ist
VarX = σ2X = E
[(X − EX )2] .
σX =√
Var X ist die Standardabweichung.Ist Y eine weitere reellwertige Zufallsvariable, so ist
Cov(X ,Y ) = E [(X − EX ) · (Y − EY )]
die Kovarianz von X und Y .
Die Korrelation von X und Y ist
Cor(X ,Y ) =Cov(X ,Y )
σX · σY.
35/84
![Page 91: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/91.jpg)
Varianz und Korrelation
Definition (Varianz, Kovarianz und Korrelation)Die Varianz einer R-wertigen Zufallsgroße X ist
VarX = σ2X = E
[(X − EX )2] .
σX =√
Var X ist die Standardabweichung.Ist Y eine weitere reellwertige Zufallsvariable, so ist
Cov(X ,Y ) = E [(X − EX ) · (Y − EY )]
die Kovarianz von X und Y .Die Korrelation von X und Y ist
Cor(X ,Y ) =Cov(X ,Y )
σX · σY.
35/84
![Page 92: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/92.jpg)
Varianz und Korrelation
Die VarianzVarX = E
[(X − EX )2]
ist die mittlere quadrierte Abweichung vom Mittelwert.
Die KorrelationCor(X ,Y ) =
Cov(X ,Y )
σX · σY
liegt immer im Intervall [−1,1]. Die Variablen X und Y sindpositiv korreliert, wenn X und Y tendenziell entweder beideuberdurchschnittlich große Werte oder beideunterdurchschnittlich große Werte annehmen.negativ korreliert, wenn X und Y tendenziell aufverschiedenen Seiten ihrer Erwartungswerte liegen.
Sind X und Y unabhangig, so sind sie auch unkorreliert, d.h.Cor(X ,Y ) = 0.
36/84
![Page 93: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/93.jpg)
Varianz und Korrelation
Die VarianzVarX = E
[(X − EX )2]
ist die mittlere quadrierte Abweichung vom Mittelwert.
Die KorrelationCor(X ,Y ) =
Cov(X ,Y )
σX · σY
liegt immer im Intervall [−1,1]. Die Variablen X und Y sindpositiv korreliert, wenn X und Y tendenziell entweder beideuberdurchschnittlich große Werte oder beideunterdurchschnittlich große Werte annehmen.negativ korreliert, wenn X und Y tendenziell aufverschiedenen Seiten ihrer Erwartungswerte liegen.
Sind X und Y unabhangig, so sind sie auch unkorreliert, d.h.Cor(X ,Y ) = 0.
36/84
![Page 94: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/94.jpg)
Varianz und Korrelation
Die VarianzVarX = E
[(X − EX )2]
ist die mittlere quadrierte Abweichung vom Mittelwert.
Die KorrelationCor(X ,Y ) =
Cov(X ,Y )
σX · σY
liegt immer im Intervall [−1,1]. Die Variablen X und Y sindpositiv korreliert, wenn X und Y tendenziell entweder beideuberdurchschnittlich große Werte oder beideunterdurchschnittlich große Werte annehmen.negativ korreliert, wenn X und Y tendenziell aufverschiedenen Seiten ihrer Erwartungswerte liegen.
Sind X und Y unabhangig, so sind sie auch unkorreliert, d.h.Cor(X ,Y ) = 0.
36/84
![Page 95: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/95.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
37/84
![Page 96: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/96.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[X−EX]>0[X−EX]<0
37/84
![Page 97: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/97.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[Y−EY]>0
[Y−EY]<0
[X−EX]>0[X−EX]<0
37/84
![Page 98: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/98.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[X−EX]*[Y−EY]<0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]<0
37/84
![Page 99: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/99.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[X−EX]*[Y−EY]<0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]<0
Cov(X,Y)= 1.11
37/84
![Page 100: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/100.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[X−EX]*[Y−EY]<0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]<0
38/84
![Page 101: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/101.jpg)
Varianz und Korrelation
Wieso Cov(X ,Y ) = E([X − EX ][Y − EY ])?
0 2 4 6 8 10
02
46
810
X
Y
[X−EX]*[Y−EY]<0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]>0
[X−EX]*[Y−EY]<0
Cov(X,Y)= −0.78
38/84
![Page 102: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/102.jpg)
Varianz und Korrelation
Beispiel: Die empirische Verteilung
Sind x1, . . . , xn ∈ R Daten und entsteht X durch rein zufalligesZiehen aus diesen Daten, so gilt:
EX = x
und
Var X =1n
n∑i=1
(xi − x)2
Entsprechend kann man auch fur Daten (xi , yi) die empirischenKovarianzen und Korrelationen ausrechen, siehe nachsteSeite...
39/84
![Page 103: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/103.jpg)
Varianz und Korrelation
Beispiel: Die empirische Verteilung
Sind x1, . . . , xn ∈ R Daten und entsteht X durch rein zufalligesZiehen aus diesen Daten, so gilt:
EX = x
und
Var X =1n
n∑i=1
(xi − x)2
Entsprechend kann man auch fur Daten (xi , yi) die empirischenKovarianzen und Korrelationen ausrechen, siehe nachsteSeite...
39/84
![Page 104: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/104.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
40/84
![Page 105: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/105.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
40/84
![Page 106: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/106.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
40/84
![Page 107: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/107.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
0 2 4 6 8 10
02
46
810
X
Y
40/84
![Page 108: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/108.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
0 2 4 6 8 10
02
46
810
X
Y
40/84
![Page 109: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/109.jpg)
Varianz und Korrelation
σX = 0.95, σY = 0.92
Cov(X ,Y ) = −0.06
Cor(X ,Y ) = −0.069
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.13, σY = 1.2
Cov(X ,Y ) = −1.26
Cor(X ,Y ) = −0.92
0 2 4 6 8 10
02
46
810
X
Y
40/84
![Page 110: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/110.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
41/84
![Page 111: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/111.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
41/84
![Page 112: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/112.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
41/84
![Page 113: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/113.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
0 2 4 6 8 10
02
46
810
X
Y
41/84
![Page 114: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/114.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
0 2 4 6 8 10
02
46
810
X
Y
41/84
![Page 115: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/115.jpg)
Varianz und Korrelation
σX = 1.14, σY = 0.78
Cov(X ,Y ) = 0.78
Cor(X ,Y ) = 0.71
0 2 4 6 8 10
02
46
810
X
Y
σX = 1.03, σY = 0.32
Cov(X ,Y ) = 0.32
Cor(X ,Y ) = 0.95
0 2 4 6 8 10
02
46
810
X
Y
41/84
![Page 116: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/116.jpg)
Varianz und Korrelation
σX = 0.91, σY = 0.88
Cov(X ,Y ) = 0
Cor(X ,Y ) = 0
0 2 4 6 8 10
02
46
810
X
Y
42/84
![Page 117: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/117.jpg)
Varianz und Korrelation
σX = 0.91, σY = 0.88
Cov(X ,Y ) = 0
Cor(X ,Y ) = 0
0 2 4 6 8 10
02
46
810
X
Y
42/84
![Page 118: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/118.jpg)
Varianz und Korrelation
σX = 0.91, σY = 0.88
Cov(X ,Y ) = 0
Cor(X ,Y ) = 0
0 2 4 6 8 10
02
46
810
X
Y
42/84
![Page 119: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/119.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 120: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/120.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 121: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/121.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) =
a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 122: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/122.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarX
Var(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 123: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/123.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) =
VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 124: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/124.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 125: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/125.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=
∑ni=1 Var
(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 126: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/126.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 127: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/127.jpg)
Varianz und Korrelation
Rechenregeln fur Varianzen
VarX = E[(X − EX )2]
VarX = Cov(X ,X )
VarX = E(X 2)− (EX )2
Var(a · X ) = a2 · VarXVar(X + Y ) = VarX + VarY + 2 · Cov(X ,Y )
Var(∑n
i=1 Xi)
=∑n
i=1 Var(Xi)
+ 2 ·∑n
j=1
∑j−1i=1 Cov(Xi ,Xj)
Sind (X ,Y ) stochastisch unabhangig, so folgt:
Var(X + Y ) = VarX + VarY
43/84
![Page 128: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/128.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)
Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 129: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/129.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 130: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/130.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EY
Cov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 131: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/131.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 132: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/132.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 133: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/133.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 134: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/134.jpg)
Varianz und Korrelation
Rechenregeln fur Kovarianzen
Cov(X ,Y ) = E[(X − EX ) · (Y − EY )]
Sind X und Y unabhangig, so folgt Cov(X ,Y ) = 0(die Umkehrung gilt nicht!)Cov(X ,Y )=Cov(Y ,X )
Cov(X ,Y ) = E(X · Y )− EX · EYCov(a · X ,Y ) = a · Cov(X ,Y ) = Cov(X ,a · Y )
Cov(X + Z ,Y ) = Cov(X ,Y ) + Cov(Z ,Y )
Cov(X ,Z + Y ) = Cov(X ,Z ) + Cov(X ,Y )
Die letzten drei Regeln beschreiben die Bilinearitat derKovarianz.
44/84
![Page 135: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/135.jpg)
Varianz und Korrelation
Rechenregeln fur die Korrelation
Cor(X ,Y ) =Cov(X ,Y )
σX · σY
−1 ≤ Cor(X ,Y ) ≤ 1Cor(X ,Y ) = Cor(Y ,X )
Cor(X ,Y ) = Cov(X/σX ,Y/σY )
Cor(X ,Y ) = 1 genau dann wenn Y eine wachsende,affin-lineare Funktion von X ist, d.h. falls es a > 0 undb ∈ R gibt, so dass Y = a · X + bCor(X ,Y ) = −1 genau dann wenn Y eine fallende,affin-lineare Funktion von X ist, d.h. falls es a < 0 undb ∈ R gibt, so dass Y = a · X + b
45/84
![Page 136: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/136.jpg)
Varianz und Korrelation
Mit diesen Rechenregeln konnen wir nun beweisen:
SatzSind X1,X2, . . .Xn unabhangige R-wertige Zufallsgroßen mitMittelwert µ und Varianz σ2, so gilt fur X = 1
n
∑ni=1 Xi :
EX = µ
undVar X =
1nσ2,
d.h.σX =
σ√n
46/84
![Page 137: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/137.jpg)
Varianz und Korrelation
Beweis: Linearitat des Erwartungswertes impliziert
EX = E(1
n
n∑i=1
Xi
)=
1n
n∑i=1
E(Xi)
=1n
n∑i=1
µ = µ.
Die Unabhangigkeit der Xi vereinfacht die Varianz zu
Var X = Var(1
n
n∑i=1
Xi
)=
1n2 Var
( n∑i=1
Xi
)=
1n2
n∑i=1
Var(Xi)
=1n2
n∑i=1
σ2 =1nσ2
47/84
![Page 138: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/138.jpg)
Varianz und Korrelation
Beweis: Linearitat des Erwartungswertes impliziert
EX = E(1
n
n∑i=1
Xi
)=
1n
n∑i=1
E(Xi)
=1n
n∑i=1
µ = µ.
Die Unabhangigkeit der Xi vereinfacht die Varianz zu
Var X = Var(1
n
n∑i=1
Xi
)=
1n2 Var
( n∑i=1
Xi
)=
1n2
n∑i=1
Var(Xi)
=1n2
n∑i=1
σ2 =1nσ2
47/84
![Page 139: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/139.jpg)
Varianz und Korrelation
Bernoulli-VerteilungEine Bernoulli-verteilte Zufallsvariable Y mit Erfolgsws p ∈ [0,1]hat Erwartungswert
EY = p
und VarianzVar Y = p · (1− p)
Beweis: Aus P(Y = 1) = p und P(Y = 0) = (1− p) folgt
EY = 1 · p + 0 · (1− p) = p.
Varianz:Var Y = E
(Y 2)− (EY
)2
= 12 · p + 02 · (1− p)− p2 = p · (1− p)
48/84
![Page 140: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/140.jpg)
Varianz und Korrelation
Bernoulli-VerteilungEine Bernoulli-verteilte Zufallsvariable Y mit Erfolgsws p ∈ [0,1]hat Erwartungswert
EY = p
und VarianzVar Y = p · (1− p)
Beweis: Aus P(Y = 1) = p und P(Y = 0) = (1− p) folgt
EY = 1 · p + 0 · (1− p) = p.
Varianz:Var Y = E
(Y 2)− (EY
)2
= 12 · p + 02 · (1− p)− p2 = p · (1− p)
48/84
![Page 141: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/141.jpg)
Varianz und Korrelation
Bernoulli-VerteilungEine Bernoulli-verteilte Zufallsvariable Y mit Erfolgsws p ∈ [0,1]hat Erwartungswert
EY = p
und VarianzVar Y = p · (1− p)
Beweis: Aus P(Y = 1) = p und P(Y = 0) = (1− p) folgt
EY = 1 · p + 0 · (1− p) = p.
Varianz:Var Y = E
(Y 2)− (EY
)2
= 12 · p + 02 · (1− p)− p2 = p · (1− p)
48/84
![Page 142: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/142.jpg)
Varianz und Korrelation
Binomialverteilung
Seien nun Y1, · · · ,Yn unabhangig und Bernoulli-verteilt mitErfolgsws p. Dann gilt
n∑i=1
Yi =: X ∼ bin(n,p)
und es folgt:
Var X =
Var( n∑
i=1
Yi
)=
n∑i=1
Var Yi = n · p · (1− p)
49/84
![Page 143: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/143.jpg)
Varianz und Korrelation
Binomialverteilung
Seien nun Y1, · · · ,Yn unabhangig und Bernoulli-verteilt mitErfolgsws p. Dann gilt
n∑i=1
Yi =: X ∼ bin(n,p)
und es folgt:
Var X = Var( n∑
i=1
Yi
)=
n∑i=1
Var Yi = n · p · (1− p)
49/84
![Page 144: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/144.jpg)
Varianz und Korrelation
Binomialverteilung
Seien nun Y1, · · · ,Yn unabhangig und Bernoulli-verteilt mitErfolgsws p. Dann gilt
n∑i=1
Yi =: X ∼ bin(n,p)
und es folgt:
Var X = Var( n∑
i=1
Yi
)=
n∑i=1
Var Yi =
n · p · (1− p)
49/84
![Page 145: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/145.jpg)
Varianz und Korrelation
Binomialverteilung
Seien nun Y1, · · · ,Yn unabhangig und Bernoulli-verteilt mitErfolgsws p. Dann gilt
n∑i=1
Yi =: X ∼ bin(n,p)
und es folgt:
Var X = Var( n∑
i=1
Yi
)=
n∑i=1
Var Yi = n · p · (1− p)
49/84
![Page 146: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/146.jpg)
Varianz und Korrelation
Binomialverteilung
Satz (Erwartungswert und Varianz der Binomialverteilung)Ist X binomialverteilt mit Parametern (n,p), so gilt:
EX = n · p
undVar X = n · p · (1− p)
50/84
![Page 147: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/147.jpg)
Ein Anwendungsbeispiel
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
51/84
![Page 148: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/148.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 149: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/149.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 150: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/150.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 151: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/151.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 152: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/152.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 153: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/153.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 154: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/154.jpg)
Ein Anwendungsbeispiel
In einem Genom werde die Aminosaure Prolin101844 mal durch CCT und 106159 mal durch CCA codiert.
Ist es nur vom reinen Zufall abhangig,welches Codon verwendet wird?
Dann ware die Anzahl X der CCT binomialverteilt mit p = 12 und
n = 101844 + 106159 = 208003.
EX = n · p = 104001.5
σX =√
n · p · (1− p) ≈ 228
104001.5− 101844 = 2157.5 ≈ 9.5 · σX
Sieht das nach Zufall aus?
52/84
![Page 155: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/155.jpg)
Ein Anwendungsbeispiel
Die Frage ist:
Wie groß ist die Wahrscheinlichkeiteiner Abweichung vom Erwartungswert
von mindestens ≈ 9.5 · σX , wenn alles Zufall ist?
Wir mussen alsoP(|X − EX | ≥ 9.5σX
)berechnen.
Das Problem bei der Binomialverteilung ist:(n
k
)exakt zu
berechnen, ist fur große n sehr aufwandig. Deshalb:
Die Binomialverteilung wird oftdurch andere Verteilungen approximiert.
53/84
![Page 156: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/156.jpg)
Ein Anwendungsbeispiel
Die Frage ist:
Wie groß ist die Wahrscheinlichkeiteiner Abweichung vom Erwartungswert
von mindestens ≈ 9.5 · σX , wenn alles Zufall ist?
Wir mussen alsoP(|X − EX | ≥ 9.5σX
)berechnen.
Das Problem bei der Binomialverteilung ist:(n
k
)exakt zu
berechnen, ist fur große n sehr aufwandig. Deshalb:
Die Binomialverteilung wird oftdurch andere Verteilungen approximiert.
53/84
![Page 157: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/157.jpg)
Ein Anwendungsbeispiel
Die Frage ist:
Wie groß ist die Wahrscheinlichkeiteiner Abweichung vom Erwartungswert
von mindestens ≈ 9.5 · σX , wenn alles Zufall ist?
Wir mussen alsoP(|X − EX | ≥ 9.5σX
)berechnen.
Das Problem bei der Binomialverteilung ist:(n
k
)exakt zu
berechnen, ist fur große n sehr aufwandig. Deshalb:
Die Binomialverteilung wird oftdurch andere Verteilungen approximiert.
53/84
![Page 158: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/158.jpg)
Ein Anwendungsbeispiel
Die Frage ist:
Wie groß ist die Wahrscheinlichkeiteiner Abweichung vom Erwartungswert
von mindestens ≈ 9.5 · σX , wenn alles Zufall ist?
Wir mussen alsoP(|X − EX | ≥ 9.5σX
)berechnen.
Das Problem bei der Binomialverteilung ist:(n
k
)exakt zu
berechnen, ist fur große n sehr aufwandig. Deshalb:
Die Binomialverteilung wird oftdurch andere Verteilungen approximiert.
53/84
![Page 159: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/159.jpg)
Die Normalverteilung
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
54/84
![Page 160: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/160.jpg)
Die Normalverteilung
Die Binomialverteilung mit großer Versuchzahl nsieht (nahezu) aus wie die Normalverteilung:
400 450 500 550 600
0.00
00.
005
0.01
00.
015
0.02
00.
025
400:600
dbin
om(4
00:6
00, 1
000,
0.5
)
55/84
![Page 161: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/161.jpg)
Die Normalverteilung
Die Binomialverteilung mit großer Versuchzahl nsieht (nahezu) aus wie die Normalverteilung:
400 450 500 550 600
0.00
00.
005
0.01
00.
015
0.02
00.
025
400:600
dbin
om(4
00:6
00, 1
000,
0.5
)
55/84
![Page 162: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/162.jpg)
Die Normalverteilung
Dichte der StandardnormalverteilungEine Zufallsvariable Z mit der Dichte
f (x) =1√2π· e−
x22
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
heißt standardnormalverteilt.
“Gauß-Glocke”
kurz:Z ∼ N (0,1)
EZ = 0
Var Z = 1
56/84
![Page 163: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/163.jpg)
Die Normalverteilung
Dichte der StandardnormalverteilungEine Zufallsvariable Z mit der Dichte
f (x) =1√2π· e−
x22
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
heißt standardnormalverteilt.
“Gauß-Glocke”
kurz:Z ∼ N (0,1)
EZ = 0
Var Z = 1
56/84
![Page 164: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/164.jpg)
Die Normalverteilung
Dichte der StandardnormalverteilungEine Zufallsvariable Z mit der Dichte
f (x) =1√2π· e−
x22
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
heißt standardnormalverteilt.
“Gauß-Glocke”
kurz:Z ∼ N (0,1)
EZ = 0
Var Z = 1
56/84
![Page 165: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/165.jpg)
Die Normalverteilung
Ist Z N (0,1)-verteilt, so ist X = σ · Z + µ normalverteilt mitMittelwert µ und Varianz σ2, kurz:
X ∼ N (µ, σ2)
X hat dann die Dichte
f (x) =1√
2πσ2· e−
(x−µ)2
2σ2 .
57/84
![Page 166: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/166.jpg)
Die Normalverteilung
Ist Z N (0,1)-verteilt, so ist X = σ · Z + µ normalverteilt mitMittelwert µ und Varianz σ2, kurz:
X ∼ N (µ, σ2)
X hat dann die Dichte
f (x) =1√
2πσ2· e−
(x−µ)2
2σ2 .
57/84
![Page 167: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/167.jpg)
Die Normalverteilung
Merkregeln
Ist Z ∼ N (µ, σ2), so gilt:P(|Z − µ| > σ) ≈ 33%
P(|Z − µ| > 1.96 · σ) ≈ 5%
P(|Z − µ| > 3 · σ) ≈ 0.3%
58/84
![Page 168: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/168.jpg)
Die Normalverteilung
Merkregeln
Ist Z ∼ N (µ, σ2), so gilt:P(|Z − µ| > σ) ≈ 33%
P(|Z − µ| > 1.96 · σ) ≈ 5%
P(|Z − µ| > 3 · σ) ≈ 0.3%
58/84
![Page 169: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/169.jpg)
Die Normalverteilung
Merkregeln
Ist Z ∼ N (µ, σ2), so gilt:P(|Z − µ| > σ) ≈ 33%
P(|Z − µ| > 1.96 · σ) ≈ 5%
P(|Z − µ| > 3 · σ) ≈ 0.3%
58/84
![Page 170: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/170.jpg)
Die Normalverteilung
f (x) =1√
2πσ2· e−
(x−µ)2
2σ2
0 2 4 6 8 10
0.0
00.0
50.1
00.1
50.2
00.2
5
µ− σ µ + σµ
59/84
![Page 171: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/171.jpg)
Die Normalverteilung
Dichten brauchen IntegraleSei Z eine Zufallsvariable mit Dichte f (x).
0 2 4 6 8 10
0.0
00
.05
0.1
00
.15
0.2
00
.25
ba
Dann gilt
P(Z ∈ [a,b]) =
∫ b
af (x)dx .
60/84
![Page 172: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/172.jpg)
Die Normalverteilung
Dichten brauchen IntegraleSei Z eine Zufallsvariable mit Dichte f (x).
0 2 4 6 8 10
0.0
00
.05
0.1
00
.15
0.2
00
.25
ba
Dann gilt
P(Z ∈ [a,b]) =
∫ b
af (x)dx .
60/84
![Page 173: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/173.jpg)
Die Normalverteilung
Die Standardnormal-Dichte und das Gauß’sche Fehlerintegral Φ:f (x) = 1√
2πe−x2/2
−3 −2 −1 0 1 2 30.
00.
10.
20.
30.
4
x
Sta
ndar
d−N
orm
aldi
chte
a b
e−x2 2 2π
Sei Z standard-normalverteilt:Φ(a) =
∫ a−∞
1√2π
e−x2/2 dx , also fur a ∈ RP(Z ≤ a) = Φ(a), und fur a < bP(Z ∈ [a,b]) = P(Z ≤ b)− P(Z ≤ a)
Die Funktion Φ laßt sich nicht durch elementare Integrationausdrucken, sie wird numerisch bestimmt; man entnimmt in der Praxisden Wert einem Computerprogramm oder einer Tabelle.
61/84
![Page 174: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/174.jpg)
Die Normalverteilung
Die Normalverteilung in R
Die Normalverteilung hat in R das Kurzel ’norm’.
Es gibt 4 R-Befehle:dnorm(): Dichte der Normalverteilung (density)rnorm(): Ziehen einer Stichprobe (random sample)pnorm(): Verteilungsfunktion der Normalverteilung (probability)qnorm(): Quantilfunktion der Normalverteilung (quantile)
62/84
![Page 175: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/175.jpg)
Die Normalverteilung
Die Normalverteilung in R
Die Normalverteilung hat in R das Kurzel ’norm’.
Es gibt 4 R-Befehle:dnorm(): Dichte der Normalverteilung (density)
rnorm(): Ziehen einer Stichprobe (random sample)pnorm(): Verteilungsfunktion der Normalverteilung (probability)qnorm(): Quantilfunktion der Normalverteilung (quantile)
62/84
![Page 176: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/176.jpg)
Die Normalverteilung
Die Normalverteilung in R
Die Normalverteilung hat in R das Kurzel ’norm’.
Es gibt 4 R-Befehle:dnorm(): Dichte der Normalverteilung (density)rnorm(): Ziehen einer Stichprobe (random sample)
pnorm(): Verteilungsfunktion der Normalverteilung (probability)qnorm(): Quantilfunktion der Normalverteilung (quantile)
62/84
![Page 177: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/177.jpg)
Die Normalverteilung
Die Normalverteilung in R
Die Normalverteilung hat in R das Kurzel ’norm’.
Es gibt 4 R-Befehle:dnorm(): Dichte der Normalverteilung (density)rnorm(): Ziehen einer Stichprobe (random sample)pnorm(): Verteilungsfunktion der Normalverteilung (probability)
qnorm(): Quantilfunktion der Normalverteilung (quantile)
62/84
![Page 178: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/178.jpg)
Die Normalverteilung
Die Normalverteilung in R
Die Normalverteilung hat in R das Kurzel ’norm’.
Es gibt 4 R-Befehle:dnorm(): Dichte der Normalverteilung (density)rnorm(): Ziehen einer Stichprobe (random sample)pnorm(): Verteilungsfunktion der Normalverteilung (probability)qnorm(): Quantilfunktion der Normalverteilung (quantile)
62/84
![Page 179: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/179.jpg)
Die Normalverteilung
Beispiel: Dichte der Standardnormalverteilung:> dnorm(0)
[1] 0.3989423
> plot(dnorm,from=-4,to=4)
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
> dnorm(0,mean=1,sd=2)
63/84
![Page 180: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/180.jpg)
Die Normalverteilung
Beispiel: Dichte der Standardnormalverteilung:> dnorm(0)
[1] 0.3989423
> plot(dnorm,from=-4,to=4)
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
> dnorm(0,mean=1,sd=2)
63/84
![Page 181: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/181.jpg)
Die Normalverteilung
Beispiel: Dichte der Standardnormalverteilung:> dnorm(0)
[1] 0.3989423
> plot(dnorm,from=-4,to=4)
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
> dnorm(0,mean=1,sd=2)
63/84
![Page 182: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/182.jpg)
Die Normalverteilung
Beispiel: Ziehen einer Stichprobe
Ziehen einer Stichprobe der Lange 6 aus einerStandardnormalverteilung:> rnorm(6)
[1] -1.24777899 0.03288728 0.19222813 0.81642692
-0.62607324 -1.09273888
Ziehen einer Stichprobe der Lange 7 aus einerNormalverteilung mit Mittelwert 5 und Standardabweichung 3:> rnorm(7,mean=5,sd=3)
[1] 2.7618897 6.3224503 10.8453280 -0.9829688 5.6143127
0.6431437 8.123570
64/84
![Page 183: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/183.jpg)
Die Normalverteilung
Beispiel: Ziehen einer Stichprobe
Ziehen einer Stichprobe der Lange 6 aus einerStandardnormalverteilung:> rnorm(6)
[1] -1.24777899 0.03288728 0.19222813 0.81642692
-0.62607324 -1.09273888
Ziehen einer Stichprobe der Lange 7 aus einerNormalverteilung mit Mittelwert 5 und Standardabweichung 3:> rnorm(7,mean=5,sd=3)
[1] 2.7618897 6.3224503 10.8453280 -0.9829688 5.6143127
0.6431437 8.123570
64/84
![Page 184: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/184.jpg)
Die Normalverteilung
Beispiel: Ziehen einer Stichprobe
Ziehen einer Stichprobe der Lange 6 aus einerStandardnormalverteilung:> rnorm(6)
[1] -1.24777899 0.03288728 0.19222813 0.81642692
-0.62607324 -1.09273888
Ziehen einer Stichprobe der Lange 7 aus einerNormalverteilung mit Mittelwert 5 und Standardabweichung 3:> rnorm(7,mean=5,sd=3)
[1] 2.7618897 6.3224503 10.8453280 -0.9829688 5.6143127
0.6431437 8.123570
64/84
![Page 185: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/185.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 0, σ2 = 1), also standardnormalverteilt.
P(Z < a) berechnet man in R mit pnorm(a)
> pnorm(0.5) [1] 0.6914625
stan
dard
nor
mal
den
sity
0.0
0.1
0.2
0.3
0.4
0.5
65/84
![Page 186: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/186.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 0, σ2 = 1), also standardnormalverteilt.
P(Z < a) berechnet man in R mit pnorm(a)
> pnorm(0.5) [1] 0.6914625
stan
dard
nor
mal
den
sity
0.0
0.1
0.2
0.3
0.4
0.5
65/84
![Page 187: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/187.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 0, σ2 = 1), also standardnormalverteilt.
P(Z < a) berechnet man in R mit pnorm(a)
> pnorm(0.5) [1] 0.6914625
stan
dard
nor
mal
den
sity
0.0
0.1
0.2
0.3
0.4
0.5
65/84
![Page 188: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/188.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 5, σ2 = 2.25).
Berechnung von P(Z ∈ [3,4]):
P(Z ∈ [3,4]) = P(Z < 4)− P(Z < 3)
> pnorm(4,mean=5,sd=1.5)-pnorm(3,mean=5,sd=1.5)
[1] 0.1612813
66/84
![Page 189: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/189.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 5, σ2 = 2.25).
Berechnung von P(Z ∈ [3,4]):
P(Z ∈ [3,4]) = P(Z < 4)− P(Z < 3)
> pnorm(4,mean=5,sd=1.5)-pnorm(3,mean=5,sd=1.5)
[1] 0.1612813
66/84
![Page 190: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/190.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 5, σ2 = 2.25).
Berechnung von P(Z ∈ [3,4]):
P(Z ∈ [3,4]) = P(Z < 4)− P(Z < 3)
> pnorm(4,mean=5,sd=1.5)-pnorm(3,mean=5,sd=1.5)
[1] 0.1612813
66/84
![Page 191: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/191.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 5, σ2 = 2.25).
Berechnung von P(Z ∈ [3,4]):
P(Z ∈ [3,4]) = P(Z < 4)− P(Z < 3)
> pnorm(4,mean=5,sd=1.5)-pnorm(3,mean=5,sd=1.5)
[1] 0.1612813
66/84
![Page 192: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/192.jpg)
Die Normalverteilung
Beispiel: Berechnung von Wahrscheinlichkeiten:Sei Z ∼ N (µ = 5, σ2 = 2.25).
Berechnung von P(Z ∈ [3,4]):
P(Z ∈ [3,4]) = P(Z < 4)− P(Z < 3)
> pnorm(4,mean=5,sd=1.5)-pnorm(3,mean=5,sd=1.5)
[1] 0.1612813
66/84
![Page 193: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/193.jpg)
Die Normalverteilung
Sei Z ∼ N (µ, σ2).Frage: Wie berechnet man P(Z = 5)?
Antwort: Fur jedes x ∈ R gilt P(Z = x) = 0
Was wird dann aus EZ =∑
a∈S a · P(Z = a) ?
Muss reformiert werden:
EZ =
∫ ∞−∞
x · f (x)dx
Aber zum Gluck kennen wir schon das Ergebnis EZ = µ.
67/84
![Page 194: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/194.jpg)
Die Normalverteilung
Sei Z ∼ N (µ, σ2).Frage: Wie berechnet man P(Z = 5)?
Antwort: Fur jedes x ∈ R gilt P(Z = x) = 0
Was wird dann aus EZ =∑
a∈S a · P(Z = a) ?
Muss reformiert werden:
EZ =
∫ ∞−∞
x · f (x)dx
Aber zum Gluck kennen wir schon das Ergebnis EZ = µ.
67/84
![Page 195: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/195.jpg)
Die Normalverteilung
Sei Z ∼ N (µ, σ2).Frage: Wie berechnet man P(Z = 5)?
Antwort: Fur jedes x ∈ R gilt P(Z = x) = 0
Was wird dann aus EZ =∑
a∈S a · P(Z = a) ?
Muss reformiert werden:
EZ =
∫ ∞−∞
x · f (x)dx
Aber zum Gluck kennen wir schon das Ergebnis EZ = µ.
67/84
![Page 196: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/196.jpg)
Die Normalverteilung
Sei Z ∼ N (µ, σ2).Frage: Wie berechnet man P(Z = 5)?
Antwort: Fur jedes x ∈ R gilt P(Z = x) = 0
Was wird dann aus EZ =∑
a∈S a · P(Z = a) ?
Muss reformiert werden:
EZ =
∫ ∞−∞
x · f (x)dx
Aber zum Gluck kennen wir schon das Ergebnis EZ = µ.
67/84
![Page 197: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/197.jpg)
Die Normalverteilung
Sei Z ∼ N (µ, σ2).Frage: Wie berechnet man P(Z = 5)?
Antwort: Fur jedes x ∈ R gilt P(Z = x) = 0
Was wird dann aus EZ =∑
a∈S a · P(Z = a) ?
Muss reformiert werden:
EZ =
∫ ∞−∞
x · f (x)dx
Aber zum Gluck kennen wir schon das Ergebnis EZ = µ.
67/84
![Page 198: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/198.jpg)
Normalapproximation
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
68/84
![Page 199: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/199.jpg)
Normalapproximation
Normalapproximation
Fur große n und p, die nicht zu nahe bei 0 oder 1 liegen, kannman die Binomialverteilung durch die Normalverteilung mit dementsprechenden Erwartungswert und der entsprechendenVarianz approximieren:
Ist X ∼ bin(n,p) und Z ∼ N (µ, σ2)
mit µ = n · p und σ2 = n · p · (1− p)
so giltP(X ∈ [a,b]) ≈ P(Z ∈ [a,b])
(eine Faustregel: fur den Hausgebrauch meist okay, wennn · p · (1− p) ≥ 9)
69/84
![Page 200: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/200.jpg)
Normalapproximation
Normalapproximation
Fur große n und p, die nicht zu nahe bei 0 oder 1 liegen, kannman die Binomialverteilung durch die Normalverteilung mit dementsprechenden Erwartungswert und der entsprechendenVarianz approximieren:
Ist X ∼ bin(n,p) und Z ∼ N (µ, σ2)
mit µ = n · p und σ2 = n · p · (1− p)
so giltP(X ∈ [a,b]) ≈ P(Z ∈ [a,b])
(eine Faustregel: fur den Hausgebrauch meist okay, wennn · p · (1− p) ≥ 9)
69/84
![Page 201: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/201.jpg)
Normalapproximation
Normalapproximation
Fur große n und p, die nicht zu nahe bei 0 oder 1 liegen, kannman die Binomialverteilung durch die Normalverteilung mit dementsprechenden Erwartungswert und der entsprechendenVarianz approximieren:
Ist X ∼ bin(n,p) und Z ∼ N (µ, σ2)mit µ = n · p und σ2 = n · p · (1− p)so gilt
P(X ∈ [a,b]) ≈ P(Z ∈ [a,b])
(eine Faustregel: fur den Hausgebrauch meist okay, wennn · p · (1− p) ≥ 9)
69/84
![Page 202: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/202.jpg)
Normalapproximation
Normalapproximation
Fur große n und p, die nicht zu nahe bei 0 oder 1 liegen, kannman die Binomialverteilung durch die Normalverteilung mit dementsprechenden Erwartungswert und der entsprechendenVarianz approximieren:
Ist X ∼ bin(n,p) und Z ∼ N (µ, σ2)mit µ = n · p und σ2 = n · p · (1− p)so gilt
P(X ∈ [a,b]) ≈ P(Z ∈ [a,b])
(eine Faustregel: fur den Hausgebrauch meist okay, wennn · p · (1− p) ≥ 9)
69/84
![Page 203: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/203.jpg)
Normalapproximation
n = 1000, p = 0.5, n · p · (1− p) = 250
400 450 500 550 600
0.00
00.
005
0.01
00.
015
0.02
00.
025
400:600
dbin
om(4
00:6
00, 1
000,
0.5
)
70/84
![Page 204: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/204.jpg)
Normalapproximation
n = 1000, p = 0.5, n · p · (1− p) = 250
400 450 500 550 600
0.00
00.
005
0.01
00.
015
0.02
00.
025
400:600
dbin
om(4
00:6
00, 1
000,
0.5
)
70/84
![Page 205: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/205.jpg)
Normalapproximation
n = 10, p = 0.2, n · p · (1− p) = 1.6
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0:10
dbin
om(0
:10,
10,
0.2
)
70/84
![Page 206: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/206.jpg)
Normalapproximation
n = 10, p = 0.2, n · p · (1− p) = 1.6
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0:10
dbin
om(0
:10,
10,
0.2
)
70/84
![Page 207: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/207.jpg)
Normalapproximation
Zentraler Grenzwertsatz
Ein anderer Ausdruck fur Normalapproximation istZentraler Grenzwertsatz.
Der zentrale Grenzwertsatz besagt,dass die Verteilung von Summen
unabhangiger und identisch verteilterZufallsvariablen in etwadie Normalverteilung ist.
71/84
![Page 208: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/208.jpg)
Normalapproximation
Zentraler Grenzwertsatz
Ein anderer Ausdruck fur Normalapproximation istZentraler Grenzwertsatz.
Der zentrale Grenzwertsatz besagt,dass die Verteilung von Summen
unabhangiger und identisch verteilterZufallsvariablen in etwadie Normalverteilung ist.
71/84
![Page 209: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/209.jpg)
Normalapproximation
Zentraler GrenzwertsatzDie R-wertigen Zufallsgroßen X1,X2, . . . seien unabhangig undidentisch verteilt mit endlicher Varianz 0 < σ2 = Var Xi <∞. Seiaußerdem
Zn := X1 + X2 + · · ·+ Xn
die Summe der ersten n Variablen.
Dann ist die zentrierte undreskalierte Summe im Limes n→∞ standardnormalverteilt, d.h.
Z ∗n :=Zn − EZn√
Var Znist ungefahr ∼ N (0,1)
fur große n. Formal: Es gilt fur alle −∞ ≤ a < b ≤ ∞
limn→∞
P(a ≤ Z ∗n ≤ b) = P(a ≤ Z ≤ b),
wobei Z eine standardnormalverteilte Zufallsvariable ist.
72/84
![Page 210: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/210.jpg)
Normalapproximation
Zentraler GrenzwertsatzDie R-wertigen Zufallsgroßen X1,X2, . . . seien unabhangig undidentisch verteilt mit endlicher Varianz 0 < σ2 = Var Xi <∞. Seiaußerdem
Zn := X1 + X2 + · · ·+ Xn
die Summe der ersten n Variablen. Dann ist die zentrierte undreskalierte Summe im Limes n→∞ standardnormalverteilt, d.h.
Z ∗n :=Zn − EZn√
Var Znist ungefahr ∼ N (0,1)
fur große n.
Formal: Es gilt fur alle −∞ ≤ a < b ≤ ∞
limn→∞
P(a ≤ Z ∗n ≤ b) = P(a ≤ Z ≤ b),
wobei Z eine standardnormalverteilte Zufallsvariable ist.
72/84
![Page 211: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/211.jpg)
Normalapproximation
Zentraler GrenzwertsatzDie R-wertigen Zufallsgroßen X1,X2, . . . seien unabhangig undidentisch verteilt mit endlicher Varianz 0 < σ2 = Var Xi <∞. Seiaußerdem
Zn := X1 + X2 + · · ·+ Xn
die Summe der ersten n Variablen. Dann ist die zentrierte undreskalierte Summe im Limes n→∞ standardnormalverteilt, d.h.
Z ∗n :=Zn − EZn√
Var Znist ungefahr ∼ N (0,1)
fur große n. Formal: Es gilt fur alle −∞ ≤ a < b ≤ ∞
limn→∞
P(a ≤ Z ∗n ≤ b) = P(a ≤ Z ≤ b),
wobei Z eine standardnormalverteilte Zufallsvariable ist.
72/84
![Page 212: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/212.jpg)
Normalapproximation
Anders formuliert: Fur große n gilt (approximativ)
Zn ∼ N(µ, σ2) mit µ = EZn, σ
2 = Var Zn
Die Voraussetzungen ”unabhangig“ und ”identisch verteilt“lassen sich noch deutlich abschwachen.
Fur den Hausgebrauch:Ist Y das Resultat von vielen kleinen Beitragen, die großteilsunabhangig voneinander sind, so ist Y in etwa normalverteilt,d.h.
Y ∼ N(µ, σ2), mit µ = EY , σ2 = Var Y
73/84
![Page 213: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/213.jpg)
Normalapproximation
Anders formuliert: Fur große n gilt (approximativ)
Zn ∼ N(µ, σ2) mit µ = EZn, σ
2 = Var Zn
Die Voraussetzungen ”unabhangig“ und ”identisch verteilt“lassen sich noch deutlich abschwachen.
Fur den Hausgebrauch:Ist Y das Resultat von vielen kleinen Beitragen, die großteilsunabhangig voneinander sind, so ist Y in etwa normalverteilt,d.h.
Y ∼ N(µ, σ2), mit µ = EY , σ2 = Var Y
73/84
![Page 214: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/214.jpg)
Normalapproximation
Anders formuliert: Fur große n gilt (approximativ)
Zn ∼ N(µ, σ2) mit µ = EZn, σ
2 = Var Zn
Die Voraussetzungen ”unabhangig“ und ”identisch verteilt“lassen sich noch deutlich abschwachen.
Fur den Hausgebrauch:
Ist Y das Resultat von vielen kleinen Beitragen, die großteilsunabhangig voneinander sind, so ist Y in etwa normalverteilt,d.h.
Y ∼ N(µ, σ2), mit µ = EY , σ2 = Var Y
73/84
![Page 215: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/215.jpg)
Normalapproximation
Anders formuliert: Fur große n gilt (approximativ)
Zn ∼ N(µ, σ2) mit µ = EZn, σ
2 = Var Zn
Die Voraussetzungen ”unabhangig“ und ”identisch verteilt“lassen sich noch deutlich abschwachen.
Fur den Hausgebrauch:Ist Y das Resultat von vielen kleinen Beitragen, die großteilsunabhangig voneinander sind, so ist Y in etwa normalverteilt,d.h.
Y ∼ N(µ, σ2), mit µ = EY , σ2 = Var Y
73/84
![Page 216: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/216.jpg)
Der z-Test
Inhalt
1 Deterministische und zufallige Vorgange
2 Zufallsvariablen und Verteilung
3 Die Binomialverteilung
4 Erwartungswert
5 Varianz und Korrelation
6 Ein Anwendungsbeispiel
7 Die Normalverteilung
8 Normalapproximation
9 Der z-Test
74/84
![Page 217: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/217.jpg)
Der z-Test
Zuruck zu dem Beispiel mit denProlin-Codons im Genom-Beispiel
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Frage: Kann dies Zufall sein?Wir meinen: Nein.
Die Skeptiker sagen:
”Nur Zufall.“
75/84
![Page 218: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/218.jpg)
Der z-Test
Zuruck zu dem Beispiel mit denProlin-Codons im Genom-Beispiel
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Frage: Kann dies Zufall sein?Wir meinen: Nein.
Die Skeptiker sagen:
”Nur Zufall.“
75/84
![Page 219: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/219.jpg)
Der z-Test
Zuruck zu dem Beispiel mit denProlin-Codons im Genom-Beispiel
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Frage: Kann dies Zufall sein?
Wir meinen: Nein.
Die Skeptiker sagen:
”Nur Zufall.“
75/84
![Page 220: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/220.jpg)
Der z-Test
Zuruck zu dem Beispiel mit denProlin-Codons im Genom-Beispiel
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Frage: Kann dies Zufall sein?Wir meinen: Nein.
Die Skeptiker sagen:
”Nur Zufall.“
75/84
![Page 221: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/221.jpg)
Der z-Test
Zuruck zu dem Beispiel mit denProlin-Codons im Genom-Beispiel
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Frage: Kann dies Zufall sein?Wir meinen: Nein.
Die Skeptiker sagen:
”Nur Zufall.“
75/84
![Page 222: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/222.jpg)
Der z-Test
Die Hypothese
Reiner ZufallKein Unterschied
nennt man dieNullhypothese.
Um die Skeptiker zu uberzeugen,mussen wir die
Nullhypothese entkraftend.h. zeigen, dass unter der Nullhypothese
die Beobachtung sehr unwahrscheinlich ist.
76/84
![Page 223: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/223.jpg)
Der z-Test
Die Hypothese
Reiner ZufallKein Unterschied
nennt man dieNullhypothese.
Um die Skeptiker zu uberzeugen,mussen wir die
Nullhypothese entkraftend.h. zeigen, dass unter der Nullhypothese
die Beobachtung sehr unwahrscheinlich ist.
76/84
![Page 224: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/224.jpg)
Der z-Test
Die Hypothese
Reiner ZufallKein Unterschied
nennt man dieNullhypothese.
Um die Skeptiker zu uberzeugen,mussen wir die
Nullhypothese entkraften
d.h. zeigen, dass unter der Nullhypothesedie Beobachtung sehr unwahrscheinlich ist.
76/84
![Page 225: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/225.jpg)
Der z-Test
Die Hypothese
Reiner ZufallKein Unterschied
nennt man dieNullhypothese.
Um die Skeptiker zu uberzeugen,mussen wir die
Nullhypothese entkraftend.h. zeigen, dass unter der Nullhypothese
die Beobachtung sehr unwahrscheinlich ist.
76/84
![Page 226: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/226.jpg)
Der z-Test
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Unter der Nullhypothese ”alles nur Zufall“ist die Anzahl X der CCT bin(n,p)-verteilt
mit n = 208003 und p = 0.5.
Normalapproximation: X ist ungefahr N (µ, σ2)-verteilt mit
µ = n · p = 104001.5 ≈ 104000
und
σ =√
n · p · (1− p) = 228.0367 ≈ 228
77/84
![Page 227: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/227.jpg)
Der z-Test
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Unter der Nullhypothese ”alles nur Zufall“ist die Anzahl X der CCT bin(n,p)-verteilt
mit n = 208003 und p = 0.5.
Normalapproximation: X ist ungefahr N (µ, σ2)-verteilt mit
µ = n · p = 104001.5
≈ 104000
und
σ =√
n · p · (1− p) = 228.0367 ≈ 228
77/84
![Page 228: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/228.jpg)
Der z-Test
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Unter der Nullhypothese ”alles nur Zufall“ist die Anzahl X der CCT bin(n,p)-verteilt
mit n = 208003 und p = 0.5.
Normalapproximation: X ist ungefahr N (µ, σ2)-verteilt mit
µ = n · p = 104001.5 ≈ 104000
und
σ =√
n · p · (1− p) = 228.0367
≈ 228
77/84
![Page 229: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/229.jpg)
Der z-Test
CCT kommt k = 101844 mal vorCCA kommt n − k = 106159 mal vor
Unter der Nullhypothese ”alles nur Zufall“ist die Anzahl X der CCT bin(n,p)-verteilt
mit n = 208003 und p = 0.5.
Normalapproximation: X ist ungefahr N (µ, σ2)-verteilt mit
µ = n · p = 104001.5 ≈ 104000
und
σ =√
n · p · (1− p) = 228.0367 ≈ 228
77/84
![Page 230: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/230.jpg)
Der z-Test
Frage: Ist es plausibel, dass eine Große X , die den Wertk = 101844 angenommen hat, ungefahrN (104000,2282)-verteilt ist?
k
Wenn diese Nullhypothese H0 gilt, dann folgt
P(X = 101844) = 0
Aber das bedeutet nichts, denn P(X = k) = 0 gilt fur jeden Wertk !
78/84
![Page 231: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/231.jpg)
Der z-Test
Frage: Ist es plausibel, dass eine Große X , die den Wertk = 101844 angenommen hat, ungefahrN (104000,2282)-verteilt ist?
k
Wenn diese Nullhypothese H0 gilt, dann folgt
P(X = 101844) =
0
Aber das bedeutet nichts, denn P(X = k) = 0 gilt fur jeden Wertk !
78/84
![Page 232: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/232.jpg)
Der z-Test
Frage: Ist es plausibel, dass eine Große X , die den Wertk = 101844 angenommen hat, ungefahrN (104000,2282)-verteilt ist?
k
Wenn diese Nullhypothese H0 gilt, dann folgt
P(X = 101844) = 0
Aber das bedeutet nichts, denn P(X = k) = 0 gilt fur jeden Wertk !
78/84
![Page 233: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/233.jpg)
Der z-Test
Frage: Ist es plausibel, dass eine Große X , die den Wertk = 101844 angenommen hat, ungefahrN (104000,2282)-verteilt ist?
k
Wenn diese Nullhypothese H0 gilt, dann folgt
P(X = 101844) = 0
Aber das bedeutet nichts, denn P(X = k) = 0 gilt fur jeden Wertk !
78/84
![Page 234: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/234.jpg)
Der z-Test
Entscheidend ist die Wahrscheinlichkeit,dass X (unter Annahme der H0) einen
mindestens so extremen Wert wie k annimmt:
k
P(|X − µ| ≥ |k − µ|) = P(|X − µ| ≥ 2156) ≈ P(|X − µ| ≥ 9.5 · σ)
79/84
![Page 235: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/235.jpg)
Der z-Test
Entscheidend ist die Wahrscheinlichkeit,dass X (unter Annahme der H0) einen
mindestens so extremen Wert wie k annimmt:
k
P(|X − µ| ≥ |k − µ|)
= P(|X − µ| ≥ 2156) ≈ P(|X − µ| ≥ 9.5 · σ)
79/84
![Page 236: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/236.jpg)
Der z-Test
Entscheidend ist die Wahrscheinlichkeit,dass X (unter Annahme der H0) einen
mindestens so extremen Wert wie k annimmt:
k
P(|X − µ| ≥ |k − µ|) = P(|X − µ| ≥ 2156)
≈ P(|X − µ| ≥ 9.5 · σ)
79/84
![Page 237: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/237.jpg)
Der z-Test
Entscheidend ist die Wahrscheinlichkeit,dass X (unter Annahme der H0) einen
mindestens so extremen Wert wie k annimmt:
k
P(|X − µ| ≥ |k − µ|) = P(|X − µ| ≥ 2156) ≈ P(|X − µ| ≥ 9.5 · σ)
79/84
![Page 238: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/238.jpg)
Der z-Test
Wir wissen bereits:
Pr(|X − µ| ≥ 3 · σ) ≈ 0.003
(siehe Merkregeln!)
Also muss P(|X − µ| ≥ 9.5 · σ) extrem klein sein.In der Tat:Mit Normalapproximation istP(|X − µ| ≥ 9,5 · σ) u P(|Z | ≥ 9,5)
·= 3 · 10−21 (wo Z ∼ N (0,1))
(Der exakte Wert fur die Binomialverteilung mit n = 208003,p = 1/2 ist 3,1 · 10−21.)
80/84
![Page 239: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/239.jpg)
Der z-Test
Wir wissen bereits:
Pr(|X − µ| ≥ 3 · σ) ≈ 0.003 (siehe Merkregeln!)
Also muss P(|X − µ| ≥ 9.5 · σ) extrem klein sein.In der Tat:Mit Normalapproximation istP(|X − µ| ≥ 9,5 · σ) u P(|Z | ≥ 9,5)
·= 3 · 10−21 (wo Z ∼ N (0,1))
(Der exakte Wert fur die Binomialverteilung mit n = 208003,p = 1/2 ist 3,1 · 10−21.)
80/84
![Page 240: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/240.jpg)
Der z-Test
Wir wissen bereits:
Pr(|X − µ| ≥ 3 · σ) ≈ 0.003 (siehe Merkregeln!)
Also muss P(|X − µ| ≥ 9.5 · σ) extrem klein sein.
In der Tat:Mit Normalapproximation istP(|X − µ| ≥ 9,5 · σ) u P(|Z | ≥ 9,5)
·= 3 · 10−21 (wo Z ∼ N (0,1))
(Der exakte Wert fur die Binomialverteilung mit n = 208003,p = 1/2 ist 3,1 · 10−21.)
80/84
![Page 241: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/241.jpg)
Der z-Test
Wir wissen bereits:
Pr(|X − µ| ≥ 3 · σ) ≈ 0.003 (siehe Merkregeln!)
Also muss P(|X − µ| ≥ 9.5 · σ) extrem klein sein.In der Tat:Mit Normalapproximation istP(|X − µ| ≥ 9,5 · σ) u P(|Z | ≥ 9,5)
·= 3 · 10−21 (wo Z ∼ N (0,1))
(Der exakte Wert fur die Binomialverteilung mit n = 208003,p = 1/2 ist 3,1 · 10−21.)
80/84
![Page 242: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/242.jpg)
Der z-Test
Wir konnen also argumentieren,dass eine derartig starke Abweichung vom Erwartungswert
nur durch einen extremen Zufall zu erklaren ist.
Wir werden also dieNullhypothese “alles nur Zufall” verwerfen
und nach alternativen Erklarungen suchen,etwa unterschiedliche Effizienz von CCA und CCToder unterschiedliche Verfugbarkeit von A und T.
81/84
![Page 243: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/243.jpg)
Der z-Test
Zusammenfassung z-Test
Nullhypothese H0 (mochte man meistens verwerfen): derbeobachtete Wert x kommt aus einerNormalverteilung mit Mittelwert µ und bekannterVarianz σ2.
p-Wert =P(|X − µ| ≥ |x − µ|), wobei X ∼ N (µ, σ2), also dieWahrscheinlichkeit einer mindestens so großenAbweichung wie der beobachteten.
Signifikanzniveau α : oft 0.05. Wenn der p-Wert kleiner ist als α,verwerfen wir die Nullhypothese auf demSignifikanzniveau α und suchen nach eineralternativen Erklarung.
82/84
![Page 244: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/244.jpg)
Der z-Test
Zusammenfassung z-Test
Nullhypothese H0 (mochte man meistens verwerfen): derbeobachtete Wert x kommt aus einerNormalverteilung mit Mittelwert µ und bekannterVarianz σ2.
p-Wert =P(|X − µ| ≥ |x − µ|), wobei X ∼ N (µ, σ2), also dieWahrscheinlichkeit einer mindestens so großenAbweichung wie der beobachteten.
Signifikanzniveau α : oft 0.05. Wenn der p-Wert kleiner ist als α,verwerfen wir die Nullhypothese auf demSignifikanzniveau α und suchen nach eineralternativen Erklarung.
82/84
![Page 245: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/245.jpg)
Der z-Test
Zusammenfassung z-Test
Nullhypothese H0 (mochte man meistens verwerfen): derbeobachtete Wert x kommt aus einerNormalverteilung mit Mittelwert µ und bekannterVarianz σ2.
p-Wert =P(|X − µ| ≥ |x − µ|), wobei X ∼ N (µ, σ2), also dieWahrscheinlichkeit einer mindestens so großenAbweichung wie der beobachteten.
Signifikanzniveau α : oft 0.05. Wenn der p-Wert kleiner ist als α,verwerfen wir die Nullhypothese auf demSignifikanzniveau α und suchen nach eineralternativen Erklarung.
82/84
![Page 246: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/246.jpg)
Der z-Test
Grenzen des z-Tests
Der z-Test kann nur angewendet werden, wenn die Varianz derNormalverteilung bekannt ist oder zumindest in derNullhypothese als bekannt angenommen wird.
Das ist meistens nicht der Fall, wenn die Normalverteilung beimstatistischen Testen verwendet wird:
Meistens wird die Varianz aus den Daten geschatzt. Dann wirdanstelle des z-Tests der (wesentlich beruhmtere)
t-Testangewendet.
83/84
![Page 247: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/247.jpg)
Der z-Test
Grenzen des z-Tests
Der z-Test kann nur angewendet werden, wenn die Varianz derNormalverteilung bekannt ist oder zumindest in derNullhypothese als bekannt angenommen wird.
Das ist meistens nicht der Fall, wenn die Normalverteilung beimstatistischen Testen verwendet wird:
Meistens wird die Varianz aus den Daten geschatzt. Dann wirdanstelle des z-Tests der (wesentlich beruhmtere)
t-Testangewendet.
83/84
![Page 248: Biostatistik, WS 2017/18 - staff.uni-mainz.de · Wurfelt man 600 mal, so w¨ urde man gerne darauf wetten,¨ dass die Anzahl an Einsern zwischen 85 und 115 liegt. Die genaue Anzahl](https://reader034.vdokument.com/reader034/viewer/2022050715/5e0a51d8d19ffd15527053fb/html5/thumbnails/248.jpg)
Anhang
Tabelle: Verteilungsfunktion Φ der Standard-Normalverteilungx 0 1 2 3 4 5 6 7 8 9
0.00 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .53590.10 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .57530.20 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .61410.30 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .65170.40 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.50 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .72240.60 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .75490.70 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .78520.80 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8079 .8106 .81330.90 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.00 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .86211.10 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .88301.20 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90151.30 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .91771.40 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.50 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .94411.60 .9452 .9463 .9474 .9485 .9495 .9505 .9515 .9525 .9535 .95451.70 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .96331.80 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .97061.90 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9762 .9767
2.00 .9773 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .98172.10 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .98572.20 .9861 .9865 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .98902.30 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .99162.40 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.50 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .99522.60 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .99642.70 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .99742.80 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9980 .9980 .99812.90 .9981 .9982 .9983 .9983 .9984 .9984 .9985 .9985 .9986 .9986
Z ∼ N (0,1), so ist P(Z ≤ x) =∫ x−∞
1√2π
e−z2/2 dz = Φ(x)
Beispiel: Φ(1.74) = 0.9591. Fur x < 0 verwende Φ(−x) = 1− Φ(x)
84/84