||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 1
ANalysis Of VAriance (ANOVA) 1/2
||Seminar fΓΌr Statistik
ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und
Placebo (Faktor). Gibt es einen sign. Unterschied in der
Wirkung (kontinuierlich)?
π ~ π + π
ANOVA 2: Zwei Medikamente zur Blutdrucksenkung,
Placebo (Faktor) und Geschlecht (Faktor). Gibt es einen
sign. Unterschied in der Wirkung (kontinuierlich) (evtl.
geschlechterspezifisch)?
π ~ π1 + π2 + π
16.10.2014((Vorname Nachname)) 2
ANOVA - Idee
1-weg ANOVA
2-weg ANOVA
||Seminar fΓΌr Statistik
ANOVA = Β«VarianzanalyseΒ»
Macht Aussagen ΓΌber Mittelwerte (analysiert dazu
Varianzen)
ANOVA = Spezialfall einer Linearen Regression
ππππ‘. ππππππππ ~ ππππππππ + πΉπβπππ
Verallgemeinerung des t-Test (2 Gruppen β viele
Gruppen)
Historisch: Sehr verbreitet; heute: Immer noch extrem
verbreitet
16.10.2014Markus Kalisch 3
ANOVA: MΓΆgliche MissverstΓ€ndnisse
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 4
Wdh: Ungepaarter t-Test
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
10
M P
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
-50
5
M P
D
π
πD
π‘ βπ·
π; πππππ π»0 π π‘ππππ‘: π‘ βΌ π‘πβ1 β π(0,1)
D: βStreuungβ zwischen MW (βSignalβ)
π: βStreuungβ um MW (βFehlerβ)
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 5
ANOVA: Idee
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
Streuung zwischen Gruppen:
βBetween-Sum-of-Squaresβ (πππ΅)RSS der Gruppenmittelwerte (rote Kreuze)
um den totalen Mittelwert (blaue Linie)
πππ΅ = π β
π=1
π
ππ. β π..2
Streuung innerhalb Gruppen:
βWithin-Sum-of-Squaresβ (πππ)
RSS der Einzelbeobachtungen
(schwarze Kreise) um die einzelnen
Mittelwerte (rote Kreuze)
πππ =
π=1
π
π=1
π
πππ β ππ.2
π: π΄ππ§πβπ πΊππ’ππππ 3π: π΄ππ§πβπ π΅πππ. πππ πΊππ’πππ 10Ann: π in jeder Gruppe gleich
π3.
π2.π1. π..
Teststatistik βπππ΅
πππ
||Seminar fΓΌr Statistik
In welchem Bild ist die Teststatistik der ANOVA grΓΆsser ?
16.10.2014Markus Kalisch 6
ANOVA: Teststatistik
A
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
B
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
||Seminar fΓΌr Statistik
πππ = π + πΌπ + πππ , πππ ~ π 0, π2 πππ
Technische Nebenbedingung: π=1ππΌπ = 0
π»0: πΌ1 = πΌ2 = β― = πΌπ = 0
Teststatistik: π =πππ΅/(πβ1)
πππ/(πβ πβ1 )=πππ΅
πππ
Theorie: Falls π»0 stimmt
π ~ πΉπβ1,πβ πβ1
Damit kann ein Hypothesentest mit den ΓΌblichen 6
Schritten durchgefΓΌhrt werden
16.10.2014Markus Kalisch 7
ANOVA: Modell
βMean Squaresβ
βDegrees of freedom (Df)β
βAnalyse der
Varianzenβ
||Seminar fΓΌr Statistik
Angenommen: ππ ~ π 0,1 , π = 1,β¦π alle unabhΓ€ngig
π΄ =
π=1
π
ππ2
Chi-Quadrat-Verteilung mit π Freiheitsgraden: A ~ ππ Angenommen: π΄ ~ Ξ§π, π΅ ~ Ξ§π unabhΓ€ngig
π =π΄/π
π΅/π
F-Verteilung mit π und π Freiheitsgraden π ~ πΉπ;π
16.10.2014Markus Kalisch 8
Exkurs: Verteilungen
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 9
Beispiel in R: ANOVA-Tabelle
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
π = 3, π = 10
π β 1 = 2g*(p-1)=27
πππ΅ = 872.3πππ = 642.1
πππ΅ =872.3
2= 436.1
πππ =642.1
27= 23.8
πΉ =436.1
23.8= 18.34
||Seminar fΓΌr Statistik
Falls ANOVA signifikant: Zwischen welchen Gruppen sind
signifikante Unterschiede ?
β t-Tests fΓΌr alle Gruppenpaare
Problem: Multiples Testen
Bei π Gruppen gibt es π2=π(πβ1)
2t-Tests
Bsp: π = 20 β 190 Tests auf 5%-Niveau
KΓΆnnten etwa 0.05 β 190 β 10 falsch positive Tests haben
LΓΆsung: t-Test korrigieren (z.B. Bonferroni, β¦)
16.10.2014Markus Kalisch 10
Wo ist der Unterschied ?
Teil 1: Paarweise Tests
||Seminar fΓΌr Statistik
Vorteil:
- Vertrauensintervalle fΓΌr Differenzen der
Gruppenmittelwerte
- Wa., dass alle wahren Differenzen in den
Vertrauensintervallen liegen: 95%
Alternative zum paarweisen t-Test
Empfehlung: Tukey HSD verwenden
16.10.2014Markus Kalisch 11
Beliebte Alternative bei ANOVA:Tukeyβs Honestly Significant Difference (HSD) Test
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 12
Beispiel in R: TukeyHSD
-15 -10 -5 0 5 10
P-M
2P
-M1
M2
-M1
95% family-wise confidence level
Differences in mean levels of g Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0M1 M2 P
M2 ist deutlich wirksamer als M1
M1 und M2 sind deutlich
wirksamer als Placebo
||Seminar fΓΌr Statistik
Bisher: Differenz von zwei Gruppen
Jetzt: Linearkombination von beliebigen Gruppen
Bsp: Sind die beiden Medikamente im Mittel besser als
das Placebo ?
16.10.2014Markus Kalisch 13
Wo ist der Unterschied ?
Teil 2: Allgemeine Kontraste
||Seminar fΓΌr Statistik
Vektor mit wahren
Gruppenmittelwerten:
π = ππ1, ππ2, πππ
Kontraste-Matrix πΎ
Parameter-Vektor π
π»0: πΎ β π = π
Praxis: Benutzer definiert πΎ und π; Computer berechnet
p-Werte fΓΌr Hypothesen und korrigiert fΓΌr mult. Testen
16.10.2014Markus Kalisch 14
Kontraste: Notation
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
||Seminar fΓΌr Statistik
(Alternative zu TukeyHSD)
16.10.2014Markus Kalisch 15
Konstraste β Bsp 1: Paarweise Vergleiche
K π m
ππ2 β ππ1 = 0ππ β ππ1 = 0ππ β ππ2 = 0
||Seminar fΓΌr Statistik
Funktion βglhtβ (General Linear Hypotheses Test) im
package βmultcompβ
16.10.2014Markus Kalisch 16
Kontraste β Bsp 1: R
Approx. 95%-VI fΓΌr Unterschied M1 vs. M2:
5.67 Β± 2 β 2.181
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 17
Kontraste β Bsp 2:
Gruppe der Medikamente vs. Placebo
0.5 β ππ1 + 0.5 β ππ2 β ππ = 0ππ2 β ππ1 = 0
Medikamente vs. Placebo
Medikamente untereinander
||Seminar fΓΌr Statistik 16.10.2014Markus Kalisch 18
Kontraste β Bsp 2: R
Die Medikamente sind deutlich
wirksamer als Placebo
M2 ist deutlich wirksamer als M1
||Seminar fΓΌr Statistik
Angenommen, es gibt zwei Medikamente (M1, M2) und
auch zwei mΓΆgliche Formen von Placebo (P1, P2). Folgende
Matrix ist dann eine mΓΆgliche Kontrastmatrix fΓΌr die
Vergleiche:
(M1, M2) vs. (P1, P2)
M1 vs. M2
P1 vs. P2
16.10.2014Markus Kalisch 19
Kontraste
β’ Ja
β’ Nein
||Seminar fΓΌr Statistik
Wenige Kontraste β viel Macht
Software: Korrektur fΓΌr multiples Testen innerhalb von
einem Funktionsaufruf (aber nicht bei mehreren
Funktionsaufrufen mit verschiedenen Kontrasten)
Deshalb: Einen Satz von Kontrasten definieren, dann
auswerten; anschliessend keinen neuen Satz von
Kontrasten mehr untersuchen
16.10.2014Markus Kalisch 20
Grundregeln fΓΌr Kontraste
||Seminar fΓΌr Statistik
πππ = π + πΌπ + πππ , πππ ~ π 0, π2 πππ
1. Daten in jeder Gruppe normalverteilt
2. Gleiche Varianz in Gruppen
3. UnabhΓ€ngige Fehler πππ
In R: Funktion βplotβ wie bei Linearer Regression
Vorteil: βBalanciertes Experimentβ (gleiche Anzahl pro Gruppe):
ANOVA ist robuster gegen Abweichungen obiger Annahmen
16.10.2014Markus Kalisch 21
Residuenanalyse bei ANOVA