tutorat statistik ii im ss 09 einfaktorielle varianzanalyse ch-langrock@t-online.de

Post on 05-Apr-2015

108 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Tutorat Statistik II im SS 09einfaktorielle Varianzanalyse

ch-langrock@t-online.de

Memo: Mediator- & Moderatoranalyse

Was fällt euch noch ein?

Memo

- Spezielle Verwendungen der Methode Regressionsanalyse

- Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen

- Die vier Schritte der Mediatoranalyse- Funktion Moderatoranalyse: Beinflussung der „Höhe“

des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen

- Zentraler mathematischer Unterschied:Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren

Thema: einfaktorielle Varianzanalyse

Gliederung

Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt

I. Anwendung und Funktion der ANOVAII. Verknüpfung: Effekte, ALM & ANOVAIII. Berechnung der ANOVAIV. Hypothesen & VoraussetzungenV. Effektgrößen & Formalia

I. ANOVA: Anwendung & Funktion

ANOVA: Was und wozu?

Ziel: Vergleich von Mittelwerten

Warum kein t-Test?!

Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²)

strukturell bildhaft

5 12

7 7

3 8

4 10

6 13

M=5 M=10

Alpha-Fehler-Kumulierung

Wenn drei Gruppen verglichen werden sollen, sind verschie-dene Vergleiche möglich:

(1) struk vs. bild: t(8) = -3.73; p = .006

(2) struk vs. emo: t(8) = -9.04; p = .000

(3) bild vs. emo: t(8) = -1.69; p = .129

Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher-weise einen signifikanten Effekt zu finden (α = 0.05)!

strukturell bildhaft emotional

5 12 12

7 7 11

3 8 12

4 10 12

6 13 13

M=5 M=10 M=12

Gruppen Vergleiche Kumulierter

α-Fehler3 3 0.1434 6 0.2645 10 0.4016 15 0.5377 21 0.6598 28 0.7629 36 0.842

10 45 0.90111 55 0.94012 66 0.96613 78 0.98214 91 0.99115 105 0.995

Alpha-Fehler-Kumulierung

Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H0 gilt (alle Gruppen sind gleich).

Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!

Bonferroni-KorrekturMit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt.

Beispiel: 5 Gruppen 10 Tests αadj = 0.05 / 10 = 0.005

Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler)

Bessere Alternative: Berechnung einer Varianzanalyse

Testsadj N

ANOVA: Was und wozu?

o Die Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen → t - Test

o Die Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta-Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden

Übersicht ANOVA

Begriffsklärung 1

o Einfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann

o Beispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot)

o Mehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird

o Beispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf

Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar

Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits?

Begriffsklärung 2

o Feste Effekte: Die UV ist nominalskaliert

o Zufällige Effekte: Die UV ist intervallskaliert

Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S. 327-330 empfohlen.

Begriffsklärung 3

Begriffsklärung 4

o Univariat: Wir untersuchen eine AV in Abhängigkeit der UV

o Multivariat: Wir untersuchen mehrere AV

Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs)

II. Effekte, ALM & ANOVA

Effekte

Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert → Gruppenzahl = Anzahl der Faktorstufen

Mathematisch:

Gesamtmittelwert

Mittelwert Gruppe 2

Mittelwert Gruppe 1

→ ALM

Beispiel: Effekte

Strukturgleichung des ALM

ikikkiii

kikkiii

eaxbxbxby

axbxbxby

...23.12211

...23.12211

...

...ˆ

Effekte im ALM

ALM in Matrizenform

Dummy- und Effektkodierung

o Die Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen

o Die Dummykodierung „spart“, indem sie von einem Nulleffekt für eine Gruppe ausgeht

o Die Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:

Dummykodierung

Effektkodierung

III. Berechnung der ANOVA

Berechnung der ANOVA

- Quadratsummenzerlegung

- F-Test & Interpretation

Quadratsummenzerlegung

Basis der Methode: Varianz

1

2

2

n

yy

df

SSMS

n

ii

Quadratsumme

Freiheitsgrade

MS: Mittlere Quadratsumme

Quadratsummenzerlegung

Gesamt-Quadratsumme (SStotal)

Quadratsumme innerhalb der Gruppen (SSwithin , SSError)

Quadratsumme zwischen den Gruppen (SSbetween, SSTreatment)

n

i

p

jij yy

1 1

2

n

i

p

jjij yy

1 1

2

p

jjj yyn

1

2

Gesamt-Quadratsumme

strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.5

n

i

p

jijtotal yySS

1 1

2

2

222

222

222

7.5)-(13

7.5)-(107.5)-(8 7.5)-(7

7.5)-(12 7.5)-(6 7.5)-(4

7.5)-(37.5)-(7 7.5)-(5

totalSS

98.50

30.25 6.25 0.25 0.25 20.25

2.25 12.25 20.25 0.25 6.25

totalSS

94.109

5.98ˆ 2 total

1

ˆ

1 1

2

2

pn

yy

df

SS

n

i

p

jij

total

totaltotal

y

strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.5

Gesamtvarianz

Varianz innerhalb der Gruppen

5.48

36ˆ 2 within

n

i

p

jjijwithin yySS

1 1

2strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.536

904 9 4 1 1 4 4 0

10)²-(13 10)²-(10 10)²-(8 10)²-(7 10)²-(12

5)²-(6 5)²-(4 5)²-(3 5)²-(7 5)²-(5

withinSS

8210 pNdfwithin

Varianz zwischen den Gruppen

50.621

50.62ˆ 2 between

p

jjjbetween yynSS

1

2strukturell bildhaft

y11=5 y12=12

y21=7 y22=7

y31=3 y32=8

y41=4 y42=10

y51=6 y52=13

M1=5 M2=10

G=7.550.62

25.3125.31

(2.5)5 (-2.5)5

7.5)-(105 7.5)-(5522

22

betweenSS

1121 pdfbetween

Zwischenergebnisse

Gesamtvarianz 94.109

50.98ˆ 2

total

totaltotal df

SS

50.48

36ˆ 2

within

withinwithin df

SS

50.621

50.62ˆ 2

between

betweenbetween df

SS

Varianz innerhalb

Varianz zwischen

Additivität

Quadratsummen sind additiv

innerhalbzwischentotal QSQSQS

Freiheitsgrade sind additiv

innerhalbzwischentotal dfdfdf

Varianzen sind nicht additiv222 ˆˆˆ innerhalbzwischentotal

F-Test & Interpretation

Der F-Test

Vergleich zweier Varianzen (→ multiple Regression)

H0: Varianzen gleich groß F=1

H1: Zählervarianz (=erklärte Varianz) größer F>1

Femp > Fkrit Varianzen signifikant verschieden!

2

2

, ˆ

ˆ

innerhalb

zwischendfdf innerhalbzwischen

F

Abgleich: empirischer & kritischer Wert

o Analog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichenDie H1 gilt wenn Femp > Fkrit Die H0 gilt wenn Femp ≤ Fkrit

o Im Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab

Am Beispiel

o Femp (1, 8) = 62,5 : 4,5 = 13,89o Fkrit (1, 8) = 5,32; α = .05o Femp > Fkrit

Es gilt die H1

50.48

36ˆ 2

within

withinwithin df

SS

50.621

50.62ˆ 2

between

betweenbetween df

SS

Varianz innerhalb

Varianz zwischen

→ Leonhart S. 658 ff.

Varianzanalyse: rechnerisches Vorgehen im Überblick

o Gruppen- und Gesamtmittelwerte bildeno Quadratsummen berechnen

= „Vorstufe“ der Varianzo Freiheitsgrade berechneno Mittlere Quadratsummen berechnen

= Varianzo F-Bruch bilden, Vergleich mit krit. F-Werto Interpretation: Entscheidung für H0 oder H1

IV. Hypothesen& Voraussetzungen

Nullhypothese der ANOVA

H0: Alle Mittelwerte sind gleich: μ1 = μ2 = … = μp μi = μj (für alle i,j)

bzw.

H0: Alle Effekte sind NullH0: α1 = α2 = … = αp = 0 αi = 0 (für alle i)

bzw.

H0: Die Varianz der Effekte ist NullH0: σ²α = 0 oder σ²Effekt=0

H1: Mindestens zwei Mittelwerte sind verschiedenμi ≠ μj (für mind. ein Paar i, j)

bzw.

H1: Mindestens ein Effekt ist ungleich Nullαi ≠ 0 (für mindestens ein i)

bzw.

H1: Varianz der Effekte ist größer als Nullσ²α > 0 oder σ²Effekt>0

Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich

Alternativhypothese der ANOVA

Voraussetzungen der ANOVA

(1) Intervallskalierte, normalverteilte AV

(2) Mindestens 20 Elemente pro Gruppe

(3) Ähnlich Gruppengrößen in den Zellen

(4) Varianzhomogenität

5.1min

max n

n

Prüfung der Varianzhomogenität

Zur Überprüfung der Varianzhomogenität stehen verschie-dene Tests zur Verfügung:

a) Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung)

b) Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung)

c) Fmax-Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)

Levene-Test

Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert:

H0:

jijij yyd

jddd ...21

Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.

Varianzanalyse ist robust

D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben).

Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden.

Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!

V. Effektgrößen & Formalia

Effektgrößen

o Was war noch gleich Cohens d?

o Auch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen.

o Eta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird.

Alternativ: Berechnung aus F-Wert

Formalia: F-Tests in Forschungsdokumentationen

Konventionen:- Nötige Infos: F- und p-Wert bzw. p-Niveau,

Zähler- und Nennerfreiheitsgrade- F- und p-Wert : exakt zwei Nachkommastellen;

Ausnahme: p-Wert bei n.s.

Signifikante Ergebnisse:(F[2, 37] = 5.34; p < .01)Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)

Vielen Dank für eure Aufmerksamkeit!

Arbeitsblatt Aufgabe 1

In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz:

Land A Land B Land C

y11 = 80 y12 = 35 y13 = 70

y21 = 75 y22 = 50 y23 = 75

y31 = 60 y31 = 60 y33 = 75

y41 = 65 y42 = 40 y43 = 45

a. Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA

b. Berechnen Sie die Quadrat-summen (total, within, between)

c. Berechnen Sie die mittleren Quadratsummen (…)

d. Berechnen Sie den empirischen F-Wert

e. Geben Sie den kritischen F-Wert an (-> 4,26)

f. Entscheiden Sie sich für eine der Hypothesen

Lösung (a)

H0: µa = µb = µc oder…

H0: Die Lesekompetenz unterscheidet sich nicht

H1: µi ≠ µj für mindestens ein Paar i,j oder…

H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern

Lösung (b)

MA = 70; MB = 46,25; MC = 66,25

Mges = 60,83

SStotal = 2541,67

SSwithin = 1237,5

SSbetween = 1304,17

p

jjjbetween yynSS

1

2

n

i

p

jjijwithin yySS

1 1

2

n

i

p

jijtotal yySS

1 1

2

Lösung (c)

MStotal = 2541,67 : 11 = 231,06

MSwithin = 1237,5 : 9 = 137,5

MSbetween = 1304,17 : 2 = 625,08

11 pnNdftotal

Lösung (d,e,f)

d. Femp (2, 9) = 625,8 : 137,5 = 4,74

e. Fkrit (2, 9) = 4,26; α = .05

f. Da Femp > Fkrit gilt die H1

2

2

, ˆ

ˆ

innerhalb

zwischendfdf innerhalbzwischen

F

Arbeitsblatt Aufgabe 3

Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1

Land A Land B Land C

y11 = 80 y12 = 35 y13 = 70

y21 = 75 y22 = 50 y23 = 75

y31 = 60 y31 = 60 y33 = 75

y41 = 65 y42 = 40 y43 = 45

Lösung

Land A Land B Land C

d11 = 10 d12 = 11,25 d13 = 3,75

d21 = 5 d22 = 3,75 d23 = 8,75

d31 = 10 d31 = 13,75 d33 = 8,75

d41 = 5 d42 = 6,25 d43 = 21,25

MA = 7,5; MB = 8,75; MC = 10,63

Mges = 8,96

Lösung 2

SStotal = 274,88SSwithin = 254,69SSbetween = 19,79

MStotal = 24,95MSwithin = 28,3MSbetween = 9,9

Lösung 3

o Femp (2, 9) = 0,35

o Fkrit (2, 9) = 4,26; α = .05

Da Femp < Fkrit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt

top related