varianzanalytische methoden zweifaktorielle...

Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011

Durchführung in SPSS (File Trait Angst.sav)

Analysieren > Allgemeines Lineares Modell

> Univariat …

Varianzanalytische MethodenZweifaktorielle Versuchspläne 4/13


Haupteffekte Geschlecht und Gruppe signifikant (p < .05);

Wechselwirkung („Geschlecht * Gruppe“) nicht signifikant (p = .808)

[NV in allen 4 Gruppen gegeben (Shapiro-Wilk-Tests, ps ≥ .450; siehe später)]



Grafische Veranschaulichung der Ergebnisse durch Profilplots



Diagramm verdeutlicht, dass Effekte additiv sind;

d.h. Geschlechtseffekt ist über beide Stufen von „Gruppe“gleich, ebenso wie Effekt von „Gruppe“ über beide Geschlechter gleich ist

� Parallele Linien, keine

Wechselwirkung



Mögliche Wechselwirkungen (Beispiele)

Faktor B hat nur in der ersten Stufe von Faktor A einen Effekt

Faktor A übt nur auf die erste Stufe von Faktor B einen Effekt aus


� Wenn Wechselwirkung signifikant � anhand von Profilplots bestimmen, welchen Einfluss sie auf Haupteffekte nimmt

� Interpretation der Haupteffekte ist dann an Wechselwirkung zu relativieren (z.B. „Faktor B zeigt nur in der ersten Stufe von Faktor A einen Effekt“)

� Interpretation von Wechselwirkungen wird komplexer und anspruchsvoller bei

− mehr als zwei Stufen pro Faktor

− mehr als zwei Faktoren (nicht nur einfache Interaktionen, sondern auch zweifache und dreifache, etc.)

� Mittels Kontrasttests kann ermittelt werden, wo Wechselwirkungen liegen (simple effects analysis; in SPSS nur via Syntax)



� Alternativ: Ausgabe der Zellenmittelwerte und Vergleich, ob sich Konfidenzintervalle überlappen



4. Geschlecht * Gruppe

Abhängige Variable: STAI_trait

31,409 2,192 27,063 35,756

50,593 1,978 46,669 54,516

36,143 1,943 32,290 39,996

56,300 1,877 52,578 60,022

Gruppe

Gesunde

Angststörung

Gesunde

Angststörung

Geschlecht

männlich

weiblich

Mittelwert

Standardf

ehler Untergrenze Obergrenze

95% Konfidenzintervall

CAVE: Innerhalb der Stufen von „Gruppe“überlappen sich hier auch die KIs von Männern und Frauen � kein Haupteffekt „Geschlecht“ ?

Doch ! Test des Haupteffekts geht über alle Stufen der anderen Faktoren � mehr Testmacht!

� Voraussetzungen der zweifaktoriellen (und mehrfaktoriellen) ANOVA sind dieselben wie für einfaktorielle ANOVA (metrische Daten, Unabhängigkeit, Varianzhomogenität, Normalverteilung)

� Achtung: Voraussetzung der Normalverteilung muss in allen Faktorstufenkombinationen (= Gruppen) untersucht werden!

� Bei 2 Faktoren mit jeweils 2 Stufen � 4 Gruppen

� Mehrfaktorielle ANOVA i.A. wie einfaktorielle ANOVA ebenso robust

� Es gibt jedoch keinen vergleichbaren nicht-parametrischen Test in SPSS (z.B. zweifaktorielle Rangvarianzanalyse nicht in SPSS implementiert)



NV-Testung über alle Faktorstufenkombinationen in SPSS (File Trait Angst.sav)

Daten > Datei aufteilen …



� Analysieren > Deskriptive Statistiken > Explorative Datenanalyse … ; STAI_trait als abhängige Variable wählen



Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 1/7

� Abhängige Daten in psychologischer und insbesondere klinischer Forschung häufig

� Alle Interventionsstudien analysieren im Prinzip abhängige Daten (Prä-/Postvergleiche [Datenerhebungen vor und nach Interventionen])

� Abhängige Daten entstehen allgemein

– durch Messwiederholung

– durch Parallelisierung (matched samples)

– bei Untersuchung natürlicher Paare (z.B. Geschwister, Ehepaare)

� Verwendung abhängiger Daten verringert i.A. Zufallsfehler � Testmacht steigt durch Elimination interindividueller Unterschiede (bei Messwiederholungen: „Jede Vpn ist ihre eigene Kontrolle“)


� Einfachster Fall abhängiger Daten:

2 Messungen � t-Test für abhängige Stichproben

� Test untersucht nicht wie im Fall unabhängiger Stichproben, ob sich die Mittelwerte zweier Verteilungen voneinander unterscheiden, sondern ob der Mittelwert der Differenz aller Messwertpaare ungleich 0 ist

� Abhängiger t-Test ist Test über die Differenzen di = xi1 − xi2

� Voraussetzungen:

1. Metrische Daten (Intervall-, Rationalskala)

2. Abhängige Messungen

3. Normalverteilung der Differenzen di



1 mit −== NdfNSD

Mt

d

d


Zeitpunkt M SD

Baseline (T1) 25.71 4.53

Nach 12 Wochen (T2) 15.70 7.27


� Teststatistik

� H0: μd = 0

Beispiel: (angelehnt an Keller et al., 2000)

Effekt einer kognitiv-behavioralen Depressionsbehandlung (CBT)Outcomemaß: Hamilton Rating Scale for Depression (HRSD)

Score > 8: klinisch relevante depressive Symptomatik

N = 56 depressive Patienten vor und nach der 12-wöchigen Behandlung



Abhängiger t-Test in SPSS (File CBT.sav)

Analysieren > Mittelwerte vergleichen

> T-Test bei gepaarten Stichproben …



Statistik bei gepaarten Stichproben

25,71 56 4,528 ,605

15,70 56 7,266 ,971

HRSD_baseline

HRSD_post_treatment

Paaren

1

Mittelwert N

Standardab

weichung

Standardfe

hler des

Mittelwertes

Korrelationen bei gepaarten Stichproben

56 ,656 ,000HRSD_baseline &

HRSD_post_treatment

Paaren

1

N Korrelation Signifikanz

Test bei gepaarten Stichproben

10,018 5,489 ,733 8,548 11,488 13,658 55 ,000HRSD_baseline -

HRSD_post_treatment

Paaren

1

Mittelwert

Standardab

weichung

Standardfe

hler des

Mittelwertes Untere Obere


der Differenz

Gepaarte Differenzen

T df Sig. (2-seitig)

Intervention hochsignifikant wirksam


� Zur Überprüfung der Voraussetzungen (NV) muss neue Variable berechnet werden � Messwertdifferenzen !!!

Transformieren

> Variable berechnen …


� Analysieren > Deskriptive Statistiken > Explorative Datenanalyse … ; Diff als abhängige Variable wählen



Tests auf Normalverteilung

,095 56 ,200* ,963 56 ,080Diff

Statistik df Signifikanz Statistik df Signifikanz

Kolmogorov-Smirnova

Shapiro-Wilk

Dies ist eine untere Grenze der echten Signifikanz.*.

Signifikanzkorrektur nach Lillieforsa.

� In ANOVA kann Einfluss sowohl unabhängiger als auch abhängiger

Faktoren (simultan) untersucht werden

� „Klassisches“ Design der Interventionsforschung

– Ein Zwischensubjektfaktor (unabhängig; z.B. Versuchs- und Kontrollgruppe)

– Ein Innersubjektfaktor (abhängig; z.B. Prä/Postmessung)

� mixed design; mixed ANOVA

� „Klassischer“ Fall wird im Folgenden behandelt (2 Stufen im Zwischensubjektfaktor, 2 Stufen im Innersubjektfaktor)

� In mixed ANOVA wird zwischen zwei Fehlertermen unterschieden: Unsystem. Variabilität innerhalb der Stufen des unabhängigen Faktors und unsystematische Variabilität innerhalb der Stufen des abhängigen Faktors

Varianzanalytische MethodenMesswiederholungsdesigns 1/13


�

� Wechselwirkung zwischen unabhängigem und abhängigem Faktor kann getestet werden

� Residuum: Fehlerterm der intraindividuellen Variabilität, konfundiert mit

Interaktionseffekten (jede Vpn × Stufen des abhängigen Faktors)

Residuum ... Res

ktfaktorInnersubje ... ISF

rbjektfaktoZwischensu ... ZSF

QS QS QS

QS

QS QS

QSQS

ResISFZSFISF

Subjekte der Innerhalb

FehlerZSF

Subjekten den ZwischenGesamt 44 344 21444 3444 21++

+

+

=

×



� Mixed ANOVA erlaubt Testung dreier Hypothesen

– H0 (ZSF): H0: μ1 = μ2 = … = μk

– H0 (ISF): H0: μ1 = μ2 = … = μm

– H0 (Wechselwirkung): H0: μjl = μi + μl − μ

� F-Test für ZSF anhand der Varianzschätzung durch QSFehler, für ISF und Wechselwirkung anhand jener von QSRes

Beispiel: (angelehnt an Keller et al., 2000)

Wirkung von CBT im Vergleich

zu CBT + Antidepressivum in

Depressionsbehandlung

(RCT: Randomized Controlled Trial)



Baseline 12 Wochen

Gruppe n M (SD) M (SD)

CBT 56 25.71 (4.53) 15.70 (7.27)

CBT + Med 49 27.41 (4.45) 10.12 (6.89)

Durchführung in SPSS (File CBT vs CBT + Med.sav)

Analysieren > Allgemeines Lineares Modell

> Meßwiederholung …





Voraussetzungstest der MANOVA

(Erklärung später)

(nicht näher relevant für mixed ANOVA)

Tafel „Multivariate Tests“ ebenso ignorieren � Output weiter unten ansehen …



Spezieller Voraussetzungs-test der ANOVA mit Mess-

WH (Erklärung später)

Nur relevant, wenn abhängiger Faktor > 2 Stufen hat

Abhängiger Faktor „Zeit“ und Wechselwirkung ist signifikant (ps < .05)

Haupteffekt Behandlung ?…



Levene-Tests für Vergleich der

Stufen des unabhängigen Faktors innerhalb jeder Stufe

des abhängigen Faktors

Homogenität gegeben (ps > .05)

Haupteffekt der Behandlung (gemittelt über beide Zeitpunkte) nicht signifikant (p > .05)



KIs überschneiden sich zum ersten Zeitpunkt, aber nicht zum zweiten (niedrigere [= bessere] Werte in CBT + Med)

4. Behandlung * Zeit

Maß: MASS_1

25,714 ,600 24,524 26,905

15,696 ,948 13,817 17,576

27,408 ,642 26,135 28,681

10,122 1,013 8,113 12,132

Zeit

1

2

1

2

Behandlung

CBT

CBT + Med

Mittelwert

Standardf

ehler Untergrenze Obergrenze




Profilplot verdeutlicht, dass Behandlung mit CBT + Med größeren Effekt hat als mit CBT alleine

Keine Baseline-Unterschiede, aber differentieller Effekt zu T2, der durch signifikante Wechsel-wirkung belegt wird

� Voraussetzungen der mixed ANOVA

1. Metrische Daten (Intervall-, Rationalskala)

2. Unabhängige Gruppen an denen zumindest zwei (abhängige) Messungen vorgenommen werden

3. Varianzhomogenität (innerhalb der Stufen des abhängigen Faktors)

4. Sphärizität (nur bei mehr als zwei Stufen im abhängigen Faktor)

5. Multivariate Normalverteilung (innerhalb der Stufen des

unabhängigen Faktors)

� Multivariate Normalverteilung:

kann mit SPSS nicht direkt geprüft werden

Näherungsweise durch Überprüfung der univariaten NV (jede Gruppe in jeder abhängigen Messung) � bei Geltung der multivariaten NV ist auch jede Variable univariat normalverteilt (Umkehrschluss gilt jedoch nicht !!!)



� Sphärizität (= Zirkularität):

– Mauchly-Test (wenn p > .05 � Sphärizität gegeben)

– Annahme, dass die Varianzen der Differenzen aller Paare von abhängigen Messungen gleich sind

– Erübrigt sich für den Fall bloß zweier abhängiger Messungen

� Bei mehr als 2 abhängigen Messungen:

wenn Mauchly-Test signifikant

� Greenhouse-Geisser- und Huynh-Feldt-Korrekturen

(Kontrolle der Typ-II-Fehlerrate)

– Greenhouse-Geisser, wenn Epsilon < 0.75

– Huynh-Feldt, wenn Epsilon > 0.75



� Mixed ANOVA wie alle ANOVAs robustes Verfahren

� Sphärizität (bei mehr als zwei Stufen im abhängigen Faktor) generell wichtigere Voraussetzung

� wenn verletzt, Korrektur notwendig (ansonsten zu hohe Typ-II-Fehlerrate)

� Wenn Sphärizität nicht gegeben, kann auch MANOVA (multivariate ANOVA) verwendet werden (wird von SPSS automatisch ausgegeben)

� hat jedoch i.A. weniger Testmacht (nur bei größerer Verletzung der Sphärizität [Epsilon < 0.7] und N > Anzahl der Messwiederholungen + 10 höhere Testmacht)

� Varianz-Kovarianz-Matrizen müssen zudem gleich sein (Box-M-Test, p > .05)



varianzanalytische methoden zweifaktorielle...

Documents