varianzanalytische methoden zweifaktorielle...
TRANSCRIPT
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Durchführung in SPSS (File Trait Angst.sav)
Analysieren > Allgemeines Lineares Modell
> Univariat …
Varianzanalytische MethodenZweifaktorielle Versuchspläne 4/13
Varianzanalytische MethodenZweifaktorielle Versuchspläne 5/13
Haupteffekte Geschlecht und Gruppe signifikant (p < .05);
Wechselwirkung („Geschlecht * Gruppe“) nicht signifikant (p = .808)
[NV in allen 4 Gruppen gegeben (Shapiro-Wilk-Tests, ps ≥ .450; siehe später)]
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenZweifaktorielle Versuchspläne 6/13
Grafische Veranschaulichung der Ergebnisse durch Profilplots
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenZweifaktorielle Versuchspläne 7/13
Diagramm verdeutlicht, dass Effekte additiv sind;
d.h. Geschlechtseffekt ist über beide Stufen von „Gruppe“gleich, ebenso wie Effekt von „Gruppe“ über beide Geschlechter gleich ist
� Parallele Linien, keine
Wechselwirkung
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenZweifaktorielle Versuchspläne 8/13
Mögliche Wechselwirkungen (Beispiele)
Faktor B hat nur in der ersten Stufe von Faktor A einen Effekt
Faktor A übt nur auf die erste Stufe von Faktor B einen Effekt aus
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Wenn Wechselwirkung signifikant � anhand von Profilplots bestimmen, welchen Einfluss sie auf Haupteffekte nimmt
� Interpretation der Haupteffekte ist dann an Wechselwirkung zu relativieren (z.B. „Faktor B zeigt nur in der ersten Stufe von Faktor A einen Effekt“)
� Interpretation von Wechselwirkungen wird komplexer und anspruchsvoller bei
− mehr als zwei Stufen pro Faktor
− mehr als zwei Faktoren (nicht nur einfache Interaktionen, sondern auch zweifache und dreifache, etc.)
� Mittels Kontrasttests kann ermittelt werden, wo Wechselwirkungen liegen (simple effects analysis; in SPSS nur via Syntax)
Varianzanalytische MethodenZweifaktorielle Versuchspläne 9/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Alternativ: Ausgabe der Zellenmittelwerte und Vergleich, ob sich Konfidenzintervalle überlappen
Varianzanalytische MethodenZweifaktorielle Versuchspläne 10/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
4. Geschlecht * Gruppe
Abhängige Variable: STAI_trait
31,409 2,192 27,063 35,756
50,593 1,978 46,669 54,516
36,143 1,943 32,290 39,996
56,300 1,877 52,578 60,022
Gruppe
Gesunde
Angststörung
Gesunde
Angststörung
Geschlecht
männlich
weiblich
Mittelwert
Standardf
ehler Untergrenze Obergrenze
95% Konfidenzintervall
CAVE: Innerhalb der Stufen von „Gruppe“überlappen sich hier auch die KIs von Männern und Frauen � kein Haupteffekt „Geschlecht“ ?
Doch ! Test des Haupteffekts geht über alle Stufen der anderen Faktoren � mehr Testmacht!
� Voraussetzungen der zweifaktoriellen (und mehrfaktoriellen) ANOVA sind dieselben wie für einfaktorielle ANOVA (metrische Daten, Unabhängigkeit, Varianzhomogenität, Normalverteilung)
� Achtung: Voraussetzung der Normalverteilung muss in allen Faktorstufenkombinationen (= Gruppen) untersucht werden!
� Bei 2 Faktoren mit jeweils 2 Stufen � 4 Gruppen
� Mehrfaktorielle ANOVA i.A. wie einfaktorielle ANOVA ebenso robust
� Es gibt jedoch keinen vergleichbaren nicht-parametrischen Test in SPSS (z.B. zweifaktorielle Rangvarianzanalyse nicht in SPSS implementiert)
Varianzanalytische MethodenZweifaktorielle Versuchspläne 11/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
NV-Testung über alle Faktorstufenkombinationen in SPSS (File Trait Angst.sav)
Daten > Datei aufteilen …
Varianzanalytische MethodenZweifaktorielle Versuchspläne 12/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Analysieren > Deskriptive Statistiken > Explorative Datenanalyse … ; STAI_trait als abhängige Variable wählen
Varianzanalytische MethodenZweifaktorielle Versuchspläne 13/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 1/7
� Abhängige Daten in psychologischer und insbesondere klinischer Forschung häufig
� Alle Interventionsstudien analysieren im Prinzip abhängige Daten (Prä-/Postvergleiche [Datenerhebungen vor und nach Interventionen])
� Abhängige Daten entstehen allgemein
– durch Messwiederholung
– durch Parallelisierung (matched samples)
– bei Untersuchung natürlicher Paare (z.B. Geschwister, Ehepaare)
� Verwendung abhängiger Daten verringert i.A. Zufallsfehler � Testmacht steigt durch Elimination interindividueller Unterschiede (bei Messwiederholungen: „Jede Vpn ist ihre eigene Kontrolle“)
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Einfachster Fall abhängiger Daten:
2 Messungen � t-Test für abhängige Stichproben
� Test untersucht nicht wie im Fall unabhängiger Stichproben, ob sich die Mittelwerte zweier Verteilungen voneinander unterscheiden, sondern ob der Mittelwert der Differenz aller Messwertpaare ungleich 0 ist
� Abhängiger t-Test ist Test über die Differenzen di = xi1 − xi2
� Voraussetzungen:
1. Metrische Daten (Intervall-, Rationalskala)
2. Abhängige Messungen
3. Normalverteilung der Differenzen di
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 2/7
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
1 mit −== NdfNSD
Mt
d
d
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 3/7
Zeitpunkt M SD
Baseline (T1) 25.71 4.53
Nach 12 Wochen (T2) 15.70 7.27
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Teststatistik
� H0: μd = 0
Beispiel: (angelehnt an Keller et al., 2000)
Effekt einer kognitiv-behavioralen Depressionsbehandlung (CBT)Outcomemaß: Hamilton Rating Scale for Depression (HRSD)
Score > 8: klinisch relevante depressive Symptomatik
N = 56 depressive Patienten vor und nach der 12-wöchigen Behandlung
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 4/7
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Abhängiger t-Test in SPSS (File CBT.sav)
Analysieren > Mittelwerte vergleichen
> T-Test bei gepaarten Stichproben …
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 5/7
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Statistik bei gepaarten Stichproben
25,71 56 4,528 ,605
15,70 56 7,266 ,971
HRSD_baseline
HRSD_post_treatment
Paaren
1
Mittelwert N
Standardab
weichung
Standardfe
hler des
Mittelwertes
Korrelationen bei gepaarten Stichproben
56 ,656 ,000HRSD_baseline &
HRSD_post_treatment
Paaren
1
N Korrelation Signifikanz
Test bei gepaarten Stichproben
10,018 5,489 ,733 8,548 11,488 13,658 55 ,000HRSD_baseline -
HRSD_post_treatment
Paaren
1
Mittelwert
Standardab
weichung
Standardfe
hler des
Mittelwertes Untere Obere
95% Konfidenzintervall
der Differenz
Gepaarte Differenzen
T df Sig. (2-seitig)
Intervention hochsignifikant wirksam
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 6/7
� Zur Überprüfung der Voraussetzungen (NV) muss neue Variable berechnet werden � Messwertdifferenzen !!!
Transformieren
> Variable berechnen …
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Analysieren > Deskriptive Statistiken > Explorative Datenanalyse … ; Diff als abhängige Variable wählen
Varianzanalytische MethodenEinschub: abhängige Daten, t-Test für abhängige Stichproben 7/7
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Tests auf Normalverteilung
,095 56 ,200* ,963 56 ,080Diff
Statistik df Signifikanz Statistik df Signifikanz
Kolmogorov-Smirnova
Shapiro-Wilk
Dies ist eine untere Grenze der echten Signifikanz.*.
Signifikanzkorrektur nach Lillieforsa.
� In ANOVA kann Einfluss sowohl unabhängiger als auch abhängiger
Faktoren (simultan) untersucht werden
� „Klassisches“ Design der Interventionsforschung
– Ein Zwischensubjektfaktor (unabhängig; z.B. Versuchs- und Kontrollgruppe)
– Ein Innersubjektfaktor (abhängig; z.B. Prä/Postmessung)
� mixed design; mixed ANOVA
� „Klassischer“ Fall wird im Folgenden behandelt (2 Stufen im Zwischensubjektfaktor, 2 Stufen im Innersubjektfaktor)
� In mixed ANOVA wird zwischen zwei Fehlertermen unterschieden: Unsystem. Variabilität innerhalb der Stufen des unabhängigen Faktors und unsystematische Variabilität innerhalb der Stufen des abhängigen Faktors
Varianzanalytische MethodenMesswiederholungsdesigns 1/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
�
� Wechselwirkung zwischen unabhängigem und abhängigem Faktor kann getestet werden
� Residuum: Fehlerterm der intraindividuellen Variabilität, konfundiert mit
Interaktionseffekten (jede Vpn × Stufen des abhängigen Faktors)
Residuum ... Res
ktfaktorInnersubje ... ISF
rbjektfaktoZwischensu ... ZSF
QS QS QS
QS
QS QS
QSQS
ResISFZSFISF
Subjekte der Innerhalb
FehlerZSF
Subjekten den ZwischenGesamt 44 344 21444 3444 21++
+
+
=
×
Varianzanalytische MethodenMesswiederholungsdesigns 2/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Mixed ANOVA erlaubt Testung dreier Hypothesen
– H0 (ZSF): H0: μ1 = μ2 = … = μk
– H0 (ISF): H0: μ1 = μ2 = … = μm
– H0 (Wechselwirkung): H0: μjl = μi + μl − μ
� F-Test für ZSF anhand der Varianzschätzung durch QSFehler, für ISF und Wechselwirkung anhand jener von QSRes
Beispiel: (angelehnt an Keller et al., 2000)
Wirkung von CBT im Vergleich
zu CBT + Antidepressivum in
Depressionsbehandlung
(RCT: Randomized Controlled Trial)
Varianzanalytische MethodenMesswiederholungsdesigns 3/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Baseline 12 Wochen
Gruppe n M (SD) M (SD)
CBT 56 25.71 (4.53) 15.70 (7.27)
CBT + Med 49 27.41 (4.45) 10.12 (6.89)
Durchführung in SPSS (File CBT vs CBT + Med.sav)
Analysieren > Allgemeines Lineares Modell
> Meßwiederholung …
Varianzanalytische MethodenMesswiederholungsdesigns 4/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenMesswiederholungsdesigns 5/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Varianzanalytische MethodenMesswiederholungsdesigns 6/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Voraussetzungstest der MANOVA
(Erklärung später)
(nicht näher relevant für mixed ANOVA)
Tafel „Multivariate Tests“ ebenso ignorieren � Output weiter unten ansehen …
Varianzanalytische MethodenMesswiederholungsdesigns 7/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Spezieller Voraussetzungs-test der ANOVA mit Mess-
WH (Erklärung später)
Nur relevant, wenn abhängiger Faktor > 2 Stufen hat
Abhängiger Faktor „Zeit“ und Wechselwirkung ist signifikant (ps < .05)
Haupteffekt Behandlung ?…
Varianzanalytische MethodenMesswiederholungsdesigns 8/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Levene-Tests für Vergleich der
Stufen des unabhängigen Faktors innerhalb jeder Stufe
des abhängigen Faktors
Homogenität gegeben (ps > .05)
Haupteffekt der Behandlung (gemittelt über beide Zeitpunkte) nicht signifikant (p > .05)
Varianzanalytische MethodenMesswiederholungsdesigns 9/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
KIs überschneiden sich zum ersten Zeitpunkt, aber nicht zum zweiten (niedrigere [= bessere] Werte in CBT + Med)
4. Behandlung * Zeit
Maß: MASS_1
25,714 ,600 24,524 26,905
15,696 ,948 13,817 17,576
27,408 ,642 26,135 28,681
10,122 1,013 8,113 12,132
Zeit
1
2
1
2
Behandlung
CBT
CBT + Med
Mittelwert
Standardf
ehler Untergrenze Obergrenze
95% Konfidenzintervall
Varianzanalytische MethodenMesswiederholungsdesigns 10/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
Profilplot verdeutlicht, dass Behandlung mit CBT + Med größeren Effekt hat als mit CBT alleine
Keine Baseline-Unterschiede, aber differentieller Effekt zu T2, der durch signifikante Wechsel-wirkung belegt wird
� Voraussetzungen der mixed ANOVA
1. Metrische Daten (Intervall-, Rationalskala)
2. Unabhängige Gruppen an denen zumindest zwei (abhängige) Messungen vorgenommen werden
3. Varianzhomogenität (innerhalb der Stufen des abhängigen Faktors)
4. Sphärizität (nur bei mehr als zwei Stufen im abhängigen Faktor)
5. Multivariate Normalverteilung (innerhalb der Stufen des
unabhängigen Faktors)
� Multivariate Normalverteilung:
kann mit SPSS nicht direkt geprüft werden
Näherungsweise durch Überprüfung der univariaten NV (jede Gruppe in jeder abhängigen Messung) � bei Geltung der multivariaten NV ist auch jede Variable univariat normalverteilt (Umkehrschluss gilt jedoch nicht !!!)
Varianzanalytische MethodenMesswiederholungsdesigns 11/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Sphärizität (= Zirkularität):
– Mauchly-Test (wenn p > .05 � Sphärizität gegeben)
– Annahme, dass die Varianzen der Differenzen aller Paare von abhängigen Messungen gleich sind
– Erübrigt sich für den Fall bloß zweier abhängiger Messungen
� Bei mehr als 2 abhängigen Messungen:
wenn Mauchly-Test signifikant
� Greenhouse-Geisser- und Huynh-Feldt-Korrekturen
(Kontrolle der Typ-II-Fehlerrate)
– Greenhouse-Geisser, wenn Epsilon < 0.75
– Huynh-Feldt, wenn Epsilon > 0.75
Varianzanalytische MethodenMesswiederholungsdesigns 12/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011
� Mixed ANOVA wie alle ANOVAs robustes Verfahren
� Sphärizität (bei mehr als zwei Stufen im abhängigen Faktor) generell wichtigere Voraussetzung
� wenn verletzt, Korrektur notwendig (ansonsten zu hohe Typ-II-Fehlerrate)
� Wenn Sphärizität nicht gegeben, kann auch MANOVA (multivariate ANOVA) verwendet werden (wird von SPSS automatisch ausgegeben)
� hat jedoch i.A. weniger Testmacht (nur bei größerer Verletzung der Sphärizität [Epsilon < 0.7] und N > Anzahl der Messwiederholungen + 10 höhere Testmacht)
� Varianz-Kovarianz-Matrizen müssen zudem gleich sein (Box-M-Test, p > .05)
Varianzanalytische MethodenMesswiederholungsdesigns 13/13
Dr. Ulrich Tran, VO Ausgewählte Methoden, SS 2011