fortbildung i analyse stetiger daten ein- bzw. zwei...
TRANSCRIPT
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I
Analyse stetiger DatenEin- bzw. Zwei-Gruppenvergleich
- 09.03.2005 -
Dipl.-Stat. C. NicolayInstitut für Medizinische Biometrie, Informatik und Epidemiologie
der Universität BonnSigmund-Freud-Str. 25
53105 [email protected]
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 2 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Themen:
• DatenÜberprüfen der DatenDeskriptive Darstellung, Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrische Verfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test (gleiche Varianzen)
t-Test (ungleiche Varianzen)nicht-parametrisch: U-Test von Mann-Whitney
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 3 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Überprüfen der Daten• Eingabefehler• Inkonsistenzen -> Plausibilitäts-Checks• Ausreisser• Fehlende Werte
Deskriptive Darstellung• Anzahl der Werte• Mittelwert, Standardabweichung• 95%-Konfidenzintervall• Minimum, Median, Maximum
Graphische Darstellung• Histogramm• Box-Plot• Normal Plot
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 4 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff.)
IgM [g/l]
3 1,07 2,3
19 6,427 9,132 10,735 11,738 12,838 12,822 7,416 5,416 5,46 2,07 2,39 3,06 2,02 ,73 1,03 1,03 1,02 ,71 ,31 ,31 ,31 ,3
298 100,0
,1,2,3,4,5,6,7,8,91,01,11,21,31,41,51,61,71,82,02,12,22,52,74,5Gesamt
GültigHäufigkeit Prozent
Univariate Statistiken
,803,749
,857
,760,700,220
,4695,1
4,54,4,5
,0272
MittelwertUntergrenzeObergrenze
95% Konfidenzintervalldes Mittelwerts
5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichStandardfehler
IgM [g/l]Statistik
0,0 1,0 2,0 3,0 4,0 5,0
IgM [g/l]
0
10
20
30
40
Häu
figke
it
Histogramm
IgM [g/l]
0,0
1,0
2,0
3,0
4,0
5,0
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 5 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
Box-Plot
unteres Quartil (Q1)
Maximum
oberes Quartil (Q3)
Median
Minimum
Ausreisser: Mehr als 1½ Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt
Extremwerte: Mehr als 3 Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 6 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
-1 0 1 2 3 4 5
Beobachteter Wert
-3
-2
-1
0
1
2
3
Erw
arte
ter N
orm
alw
ert
IgM [g/l]: Normalplot
Tests auf Normalverteilung
,170 298 ,000 ,823 298 ,000IgM [g/l]Statistik df Signifikanz Statistik df Signifikanz
Kolmogorov-Smirnova Shapiro-Wilk
Signifikanzkorrektur nach Lillieforsa.
Der W-Test von Shapiro-Wilk ist eine Möglichkeit zu testen, ob die vorliegenden Daten normalverteilt sind. Man sollte sich aber nicht allein auf das Test-Ergebnis verlassen, sondern immer die dazugehörigen deskriptiven Statistiken, Histogramm oder Box-Plot und den Normalplot in die Entscheidung mit einbeziehen. Bei den vorliegenden Daten braucht man eigentlich das Test-Ergebnis nicht, um zu dem Schluss zu kommen, dass die Daten nicht normalverteilt sind.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 7 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff., Fortsetzung)Die Daten können durch logarithmieren (hier: zur Basis e) in eine Normalverteilung überführt werden
TransformationViele Variablen (z.B. Labordaten) sind exponentialverteilt, wie die Daten aus dem Beispiel. Solche Daten kann man durch eine Transformation in eine Normalverteilung überführen.Vorteile:• Erfüllung der Voraussetzung für viele parametrische Verfahren• Angleichung der Varianz für verschiedene Gruppen. Dies funktioniert v.a. dann gut, wenn das Verhältnis von Standardabweichung zu Mittelwert inden verschiedenen Gruppen ähnlich ist.
• Reduktion des Einflusses von Ausreißern
Mögliche Transformationen:• log10(x) oder loge(x)
•
• 1/x
x
-2,000 0,000 2,000
ln(IgM) [g/l]
0
10
20
30
40
Häu
figke
it
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 8 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
Histogramm
Univariate Statistiken
-,36316-,42551
-,30082
-,35502-,35667
,299,546895
-2,3031,5043,807,693
,03168
MittelwertUntergrenzeObergrenze
95% Konfidenzintervalldes Mittelwerts
5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichStandardfehler
ln(IgM) [g/l]Statistik
-2 -1 0 1 2
Beobachteter Wert
-3
-2
-1
0
1
2
3
Erw
arte
ter N
orm
alw
ert
ln(IgM) [g/l]: Normalplot
Tests auf Normalverteilung
,098 298 ,000 ,976 298 ,000ln(IgM) [g/l]Statistik df Signifikanz Statistik df Signifikanz
Kolmogorov-Smirnova Shapiro-Wilk
Signifikanzkorrektur nach Lillieforsa.
Cave: Aufgrund des großen Stichproben-umfanges findet der W-Test auch kleine,nicht normalverteilte Datenmengen, die aber eigentlich unwichtig sind.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 9 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Parametrische vs. nicht-parametrische Verfahren
Viele statistische Methoden basieren auf der Annahme, dass die beobachteten Daten eine Stichprobe aus einer Grundgesamt-heit darstellen mit einer Verteilung (in dieser Grundgesamtheit), die man theoretisch (mathematisch) beschreiben kann.
Wenn diese Annahme vernünftig ist, dann sind die o.g. statistischen Analyse-Methoden einfach zu benutzen und besitzen eine große Bandbreite.
Wenn die Verteilungs-Annahmen jedoch nicht begründet sind, und dennoch parametrische Methoden benutzt werden, so kann dies zu falschen und somit ungültigen Schlussfolgerungen führen.
Bei der Analyse von Daten wählt man demnach zwischen- parametrischen Methoden (es werden konkrete Verteilungs-
annahmen der Daten vorausgesetzt) und- nicht-parametrischen Methoden (es werden keine
Verteilungsannahmen vorausgesetzt).
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 10 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene vs. unverbundene Testsituation
In einer verbundenen Testsituation werden zwei oder mehrere Beobachtungen an einer Untersuchungseinheit (Individuen, Tiere, Laborversuchsansatz, etc.) durchgeführt (gepaarte oder abhängige Daten).Daraus folgt logischerweise, dass der Stichprobenumfang in beiden Gruppen gleich ist.Auch Studien, bei denen Patientengruppen individuell gematchtsind, fallen in diese Kategorie.Beispiel:Blutdruck während und nach der Schwangerschaft bei einer Gruppe von n Frauen
In einer unverbundenen Testsituation gehören die Beobachtungen zu zwei unabhängigen Gruppen von Individuen (Tieren etc.).Die Stichprobenumfänge müssen nicht gleich groß sein. Manchmal ist das auch gar nicht möglich, z.B. bei seltenen Erkrankungen.Beispiel:Geburtsgewicht von Jungen vs. Geburtsgewicht von Mädchen
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 11 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene Testsituation: t-Test (Theorie)
Testproblem (Beispiel):Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben Gruppe von n Individuen gemessen. Aufgrund der verbundenen Testsituation kann die Analyse vereinfacht werden, indem man die intraindividuellen Differenzen berechnet und diese analysiert. Hier spielt die Variabilität innerhalb der Individuen eine tragende Rolle.
Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) müssen aus einer normalverteilten Grundgesamtheit stammen.
H0: Erwartungswert(di) = 0H1: Erwartungswert(di) ≠ 0
Die dazugehörige Test-Statistik verbindet den Mittelwert der
beobachteten, intraindividuellen Differenzen mit dem dazugehörigen Standardfehler.
(s = Standardabweichung)
)(dsedt =
nsdse =)(
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 12 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene Testsituation: t-Test (Beispiel)Mean daily dietary intake over 10 pre-menstrual and 10 post-menstrual days(Altman, S. 190 ff.)
Dietary intake (kJ)# pre post Diff.----------------------------------1 5260 3910 13502 5470 4220 12503 5640 3885 17554 6180 5160 10205 6390 5645 7456 6515 4680 18357 6805 5265 15408 7515 5975 15409 7515 6790 72510 8230 6900 133011 8770 7335 1435
Univariate Statistiken
6753,641142,12344,36
5433,181216,83366,89
1320,45366,75110,58
MittelwertStandardabweichungStandardfehlerMittelwertStandardabweichungStandardfehlerMittelwertStandardabweichungStandardfehler
Pre-menstrual
Post-menstrual
Difference (pre-post)
Statistik
Test bei gepaarten Stichproben
1320,455 366,746 110,578 11,941 10 ,000Pre-menstrual -Post-menstrual
MittelwertStandardab-
weichung
Standard-fehler des
Mittelwertes T df Sig. (2-seitig)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 13 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene Testsituation: Vorzeichen-Rang-Testvon Wilcoxon (Theorie)
Testproblem (Beispiel):Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselbenGruppe von n Individuen gemessen. Die intraindividuellen Differenzenentstammen wahrscheinlich keiner Normalverteilung.
Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) stammen aus einer Grundgesamtheit mit einer symmetrischen Verteilung. -> auch hier kann eine Transformation der Daten helfen.
Man geht in drei Schritten vor:(1) Berechnen der intraindividuellen Differenzen(2) Ordnen der intraind. Differenzen ohne Beachtung des Vorzeichens(3) Berechnen der Rangsumme aller negativen bzw. positiven Ränge
(R- bzw. R+, ohne Null-Differenzen)
Die Test-Statistik W = min(|R-|, |R+|)
Eine Alternative hierzu ist der Vorzeichen-Test.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 14 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene Testsituation: Vorzeichen-Rang-Test von Wilcoxon (Beispiel)Daily energy intake of 11 healthy women with rank order of differences(ignoring their signs) from the recommended intake of 7725 kJ (Altman, S. 188 ff.)
Daily Diff. to Rank of# intake 7725 kJ differences-------------------------------------------------1 5260 2465 112 5470 2255 103 5640 2085 94 6180 1545 85 6390 1335 76 6515 1210 67 6805 920 48 7515 210 1.59 7515 210 1.510 8230 - 505 311 8770 -1045 5
Statistik für Wilcoxon-Test
-2,224a
,026
ZAsymptotischeSignifikanz (2-seitig)
Recommendeddaily intake [kJ] -
Pre-menstrual
Basiert auf negativen Rängen.a.
Ränge
2a 4,00 8,009b 6,44 58,000c
11
Negative RängePositive RängeBindungenGesamt
Recommendeddaily intake [kJ]- Pre-menstrual
NMittlerer
RangRang-
summe
Recommended daily intake [kJ] < Pre-menstruala.
Recommended daily intake [kJ] > Pre-menstrualb.
Recommended daily intake [kJ] = Pre-menstrualc.
Unverbundene Testsituation: t-Test (gleiche Varianzen)
Testproblem (Beispiel):Eine stetige Variable wurde in zwei verschiedenen Gruppen gemessen. Die Stichprobenumfänge müssen nicht gleich sein. Wir interessieren uns für den mittleren Unterschied zwischen beiden Gruppen. In dieser Situation wird die Variabilität zwischen den Individuen wichtig.
Voraussetzungen: Beide Stichproben stammen jeweils aus einer normalverteilten Grundgesamt-heit, und die Varianzen in beiden Stichproben sind gleich.
H0: Erwartungswert(Gruppe 1) = Erwartungswert(Gruppe 2)H1: Erwartungswert(Gruppe 1) ≠ Erwartungswert(Gruppe 2)
Die dazugehörige Test-Statistik
verbindet wie beim gepaarten t-Test den Mittelwert der beobachteten Differenzen mit dem dazugehörigen Standardfehler. Hier wird der Standardfehler aus den einzelnen Standardabweichungen berechnet.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 15 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
)( 21
21
xxsexxt−−
=
2121
222
211
2111
2)1()1()(
nnnnsnsnxxse +⋅
−+−+−
=−
Unverbundene Testsituation: t-Test (gleiche Varianzen)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 16 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Lean Obese# (n=13) (n=9)--------------------------------1 6.13 8.792 7.05 9.193 7.48 9.214 7.48 9.685 7.53 9.696 7.58 9.977 7.90 11.518 8.08 11.859 8.09 12.7910 8.1111 8.4012 10.1513 10.88
Gruppenstatistiken
13 8,0662 1,23808 ,343389 10,2978 1,39787 ,46596
GruppeLeanObese
N MittelwertStandard-
abweichung
Standard-fehler des
Mittelwertes
Test bei unabhängigen Stichproben
-3,946 20 ,001 -2,23162 ,56560 -3,41145 -1,05180T df Sig. (2-seitig)
MittlereDifferenz
Standard-fehler derDifferenz Untere Obere
95% Konfidenzintervallder Differenz
T-Test für die Mittelwertgleichheit
Beispiel:24 hour total energy expenditure (MJ/day) in groups of lean and obese women(Altman, S. 193 ff.)
Unverbundene Testsituation: t-Test (ungleiche Varianzen)
Testproblem (Beispiel):Wie beim t-Test (gleiche Varianzen)
Manchmal liegen Daten vor, die aus normalverteilten Grundgesamtheitenstammen, aber bei denen sich die Variabilität in den beiden Gruppen stark unterscheidet.(1) Wie groß muss dieser Unterschied sein, bevor er zu groß ist?(2) Was tut man in diesem Fall?
Zu (1):Zur Überprüfung kann man F-Test heranziehen (standardmäßig in SPSS).
Zu (2):Kann man davon ausgehen, dass die Daten aus normalverteilten Grundgesamt-heiten stammen, aber mit verschiedenen Varianzen, dann kann man einen etwasmodifizierten t-Test für die Analyse benutzen. Die Modifikation bezieht sich auf die Berechung des Standardfehlers der Differenzen.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 17 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney2
22
1
21
21 )(ns
nsxxse +=−
Unverbundene Testsituation: t-Test (ungleiche Varianzen)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 18 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
No/Slight Markedsymptoms symptoms
# (n=9) (n=7)--------------------------------1 34 52 45 83 49 184 55 245 58 606 59 847 608 629 86
Beispiel:Serum thyroxine level (nmol/l) in 16 hypothyroidinfants by severity of symptoms (Altman, S. 198 ff.)
Gruppenstatistiken
9 56,44 14,222 4,7417 42,14 37,481 14,166
SymptomsNo/slightMarked
N MittelwertStandard-
abweichung
Standard-fehler des
Mittelwertes
Test bei unabhängigen Stichproben
15,573 ,001 1,059 14 ,307 14,302 13,500 -14,654 43,257
,957 7,35 ,369 14,302 14,939 -20,684 49,288
Varianzen sindgleichVarianzen sindnicht gleich
FSignifi-kanz
Levene-Test derVarianzgleichheit
T dfSig.
(2-seitig)Mittlere
Differenz
Standard-fehler derDifferenz Untere Obere
95% Konfidenzintervallder Differenz
T-Test für die Mittelwertgleichheit
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 19 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Unverbundene Testsituation: U-Test von Mann-Whitney(Theorie)
Testproblem (Beispiel):Wie beim t-Test für unverbundene Stichproben. Die Werte entstammen aber wahrscheinlich keinen normalverteilten Grundgesamtheiten.
Voraussetzungen: Die Daten sind ordinal skaliert.
Man geht in drei Schritten vor:(1) Alle n=n1+n2 Beobachtungen werden der Reihe nach geordnet(2) Die Rangsummen für jede der beiden Gruppen wird berechnet.
(T1 bzw. T2)(3) Test-Statistik U = n1n2 + ½ n1(n1+1) – T1, bzw.
U‘= n1n2 + ½ n2(n2+1) – T2
U ist die Anzahl aller möglichen Paare (x,y) von Beobachtungen mit x ausGruppe 1 und y aus Gruppe 2 für die gilt: x < y (Rangplatzüberschreitung), U‘ ist die Anzahl der Rangplatzunterschreitungen (U+U‘ = n1n2).U bzw. U‘ werden mit dem unter der Nullhypothese erwarteten
U-Wert verglichen.221 nn
U⋅
=μ
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 20 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten
• Parametrische vs. nicht-parametrischeVerfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:
Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituationparametrisch: t-Test
(gleiche Varianzen)t-Test
(ungleiche Varianzen)nicht-parametrisch:
U-Test von Mann-Whitney
Unverbundene Testsituation: U-Test von Mann-Whitney(Beispiel)
24 hour total energy expenditure (MJ/day) in groups of lean and obesewomen (Altman, S. 193 ff.)
Lean Obese# (n=13) (n=9)--------------------------------1 6.13 8.792 7.05 9.193 7.48 9.214 7.48 9.685 7.53 9.696 7.58 9.977 7.90 11.518 8.08 11.859 8.09 12.7910 8.1111 8.4012 10.1513 10.88
Ränge
13 7,92 103,009 16,67 150,00
22
GruppeLeanObeseGesamt
N Mittlerer Rang Rangsumme
U-Test von Mann-Whitney
12,000-3,106
,002
Mann-Whitney-UZAsymptotischeSignifikanz (2-seitig)
24h totalenergy
(MJ/day)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 21 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Daten(1 oder 2 Gruppen)
normal-verteilt?
Überprüfung durch• deskript. Statistik (Ausreißer ?)• Histogramm/Boxplot/Normalplot• W-Test Shapiro-Wilk
janein
Transformationhilfreich?
ja
UnverbundeneTestsituation
VerbundeneTestsituation
nein
t-Testfür abhängigeStichproben
U-Test vonMann-Whitney
Vorzeichen-Rang-Testvon Wilcoxon oderVorzeichen-Test
UnverbundeneTestsituation
VerbundeneTestsituation
t-Testfür unabhängige
Stichproben• Kontrolle der Varianzen• evtl. lieber nicht-para-metrische Verfahren)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 22 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Wichtiges zum Schluß (I):
• Verschiedene Tests geben nicht unbedingt dieselbe Antwort, wenn sie auf dieselben Daten angewandt werden. Sie verlangen nicht dieselbenVoraussetzungen und berücksichtigen verschiedene Aspekte der Daten.Generell gilt jedoch, dass zwei valide Methode zu ähnlichen Ergebnissenführen.
• In kleinen Stichproben haben (wenn eine parametrische Situationvorliegt) nicht-parametrische Verfahren weniger Power als parametrischeVerfahren.
• In der Praxis wird eine Analyse der Daten durchgeführt, wobei man sichzwischen nicht-parametrischen und parametrischen Verfahrenentscheidet.
• Normalerweise werden parametrische Verfahren benutzt, solange nichtein klarer Hinweis darauf besteht, dass die dazu benötigten Voraus-setzungen nicht gegeben sind.
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 23 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Wichtiges zum Schluß (II):
• Planung ist das A und O• Erst planen, dann Daten erheben, dann auswerten • Vor der Auswertung sollten die Daten ‚sauber‘ sein• Man sollte seine Daten genau kennen• Lieber einmal zu oft fragen als einmal zu wenig
Kostenlose Beratung:Institut für Medizinische Biometrie, Informatik und EpidemiologieTel.: 287 - 5400 (Frau Oldach vermittelt Sie gerne weiter)
Biometrie
Genetische Epidemiologie
Bio-informatik
IMBIE
Fortbildung I Anästhesie 9.3.2005 Folie 24 / 24
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Literatur:• Altman DG. Practical Statistics for Medical Research (1991).
Chapman & Hall• Altman DG, Machin D, Bryant TN, Gardner MJ (eds.). Statistics with
confidence (2000, 2nd ed.). British Medical Journal Books• Armitage P. Statistical Methods in Medical Research (1973).
Blackwell Scientific Publications• Rasch B, Friese M, Hofmann W, Naumann E. Quantitative Methoden
(Band 1 + 2, 2004). Springer Verlag Berlin Heidelberg New York
Software:SPSS 12.0G for Windows (version 12.0.1)
Links:http://www.akademie.ruhr-uni-bochum.de (Weiterbildung)http://www.hrz.uni-bonn.de (Hochschulrechenzentrum, SPSS-Lizenzen)