fortbildung i analyse stetiger daten ein- bzw. zwei...

Biometrie

Genetische Epidemiologie

Bio-informatik

IMBIE

Fortbildung I

Analyse stetiger DatenEin- bzw. Zwei-Gruppenvergleich

- 09.03.2005 -

Dipl.-Stat. C. NicolayInstitut für Medizinische Biometrie, Informatik und Epidemiologie

der Universität BonnSigmund-Freud-Str. 25

53105 [email protected]

Biometrie


Bio-informatik

IMBIE

Fortbildung I Anästhesie 9.3.2005 Folie 2 / 24

Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich

Themen:

• DatenÜberprüfen der DatenDeskriptive Darstellung, Graphische DarstellungCheck auf NormalverteilungTransformation von Daten

• Parametrische vs. nicht-parametrische Verfahren

• Verbundene vs. unverbundene Testsituation

• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon

• Unverbundene Testsituationparametrisch: t-Test (gleiche Varianzen)

t-Test (ungleiche Varianzen)nicht-parametrisch: U-Test von Mann-Whitney

Biometrie


Bio-informatik

IMBIE



• DatenÜberprüfen der DatenDeskriptive Darstellung Graphische DarstellungCheck auf NormalverteilungTransformation von Daten

• Parametrische vs. nicht-parametrischeVerfahren


• Verbundene Testsituationparametrisch: t-Testnicht-parametrisch:

Vorzeichen-Rang-Test von Wilcoxon

• Unverbundene Testsituationparametrisch: t-Test

(gleiche Varianzen)t-Test

(ungleiche Varianzen)nicht-parametrisch:

U-Test von Mann-Whitney

Überprüfen der Daten• Eingabefehler• Inkonsistenzen -> Plausibilitäts-Checks• Ausreisser• Fehlende Werte

Deskriptive Darstellung• Anzahl der Werte• Mittelwert, Standardabweichung• 95%-Konfidenzintervall• Minimum, Median, Maximum

Graphische Darstellung• Histogramm• Box-Plot• Normal Plot

Biometrie


Bio-informatik

IMBIE












Beispiel (D. Altman, S. 23 ff.)

IgM [g/l]

3 1,07 2,3

19 6,427 9,132 10,735 11,738 12,838 12,822 7,416 5,416 5,46 2,07 2,39 3,06 2,02 ,73 1,03 1,03 1,02 ,71 ,31 ,31 ,31 ,3

298 100,0

,1,2,3,4,5,6,7,8,91,01,11,21,31,41,51,61,71,82,02,12,22,52,74,5Gesamt

GültigHäufigkeit Prozent

Univariate Statistiken

,803,749

,857

,760,700,220

,4695,1

4,54,4,5

,0272

MittelwertUntergrenzeObergrenze

95% Konfidenzintervalldes Mittelwerts

5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichStandardfehler

IgM [g/l]Statistik

0,0 1,0 2,0 3,0 4,0 5,0

IgM [g/l]

0

10

20

30

40

Häu

figke

it

Histogramm

IgM [g/l]

0,0

1,0

2,0

3,0

4,0

5,0

Biometrie


Bio-informatik

IMBIE












Beispiel (D. Altman, S. 23 ff., Fortsetzung)

Box-Plot

unteres Quartil (Q1)

Maximum

oberes Quartil (Q3)

Median

Minimum

Ausreisser: Mehr als 1½ Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt

Extremwerte: Mehr als 3 Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt

Biometrie


Bio-informatik

IMBIE













-1 0 1 2 3 4 5

Beobachteter Wert

-3

-2

-1

0

1

2

3

Erw

arte

ter N

orm

alw

ert

IgM [g/l]: Normalplot

Tests auf Normalverteilung

,170 298 ,000 ,823 298 ,000IgM [g/l]Statistik df Signifikanz Statistik df Signifikanz

Kolmogorov-Smirnova Shapiro-Wilk

Signifikanzkorrektur nach Lillieforsa.

Der W-Test von Shapiro-Wilk ist eine Möglichkeit zu testen, ob die vorliegenden Daten normalverteilt sind. Man sollte sich aber nicht allein auf das Test-Ergebnis verlassen, sondern immer die dazugehörigen deskriptiven Statistiken, Histogramm oder Box-Plot und den Normalplot in die Entscheidung mit einbeziehen. Bei den vorliegenden Daten braucht man eigentlich das Test-Ergebnis nicht, um zu dem Schluss zu kommen, dass die Daten nicht normalverteilt sind.

Biometrie


Bio-informatik

IMBIE












Beispiel (D. Altman, S. 23 ff., Fortsetzung)Die Daten können durch logarithmieren (hier: zur Basis e) in eine Normalverteilung überführt werden

TransformationViele Variablen (z.B. Labordaten) sind exponentialverteilt, wie die Daten aus dem Beispiel. Solche Daten kann man durch eine Transformation in eine Normalverteilung überführen.Vorteile:• Erfüllung der Voraussetzung für viele parametrische Verfahren• Angleichung der Varianz für verschiedene Gruppen. Dies funktioniert v.a. dann gut, wenn das Verhältnis von Standardabweichung zu Mittelwert inden verschiedenen Gruppen ähnlich ist.

• Reduktion des Einflusses von Ausreißern

Mögliche Transformationen:• log10(x) oder loge(x)

•

• 1/x

x

-2,000 0,000 2,000

ln(IgM) [g/l]

0

10

20

30

40

Häu

figke

it

Biometrie


Bio-informatik

IMBIE













Histogramm


-,36316-,42551

-,30082

-,35502-,35667

,299,546895

-2,3031,5043,807,693

,03168

MittelwertUntergrenzeObergrenze

95% Konfidenzintervalldes Mittelwerts

5% getrimmtes MittelMedianVarianzStandardabweichungMinimumMaximumSpannweiteInterquartilbereichStandardfehler

ln(IgM) [g/l]Statistik

-2 -1 0 1 2

Beobachteter Wert

-3

-2

-1

0

1

2

3

Erw

arte

ter N

orm

alw

ert

ln(IgM) [g/l]: Normalplot

Tests auf Normalverteilung

,098 298 ,000 ,976 298 ,000ln(IgM) [g/l]Statistik df Signifikanz Statistik df Signifikanz

Kolmogorov-Smirnova Shapiro-Wilk

Signifikanzkorrektur nach Lillieforsa.

Cave: Aufgrund des großen Stichproben-umfanges findet der W-Test auch kleine,nicht normalverteilte Datenmengen, die aber eigentlich unwichtig sind.

Biometrie


Bio-informatik

IMBIE












Parametrische vs. nicht-parametrische Verfahren

Viele statistische Methoden basieren auf der Annahme, dass die beobachteten Daten eine Stichprobe aus einer Grundgesamt-heit darstellen mit einer Verteilung (in dieser Grundgesamtheit), die man theoretisch (mathematisch) beschreiben kann.

Wenn diese Annahme vernünftig ist, dann sind die o.g. statistischen Analyse-Methoden einfach zu benutzen und besitzen eine große Bandbreite.

Wenn die Verteilungs-Annahmen jedoch nicht begründet sind, und dennoch parametrische Methoden benutzt werden, so kann dies zu falschen und somit ungültigen Schlussfolgerungen führen.

Bei der Analyse von Daten wählt man demnach zwischen- parametrischen Methoden (es werden konkrete Verteilungs-

annahmen der Daten vorausgesetzt) und- nicht-parametrischen Methoden (es werden keine

Verteilungsannahmen vorausgesetzt).

Biometrie


Bio-informatik

IMBIE












Verbundene vs. unverbundene Testsituation

In einer verbundenen Testsituation werden zwei oder mehrere Beobachtungen an einer Untersuchungseinheit (Individuen, Tiere, Laborversuchsansatz, etc.) durchgeführt (gepaarte oder abhängige Daten).Daraus folgt logischerweise, dass der Stichprobenumfang in beiden Gruppen gleich ist.Auch Studien, bei denen Patientengruppen individuell gematchtsind, fallen in diese Kategorie.Beispiel:Blutdruck während und nach der Schwangerschaft bei einer Gruppe von n Frauen

In einer unverbundenen Testsituation gehören die Beobachtungen zu zwei unabhängigen Gruppen von Individuen (Tieren etc.).Die Stichprobenumfänge müssen nicht gleich groß sein. Manchmal ist das auch gar nicht möglich, z.B. bei seltenen Erkrankungen.Beispiel:Geburtsgewicht von Jungen vs. Geburtsgewicht von Mädchen

Biometrie


Bio-informatik

IMBIE












Verbundene Testsituation: t-Test (Theorie)

Testproblem (Beispiel):Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben Gruppe von n Individuen gemessen. Aufgrund der verbundenen Testsituation kann die Analyse vereinfacht werden, indem man die intraindividuellen Differenzen berechnet und diese analysiert. Hier spielt die Variabilität innerhalb der Individuen eine tragende Rolle.

Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) müssen aus einer normalverteilten Grundgesamtheit stammen.

H0: Erwartungswert(di) = 0H1: Erwartungswert(di) ≠ 0

Die dazugehörige Test-Statistik verbindet den Mittelwert der

beobachteten, intraindividuellen Differenzen mit dem dazugehörigen Standardfehler.

(s = Standardabweichung)

)(dsedt =

nsdse =)(

Biometrie


Bio-informatik

IMBIE












Verbundene Testsituation: t-Test (Beispiel)Mean daily dietary intake over 10 pre-menstrual and 10 post-menstrual days(Altman, S. 190 ff.)

Dietary intake (kJ)# pre post Diff.----------------------------------1 5260 3910 13502 5470 4220 12503 5640 3885 17554 6180 5160 10205 6390 5645 7456 6515 4680 18357 6805 5265 15408 7515 5975 15409 7515 6790 72510 8230 6900 133011 8770 7335 1435


6753,641142,12344,36

5433,181216,83366,89

1320,45366,75110,58

MittelwertStandardabweichungStandardfehlerMittelwertStandardabweichungStandardfehlerMittelwertStandardabweichungStandardfehler

Pre-menstrual

Post-menstrual

Difference (pre-post)

Statistik

Test bei gepaarten Stichproben

1320,455 366,746 110,578 11,941 10 ,000Pre-menstrual -Post-menstrual

MittelwertStandardab-

weichung

Standard-fehler des

Mittelwertes T df Sig. (2-seitig)

Biometrie


Bio-informatik

IMBIE












Verbundene Testsituation: Vorzeichen-Rang-Testvon Wilcoxon (Theorie)

Testproblem (Beispiel):Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselbenGruppe von n Individuen gemessen. Die intraindividuellen Differenzenentstammen wahrscheinlich keiner Normalverteilung.

Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) stammen aus einer Grundgesamtheit mit einer symmetrischen Verteilung. -> auch hier kann eine Transformation der Daten helfen.

Man geht in drei Schritten vor:(1) Berechnen der intraindividuellen Differenzen(2) Ordnen der intraind. Differenzen ohne Beachtung des Vorzeichens(3) Berechnen der Rangsumme aller negativen bzw. positiven Ränge

(R- bzw. R+, ohne Null-Differenzen)

Die Test-Statistik W = min(|R-|, |R+|)

Eine Alternative hierzu ist der Vorzeichen-Test.

Biometrie


Bio-informatik

IMBIE












Verbundene Testsituation: Vorzeichen-Rang-Test von Wilcoxon (Beispiel)Daily energy intake of 11 healthy women with rank order of differences(ignoring their signs) from the recommended intake of 7725 kJ (Altman, S. 188 ff.)

Daily Diff. to Rank of# intake 7725 kJ differences-------------------------------------------------1 5260 2465 112 5470 2255 103 5640 2085 94 6180 1545 85 6390 1335 76 6515 1210 67 6805 920 48 7515 210 1.59 7515 210 1.510 8230 - 505 311 8770 -1045 5

Statistik für Wilcoxon-Test

-2,224a

,026

ZAsymptotischeSignifikanz (2-seitig)

Recommendeddaily intake [kJ] -

Pre-menstrual

Basiert auf negativen Rängen.a.

Ränge

2a 4,00 8,009b 6,44 58,000c

11

Negative RängePositive RängeBindungenGesamt

Recommendeddaily intake [kJ]- Pre-menstrual

NMittlerer

RangRang-

summe

Recommended daily intake [kJ] < Pre-menstruala.

Recommended daily intake [kJ] > Pre-menstrualb.

Recommended daily intake [kJ] = Pre-menstrualc.

Unverbundene Testsituation: t-Test (gleiche Varianzen)

Testproblem (Beispiel):Eine stetige Variable wurde in zwei verschiedenen Gruppen gemessen. Die Stichprobenumfänge müssen nicht gleich sein. Wir interessieren uns für den mittleren Unterschied zwischen beiden Gruppen. In dieser Situation wird die Variabilität zwischen den Individuen wichtig.

Voraussetzungen: Beide Stichproben stammen jeweils aus einer normalverteilten Grundgesamt-heit, und die Varianzen in beiden Stichproben sind gleich.

H0: Erwartungswert(Gruppe 1) = Erwartungswert(Gruppe 2)H1: Erwartungswert(Gruppe 1) ≠ Erwartungswert(Gruppe 2)

Die dazugehörige Test-Statistik

verbindet wie beim gepaarten t-Test den Mittelwert der beobachteten Differenzen mit dem dazugehörigen Standardfehler. Hier wird der Standardfehler aus den einzelnen Standardabweichungen berechnet.

Biometrie


Bio-informatik

IMBIE












)( 21

21

xxsexxt−−

=

2121

222

211

2111

2)1()1()(

nnnnsnsnxxse +⋅

−+−+−

=−

Unverbundene Testsituation: t-Test (gleiche Varianzen)

Biometrie


Bio-informatik

IMBIE












Lean Obese# (n=13) (n=9)--------------------------------1 6.13 8.792 7.05 9.193 7.48 9.214 7.48 9.685 7.53 9.696 7.58 9.977 7.90 11.518 8.08 11.859 8.09 12.7910 8.1111 8.4012 10.1513 10.88

Gruppenstatistiken

13 8,0662 1,23808 ,343389 10,2978 1,39787 ,46596

GruppeLeanObese

N MittelwertStandard-

abweichung

Standard-fehler des

Mittelwertes

Test bei unabhängigen Stichproben

-3,946 20 ,001 -2,23162 ,56560 -3,41145 -1,05180T df Sig. (2-seitig)

MittlereDifferenz

Standard-fehler derDifferenz Untere Obere

95% Konfidenzintervallder Differenz

T-Test für die Mittelwertgleichheit

Beispiel:24 hour total energy expenditure (MJ/day) in groups of lean and obese women(Altman, S. 193 ff.)

Unverbundene Testsituation: t-Test (ungleiche Varianzen)

Testproblem (Beispiel):Wie beim t-Test (gleiche Varianzen)

Manchmal liegen Daten vor, die aus normalverteilten Grundgesamtheitenstammen, aber bei denen sich die Variabilität in den beiden Gruppen stark unterscheidet.(1) Wie groß muss dieser Unterschied sein, bevor er zu groß ist?(2) Was tut man in diesem Fall?

Zu (1):Zur Überprüfung kann man F-Test heranziehen (standardmäßig in SPSS).

Zu (2):Kann man davon ausgehen, dass die Daten aus normalverteilten Grundgesamt-heiten stammen, aber mit verschiedenen Varianzen, dann kann man einen etwasmodifizierten t-Test für die Analyse benutzen. Die Modifikation bezieht sich auf die Berechung des Standardfehlers der Differenzen.

Biometrie


Bio-informatik

IMBIE











U-Test von Mann-Whitney2

22

1

21

21 )(ns

nsxxse +=−

Unverbundene Testsituation: t-Test (ungleiche Varianzen)

Biometrie


Bio-informatik

IMBIE












No/Slight Markedsymptoms symptoms

# (n=9) (n=7)--------------------------------1 34 52 45 83 49 184 55 245 58 606 59 847 608 629 86

Beispiel:Serum thyroxine level (nmol/l) in 16 hypothyroidinfants by severity of symptoms (Altman, S. 198 ff.)

Gruppenstatistiken

9 56,44 14,222 4,7417 42,14 37,481 14,166

SymptomsNo/slightMarked

N MittelwertStandard-

abweichung

Standard-fehler des

Mittelwertes

Test bei unabhängigen Stichproben

15,573 ,001 1,059 14 ,307 14,302 13,500 -14,654 43,257

,957 7,35 ,369 14,302 14,939 -20,684 49,288

Varianzen sindgleichVarianzen sindnicht gleich

FSignifi-kanz

Levene-Test derVarianzgleichheit

T dfSig.

(2-seitig)Mittlere

Differenz

Standard-fehler derDifferenz Untere Obere

95% Konfidenzintervallder Differenz

T-Test für die Mittelwertgleichheit

Biometrie


Bio-informatik

IMBIE












Unverbundene Testsituation: U-Test von Mann-Whitney(Theorie)

Testproblem (Beispiel):Wie beim t-Test für unverbundene Stichproben. Die Werte entstammen aber wahrscheinlich keinen normalverteilten Grundgesamtheiten.

Voraussetzungen: Die Daten sind ordinal skaliert.

Man geht in drei Schritten vor:(1) Alle n=n1+n2 Beobachtungen werden der Reihe nach geordnet(2) Die Rangsummen für jede der beiden Gruppen wird berechnet.

(T1 bzw. T2)(3) Test-Statistik U = n1n2 + ½ n1(n1+1) – T1, bzw.

U‘= n1n2 + ½ n2(n2+1) – T2

U ist die Anzahl aller möglichen Paare (x,y) von Beobachtungen mit x ausGruppe 1 und y aus Gruppe 2 für die gilt: x < y (Rangplatzüberschreitung), U‘ ist die Anzahl der Rangplatzunterschreitungen (U+U‘ = n1n2).U bzw. U‘ werden mit dem unter der Nullhypothese erwarteten

U-Wert verglichen.221 nn

U⋅

=μ

Biometrie


Bio-informatik

IMBIE












Unverbundene Testsituation: U-Test von Mann-Whitney(Beispiel)

24 hour total energy expenditure (MJ/day) in groups of lean and obesewomen (Altman, S. 193 ff.)

Lean Obese# (n=13) (n=9)--------------------------------1 6.13 8.792 7.05 9.193 7.48 9.214 7.48 9.685 7.53 9.696 7.58 9.977 7.90 11.518 8.08 11.859 8.09 12.7910 8.1111 8.4012 10.1513 10.88

Ränge

13 7,92 103,009 16,67 150,00

22

GruppeLeanObeseGesamt

N Mittlerer Rang Rangsumme


12,000-3,106

,002

Mann-Whitney-UZAsymptotischeSignifikanz (2-seitig)

24h totalenergy

(MJ/day)

Biometrie


Bio-informatik

IMBIE



Daten(1 oder 2 Gruppen)

normal-verteilt?

Überprüfung durch• deskript. Statistik (Ausreißer ?)• Histogramm/Boxplot/Normalplot• W-Test Shapiro-Wilk

janein

Transformationhilfreich?

ja

UnverbundeneTestsituation

VerbundeneTestsituation

nein

t-Testfür abhängigeStichproben

U-Test vonMann-Whitney

Vorzeichen-Rang-Testvon Wilcoxon oderVorzeichen-Test

UnverbundeneTestsituation

VerbundeneTestsituation

t-Testfür unabhängige

Stichproben• Kontrolle der Varianzen• evtl. lieber nicht-para-metrische Verfahren)

Biometrie


Bio-informatik

IMBIE



Wichtiges zum Schluß (I):

• Verschiedene Tests geben nicht unbedingt dieselbe Antwort, wenn sie auf dieselben Daten angewandt werden. Sie verlangen nicht dieselbenVoraussetzungen und berücksichtigen verschiedene Aspekte der Daten.Generell gilt jedoch, dass zwei valide Methode zu ähnlichen Ergebnissenführen.

• In kleinen Stichproben haben (wenn eine parametrische Situationvorliegt) nicht-parametrische Verfahren weniger Power als parametrischeVerfahren.

• In der Praxis wird eine Analyse der Daten durchgeführt, wobei man sichzwischen nicht-parametrischen und parametrischen Verfahrenentscheidet.

• Normalerweise werden parametrische Verfahren benutzt, solange nichtein klarer Hinweis darauf besteht, dass die dazu benötigten Voraus-setzungen nicht gegeben sind.

Biometrie


Bio-informatik

IMBIE



Wichtiges zum Schluß (II):

• Planung ist das A und O• Erst planen, dann Daten erheben, dann auswerten • Vor der Auswertung sollten die Daten ‚sauber‘ sein• Man sollte seine Daten genau kennen• Lieber einmal zu oft fragen als einmal zu wenig

Kostenlose Beratung:Institut für Medizinische Biometrie, Informatik und EpidemiologieTel.: 287 - 5400 (Frau Oldach vermittelt Sie gerne weiter)

Biometrie


Bio-informatik

IMBIE



Literatur:• Altman DG. Practical Statistics for Medical Research (1991).

Chapman & Hall• Altman DG, Machin D, Bryant TN, Gardner MJ (eds.). Statistics with

confidence (2000, 2nd ed.). British Medical Journal Books• Armitage P. Statistical Methods in Medical Research (1973).

Blackwell Scientific Publications• Rasch B, Friese M, Hofmann W, Naumann E. Quantitative Methoden

(Band 1 + 2, 2004). Springer Verlag Berlin Heidelberg New York

Software:SPSS 12.0G for Windows (version 12.0.1)

Links:http://www.akademie.ruhr-uni-bochum.de (Weiterbildung)http://www.hrz.uni-bonn.de (Hochschulrechenzentrum, SPSS-Lizenzen)

http://www.akademie.ruhr-uni-bochum.de/

http://www.hrz.uni-bonn.de/

fortbildung i analyse stetiger daten ein- bzw. zwei...

Documents