Basiskurs Statistik und SPSS für Mediziner · SPSS - Menüleiste Sämtliche Operationen werden über die Menüleiste gestartet. Wichtigste Punkte: • Datei: Öffnen und Speichern

Institut für Medizinische Statistik und

Epidemiologie

Basiskurs Statistik und SPSS für Mediziner

Bernhard Haller

Alexander Hapfelmeier

Armin Ott

Birgit Waschulzik

Basis-Kurs Statistik und SPSS für Mediziner

Inhaltsverzeichnis

1. Grundlagen und Begriffe 3

2. Dateneingabe und –aufbereitung 12

3. Deskriptive Statistik 19

4. Grafische Darstellung 29

5. Bearbeitung der Daten in SPSS 38

6. Prinzip des statistischen Testens 57

7. Korrelation 101

8. Regression 111

9. Analyse von Überlebenszeiten 122

10. Publikation der Ergebnisse 145

2

Basis-Kurs Statistik und SPSS für Mediziner 3

Grundlagen und -begriffe

Basis-Kurs Statistik und SPSS für Mediziner 4

Statistische Einheiten / Merkmale / Ausprägungen

Merkmalsträger/ Beobachtungseinheit

• Proband

• Patient

• Maus

• …

Geschlecht

Gewicht

Laborwerte:

Blutdruckwerte:

Größe 172 cm

65 kg

124 / 82 mmHg

Kreatinin 78 μmol/l

Glukose 4,2 mmol/l

männlich

Merkmalsausprägung

Merkmal

Basis-Kurs Statistik und SPSS für Mediziner 5

Merkmalstypen

Ergebnis von

Zählung

Anzahl Operationen

Lymphknotenbefall

Ergebnis von

Wägung oder

Messung

Beispiele: BMI, Größe

Überlebenszeit

Rangfolge

möglich

TNM-Klassifik.

Schweregrade

keine Rang-

folge möglich

Geschlecht,

Tumorlokal.

Richtiges Einordnen von Merkmalstypen ist wichtige Voraussetzung

für die adäquate Anwendung statistischer Methoden!

quantitativ

stetig

metrisch diskret

qualitativ

ordinal-

skaliert

nominal-

skaliert

Merkmale

Basis-Kurs Statistik und SPSS für Mediziner 6

Statistische Einheiten / Merkmale / Ausprägungen

• Viele Auswertverfahren setzen unabhängige Beobachtungseinheiten

voraus

• Meistens verletzt, wenn mehrere Beobachtungen pro Patient vorliegen

– Wiederholte Messungen im Zeitverlauf

– z.B. mehrere Läsionen/Augen/Organe/… eines Patienten

– Bewertung eines Patienten von mehreren Beurteilern

• In solchen Fällen müssen adäquate (komplexere) Verfahren angewandt

werden

Basis-Kurs Statistik und SPSS für Mediziner 7

Grundgesamtheit und Stichprobe

• Grundgesamtheit: Menge aller interessierenden statistischen Einheiten -

z.B. alle Patienten mit einer bestimmten Indikation

• Stichprobe: (Zufällige) Auswahl einer Teilmenge aus dieser Grundgesamtheit

Basis-Kurs Statistik und SPSS für Mediziner 8

Aufgaben der Statistik

• Deskriptive (beschreibende) Statistik

• Explorative (suchende) Statistik

• Induktive (schließende) Statistik

Basis-Kurs Statistik und SPSS für Mediziner 9

Deskriptive Statistik

• Zusammenfassung in spezifische Kenngrößen

(Lageparameter bzw. Häufigkeiten)

• Grafische Aufbereitung

• Präsentation von umfangreichem Datenmaterial

• Datenvalidierung (z.B. Identifikation von Falscheingaben)

• Reine Beschreibung der erhobenen Daten, keine Rückschlüsse über

die Objekte der Erhebung hinaus möglich

Basis-Kurs Statistik und SPSS für Mediziner 10

Explorative Statistik

• Suche nach Strukturen oder Besonderheiten in den Daten

• Generierung neuer Fragestellungen und Hypothesen

• Verwendung bei nicht exakt spezifizierten Fragestellungen

• Keine Rückschlüsse über die Erhebung hinaus möglich, jedoch häufig

deutliche Hinweise bzw. „empirische Evidenz“

Basis-Kurs Statistik und SPSS für Mediziner 11

Induktive Statistik

• Versuch, durch Einbeziehung von Wahrscheinlichkeitstheorie

allgemeine Schlussfolgerungen für die Grundgesamtheit zu ziehen

• Sorgfältige Versuchsplanung nötig

• Fragestellungen und stochastische Modelle müssen a priori

spezifiziert werden

Schließen: Stichprobe Grundgesamtheit

– Schätzen: Plausibelster Parameter für Grundgesamtheit mit Maß

bzgl. der Unsicherheit (KI)

– Testen: Prüfen von zuvor spezifizierten Hypothesen

Basis-Kurs Statistik und SPSS für Mediziner 12

Dateneingabe und -aufbereitung

Basis-Kurs Statistik und SPSS für Mediziner 13

Dateneingabe

• Eingabe „einfacher“ Daten in Standardsoftware (z.B. MS Excel)

– Vorteile: Akzeptanz, meist Grundkenntnisse vorhanden, einfach zu

bedienen, weit verbreitet, kompatibel

– Nachteile: fehleranfällig, keine Kontrollen, keine feste Struktur

• Eingabe komplexerer Daten in Datenbanksysteme (z.B. MS Access,

spezielle Software), evtl. mit Eingabemaske

– Vorteile: geringere Fehlerquote, logische Abfragen möglich, …

– Nachteile: komplex (evtl. Administrator und/oder Programmierer benötigt)

Strenge Anforderungen an Dateneingabe bei

Studien nach AMG oder MPG

!

Basis-Kurs Statistik und SPSS für Mediziner 14

Dateneingabe in Excel

Feste Struktur zum Einlesen in Statistiksoftware (SPSS) erforderlich!

• Jede Beobachtungseinheit (Patient) eine Zeile

• Jedes erhobene Merkmal eine Spalte

• Zellenformat „Standard“ immer beibehalten!

• Datum: (TT.MM.JJJJ)

• Quantitative Merkmale: nur die Zahlen eingeben (nicht: NA, <0.1, 74 kg, …)

• Nominale/ordinale Merkmale: Ausprägungen numerisch kodieren

• Fehlende Zellen frei lassen oder eindeutig kodieren (z.B. 9999)

ID Therapiegruppe Alter Geschlecht OP-Datum Therapieerfolg

1 0 56 1 12.11.2006 0

2 2 78 1 24.08.2004 1

3 1 66 0 13.07.2007 1

4 1 40 0 18.01.2006 0

Basis-Kurs Statistik und SPSS für Mediziner 15

SPSS - Datenansicht

• Zeigt Daten an

• Neue Daten können eingegeben werden

• Korrekt formatierte Datensätze können eingelesen werden (Excel, .txt, …)

Basis-Kurs Statistik und SPSS für Mediziner 16

SPSS - Variablenansicht

Eigenschaften der erho-

benen Variablen können

geändert werden:

• Variablenname

• Ausgegebener Name

(Variablenlabel)

• Gruppennamen

(Wertelabels)

• Messniveaus

• Definition fehlender

Werte

Basis-Kurs Statistik und SPSS für Mediziner 17

SPSS - Ausgabe

Ergebnisse durchgeführter

Operationen werden im

Ausgabefenster angezeigt

(Tabellen, Grafiken, …)

Diese können bearbeitet &

exportiert werden (z.B. als

PDF, Excel-Datei, …)

Basis-Kurs Statistik und SPSS für Mediziner 18

SPSS - Menüleiste

Sämtliche Operationen werden über die Menüleiste gestartet.

Wichtigste Punkte:

• Datei: Öffnen und Speichern von Daten

• Daten: Umstrukturieren des aktuellen Datensatzes, Auswahl

relevanter Beobachtungen, Sortieren

• Transformieren: Berechnen neuer Variablen, Umkodieren

bestehender Variablen

• Analysieren: Sämtliche Verfahren zur Analyse der Daten, deskriptive

Statistiken, statistische Testverfahren, Regressionsmodelle, …

• Diagramme: verschiedene Untermenüs zur Erstellung von Grafiken

Basis-Kurs Statistik und SPSS für Mediziner 19

Deskriptive Statistik

Basis-Kurs Statistik und SPSS für Mediziner 20

Quantitative Merkmale: Maßzahlen

Lokalisationsmaße -> Lage:

– Arithmetisches Mittel

– Median

– Quantile

– Modus

Dispersionsmaße -> Streuung:

– Spannweite

– Varianz

– Standardabweichung

– Variationskoeffizient

Basis-Kurs Statistik und SPSS für Mediziner 21

Lokalisation (Lage): Mittelwert, Median

Seien x1,x2, …,xn die Merkmalsausprägungen eines Merkmals X von n Patienten

• Mittelwert:

• Median (teilt die Daten in zwei gleich große Hälften):

geordnete Werte x(1), …, x(n): x(1) < x(2) < … < x(n)

ungerade

Anzahl von

Beobachtungen

gerade

Anzahl von

Beobachtungen

n

i

ixn

x

1

Median: = 𝑥𝑛+12

= 𝑥0.5

Median: =1

2(𝑥𝑛

2+ 𝑥𝑛

2+1) = 𝑥0.5

Basis-Kurs Statistik und SPSS für Mediziner 22

Streuung: Spannweite, Quantile, Interquartilsabstand

X x(1) x(2) x(3) … x(n)

Minimum Spannweite Maximum

x0.25

25%

x0.75

75%

25% IQR

Interquartilsabstand = x 0.75 – x 0.25

(inter quartile range (IQR))

Spannweite = x max – x min (range)

Basis-Kurs Statistik und SPSS für Mediziner 23

In den Daten beobachtete Streuung:

• Varianz:

• Standardabweichung:

• Variationskoeffizient:

Mittelwert und Standardabweichung implizieren symmetrische Verteilung

Bei schiefer Verteilung Median und IQR oder Minimum / Maximum angeben

Streuung: Varianz, Standardabweichung

n

i

xi

xn

S

1

)(1

1 22

2SS

xS

cV

Basis-Kurs Statistik und SPSS für Mediziner 24

Schätzung von Maßzahlen

Symmetrische Verteilung:

Alle Verteilungen:

Sehr flexibel:

Analysieren Deskriptive Statistiken Deskriptive Statistik Optionen

gewünschte Maßzahlen auswählen

Analysieren Deskriptive Statistiken

Häufigkeiten Statistiken

gewünschte Maßzahlen auswählen

Analysieren Tabellen

Benutzerdefinierte Tabellen

Basis-Kurs Statistik und SPSS für Mediziner 25

Grafische Darstellung

Beschreibung eines Merkmals

Basis-Kurs Statistik und SPSS für Mediziner 26

Quantitative Merkmale (eindimensional)

Histogramm: Boxplot:

75. Perzentil

50. Perz. (Median)

25. Perzentil

Minimum*

Grafik Diagrammerstellung Galerie

Histogramm Boxplot

*Ausreißer und Extremwerte werden

gesondert gekennzeichnet

Maximum*

Basis-Kurs Statistik und SPSS für Mediziner 27

Qualitative Merkmale (eindimensional)

Grafik Diagrammerstellung Galerie

Balken Kreis/Polar

ordinales oder nominales Skalenniveau nur nominales Skalenniveau

Darstellung absoluter Anzahlen oder relativer Häufigkeiten (%)

Basis-Kurs Statistik und SPSS für Mediziner 28

Eindimensionale Darstellung - Zusammenfassung

Merkmalstyp Maßzahlen

quantitativ Histogramm

Fehlerbalken (symm. Vtlg)

Boxplot

(symm Vtlg.)

Median (xmin, xmax / IQR)

graphisch

qualitativ

- ordinalskaliert

(mit Rangfolge)

Säulendiagramm

absolute bzw. relative

Häufigkeiten

- nominalskaliert

(ohne Rangfolge)

Kreisdiagramm

Säulendiagramm

absolute bzw. relative

Häufigkeiten

x s

Basis-Kurs Statistik und SPSS für Mediziner 29

Grafische Darstellung

Zusammenhang zweier Merkmale

Basis-Kurs Statistik und SPSS für Mediziner 30

Zusammenhang zwischen zwei Merkmalen

Folgende Kombinationen sind möglich:

qualitativ – qualitativ

• Geschlecht – Therapie (A,B)

• Therapie – Therapieerfolg

qualitativ – quantitativ

• Geschlecht – Cholesterinspiegel

• Therapie – Blutdruckänderung

quantitativ – quantitativ

• Alter – Blutdruck

• Dosis – Änderung Blutwert

Basis-Kurs Statistik und SPSS für Mediziner 31

Qualitativ - qualitativ

Beispiel: Diabetes und Therapie

Tabelle und Säulendiagramm mit relativen

Häufigkeiten (%).

Die absoluten Häufigkeiten sind aufgrund der

unterschiedlichen Fallzahlen in den Gruppen

nicht vergleichbar!

Grafik Diagrammerstellung Galerie Balken

Analysieren Deskriptive Statistiken Kreuztabellen Zellen

Prozentwerte Spaltenweise

Basis-Kurs Statistik und SPSS für Mediziner 32

Qualitativ - quantitativ

Vergleich zweier Medikamente hinsichtlich Änderung des systolischen

Blutdrucks innerhalb eines Jahres bei Patienten mit Bluthochdruck:

Wenn sich der Median deutlich vom Mittelwert unterscheidet, deutet dies auf eine

schiefe Verteilung hin (u.a. keine Normalverteilung).

Analysieren Tabellen Benutzerdefinierte Tabellen

Basis-Kurs Statistik und SPSS für Mediziner 33

Qualitativ - quantitativ

ungeeignet, da viele Punkte

überdeckt werden

gut geeignet, vor allem bei wenigen

Beobachtungen

Werte werden aber zum Teil gerundet

Grafik Diagrammerstellung

Galerie Streu-

/Punktdiagramm

Grafik Diagrammerstellung

Galerie Streu-/Punktdiagramm

Punktdiagramm

Basis-Kurs Statistik und SPSS für Mediziner 34

Qualitativ - quantitativ

Boxplot: gut geeignet, etabliert,

schwierig bei sehr kleinen Fallzahlen

Fehlerbalken (MW ± 2 Stdabw.):

nur bei symmetrischen Verteilungen

geeignet

Grafik Diagrammerstellung

Galerie Boxplot

Grafik alte Dialogfelder

Fehlerbalken

Basis-Kurs Statistik und SPSS für Mediziner 35

Quantitativ – quantitativ

Grafik Diagrammerstellung Galerie

Streu-/Punktdiagramm

Beispiel: Blutdruck zu Beginn der Studie und Alter

Basis-Kurs Statistik und SPSS für Mediziner 36

Verbundene Stichproben bei quantitativen Merkmalen

Beispiel:

Untersuchung der Wirkung eines Medikaments, z.B. eines Blutdrucksenkers.

Einer Reihe von Personen wird der Blutdruck vor und nach der

Medikamenteneinnahme gemessen.

Medikamenteneinnahme

Wert vorher Wert nachher

Basis-Kurs Statistik und SPSS für Mediziner 37

Verbundene Stichproben bei quantitativen Merkmalen

Darstellung der Messwerte des Blutdrucks

vor Therapiebeginn und nach einem Jahr

Darstellung der

Differenzen

Basis-Kurs Statistik und SPSS für Mediziner 38

Bearbeitung der Daten in SPSS

Daten sortieren

Basis-Kurs Statistik und SPSS für Mediziner 39

Durch einen Rechtsklick auf die

Variable (hier ID) kann die

Sortierreihenfolge ausgewählt

werden.

Neue Variablen berechnen

Basis-Kurs Statistik und SPSS für Mediziner 40

Variablen umcodieren

Basis-Kurs Statistik und SPSS für Mediziner 41

Beispiel:

Alter in

Altersklassen

einteilen

Datensatz nach Gruppen aufteilen

Basis-Kurs Statistik und SPSS für Mediziner 42

Separate

Auswertung für

einzelne

Gruppen (z.B.

Geschlecht).

Datensatz nach Gruppen aufteilen II

Basis-Kurs Statistik und SPSS für Mediziner 43

● Gruppen vergleichen

● Ausgabe nach Gruppen

aufteilen

Verschiedene Ausgaben möglich:

Zeitdauer berechnen

Basis-Kurs Statistik und SPSS für Mediziner 44

Differenz

zwischen zwei

Datumsvariablen

berechnen

Transformieren Assistent für Datum und

Uhrzeit

Zeitdauer berechnen II

Basis-Kurs Statistik und SPSS für Mediziner 45

Zwei Datensätze zusammenfügen

Basis-Kurs Statistik und SPSS für Mediziner 46

Neue

Variablen aus

einem

anderen

Datensatz

zum

bestehenden

hinzufügen.

ACHTUNG:

Beide Datensätze

müssen

aufsteigend bzgl.

der Schlüssel-

variablen sortiert

sein.

Zwei Datensätze zusammenfügen II

Basis-Kurs Statistik und SPSS für Mediziner 47

Beobachtungen

werden hier anhand

der Patienten-ID

zugeordnet.

Zwei Datensätze zusammenfügen - Ausgabe

Basis-Kurs Statistik und SPSS für Mediziner 48

Datensatz

enthält nun

auch die

Variable

ernaehrung.

Doppelte Fälle ermitteln

Basis-Kurs Statistik und SPSS für Mediziner 49

Überprüfen, ob

Beobachtungen

bezüglich

bestimmter

Variablen

identische Werte

aufweisen um

damit doppelte

Beobachtungen

auszuschließen.

Doppelte Fälle ermitteln - Ausgabe

Basis-Kurs Statistik und SPSS für Mediziner 50

Variable

„PrimaryFirst“

indiziert erste („1“)

und weitere („0“)

Beobachtung

bzgl. der

ausgewählten

Variablen (hier

ID).

Fälle ausschließen

Basis-Kurs Statistik und SPSS für Mediziner 51

Auswahl

bestimmter

Beobachtungen

für die

Auswertung.

Beispiel: Auswahl

der ersten

Beobachtungen

(PrimaryFirst=1)

und somit

Ausschluss der

doppelten

Beobachtungen

(PrimaryFirst=0).

Fälle ausschließen - Ausgabe

Basis-Kurs Statistik und SPSS für Mediziner 52

Aus der Analyse

ausgeschlossene

Beobachtungen

werden

durchgestrichen

dargestellt.

Diese werden für

die weiteren

Auswertungen

ignoriert.

Variable als Datum definieren

Basis-Kurs Statistik und SPSS für Mediziner 53

Als Variablentyp

statt „Numerisch“,

„Datum“ und

gewünschtes

Format

auswählen.

Datumsvariable erstellen

Basis-Kurs Statistik und SPSS für Mediziner 54

Aus drei separaten

Variablen tag_0,

monat_0, jahr_0

eine Datumsvariable

erstellen

Transformieren Assistent für Datum und

Uhrzeit

Datumsvariable erstellen II

Basis-Kurs Statistik und SPSS für Mediziner 55

Basis-Kurs Statistik und SPSS für Mediziner 56

Maßzahlen im Überblick

Maßzahlen

Skalenniveau

(mindestens erforderlich) Eigenschaft

Arithmetisches Mittel metrisch - ausreißerempfindlich

- Vorsicht bei schiefen Verteilungen!

Median, Quantile ordinal - robust gegenüber Ausreißern

Modus (Ausprägung mit den

meisten Beobachtungen) nominal

- wenig Aussagekraft

- absolut unempfindlich gegenüber

Ausreißern

- Interpretationsprobleme bei

mehrgipfligen Verteilungen

Varianz, Standardabweichung metrisch - geeignet für symmetrische Verteilungen

- Maß der Streuung um den Mittelwert

Variationskoeffizient Verhältnisskala - unabhängig von Einheiten

Quartilsabstand ordinal - einfache Berechnung

- robust gegenüber Ausreißern

Spannweite metrisch - um Messintervall festzulegen

Standardfehler metrisch - Standardfehler des Mittelwerts

Basis-Kurs Statistik und SPSS für Mediziner 57

Prinzip des statistischen Testens

Basis-Kurs Statistik und SPSS für Mediziner 58

Testentscheidungen

Entscheidung bzgl. der Stichprobe

H0 beibehalten H0 verwerfen

Situation in der

Grundgesamtheit

H0 trifft zu Richtige Entscheidung Fehler 1. Art

H1 trifft zu Fehler 2. Art Richtige Entscheidung

Es kann nie nachgewiesen werden, dass die Nullhypothese zutrifft!

Alternativer Ansatz: Äquivalenztests

Die Forschungshypothese muss stets als Alternativhypothese (H1) formuliert werden.

Basis-Kurs Statistik und SPSS für Mediziner 59

p-Wert:

Ist die Wahrscheinlichkeit bei Gültigkeit der Nullhypothese, den beobachteten oder einen in Richtung der Alternative extremeren Unterschied/Effekt zu erhalten.

Signifikanzniveau α:

Zuvor spezifiziertes Level, das vom p-Wert unterschritten werden muss um die Nullhypothese abzulehnen.

Wann sollte nun die Nullhypothese abgelehnt werden?

p < α H0 ablehnen

Ist es unwahrscheinlich, den beobachteten oder einen stärkeren Effekt unter H0 zu erhalten, wird H0 zugunsten von H1 verworfen.

Der p-Wert gibt (umgangssprachlich) die Wahrscheinlichkeit (probability) an, dass der in einer Stichprobe beobachtete Unterschied rein zufällig (d.h. wenn kein Unterschied in der Grundgesamtheit vorliegt) aufgetreten sein könnte.

Entscheidungsregel

Basis-Kurs Statistik und SPSS für Mediziner 60

Der Fehler 1. Art (α-Fehler)

Die Nullhypothese wird abgelehnt, obwohl sie eigentlich gültig ist.

• Kein Gruppenunterschied in der Grundgesamtheit

• Falscher Schluss aufgrund „unglücklicher“ Stichprobe

• Meistens: α = 5% oder α = 1%

Bei α = 5% tritt dies per Definition

bei 5% aller Tests auf, bei denen es

keinen Unterschied in der

Grundgesamtheit gibt.

Die Nullhypothese wird nicht verworfen, obwohl sie nicht zutrifft.

• Tatsächlich Gruppenunterschied in der Grundgesamtheit vorhanden

• Unterschied ist anhand der Stichprobe nicht nachweisbar

• Die Wahrscheinlichkeit für den Fehler 2. Art wird durch einen statistischen Test

nicht kontrolliert (abhängig z.B. von Fallzahl) Fallzahlplanung / Power

Basis-Kurs Statistik und SPSS für Mediziner 61

Der Fehler 2. Art (β-Fehler)

Wkt. des Eintretens hängt

ab vom wahren Effekt

in der GG, der Fallzahl, …

Basis-Kurs Statistik und SPSS für Mediziner 62

Power

Die Power eines Tests gibt die Wahrscheinlichkeit an, einen in der Grundgesamtheit

vorhandenen Unterschied in einer zufälligen Stichprobe (der Größe n) statistisch

nachzuweisen.

•Je größer die Fallzahl desto höher die Power!

•Die Power kann demnach nur durch das Studiendesign (Anzahl der Patienten) beeinflusst

werden!

•Power = 1 – Fehler 2. Art

•Der Fehler 2. Art ist die Wahrscheinlichkeit, einen in der Grundgesamtheit tatsächlich

vorhandenen Unterschied mit der vorliegenden Stichprobe nicht nachzuweisen (H0 wird

beibehalten obwohl H1 wahr ist).

Basis-Kurs Statistik und SPSS für Mediziner 63

Statistische Tests

• Ein statistischer Test ist lediglich eine Entscheidungshilfe, jedoch nie ein Nach- oder

Beweis.

• Ein signifikantes Testergebnis bedeutet: wahrscheinlich nicht durch Zufall zu erklären.

• p > α bedeutet nicht, dass H0 zutrifft, sondern lediglich, dass in den Daten keine

ausreichende Evidenz gegen H0 gefunden wurde.

„Absence of evidence is not evidence of absence“ (Altman & Bland, 1995)

• Es sollte stets die klinische Relevanz der Ergebnisse beurteilt werden.

– Auch statistisch signifikante Ergebnisse können klinisch irrelevant sein.

– Vor allem bei geringer Fallzahl können nicht signifikante Ergebnisse klinisch

relevant sein.

Diese sollten entsprechend beschrieben und diskutiert werden.

Basis-Kurs Statistik und SPSS für Mediziner 64

Statistische Tests

• Nur Ergebnisse bzgl. a priori spezifizierter Hypothesen können sinnvoll interpretiert

werden

Erläuterung im Teil Studienplanung und –interpretation (2. Kurstag)

• Nur wenn ein geeigneter Hypothesentest gewählt wurde, erhält man ein unverzerrtes

Testergebnis

sorgfältige Wahl des statistischen Test (Fragestellung, Annahmen,

Voraussetzungen, …)

• Die statistischen „Standardtests“ gehen von unabhängigen Beobachtungen aus:

Unverbundene Tests: Jedes Individuum (Patient) geht nur mit einer Beobachtung in

den Test ein

Verbundene Tests: Jedes Individuum geht mit einem Paar an Beobachtungen in

den Test ein

Bei wiederholten Messungen / korrelierten Daten werden spezielle Verfahren benötigt

(z.B. GEE-Modelle, gemischte Modelle).

Basis-Kurs Statistik und SPSS für Mediziner 65

Einseitig vs. zweiseitig

zweiseitig:

H0: Parameter 1 = Parameter 2 H1: Parameter 1 Parameter 2

einseitig:

H0: Parameter 1 Parameter 2 H1: Parameter 1 > Parameter 2

Oder

H0: Parameter 1 Parameter 2 H1: Parameter 1 < Parameter 2

Es kann das Signifikanzniveau in einer vorab festgelegten Richtung ausgeschöpft werden.

Ich interessiere mich dafür, ob überhaupt ein Unterschied vorliegt.

Das Signifikanzniveau, z.B. 5%, wird auf beide möglichen Ausgänge

Parameter 1 < Parameter 2 oder Parameter 1 > Parameter 2

aufgeteilt (jeweils 2,5%).

Einseitige vs. zweiseitige Tests

Basis-Kurs Statistik und SPSS für Mediziner 66

• Der klassische Test ist immer zweiseitig. Um einseitig testen zu können, muss man im

Vorfeld klar begründen, wieso ein Effekt in die andere Richtung ausgeschlossen

werden kann.

• Bland JM, Altman DG (BMJ, 1994):

– „Two sided tests should be used unless there is a very good reason for doing

otherwise.“

– „One sided tests should never be used simply as a device to make a

conventionally non-significant difference significant.“

Basis-Kurs Statistik und SPSS für Mediziner 67

Verbunden - unverbunden

verbunden (abhängige Stichproben):

Untersuchungen am selben Kollektiv (oft: „vorher – nachher“ Situationen)

– Änderung des Blutdrucks durch Einnahme von Medikamenten

– Änderung eines Schmerzscores durch OP

– Vergleich Intima Dicke linke und rechte Seite

Oft nicht ausreichend, um z.B. einen Therapieeffekt zu beurteilen (keine Kontrolle)

unverbunden (unabhängige Stichproben):

Vergleiche von unterschiedlichen Kollektiven (Gruppenvergleiche)

– Vergleich von Rauchern und Nicht-Rauchern

– Vergleich von Männern und Frauen

– Vergleich von unterschiedlichen Therapien A, B und C

Basis-Kurs Statistik und SPSS für Mediziner 68

Parametrisch – nicht-parametrisch

Parametrische Tests

Es wird vorausgesetzt, dass die Daten einer speziellen Verteilung folgen (oft Normalverteilungsannahme)!

Bsp: t-Test, ANOVA (Varianzanalyse), Pearson Korrelationskoeffizient

Nicht parametrische Tests (verteilungsfrei)

kommen weitestgehend ohne Annahmen aus, es wird häufig mit Rangzahlen, statt den gemessenen Werten gerechnet (mindestens ordinales Skalenniveau erforderlich).

Aber: geringere Power als parametrische Verfahren (mehr Patienten notwendig)

Bsp: Mann-Whitney-U Test, Wilcoxon-Test, Spearman Korrelationskoeffizient

Basis-Kurs Statistik und SPSS für Mediziner 69

Asymptotisch - exakt

Asymptotische Tests:

Testergebnisse (p-Werte) besitzen nur Gültigkeit wenn asymptotische Annahmen (z.B.

Verteilungsannahmen) hinreichend erfüllt sind: gegeben bei großen Stichprobenzahlen

(n>30).

Geringe Abweichungen von notwendigen Verteilungsannahmen können durch Erhöhung

der Fallzahl kompensiert werden.

Bsp: Chi2-Test, z-Test

Exakte Tests:

Auch bei sehr kleinen Stichprobenumfängen gültig, bei denen Verteilungsannahmen nicht

verifiziert werden können.

Nachteil: rechenintensiv und geringere Power

Bsp: Exakter Test nach Fisher, Permutationstests

Basis-Kurs Statistik und SPSS für Mediziner 70

Übersicht über die wichtigsten Tests

Merkmale

qualitativ

quantitativ

Normalverteilung beliebige Verteilung

Unverbunden

(2 unabhängige Gruppen)

2-Test,

exakter Test nach Fisher

(=Fisher-Test)

t-Test für unverbundene

Stichproben

Mann-Whitney U Test /

Wilcoxon-Rangsummentest

Unverbunden

(3+ unabhängige Gruppen)

2-Test

Fisher-(Freeman-Halton-)Test

Einfache Varianz-

analyse Kruskal-Wallis-Test

Verbunden

(2 Messungen pro Indiv.)

Vorzeichen-Test,

McNemar-Test

t-Test für verbundene

Stichproben

Vorzeichen-Test,

Wilcoxon-Vorzeichen-Rang-Test

Verbunden

(3+ Messungen pro Indiv.)

Cochrans Q-Test

Armitage Trend-Test

Varianzanalyse für

Messwiederholungen Friedman-Test

Basis-Kurs Statistik und SPSS für Mediziner 71

Chi-Quadrat-Test, exakter Test nach Fisher

Basis-Kurs Statistik und SPSS für Mediziner 72

Chi-Quadrat-Test

Beispiel:

Besteht zwischen zwei Medikamenten ein Unterschied bzgl. der 1-Jahres-Mortalität?

(α=0,05)

Idee: Die Häufigkeit von Todesfällen beträgt insgesamt 28/313 = 9%.

Hätten beide Medikamente das gleiche Mortalitätsrisiko, wäre die erwartete Sterberate in

beiden Gruppen ebenfalls gleich 9%.

beobachtet ASPAC Heparin gesamt

gestorben 9 (5,6%) 19 (12,6%) 28 (9,0%)

nicht gestorben 153 132 285

gesamt 162 151 313

Basis-Kurs Statistik und SPSS für Mediziner 73

Chi-Quadrat-Test

beobachtet

erwartet (unter H0) ASPAC Heparin gesamt

gestorben 9

9%*162 = 14,5

19

9%*151 = 13,5 28 (9%)

nicht gestorben 153

162-14,5 = 147,5

132

151-13,5 = 137,5 285

gesamt 162 151 313

Je stärker die beobachteten Werte von den erwarteten Werten abweichen, desto mehr spricht

das für die Alternativhypothese.

Vergleich erwarteter mit beobachteten Häufigkeiten:

Basis-Kurs Statistik und SPSS für Mediziner 74

Chi-Quadrat-Test

Indikation:

• Prüfung auf Assoziation zweier Merkmale

• Vergleich der Häufigkeitsverteilung kategorialer Merkmale

bei unabhängigen Gruppen

Voraussetzungen:

• Mindestens 80% der Zellen haben eine erwartete Häufigkeit 5

• Kategoriale Variablen

Beim Vergleich von mehr als zwei Gruppen lautet die Alternativhypothese:

Mindestens eine Gruppe unterscheidet sich von mindestens einer

anderen in ihrer Häufigkeitsverteilung.

Basis-Kurs Statistik und SPSS für Mediziner 75

Exakter Test nach Fisher

Falls Voraussetzung für Chi-Quadrat-Test nicht erfüllt?

→ Exakter Test nach Fisher

• auch bei schwach besetzten Zellen gültig

• keine Verteilungsannahme (Permutationstest)

• sehr rechenintensiv (bei heutiger Rechenleistung im Regelfall

nicht relevant)

Basis-Kurs Statistik und SPSS für Mediziner 76

Exakter Test von Fisher - SPSS

Chi-Quadrat-Test: Analysieren Deskriptive Statistiken Kreuztabellen

Statistiken Chi-Quadrat auswählen

Exakter Test von Fisher: zusätzlich Exakt Exakt auswählen

Fisher Chi-Quadrat

Basis-Kurs Statistik und SPSS für Mediziner 77

Test auf Normalverteilung (?)

Basis-Kurs Statistik und SPSS für Mediziner 78

Kolmogorov-Smirnov-Test

Es sei zu testen, ob der Hämoglobingehalt im Blut bei Frauen nicht normalverteilt ist.

Die Stichprobenwerte von 10 Frauen ergaben:

12.4 11.8 12.9 12.6 13.0 12.5 12.0 11.5 13.2 12.8 [g/dl]

Nullhypothese: Die Daten folgen einer Normalverteilung.

Interpretation: Man kann nicht nachweisen, dass die Verteilung von Hämoglobin von der

Normalverteilung überzufällig abweicht.

Analysieren Deskriptive Statistiken Explorative Datenanalyse Diagramme

Normalverteilungsdiagramm mit Tests ankreuzen

Basis-Kurs Statistik und SPSS für Mediziner 79

Kolmogorov-Smirnov-Test

Dilemma:

• Geringe Power bei kleinen Fallzahlen (n<50) Abweichungen von der NV-Annahme können evtl. nicht nachgewiesen werden (p>0,05).

• Große Fallzahlen: Bereits bei geringen Abweichungen ergeben sich signifikante Unterschiede von der NV. Häufig gilt jedoch für asymptotische Testeigenschaften: Für n>30 geringe bis mäßige Abweichungen von der NV-Annahme nicht relevant

Daher (insbesondere bei kleinen Stichproben):

• grafische Verfahren verwenden (z.B. Histogramm)

• Deskriptive Faustregeln beachten (bei NV gilt):

– Mittelwert ≈ Median

– Symmetrische Abweichung von Minimum und Maximum um den Mittelwert

– Symmetrische Abweichung der Quartile um den Mittelwert

Basis-Kurs Statistik und SPSS für Mediziner 80

t-Test

Basis-Kurs Statistik und SPSS für Mediziner 81

t-Test für unverbundene Stichproben

Voraussetzung:

- Die Daten in beiden Gruppen sind normalverteilt

- Die beiden Gruppen sind unabhängig (z.B. verschiedene Patienten)

Es existieren Varianten für gleiche (klassischer t-Test) und ungleiche (Welch-Test)

Varianzen in den beiden Gruppen.

Hypothesen: H0: µ1 = µ2 die Mittelwerte in beiden Gruppen sind gleich

H1: µ1 ≠ µ2 die Mittelwerte sind unterschiedlich

Benötigt:

• Fallzahl in den beiden Gruppen (n1, n2)

• Mittelwerte in den beiden Gruppen ( , )

• Standardabweichung oder Varianz in den beiden Gruppen (s1, s2 bzw. s12, s2

2)

x y

Basis-Kurs Statistik und SPSS für Mediziner 82

t-Test für unverbundene Stichproben - Beispiel

Beispiel Hämoglobingehalt bei Männern und Frauen:

Formulierung der Hypothesen:

H0: Die Mittelwerte in beiden Gruppen sind gleich: µM = µF

H1: Die Mittelwerte in beiden Gruppen unterscheiden sich: µM µF

Festlegung der Irrtumswahrscheinlichkeit (für den Fehler 1. Art):

α= 5%

55,0;5,12;10

90,0;0,13;10

FrauenFrauenFrauen

MännerMännerMänner

sxn

Basis-Kurs Statistik und SPSS für Mediziner 83

t-Test für unverbundene Stichproben - SPSS

Analysieren Mittelwerte vergleichen T-Test bei unabhängigen Stichproben

Deskriptive Statistiken:

t-Test:

• Teststatistik (t): Differenz der Mittelwerte / Standardfehler der Differenz

• (Levene‘s Test - Test auf Gleichheit der Varianzen: p<0,05 zweite Zeile)

• Sig. (2-tailed): p-Wert

• 95%-Konfidenzintervall für Differenz der Mittelwerte (0 nicht enthalten p<0,05)

Basis-Kurs Statistik und SPSS für Mediziner 84

t-Test für verbundene Stichproben

Voraussetzungen

• Normalverteilung der Differenz der Paare

• Zu jedem Individuum existieren zwei Messungen (x und y)

Hypothesen:

H0: = 0

H1: 0

d.h. es wird getestet, ob eine signifikante Änderung der Werte

beobachtet werden kann.

Um die Wirksamkeit von Therapien zu überprüfen, ist immer eine

Kontrollgruppe nötig, da auch andere Effekte (z.B. Zeit) eine

Änderung der Werte hervorrufen können.

wobei Δ = x-y

Basis-Kurs Statistik und SPSS für Mediziner 85

t-Test für verbundene Stichproben – Beispiel

Messwerte von Materialeigenschaften eines Implantats im Rohzustand (x) und nach

Oberflächenbehandlung (y):

i xi yi i=xi-yi

1 4,0 3,0 1,0

2 3,5 3,0 0,5

3 4,1 3,8 0,3

4 5,5 2,1 3,4

5 4,6 4,9 -0,3

6 6,0 5,3 0,7

7 5,1 3,1 2,0

8 4,3 2,7 1,6

MW ( ) s

4,6 3,5 1,15 1,16

Basis-Kurs Statistik und SPSS für Mediziner 86

t-Test für verbundene Stichproben – SPSS

Deskriptive Analysen

t-Test für verbundene Stichproben

p-Wert

95%-Konfidenzintervall

für den Mittelwert der Differenz

Analysieren Mittelwerte vergleichen T-Test bei verbundenen Stichproben

Basis-Kurs Statistik und SPSS für Mediziner 87

Verbundene vs. unverbundene Stichproben

Vorteil verbundener Stichproben:

• Genauigkeitsgewinn durch Abschätzung der intra-individuellen Streuung

• Voraussetzungen schwächer: Normalverteilung für Differenz (häufig erfüllt)

Nachteil verbundener Stichproben:

• Änderungen innerhalb der Gruppe durch viele Einflüsse möglich

• Fehlende Werte bei einer Messung führen zum Ausschluss der Beobachtungseinheit

• Carry-over Effekte möglich

Basis-Kurs Statistik und SPSS für Mediziner 88

Erweiterungen des t-Tests

• Mehr als zwei Gruppen (unverbunden)

ANOVA (Varianzanalyse), einfaktoriell

• Mehr als zwei wiederholte Messungen (z.B. Zeitpunkte)

ANOVA für Messwiederholungen

• Adjustierter t-Test

ANCOVA (Kovarianzanalyse, entspricht linearer Regression)

• Quantitative Einflussgröße

Regressionsmodell

• Simultaner Einfluss mehrere Einflussgrößen

Regressionsmodell

Basis-Kurs Statistik und SPSS für Mediziner 89

Nichtparametrische Tests

Basis-Kurs Statistik und SPSS für Mediziner 90

Nichtparametrische Tests

• Nichtparametrisch = verteilungsfrei

• KEINE Normalverteilungsannahme

• Es werden keine Originaldaten verwendet, sondern deren Ränge

• Quantitative UND ordinale Merkmalstypen

• Geringere Effizienz im Vergleich zu parametrischen Verfahren

• Keine interpretierbaren Effektschätzer und Konfidenzintervalle

Basis-Kurs Statistik und SPSS für Mediziner 91

Überblick

Vorzeichen-Test Wilcoxon-Test

(Rang-Vorzeichen-Test) Friedman-Test

Mann-Whitney-U Test

/ Wilcoxon-Test (Rangsummen-Test)

Kruskal-Wallis-Test

2 Stichproben > 2 Stichproben 2 Stichproben > 2 Stichproben

verbundene

Stichproben

unverbundene

Stichproben

verteilungsfreie Verfahren

Basis-Kurs Statistik und SPSS für Mediziner 92

Mann-Whitney-U-Test / Wilcoxon-Rangsummentest

• Zwei unverbundene Stichproben

• Basierend auf Rängen

• Bei Vorliegen einer Normalverteilung:

– der t-Test hat bei gegebener Fallzahl eine (etwas) größere Power als der

Mann-Whitney-U-Test

– bzw. für den Mann-Whitney-U-Test ist eine größere Fallzahl nötig, um die

gleiche Power zu erzielen

• H0: Die Beobachtungen der Gruppe A stammen aus der gleichen Verteilung wie

die der Gruppe B (d.h. H0: P(XA > XB) = 50%).

• Bei gleicher Form der Verteilungsfunktion entspricht dies einem Test auf

Gleichheit der Mediane

• Treatment: Steroid-Behandlung bei

schwangeren Frauen

• Zielgröße: Thrombozytenzahl bei den

Neugeborenen (pro mm³)

Basis-Kurs Statistik und SPSS für Mediziner 93

Mann-Whitney-U-Test – Beispiel (Pocock)

hier: keine Normalverteilung, keine Symmetrie

Treatm ent lfd .

N r.

Throm bozyten-

zahl

R ang

1 120.000 12

2 215.000 18

3 90.000 9

4 67.000 8

5 126.000 14

6 95.000 10

7 190.000 17

8 180.000 16

9 135.000 15

m it

S tero iden

10 65.000 7

11 12.000 1

12 124.000 13

13 20.000 3

14 112.000 11

15 399.000 19

16 32.000 4

17 60.000 6

18 40.000 5

ohne

S tero ide

19 18.000 2

ja nein

Basis-Kurs Statistik und SPSS für Mediziner 94

Mann-Whitney-U-Test – SPSS

Analysieren Nichtparametrische Tests Alte Dialogfelder

Zwei unabhängige Stichproben

Bestimmung der Rangsummen

Ausgabe des p-Wertes

p-Wert

Basis-Kurs Statistik und SPSS für Mediziner 95

Vorzeichen-Test (Sign-Test)

• Zwei verbundene Stichproben

• (x1, y1), ... ,(xn, yn): gepaarte Stichprobe der Zufallsvariablen X und Y

• Annahmen

– Differenzen Di = Yi – Xi sind unabhängig

– P(Xi = Yi) = 0 (keine Bindungen)

Testproblem:

H0: P(X<Y) = P(X>Y) = 0.5 (Anteil pos./neg. Änderungen 50%)

H1: P(X<Y) ≠ P(X>Y) (Anteil pos./neg. Änderungen unausgewogen)

Basis-Kurs Statistik und SPSS für Mediziner 96

Vorzeichen-Test - Beispiel

Gewicht vor Diät Nach Diät

80

91

89

95

98

88

85

95

92

78

101

90

150

101

95

103

98

92

105

104

93

102

78

100

86

120

Delta

-21

-4

-14

-3

6

-17

-19

2

-1

-10

0

1

4

30

Ti

0

1

0

1

0

1

T=5

Delta: Differenz(nach-vor)

T: 1, wenn Delta>0

0, wenn Delta<0

Basis-Kurs Statistik und SPSS für Mediziner 97

Häufigkeiten

8

5

1

14

Negative Differenzen a

Positive Differenzen b

Bindungen c

Gesamt

Koerpergewicht nach

Diaet - Koerpergewicht

vor Diaet

N

Koerpergewicht nach Diaet < Koerpergewicht vor Diaeta.

Koerpergewicht nach Diaet > Koerpergewicht vor Diaetb.

Koerpergewicht nach Diaet = Koerpergewicht vor Diaetc.

Vorzeichen-Test - SPSS

Deskriptive Analysen:

Ausgabe des p-Wertes:

Statistik für Test b

,581a

,291

,157

Exakte Signifikanz

(2-seitig)

Exakte Signifikanz

(1-seitig)

Punkt-Wahrscheinlichkeit

Koerpergewi

cht nach

Diaet -

Koerpergewi

cht vor Diaet

Verwendetete Binomialverteilung.a.

Vorzeichentestb.

Analysieren Nichtparametrische Tests Alte Dialogfelder

Zwei verbundene Stichproben Vorzeichen

Basis-Kurs Statistik und SPSS für Mediziner 98

Wilcoxon-Rang-Vorzeichen-Test (signed-rank test)

• Zwei verbundene Stichproben (gepaarte Beobachtungen)

• Zusätzliche Annahme:

Verteilung der Differenzen ist stetig und symmetrisch um den Median Δmed.

• Paare mit Bindungen (xi=yi) werden im Test ignoriert

Testproblem:

H0: Δmed = 0

H1: Δmed ≠ 0

Falls Annahmen für die entsprechenden Tests erfüllt:

• t-Test für verbundene Stichproben ist effizienter als Wilcoxon-Rang-Vorzeichen-

Test

• Wilcoxon-Rang-Vorzeichen-Test ist effizienter als einfacher Vorzeichentest

Basis-Kurs Statistik und SPSS für Mediziner 99

Wilcoxon-Rang-Vorzeichen-Test - - Beispiel

Gewicht vor Diät

80

91

89

95

98

88

85

95

92

78

101

90

150

101

95

103

98

92

105

104

93

102

78

100

86

120

-21

-4

-14

-3

6

-17

-19

2

-1

-10

0

1

4

30

Nach Diät

Delta |Delta|

21

4

14

3

6

17

19

2

1

10

0

1

4

30

R(|D|)

12

5,5

9

4

7

10

11

3

1,5

8

1,5

5,5

13

T

0

1

0

1

0

1

Ti R(|D|)

7

3

1,5

5,5

13

W+=30

Delta: Differenz

|Delta|: Betrag der Differenz

R(|D|): Rang von |Delta|

T: 1, wenn Delta>0

0, wenn Delta<0

Ti×R(|D|): Nur Ränge für T=1

werden gezählt

W+: Summe dieser Ränge

Basis-Kurs Statistik und SPSS für Mediziner 100

Wilcoxon-Rang-Vorzeichen-Test - - SPSS

Deskriptive Statistiken

Ausgabe der Teststatistik

und des p-Wertes

Analysieren Nichtparametrische Tests Alte Dialogfelder

Zwei verbundene Stichproben Wilcoxon

Basis-Kurs Statistik und SPSS für Mediziner 101

Korrelation

Basis-Kurs Statistik und SPSS für Mediziner 102

Korrelation

Korrelationen werden berechnet, um die Stärke eines linearen

(monotonen) Zusammenhangs zwischen zwei stetigen (ordinalen)

Merkmalen X und Y zu erfassen.

Beispiele:

Es soll untersucht werden,

1. ob ein Zusammenhang zwischen Körpergröße und Gewicht besteht,

2. ob sich der Blutdruck/BMI mit dem Alter ändert,

3. ob mit einer höheren Tumorexpression auch ein schlechterer klinischer

Score einhergeht.

Basis-Kurs Statistik und SPSS für Mediziner 103

Korrelation - Beispiel

Beispiel:

Körperfettanteil, Größe, Gewicht und Hüftumfang wurden an 252 Männern erhoben. Ziel der Studie ist es, den Anteil von Körperfett durch einfach zu erhebende Surrogate möglichst genau abzuschätzen.

Basis-Kurs Statistik und SPSS für Mediziner 104

Korrelation - Beispiel

Grafik Diagrammerstellung Streu-/Punktdiagramm

Basis-Kurs Statistik und SPSS für Mediziner 105

Pearson Korrelationskoeffizient r

Voraussetzung:

• 2 normalverteilte (stetige) Variablen

• Vorsicht bei Ausreißern! r nach Spearman als robustes Maß

Eigenschaften:

• Wertebereich: –1 bis +1 (symmetrisches Maß)

• Invariant gegenüber linearen Transformationen

(z.B. egal ob Gewicht in Gramm oder Kilogramm)

Interpretation:

• Misst die Stärke des linearen Zusammenhangs

• r = -1, r = 1: perfekter linearer Zusammenhang

• r ≈ 0: kein linearer Zusammenhang

• r > 0 (r < 0): gleichsinniger (gegensinniger) Zusammenhang

Basis-Kurs Statistik und SPSS für Mediziner 106

Pearson Korrelationskoeffizient - Beispiel

Analysieren Korrelation Bivariat

Basis-Kurs Statistik und SPSS für Mediziner 107

Korrelation – Anmerkungen

Achtung! Viele verschiedene Zusammenhänge

können den gleichen Korrelations-

koeffizienten ergeben, aber trotzdem nicht

den Trend der Punktwolke widerspiegeln.

Problem:

• Es liegt kein linearer oder monotoner

Zusammenhang vor.

• Ausreißer beeinflussen das Ergebnis.

• Die Daten sind nicht normalverteilt.

Lösung:

• Korrelationskoeffizient nach Spearman

• Flexible Modellierung (Regression)

r=0,8

Basis-Kurs Statistik und SPSS für Mediziner 108

Korrelationskoeffizient nach Spearman

Voraussetzung:

• mind. ordinalskalierte Merkmale

Eigenschaften:

• Basiert auf Rängen

• Robust gegenüber Ausreißern

Interpretation:

• Maß für monotonen Zusammenhang

• Berechnung, Interpretation und Auswertung äquivalent zu Pearson

Korrelationskoeffizient.

Analysieren Korrelation Bivariat Spearman

Basis-Kurs Statistik und SPSS für Mediziner 109

Stärke des Zusammenhangs

Ausmaß des Korrelationskoeffizienten:

0.00 bis 0.19 kein / sehr schwacher

0.20 bis 0.39 schwacher

Wenn |r| 0.40 bis 0.69 moderater Zusammenhang

0.70 bis 0.89 starker

0.90 bis 1.00 sehr starker

Signifikanz des Korrelationskoeffizienten:

Beurteilung zum Signifikanzniveau α (meist α = 0,05)

Warnung:

Tests dürfen in explorativen Studien nur als hypothesengenerierend verstanden werden. Für konfirmatorische Aussagen ist eine Korrektur für multiples Testen erforderlich.

Basis-Kurs Statistik und SPSS für Mediziner 110

Korrelation – Anmerkungen

• Korrelationskoeffizienten sind nicht anwendbar für nominale Variablen, auch wenn diese als Zahlen kodiert sind

• Korrelation ≠ Kausalität

• Bei komplexen Zusammenhängen folgt aus r = 0 nicht immer Unabhängigkeit der Variablen (z.B. U-förmiger Zusammenhang).

• Der Begriff „Korrelation“ wird in der Statistik nicht allgemein für alle Arten von Assoziationstests verwendet.

• Wichtig: Betrag des Koeffizienten und p-Wert sind gemeinsam zu interpretieren, denn:

– Bei großem n sind auch kleine r signifikant von 0 verschieden.

– Bei kleinem n können auch große r nicht signifikant sein.

Basis-Kurs Statistik und SPSS für Mediziner 111

Regression

Basis-Kurs Statistik und SPSS für Mediziner 112

Einfache lineare Regression

Die Geradengleichung y = a + bx stellt dabei die Regressionsgleichung dar.

b quantifiziert den Zusammenhang zwischen Y und X.

b

1

b = Anstieg/Slope

(Zu-/Abnahme von Y, wenn X um eine Einheit ansteigt)

a

a = Konstante/Intercept

(Schnittpunkt der Regressionsgeraden mit y-Achse

bzw. y-Wert der Regressionsgeraden bei x=0)

y = vorhergesagter Y Wert ^

^

= Abweichung/Residuum: Die Parameter a und b werden so

bestimmt, dass die Summe der quadrierten Abweichungen

minimal wird „Kleinste Quadrate Schätzer“.

Basis-Kurs Statistik und SPSS für Mediziner 113

Einfache lineare Regression – Beispiel

Annahme:

Körperfett steht in einer linearen

Beziehung zum Brustumfang.

Allgemeine Form der Geradengleichung:

Geschätzter Körperfettanteil = a + b · Brustumfang

Basis-Kurs Statistik und SPSS für Mediziner 114

Einfache lineare Regression – SPSS

Grafik: Grafik Diagrammerstellung Streu-/Punktdiagramm

Regressionsgreade: Doppelklick auf Grafik Elemente Anpassungslinie bei

Gesamtsumme

Basis-Kurs Statistik und SPSS für Mediziner 115

Einfache lineare Regression – SPSS

Analysieren Regression Linear

Steigung (= b)

Konstante (= a)

Zielgröße Y

Geschätzter Körperfettanteil = -51,172 + 0,697·Brustumfang

Die Nullhypothese H0: b = 0, d.h.

„kein Zusammenhang“, kann auf

dem 5%-Signifikanzniveau

abgelehnt werden.

Basis-Kurs Statistik und SPSS für Mediziner 116

Einfache lineare Regression – Beispiel

Die aus den Daten geschätzte Regressionsgleichung kann benutzt werden, um

Körperfett bei Männern abzuschätzen.

z. B. für einen Mann mit 100 cm Brustumfang ergibt sich

Geschätzter Körperfettanteil = -51,172 + 0,697·100 [cm]

= 0,185

= 18,5%

Basis-Kurs Statistik und SPSS für Mediziner 117

Multiple lineare Regression

In einer multiplen Regression lassen sich die Effekte mehrerer Variablen simultan

bestimmen.

• Allgemeine Form der Geraden, um Körperfett aus mehreren Einflussgrößen zu

bestimmen:

Körperfett = b0 + b1·Brustumfang + b2·Übergewicht + b3·Adipositas

• Berechnung der Regressionskoeffizienten auf Basis der Daten ergibt:

Körperfett = -31,454 + 0,480·Brustumfang + 3,864·Übergewicht + 6,290·Adipositas

Basis-Kurs Statistik und SPSS für Mediziner 118

Multiple lineare Regression – Interpretation

Körperfett = -31,454 + 0,480·Brustumfang + 3,864·Übergewicht + 6,290·Adipositas

• Eine (theoretische) Person mit Brustumfang von 0 cm und BMI im

Normalbereich hätte einen erwarteten Körperfettanteil von -31,45%

• Ein normalgewichtiger Mann mit einem Brustumfang von 100 cm hat einen

erwarteten/vorhergesagten Körperfettanteil von -31,454 + 0,480·100 = 8,55%

• Im Vergleich dazu hat ein adipöser Mann mit gleichem Brustumfang einen

vorhergesagten Körperfettanteil von -31,454 + 0,480·100 + 6,290 = 14,84%

Basis-Kurs Statistik und SPSS für Mediziner 119

Gütemaß

Wie gut beschreibt die Regressionsgerade die Daten?

Wie genau kann die abhängige Größe durch das Modell vorhergesagt

werden?

Bestimmtheitsmaß (R2)

Interpretation:

R² gibt an, wie viel Prozent der Streuung der abhängigen Variablen Y durch

die Regressionsgerade erklärt werden kann. Es entspricht in der einfachen

linearen Regression mit einer stetigen Einflussgröße dem quadrierten Pearson

Korrelationskoeffizienten.

Wertebereich: 0 bis 1

Basis-Kurs Statistik und SPSS für Mediziner 120

Gütemaß – SPSS

Modell I: Einflussgröße nur Brustumfang R2 = 0,494

Modell II: Einflussgrößen Brustumfang, Übergewicht, Adipositas R2 = 0,519

Basis-Kurs Statistik und SPSS für Mediziner 121

Lineare Regression: Annahmen

Voraussetzungen für die Durchführung einer linearen Regression:

Die Residuen müssen normalverteilt sein (nicht die Zielgröße) ( Histogramm

der Residuen)

Analysieren Regression linear

Diagramme unter Diagramme der

standardisierten Residuen Haken setzen

bei „Histogramm“

Basis-Kurs Statistik und SPSS für Mediziner 122

Analyse von Überlebenszeiten

Basis-Kurs Statistik und SPSS für Mediziner 123

Typische Beispiele und Problemstellung

• Überlebenszeit oder 1, 2, 3, ... Jahres-Überlebensrate - von Krebspatienten - nach Transplantationen

• Dauer bis zur Schmerzfreiheit nach Knieoperation

• Unterscheiden sich 2 oder mehr Gruppen hinsichtlich der Überlebenszeit?

Überlebenszeit: Zeitspanne T bis zum Eintreten eines bestimmten Ereignisses

Probleme: Ereigniszeiten unvollständig beobachtet

Zensierungsproblematik

z.B. Nachbeobachtungsperioden unterschiedlich lang, manche Patienten scheiden während der Studie aus

Ereignis: Tod, Rezidiv, Remission, ...

Basis-Kurs Statistik und SPSS für Mediziner 124

Beobachtungsmuster

Basis-Kurs Statistik und SPSS für Mediziner 125

Kaplan-Meier-Schätzer

Basis-Kurs Statistik und SPSS für Mediziner 126

Kaplan-Meier-Schätzer

* lebend zum letzten Beobachtungszeitpunkt § Lost to follow up (Studienabbruch)

Überlebenszeiten (in Monaten) von 30 Patienten in einer randomisierten Studie

Therapie vs. Placebo:

Frage: Wie groß ist die

Überlebenswahrscheinlichkeit in

den beiden Gruppen?

Problem:

Zensierungen/unterschiedlich

lange Beobachtungsdauern

Lösung: Kaplan-Meier-Schätzer

Therapie

(n=15)

Placebo

(n=15)

5 143 2 63

12 145* 4 71

56§ 146* 7 90*

68 148 22 100

89 162* 28 146*

96 168* 32 167*

128* 181* 40 182*

141* 54

Basis-Kurs Statistik und SPSS für Mediziner 127

Kaplan-Meier-Schätzer

Idee:

1. Sortieren der Daten nach Ereigniszeiten. Die Ereignisse geben

Beobachtungsintervalle vor.

2. Bestimmung der Personen unter Risiko zu jedem Zeitpunkt: Personen, die

bis unmittelbar vor dem Zeitpunkt gelebt haben und Personen, die

irgendwann nach diesem Zeitpunkt zensiert wurden.

3. Für jedes Zeitintervall Berechnung der (bedingten) Wahrscheinlichkeit, dass

jemand, der bis zu Beginn des Intervalls gelebt hat, bis zum Ende des

Intervalls überleben wird.

4. Berechnung der Überlebenswahrscheinlichkeit zu jedem Zeitpunkt als

Produkt der bedingten Wahrscheinlichkeiten, jedes Zeitintervall zu

überleben.

Basis-Kurs Statistik und SPSS für Mediziner 128

Kaplan-Meier-Schätzer - Beispiel

Zeit-

punkt

Patienten

unter

Risiko

Anzahl

Ereignisse

Wahrscheinlichkeit,

Intervall

zu überleben

Kumulierte

Überlebenswahrscheinlichkeit

5 15 1 14/15 14/15

12 14 1 13/14 14/15 13/14

56§ 13 0

68 12 1 11/12 14/15 13/14 11/12

89 11 1 10/11 14/15 13/14 11/12 10/11

… … … … …

Berechnung am Beispiel Therapiegruppe

Basis-Kurs Statistik und SPSS für Mediziner 129

Kaplan-Meier-Schätzung - SPSS

Analysieren Überleben

Kaplan-Meier

Basis-Kurs Statistik und SPSS für Mediziner 130

Kaplan-Meier-Kurve

Analysieren Überleben

Kaplan-Meier Optionen

unter Diagramme „Überleben“

auswählen

Beispiel: Medianes Überleben

Basis-Kurs Statistik und SPSS für Mediziner 131

Kaplan-Meier-Kurve

Beispiel: 10 Jahres Überleben

Basis-Kurs Statistik und SPSS für Mediziner 131

Basis-Kurs Statistik und SPSS für Mediziner 132

Log-rank Test

Basis-Kurs Statistik und SPSS für Mediziner 133

Log-rank Test

Statistische Hypothesen:

• H0: kein Unterschied in der Verteilung der Überlebenszeiten zwischen

Placebo und Therapiegruppe, d.h.

Todesfälle treten in zufälliger Reihenfolge unabhängig von der

Gruppenzugehörigkeit auf

• H1: Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und

Therapiegruppe, d.h.

Todesfälle treten in einer Gruppe früher als in der anderen Gruppe auf

Voraussetzung:

Kaplan-Meier-Kurven sollten sich nicht überschneiden

Basis-Kurs Statistik und SPSS für Mediziner 134

Log-rank Test

Idee:

1. Bestimmung der beobachteten Anzahl an Todesfällen in beiden Gruppen

(beobachtete Ereignisse zum Ereigniszeitpunkt tj in den beiden Gruppen: dAj und dBj).

2. Berechnung der unter H0 erwarteten Anzahl von Todesfällen in beiden

Gruppen zu den einzelnen Zeitpunkten tj (E(dAj), E(dBj))

3. Vergleich der beobachteten und erwarteten Anzahlen an Ereignissen einer

Gruppe mittels der Log-rank-Teststatistik:

Bei hinreichend großer Zahl der Ereignisse ist LR annähernd χ2-verteilt.

Faustregel: insgesamt mindestens 30 Ereignisse über beide Gruppen

)( )]([

2

UVar

ULRdEdU

Aj

j

Aj

Basis-Kurs Statistik und SPSS für Mediziner 135

Log-rank Test -- Beispiel

Analysieren Überleben

Kaplan-Meier

Faktor vergleichen

unter Teststatistiken

„Log-Rang“ auswählen

Basis-Kurs Statistik und SPSS für Mediziner 136

Log-rank Test Cox-Regression

Grenzen des Log-rank-Tests:

• Reiner Signifikanztest

liefert keine Effektgrößen

• Lediglich Gruppenvergleiche möglich

(nur eine binäre bzw. kategoriale Einflussgröße)

Cox-Regression „erweitert“ den Log-rank-Test

• Simultaner Effekt mehrerer Einflussgrößen

• Metrische Einflussgrößen

• Adjustierter Gruppenvergleich

• Hazard Ratio als Effektmaß

Basis-Kurs Statistik und SPSS für Mediziner 137

Cox-Regression

Basis-Kurs Statistik und SPSS für Mediziner 138

Cox-Regression - Hazardfunktion

Zielgröße in der Cox-Regression: Hazardrate (Risikofunktion) h(t):

h(t) beschreibt die infinitesimale Wahrscheinlichkeit für ein Ereignis zum Zeitpunkt t,

gegeben das Ereignis ist vor Zeitpunkt t noch nicht eingetreten,

d.h. die Wahrscheinlichkeit, wenn ein Patient bis t überlebt hat, dass er unmittelbar

zum Zeitpunkt t verstirbt.

t

tTttTtPth

t

)|(lim)(

0

Basis-Kurs Statistik und SPSS für Mediziner 139

Cox-Regression (proportional hazards model)

Cox-Modell:

)Xβ...XβXexp( β(t)hh(t)mm22110

Voraussetzung:

Proportionale Hazardraten, d.h. Effekte verschiedener Variablen auf das Überleben

sind über die Zeit konstant!

Basis-Kurs Statistik und SPSS für Mediziner 140

Cox-Regression

h(t): Hazardrate

h0(t): unspezifizierter Baseline-Hazard (beschreibt das Risiko, wenn alle Einflussgrößen gleich 0 sind)

X1,…,Xm: Werte der Einflussgrößen

β1,...,βm: Regressionskoeffizienten

)Xβ...XβXexp( β(t)hh(t)mm22110

Basis-Kurs Statistik und SPSS für Mediziner 141

Cox Regression – Hazard Ratio

• Zwei-Gruppen-Fall (0 vs. 1): HR=exp(β)

Risikoverhältnis zwischen den beiden Gruppen

• Gruppenunterschied von primärem Interesse, weitere Einflussgrößen als

adjustierende Variablen

adjustiertes Risikoverhältnis zwischen den Gruppen

• Stetige Einflussgröße

exp(β) beschreibt die relative Änderung des Risikos bei Änderung

der Einflussgröße um eine Einheit

z.B. exp(ß) = 1.12 Risikoanstieg von 12%

exp(ß) = 0.80 Risikoreduktion um 20%

exp(ß) = 1 kein Risikounterschied

Basis-Kurs Statistik und SPSS für Mediziner 142

Cox-Regression – Beispiel

• Randomisierte Studie mit 158 Patienten (74 mit Standardtherapie, 84 mit neuer Therapie)

• Weitere Einflussgrößen:

– Alter

– Geschlecht (1=männlich, 0=weiblich)

– Score für Gesundheitszustand (0 bis 100, hohe Werte sprechen für guten Zustand)

• Endpunkt: Zeit bis zum Tod / bis Zensierung

• Status (0=zensiert, 1=Ereignis)

ID Beobachtete Zeit Status Therapie Geschlecht Alter Score

1 17 0 0 0 39 14

2 8 1 0 1 46 84

3 41 0 1 1 61 67

4 6 0 0 0 34 8

5 45 1 0 0 25 99

6 8 1 0 1 35 2

7 8 1 1 0 48 58

8 20 1 1 1 46 43

9 3 1 1 0 41 26

Basis-Kurs Statistik und SPSS für Mediziner 143

Cox-Regression - SPSS

• Variablen für Überlebenszeit und Status sowie Einflussgrößen definieren

• Output:

B: Regressionskoeffizient

Exp(B): geschätztes Risikoverhältnis

CI for Exp(B): Konfidenzintervall für das Risikoverhältnis

Sig.: p-Wert

Analysieren Überleben Cox-Regression (bei Optionen „Konfidenzintervall für

Exp(B)“ markieren)

Basis-Kurs Statistik und SPSS für Mediziner 144

Cox- Regression - SPSS

• In den beobachteten Daten führt die neue Therapie zu einer Verringerung des Risikos

(B<0 bzw. Exp(B)<1)

• Risikoverhältnis (=HR) beträgt 0,556 Das Risiko unter der neuen Therapie beträgt das

0,556-fache des Risikos unter der Standardtherapie

• Verringerung des Risikos ist signifikant (p-Wert<0,05 / HR von 1 ist nicht im

Konfidenzintervall enthalten)

• Kein signifikanter Alters- und Geschlechtseffekt

• Signifikanter Einfluss des Scores. Ein Unterschied von einem Punkt spricht für eine

Risikoänderung um den Faktor 0,987

• Ein Unterschied von 10 Scorepunkten führt zu einer Risikoreduktion auf das 0,878-fache:

exp(10·β) = exp(10 ·(-0,013)) = 0,878

Basis-Kurs Statistik und SPSS für Mediziner 145

Publikation der Ergebnisse

Basis-Kurs Statistik und SPSS für Mediziner 146

Publikation der Ergebnisse: Formulierungsfallen I

Häufige Fehlerquellen:

„..age was significant in patient groups (p=0.021)“

das Wort signifikant darf nie alleine stehen, es bezieht sich immer auf einen Unterschied oder einen Zusammenhang, der mit Hilfe eines statistischen Tests auf Zufälligkeit geprüft wurde.

„..age was significantly different in both patient groups (p=0.021)“

auch die Richtung des Unterschiedes sollte erwähnt werden. In diesem Fall: Welche Gruppe war denn älter?

besser: „ … age was significantly higher in group A compared to group B (mean difference: 4 , 95% confidence interval (1.7 – 6.3), p=0.021)“

Das Wort „signifikant“ sollte nur dann verwendet werden, wenn wirklich „statistische Signifikanz“ gemeint ist – nicht klinische Relevanz!

Basis-Kurs Statistik und SPSS für Mediziner 147

Publikation der Ergebnisse: Formulierungsfallen II

„..there was no difference between patient groups..“

Nur weil ein Unterschied statistisch nicht nachgewiesen werden konnte,

bedeutet dies noch lange nicht, dass tatsächlich kein Unterschied besteht.

„..there was no significant difference between patient groups..“

besser: oder

„..patient groups were similar with regard to…“

„..there was a trend towards significantly higher values…

Ein „Trend“ impliziert stets eine zeitliche Entwicklung, hier eher

von einer „Tendenz“ sprechen und auf „significant“ verzichten:

„..there was a tendency to higher values …

Bitte niemals Phrasen wie: „marginally / slightly significant“ benutzen, wenn p

Basis-Kurs Statistik und SPSS für Mediziner 148

Publikation der Ergebnisse

• Auch bei nicht signifikanten Ergebnissen p-Werte berichten

• Signifikante p-Werte hinreichend genau wiedergegeben (nicht nur p<0.05)

• Mehr als 3 bzw. 4 Nachkommastellen sollten vermieden werden

• Für sehr kleine p-Werte (z.B. 0.0000453) schreibt man p<0.001

• Statistische Tests bzgl. sekundärer Studienendpunkte sollten als „explorative

Analysen“ deklariert werden (multiples Testen)

• Wirklicher Nachweis von Signifikanz nur für primäre Endpunkte möglich

• Aus p>0,05 darf niemals Gleichheit der Gruppen bzw. kein Effekt

geschlossen werden

• Es sollte immer auch die klinische Relevanz der Ergebnisse beurteilt werden

Basis-Kurs Statistik und SPSS für Mediziner 149

Empfehlenswerte Literatur

• Beck-Bornholt, Dubben: Der Hund der Eier legt – Erkennen von Fehlinformation

durch Querdenken, rororo, 2001

• Bland: An Introduction to Medical Statistics, Oxford Medical Publications, 2000

• Büning, Trenkler: Nichtparametrische statistische Methoden, de Gruyter, 1978

• Campbell, Machin: Medical Statistics – a commonsense approach, Wiley 1999

• Fahrmeir, Künstler, Pigeot, Tutz: Statistik – Der Weg zur Datenanalyse,

Springer Verlag, 2., verb. Aufl., 1999

• Harms: Biomathematik, Statistik und Dokumentation, Harms Verlag Kiel, 6.,

neub. Auflage

• Pocock: Clinical Trials – A practical approach, Wiley, 1983

• Schumacher, Schlugen: Methodik klinischer Studien. Springer Verlag 2008

Basis-Kurs Statistik und SPSS für Mediziner 150

Empfehlenswerte Literatur

• Machin, Campbell, Fayers, Pinol: „Sample Size Tables for Clinical Studies“

• Fowler J., Cohen L., Jarvis P.: „Practical Statistics for field Biology“

• Sachs L.: „Angewandte Statistik“

• Weiß C.: „Basiswissen medizinische Statistik“

• Diem K. & Lentner C.: Documenta Geigy – „Wissenschaftliche Tabellen“

• Cummings, Arch Pediatr Adolesc MED / VOL 157 2003:

„Reporting Statistical Information in Medical Journal Articles “

• Bender R. Dtsch. Med. Wschr. 2007; 132 (S 01), e1-e73

basiskurs statistik und spss für mediziner · spss - menüleiste sämtliche operationen werden...

Documents

basiskurs schmerztherapie...

ibm spss missing values 20 - math.uni-leipzig.de spss...

ibm spss custom tables - spss-statistics.de · ibm software...

benutzerhandbuch 6.4 hoduflu de - blw · der login erfolgt...

ibm spss regression 20 - math.uni-leipzig.de spss...

kurzeinführung ibm spss statistics 20 für windows · pdf...

basiskurs für apotheker: asthma bronchiale - my-cme.de ·...

basiskurs/lehrgang ensembleleitung blasorchester

spss hausübungen mit latex

tightvnc -...

ibm spss neural networks · · 2013-08-26ibm software ibm...

basiskurs linux

ibm spss complex samples 20 - math.uni-leipzig.de spss...

spss base 16.0 – benutzerhandbuch - uni-muenster.de ·...

spss advanced models™ 16 - uni- · pdf filevorwort spss...

lehrerfortbildung baden-württemberg1 basiskurs...

einführung in spss

spss tables (tabellen)™ 16 - uni-muenster.de · vorwort...

basiskurs schmerztherapie b - paincourse -...

inhalt - beltz verlagsgruppe | beltzlesen – schreiben –...