basiskurs statistik und spss für mediziner · spss - menüleiste sämtliche operationen werden...
Post on 14-Jun-2020
8 Views
Preview:
TRANSCRIPT
Institut für Medizinische Statistik und
Epidemiologie
Basiskurs Statistik und SPSS für Mediziner
Bernhard Haller
Alexander Hapfelmeier
Armin Ott
Birgit Waschulzik
Basis-Kurs Statistik und SPSS für Mediziner
Inhaltsverzeichnis
1. Grundlagen und Begriffe 3
2. Dateneingabe und –aufbereitung 12
3. Deskriptive Statistik 19
4. Grafische Darstellung 29
5. Bearbeitung der Daten in SPSS 38
6. Prinzip des statistischen Testens 57
7. Korrelation 101
8. Regression 111
9. Analyse von Überlebenszeiten 122
10. Publikation der Ergebnisse 145
2
Basis-Kurs Statistik und SPSS für Mediziner 3
Grundlagen und -begriffe
Basis-Kurs Statistik und SPSS für Mediziner 4
Statistische Einheiten / Merkmale / Ausprägungen
Merkmalsträger/ Beobachtungseinheit
• Proband
• Patient
• Maus
• …
Geschlecht
Gewicht
Laborwerte:
Blutdruckwerte:
Größe 172 cm
65 kg
124 / 82 mmHg
Kreatinin 78 μmol/l
Glukose 4,2 mmol/l
männlich
Merkmalsausprägung
Merkmal
Basis-Kurs Statistik und SPSS für Mediziner 5
Merkmalstypen
Ergebnis von
Zählung
Anzahl Operationen
Lymphknotenbefall
Ergebnis von
Wägung oder
Messung
Beispiele: BMI, Größe
Überlebenszeit
Rangfolge
möglich
TNM-Klassifik.
Schweregrade
keine Rang-
folge möglich
Geschlecht,
Tumorlokal.
Richtiges Einordnen von Merkmalstypen ist wichtige Voraussetzung
für die adäquate Anwendung statistischer Methoden!
quantitativ
stetig
metrisch diskret
qualitativ
ordinal-
skaliert
nominal-
skaliert
Merkmale
Basis-Kurs Statistik und SPSS für Mediziner 6
Statistische Einheiten / Merkmale / Ausprägungen
• Viele Auswertverfahren setzen unabhängige Beobachtungseinheiten
voraus
• Meistens verletzt, wenn mehrere Beobachtungen pro Patient vorliegen
– Wiederholte Messungen im Zeitverlauf
– z.B. mehrere Läsionen/Augen/Organe/… eines Patienten
– Bewertung eines Patienten von mehreren Beurteilern
• In solchen Fällen müssen adäquate (komplexere) Verfahren angewandt
werden
Basis-Kurs Statistik und SPSS für Mediziner 7
Grundgesamtheit und Stichprobe
• Grundgesamtheit: Menge aller interessierenden statistischen Einheiten -
z.B. alle Patienten mit einer bestimmten Indikation
• Stichprobe: (Zufällige) Auswahl einer Teilmenge aus dieser Grundgesamtheit
Basis-Kurs Statistik und SPSS für Mediziner 8
Aufgaben der Statistik
• Deskriptive (beschreibende) Statistik
• Explorative (suchende) Statistik
• Induktive (schließende) Statistik
Basis-Kurs Statistik und SPSS für Mediziner 9
Deskriptive Statistik
• Zusammenfassung in spezifische Kenngrößen
(Lageparameter bzw. Häufigkeiten)
• Grafische Aufbereitung
• Präsentation von umfangreichem Datenmaterial
• Datenvalidierung (z.B. Identifikation von Falscheingaben)
• Reine Beschreibung der erhobenen Daten, keine Rückschlüsse über
die Objekte der Erhebung hinaus möglich
Basis-Kurs Statistik und SPSS für Mediziner 10
Explorative Statistik
• Suche nach Strukturen oder Besonderheiten in den Daten
• Generierung neuer Fragestellungen und Hypothesen
• Verwendung bei nicht exakt spezifizierten Fragestellungen
• Keine Rückschlüsse über die Erhebung hinaus möglich, jedoch häufig
deutliche Hinweise bzw. „empirische Evidenz“
Basis-Kurs Statistik und SPSS für Mediziner 11
Induktive Statistik
• Versuch, durch Einbeziehung von Wahrscheinlichkeitstheorie
allgemeine Schlussfolgerungen für die Grundgesamtheit zu ziehen
• Sorgfältige Versuchsplanung nötig
• Fragestellungen und stochastische Modelle müssen a priori
spezifiziert werden
Schließen: Stichprobe Grundgesamtheit
– Schätzen: Plausibelster Parameter für Grundgesamtheit mit Maß
bzgl. der Unsicherheit (KI)
– Testen: Prüfen von zuvor spezifizierten Hypothesen
Basis-Kurs Statistik und SPSS für Mediziner 12
Dateneingabe und -aufbereitung
Basis-Kurs Statistik und SPSS für Mediziner 13
Dateneingabe
• Eingabe „einfacher“ Daten in Standardsoftware (z.B. MS Excel)
– Vorteile: Akzeptanz, meist Grundkenntnisse vorhanden, einfach zu
bedienen, weit verbreitet, kompatibel
– Nachteile: fehleranfällig, keine Kontrollen, keine feste Struktur
• Eingabe komplexerer Daten in Datenbanksysteme (z.B. MS Access,
spezielle Software), evtl. mit Eingabemaske
– Vorteile: geringere Fehlerquote, logische Abfragen möglich, …
– Nachteile: komplex (evtl. Administrator und/oder Programmierer benötigt)
Strenge Anforderungen an Dateneingabe bei
Studien nach AMG oder MPG
!
Basis-Kurs Statistik und SPSS für Mediziner 14
Dateneingabe in Excel
Feste Struktur zum Einlesen in Statistiksoftware (SPSS) erforderlich!
• Jede Beobachtungseinheit (Patient) eine Zeile
• Jedes erhobene Merkmal eine Spalte
• Zellenformat „Standard“ immer beibehalten!
• Datum: (TT.MM.JJJJ)
• Quantitative Merkmale: nur die Zahlen eingeben (nicht: NA, <0.1, 74 kg, …)
• Nominale/ordinale Merkmale: Ausprägungen numerisch kodieren
• Fehlende Zellen frei lassen oder eindeutig kodieren (z.B. 9999)
ID Therapiegruppe Alter Geschlecht OP-Datum Therapieerfolg
1 0 56 1 12.11.2006 0
2 2 78 1 24.08.2004 1
3 1 66 0 13.07.2007 1
4 1 40 0 18.01.2006 0
Basis-Kurs Statistik und SPSS für Mediziner 15
SPSS - Datenansicht
• Zeigt Daten an
• Neue Daten können eingegeben werden
• Korrekt formatierte Datensätze können eingelesen werden (Excel, .txt, …)
Basis-Kurs Statistik und SPSS für Mediziner 16
SPSS - Variablenansicht
Eigenschaften der erho-
benen Variablen können
geändert werden:
• Variablenname
• Ausgegebener Name
(Variablenlabel)
• Gruppennamen
(Wertelabels)
• Messniveaus
• Definition fehlender
Werte
Basis-Kurs Statistik und SPSS für Mediziner 17
SPSS - Ausgabe
Ergebnisse durchgeführter
Operationen werden im
Ausgabefenster angezeigt
(Tabellen, Grafiken, …)
Diese können bearbeitet &
exportiert werden (z.B. als
PDF, Excel-Datei, …)
Basis-Kurs Statistik und SPSS für Mediziner 18
SPSS - Menüleiste
Sämtliche Operationen werden über die Menüleiste gestartet.
Wichtigste Punkte:
• Datei: Öffnen und Speichern von Daten
• Daten: Umstrukturieren des aktuellen Datensatzes, Auswahl
relevanter Beobachtungen, Sortieren
• Transformieren: Berechnen neuer Variablen, Umkodieren
bestehender Variablen
• Analysieren: Sämtliche Verfahren zur Analyse der Daten, deskriptive
Statistiken, statistische Testverfahren, Regressionsmodelle, …
• Diagramme: verschiedene Untermenüs zur Erstellung von Grafiken
Basis-Kurs Statistik und SPSS für Mediziner 19
Deskriptive Statistik
Basis-Kurs Statistik und SPSS für Mediziner 20
Quantitative Merkmale: Maßzahlen
Lokalisationsmaße -> Lage:
– Arithmetisches Mittel
– Median
– Quantile
– Modus
Dispersionsmaße -> Streuung:
– Spannweite
– Varianz
– Standardabweichung
– Variationskoeffizient
Basis-Kurs Statistik und SPSS für Mediziner 21
Lokalisation (Lage): Mittelwert, Median
Seien x1,x2, …,xn die Merkmalsausprägungen eines Merkmals X von n Patienten
• Mittelwert:
• Median (teilt die Daten in zwei gleich große Hälften):
geordnete Werte x(1), …, x(n): x(1) < x(2) < … < x(n)
ungerade
Anzahl von
Beobachtungen
gerade
Anzahl von
Beobachtungen
n
i
ixn
x
1
1
Median: = 𝑥𝑛+12
= 𝑥0.5
Median: =1
2(𝑥𝑛
2+ 𝑥𝑛
2+1) = 𝑥0.5
Basis-Kurs Statistik und SPSS für Mediziner 22
Streuung: Spannweite, Quantile, Interquartilsabstand
X x(1) x(2) x(3) … x(n)
Minimum Spannweite Maximum
x0.25
25%
x0.75
75%
25% IQR
Interquartilsabstand = x 0.75 – x 0.25
(inter quartile range (IQR))
Spannweite = x max – x min (range)
Basis-Kurs Statistik und SPSS für Mediziner 23
In den Daten beobachtete Streuung:
• Varianz:
• Standardabweichung:
• Variationskoeffizient:
Mittelwert und Standardabweichung implizieren symmetrische Verteilung
Bei schiefer Verteilung Median und IQR oder Minimum / Maximum angeben
Streuung: Varianz, Standardabweichung
n
i
xi
xn
S
1
)(1
1 22
2SS
xS
cV
Basis-Kurs Statistik und SPSS für Mediziner 24
Schätzung von Maßzahlen
Symmetrische Verteilung:
Alle Verteilungen:
Sehr flexibel:
Analysieren Deskriptive Statistiken Deskriptive Statistik Optionen
gewünschte Maßzahlen auswählen
Analysieren Deskriptive Statistiken
Häufigkeiten Statistiken
gewünschte Maßzahlen auswählen
Analysieren Tabellen
Benutzerdefinierte Tabellen
Basis-Kurs Statistik und SPSS für Mediziner 25
Grafische Darstellung
Beschreibung eines Merkmals
Basis-Kurs Statistik und SPSS für Mediziner 26
Quantitative Merkmale (eindimensional)
Histogramm: Boxplot:
75. Perzentil
50. Perz. (Median)
25. Perzentil
Minimum*
Grafik Diagrammerstellung Galerie
Histogramm Boxplot
*Ausreißer und Extremwerte werden
gesondert gekennzeichnet
Maximum*
Basis-Kurs Statistik und SPSS für Mediziner 27
Qualitative Merkmale (eindimensional)
Grafik Diagrammerstellung Galerie
Balken Kreis/Polar
ordinales oder nominales Skalenniveau nur nominales Skalenniveau
Darstellung absoluter Anzahlen oder relativer Häufigkeiten (%)
Basis-Kurs Statistik und SPSS für Mediziner 28
Eindimensionale Darstellung - Zusammenfassung
Merkmalstyp Maßzahlen
quantitativ Histogramm
Fehlerbalken (symm. Vtlg)
Boxplot
(symm Vtlg.)
Median (xmin, xmax / IQR)
graphisch
qualitativ
- ordinalskaliert
(mit Rangfolge)
Säulendiagramm
absolute bzw. relative
Häufigkeiten
- nominalskaliert
(ohne Rangfolge)
Kreisdiagramm
Säulendiagramm
absolute bzw. relative
Häufigkeiten
x s
Basis-Kurs Statistik und SPSS für Mediziner 29
Grafische Darstellung
Zusammenhang zweier Merkmale
Basis-Kurs Statistik und SPSS für Mediziner 30
Zusammenhang zwischen zwei Merkmalen
Folgende Kombinationen sind möglich:
qualitativ – qualitativ
• Geschlecht – Therapie (A,B)
• Therapie – Therapieerfolg
qualitativ – quantitativ
• Geschlecht – Cholesterinspiegel
• Therapie – Blutdruckänderung
quantitativ – quantitativ
• Alter – Blutdruck
• Dosis – Änderung Blutwert
Basis-Kurs Statistik und SPSS für Mediziner 31
Qualitativ - qualitativ
Beispiel: Diabetes und Therapie
Tabelle und Säulendiagramm mit relativen
Häufigkeiten (%).
Die absoluten Häufigkeiten sind aufgrund der
unterschiedlichen Fallzahlen in den Gruppen
nicht vergleichbar!
Grafik Diagrammerstellung Galerie Balken
Analysieren Deskriptive Statistiken Kreuztabellen Zellen
Prozentwerte Spaltenweise
Basis-Kurs Statistik und SPSS für Mediziner 32
Qualitativ - quantitativ
Vergleich zweier Medikamente hinsichtlich Änderung des systolischen
Blutdrucks innerhalb eines Jahres bei Patienten mit Bluthochdruck:
Wenn sich der Median deutlich vom Mittelwert unterscheidet, deutet dies auf eine
schiefe Verteilung hin (u.a. keine Normalverteilung).
Analysieren Tabellen Benutzerdefinierte Tabellen
Basis-Kurs Statistik und SPSS für Mediziner 33
Qualitativ - quantitativ
ungeeignet, da viele Punkte
überdeckt werden
gut geeignet, vor allem bei wenigen
Beobachtungen
Werte werden aber zum Teil gerundet
Grafik Diagrammerstellung
Galerie Streu-
/Punktdiagramm
Grafik Diagrammerstellung
Galerie Streu-/Punktdiagramm
Punktdiagramm
Basis-Kurs Statistik und SPSS für Mediziner 34
Qualitativ - quantitativ
Boxplot: gut geeignet, etabliert,
schwierig bei sehr kleinen Fallzahlen
Fehlerbalken (MW ± 2 Stdabw.):
nur bei symmetrischen Verteilungen
geeignet
Grafik Diagrammerstellung
Galerie Boxplot
Grafik alte Dialogfelder
Fehlerbalken
Basis-Kurs Statistik und SPSS für Mediziner 35
Quantitativ – quantitativ
Grafik Diagrammerstellung Galerie
Streu-/Punktdiagramm
Beispiel: Blutdruck zu Beginn der Studie und Alter
Basis-Kurs Statistik und SPSS für Mediziner 36
Verbundene Stichproben bei quantitativen Merkmalen
Beispiel:
Untersuchung der Wirkung eines Medikaments, z.B. eines Blutdrucksenkers.
Einer Reihe von Personen wird der Blutdruck vor und nach der
Medikamenteneinnahme gemessen.
Medikamenteneinnahme
Wert vorher Wert nachher
Basis-Kurs Statistik und SPSS für Mediziner 37
Verbundene Stichproben bei quantitativen Merkmalen
Darstellung der Messwerte des Blutdrucks
vor Therapiebeginn und nach einem Jahr
Darstellung der
Differenzen
Basis-Kurs Statistik und SPSS für Mediziner 38
Bearbeitung der Daten in SPSS
Daten sortieren
Basis-Kurs Statistik und SPSS für Mediziner 39
Durch einen Rechtsklick auf die
Variable (hier ID) kann die
Sortierreihenfolge ausgewählt
werden.
Neue Variablen berechnen
Basis-Kurs Statistik und SPSS für Mediziner 40
Variablen umcodieren
Basis-Kurs Statistik und SPSS für Mediziner 41
Beispiel:
Alter in
Altersklassen
einteilen
Datensatz nach Gruppen aufteilen
Basis-Kurs Statistik und SPSS für Mediziner 42
Separate
Auswertung für
einzelne
Gruppen (z.B.
Geschlecht).
Datensatz nach Gruppen aufteilen II
Basis-Kurs Statistik und SPSS für Mediziner 43
● Gruppen vergleichen
● Ausgabe nach Gruppen
aufteilen
Verschiedene Ausgaben möglich:
Zeitdauer berechnen
Basis-Kurs Statistik und SPSS für Mediziner 44
Differenz
zwischen zwei
Datumsvariablen
berechnen
Transformieren Assistent für Datum und
Uhrzeit
Zeitdauer berechnen II
Basis-Kurs Statistik und SPSS für Mediziner 45
Zwei Datensätze zusammenfügen
Basis-Kurs Statistik und SPSS für Mediziner 46
Neue
Variablen aus
einem
anderen
Datensatz
zum
bestehenden
hinzufügen.
ACHTUNG:
Beide Datensätze
müssen
aufsteigend bzgl.
der Schlüssel-
variablen sortiert
sein.
Zwei Datensätze zusammenfügen II
Basis-Kurs Statistik und SPSS für Mediziner 47
Beobachtungen
werden hier anhand
der Patienten-ID
zugeordnet.
Zwei Datensätze zusammenfügen - Ausgabe
Basis-Kurs Statistik und SPSS für Mediziner 48
Datensatz
enthält nun
auch die
Variable
ernaehrung.
Doppelte Fälle ermitteln
Basis-Kurs Statistik und SPSS für Mediziner 49
Überprüfen, ob
Beobachtungen
bezüglich
bestimmter
Variablen
identische Werte
aufweisen um
damit doppelte
Beobachtungen
auszuschließen.
Doppelte Fälle ermitteln - Ausgabe
Basis-Kurs Statistik und SPSS für Mediziner 50
Variable
„PrimaryFirst“
indiziert erste („1“)
und weitere („0“)
Beobachtung
bzgl. der
ausgewählten
Variablen (hier
ID).
Fälle ausschließen
Basis-Kurs Statistik und SPSS für Mediziner 51
Auswahl
bestimmter
Beobachtungen
für die
Auswertung.
Beispiel: Auswahl
der ersten
Beobachtungen
(PrimaryFirst=1)
und somit
Ausschluss der
doppelten
Beobachtungen
(PrimaryFirst=0).
Fälle ausschließen - Ausgabe
Basis-Kurs Statistik und SPSS für Mediziner 52
Aus der Analyse
ausgeschlossene
Beobachtungen
werden
durchgestrichen
dargestellt.
Diese werden für
die weiteren
Auswertungen
ignoriert.
Variable als Datum definieren
Basis-Kurs Statistik und SPSS für Mediziner 53
Als Variablentyp
statt „Numerisch“,
„Datum“ und
gewünschtes
Format
auswählen.
Datumsvariable erstellen
Basis-Kurs Statistik und SPSS für Mediziner 54
Aus drei separaten
Variablen tag_0,
monat_0, jahr_0
eine Datumsvariable
erstellen
Transformieren Assistent für Datum und
Uhrzeit
Datumsvariable erstellen II
Basis-Kurs Statistik und SPSS für Mediziner 55
Basis-Kurs Statistik und SPSS für Mediziner 56
Maßzahlen im Überblick
Maßzahlen
Skalenniveau
(mindestens erforderlich) Eigenschaft
Arithmetisches Mittel metrisch - ausreißerempfindlich
- Vorsicht bei schiefen Verteilungen!
Median, Quantile ordinal - robust gegenüber Ausreißern
Modus (Ausprägung mit den
meisten Beobachtungen) nominal
- wenig Aussagekraft
- absolut unempfindlich gegenüber
Ausreißern
- Interpretationsprobleme bei
mehrgipfligen Verteilungen
Varianz, Standardabweichung metrisch - geeignet für symmetrische Verteilungen
- Maß der Streuung um den Mittelwert
Variationskoeffizient Verhältnisskala - unabhängig von Einheiten
Quartilsabstand ordinal - einfache Berechnung
- robust gegenüber Ausreißern
Spannweite metrisch - um Messintervall festzulegen
Standardfehler metrisch - Standardfehler des Mittelwerts
Basis-Kurs Statistik und SPSS für Mediziner 57
Prinzip des statistischen Testens
Basis-Kurs Statistik und SPSS für Mediziner 58
Testentscheidungen
Entscheidung bzgl. der Stichprobe
H0 beibehalten H0 verwerfen
Situation in der
Grundgesamtheit
H0 trifft zu Richtige Entscheidung Fehler 1. Art
H1 trifft zu Fehler 2. Art Richtige Entscheidung
Es kann nie nachgewiesen werden, dass die Nullhypothese zutrifft!
Alternativer Ansatz: Äquivalenztests
Die Forschungshypothese muss stets als Alternativhypothese (H1) formuliert werden.
Basis-Kurs Statistik und SPSS für Mediziner 59
p-Wert:
Ist die Wahrscheinlichkeit bei Gültigkeit der Nullhypothese, den beobachteten oder einen in Richtung der Alternative extremeren Unterschied/Effekt zu erhalten.
Signifikanzniveau α:
Zuvor spezifiziertes Level, das vom p-Wert unterschritten werden muss um die Nullhypothese abzulehnen.
Wann sollte nun die Nullhypothese abgelehnt werden?
p < α H0 ablehnen
Ist es unwahrscheinlich, den beobachteten oder einen stärkeren Effekt unter H0 zu erhalten, wird H0 zugunsten von H1 verworfen.
Der p-Wert gibt (umgangssprachlich) die Wahrscheinlichkeit (probability) an, dass der in einer Stichprobe beobachtete Unterschied rein zufällig (d.h. wenn kein Unterschied in der Grundgesamtheit vorliegt) aufgetreten sein könnte.
Entscheidungsregel
Basis-Kurs Statistik und SPSS für Mediziner 60
Der Fehler 1. Art (α-Fehler)
Die Nullhypothese wird abgelehnt, obwohl sie eigentlich gültig ist.
• Kein Gruppenunterschied in der Grundgesamtheit
• Falscher Schluss aufgrund „unglücklicher“ Stichprobe
• Meistens: α = 5% oder α = 1%
Bei α = 5% tritt dies per Definition
bei 5% aller Tests auf, bei denen es
keinen Unterschied in der
Grundgesamtheit gibt.
Die Nullhypothese wird nicht verworfen, obwohl sie nicht zutrifft.
• Tatsächlich Gruppenunterschied in der Grundgesamtheit vorhanden
• Unterschied ist anhand der Stichprobe nicht nachweisbar
• Die Wahrscheinlichkeit für den Fehler 2. Art wird durch einen statistischen Test
nicht kontrolliert (abhängig z.B. von Fallzahl) Fallzahlplanung / Power
Basis-Kurs Statistik und SPSS für Mediziner 61
Der Fehler 2. Art (β-Fehler)
Wkt. des Eintretens hängt
ab vom wahren Effekt
in der GG, der Fallzahl, …
Basis-Kurs Statistik und SPSS für Mediziner 62
Power
Die Power eines Tests gibt die Wahrscheinlichkeit an, einen in der Grundgesamtheit
vorhandenen Unterschied in einer zufälligen Stichprobe (der Größe n) statistisch
nachzuweisen.
•Je größer die Fallzahl desto höher die Power!
•Die Power kann demnach nur durch das Studiendesign (Anzahl der Patienten) beeinflusst
werden!
•Power = 1 – Fehler 2. Art
•Der Fehler 2. Art ist die Wahrscheinlichkeit, einen in der Grundgesamtheit tatsächlich
vorhandenen Unterschied mit der vorliegenden Stichprobe nicht nachzuweisen (H0 wird
beibehalten obwohl H1 wahr ist).
Basis-Kurs Statistik und SPSS für Mediziner 63
Statistische Tests
• Ein statistischer Test ist lediglich eine Entscheidungshilfe, jedoch nie ein Nach- oder
Beweis.
• Ein signifikantes Testergebnis bedeutet: wahrscheinlich nicht durch Zufall zu erklären.
• p > α bedeutet nicht, dass H0 zutrifft, sondern lediglich, dass in den Daten keine
ausreichende Evidenz gegen H0 gefunden wurde.
„Absence of evidence is not evidence of absence“ (Altman & Bland, 1995)
• Es sollte stets die klinische Relevanz der Ergebnisse beurteilt werden.
– Auch statistisch signifikante Ergebnisse können klinisch irrelevant sein.
– Vor allem bei geringer Fallzahl können nicht signifikante Ergebnisse klinisch
relevant sein.
Diese sollten entsprechend beschrieben und diskutiert werden.
Basis-Kurs Statistik und SPSS für Mediziner 64
Statistische Tests
• Nur Ergebnisse bzgl. a priori spezifizierter Hypothesen können sinnvoll interpretiert
werden
Erläuterung im Teil Studienplanung und –interpretation (2. Kurstag)
• Nur wenn ein geeigneter Hypothesentest gewählt wurde, erhält man ein unverzerrtes
Testergebnis
sorgfältige Wahl des statistischen Test (Fragestellung, Annahmen,
Voraussetzungen, …)
• Die statistischen „Standardtests“ gehen von unabhängigen Beobachtungen aus:
Unverbundene Tests: Jedes Individuum (Patient) geht nur mit einer Beobachtung in
den Test ein
Verbundene Tests: Jedes Individuum geht mit einem Paar an Beobachtungen in
den Test ein
Bei wiederholten Messungen / korrelierten Daten werden spezielle Verfahren benötigt
(z.B. GEE-Modelle, gemischte Modelle).
Basis-Kurs Statistik und SPSS für Mediziner 65
Einseitig vs. zweiseitig
zweiseitig:
H0: Parameter 1 = Parameter 2 H1: Parameter 1 Parameter 2
einseitig:
H0: Parameter 1 Parameter 2 H1: Parameter 1 > Parameter 2
Oder
H0: Parameter 1 Parameter 2 H1: Parameter 1 < Parameter 2
Es kann das Signifikanzniveau in einer vorab festgelegten Richtung ausgeschöpft werden.
Ich interessiere mich dafür, ob überhaupt ein Unterschied vorliegt.
Das Signifikanzniveau, z.B. 5%, wird auf beide möglichen Ausgänge
Parameter 1 < Parameter 2 oder Parameter 1 > Parameter 2
aufgeteilt (jeweils 2,5%).
Einseitige vs. zweiseitige Tests
Basis-Kurs Statistik und SPSS für Mediziner 66
• Der klassische Test ist immer zweiseitig. Um einseitig testen zu können, muss man im
Vorfeld klar begründen, wieso ein Effekt in die andere Richtung ausgeschlossen
werden kann.
• Bland JM, Altman DG (BMJ, 1994):
– „Two sided tests should be used unless there is a very good reason for doing
otherwise.“
– „One sided tests should never be used simply as a device to make a
conventionally non-significant difference significant.“
Basis-Kurs Statistik und SPSS für Mediziner 67
Verbunden - unverbunden
verbunden (abhängige Stichproben):
Untersuchungen am selben Kollektiv (oft: „vorher – nachher“ Situationen)
– Änderung des Blutdrucks durch Einnahme von Medikamenten
– Änderung eines Schmerzscores durch OP
– Vergleich Intima Dicke linke und rechte Seite
Oft nicht ausreichend, um z.B. einen Therapieeffekt zu beurteilen (keine Kontrolle)
unverbunden (unabhängige Stichproben):
Vergleiche von unterschiedlichen Kollektiven (Gruppenvergleiche)
– Vergleich von Rauchern und Nicht-Rauchern
– Vergleich von Männern und Frauen
– Vergleich von unterschiedlichen Therapien A, B und C
Basis-Kurs Statistik und SPSS für Mediziner 68
Parametrisch – nicht-parametrisch
Parametrische Tests
Es wird vorausgesetzt, dass die Daten einer speziellen Verteilung folgen (oft Normalverteilungsannahme)!
Bsp: t-Test, ANOVA (Varianzanalyse), Pearson Korrelationskoeffizient
Nicht parametrische Tests (verteilungsfrei)
kommen weitestgehend ohne Annahmen aus, es wird häufig mit Rangzahlen, statt den gemessenen Werten gerechnet (mindestens ordinales Skalenniveau erforderlich).
Aber: geringere Power als parametrische Verfahren (mehr Patienten notwendig)
Bsp: Mann-Whitney-U Test, Wilcoxon-Test, Spearman Korrelationskoeffizient
Basis-Kurs Statistik und SPSS für Mediziner 69
Asymptotisch - exakt
Asymptotische Tests:
Testergebnisse (p-Werte) besitzen nur Gültigkeit wenn asymptotische Annahmen (z.B.
Verteilungsannahmen) hinreichend erfüllt sind: gegeben bei großen Stichprobenzahlen
(n>30).
Geringe Abweichungen von notwendigen Verteilungsannahmen können durch Erhöhung
der Fallzahl kompensiert werden.
Bsp: Chi2-Test, z-Test
Exakte Tests:
Auch bei sehr kleinen Stichprobenumfängen gültig, bei denen Verteilungsannahmen nicht
verifiziert werden können.
Nachteil: rechenintensiv und geringere Power
Bsp: Exakter Test nach Fisher, Permutationstests
Basis-Kurs Statistik und SPSS für Mediziner 70
Übersicht über die wichtigsten Tests
Merkmale
qualitativ
quantitativ
Normalverteilung beliebige Verteilung
Unverbunden
(2 unabhängige Gruppen)
2-Test,
exakter Test nach Fisher
(=Fisher-Test)
t-Test für unverbundene
Stichproben
Mann-Whitney U Test /
Wilcoxon-Rangsummentest
Unverbunden
(3+ unabhängige Gruppen)
2-Test
Fisher-(Freeman-Halton-)Test
Einfache Varianz-
analyse Kruskal-Wallis-Test
Verbunden
(2 Messungen pro Indiv.)
Vorzeichen-Test,
McNemar-Test
t-Test für verbundene
Stichproben
Vorzeichen-Test,
Wilcoxon-Vorzeichen-Rang-Test
Verbunden
(3+ Messungen pro Indiv.)
Cochrans Q-Test
Armitage Trend-Test
Varianzanalyse für
Messwiederholungen Friedman-Test
Basis-Kurs Statistik und SPSS für Mediziner 71
Chi-Quadrat-Test, exakter Test nach Fisher
Basis-Kurs Statistik und SPSS für Mediziner 72
Chi-Quadrat-Test
Beispiel:
Besteht zwischen zwei Medikamenten ein Unterschied bzgl. der 1-Jahres-Mortalität?
(α=0,05)
Idee: Die Häufigkeit von Todesfällen beträgt insgesamt 28/313 = 9%.
Hätten beide Medikamente das gleiche Mortalitätsrisiko, wäre die erwartete Sterberate in
beiden Gruppen ebenfalls gleich 9%.
beobachtet ASPAC Heparin gesamt
gestorben 9 (5,6%) 19 (12,6%) 28 (9,0%)
nicht gestorben 153 132 285
gesamt 162 151 313
Basis-Kurs Statistik und SPSS für Mediziner 73
Chi-Quadrat-Test
beobachtet
erwartet (unter H0) ASPAC Heparin gesamt
gestorben 9
9%*162 = 14,5
19
9%*151 = 13,5 28 (9%)
nicht gestorben 153
162-14,5 = 147,5
132
151-13,5 = 137,5 285
gesamt 162 151 313
Je stärker die beobachteten Werte von den erwarteten Werten abweichen, desto mehr spricht
das für die Alternativhypothese.
Vergleich erwarteter mit beobachteten Häufigkeiten:
Basis-Kurs Statistik und SPSS für Mediziner 74
Chi-Quadrat-Test
Indikation:
• Prüfung auf Assoziation zweier Merkmale
• Vergleich der Häufigkeitsverteilung kategorialer Merkmale
bei unabhängigen Gruppen
Voraussetzungen:
• Mindestens 80% der Zellen haben eine erwartete Häufigkeit 5
• Kategoriale Variablen
Beim Vergleich von mehr als zwei Gruppen lautet die Alternativhypothese:
Mindestens eine Gruppe unterscheidet sich von mindestens einer
anderen in ihrer Häufigkeitsverteilung.
Basis-Kurs Statistik und SPSS für Mediziner 75
Exakter Test nach Fisher
Falls Voraussetzung für Chi-Quadrat-Test nicht erfüllt?
→ Exakter Test nach Fisher
• auch bei schwach besetzten Zellen gültig
• keine Verteilungsannahme (Permutationstest)
• sehr rechenintensiv (bei heutiger Rechenleistung im Regelfall
nicht relevant)
Basis-Kurs Statistik und SPSS für Mediziner 76
Exakter Test von Fisher - SPSS
Chi-Quadrat-Test: Analysieren Deskriptive Statistiken Kreuztabellen
Statistiken Chi-Quadrat auswählen
Exakter Test von Fisher: zusätzlich Exakt Exakt auswählen
Fisher Chi-Quadrat
Basis-Kurs Statistik und SPSS für Mediziner 77
Test auf Normalverteilung (?)
Basis-Kurs Statistik und SPSS für Mediziner 78
Kolmogorov-Smirnov-Test
Es sei zu testen, ob der Hämoglobingehalt im Blut bei Frauen nicht normalverteilt ist.
Die Stichprobenwerte von 10 Frauen ergaben:
12.4 11.8 12.9 12.6 13.0 12.5 12.0 11.5 13.2 12.8 [g/dl]
Nullhypothese: Die Daten folgen einer Normalverteilung.
Interpretation: Man kann nicht nachweisen, dass die Verteilung von Hämoglobin von der
Normalverteilung überzufällig abweicht.
Analysieren Deskriptive Statistiken Explorative Datenanalyse Diagramme
Normalverteilungsdiagramm mit Tests ankreuzen
Basis-Kurs Statistik und SPSS für Mediziner 79
Kolmogorov-Smirnov-Test
Dilemma:
• Geringe Power bei kleinen Fallzahlen (n<50) Abweichungen von der NV-Annahme können evtl. nicht nachgewiesen werden (p>0,05).
• Große Fallzahlen: Bereits bei geringen Abweichungen ergeben sich signifikante Unterschiede von der NV. Häufig gilt jedoch für asymptotische Testeigenschaften: Für n>30 geringe bis mäßige Abweichungen von der NV-Annahme nicht relevant
Daher (insbesondere bei kleinen Stichproben):
• grafische Verfahren verwenden (z.B. Histogramm)
• Deskriptive Faustregeln beachten (bei NV gilt):
– Mittelwert ≈ Median
– Symmetrische Abweichung von Minimum und Maximum um den Mittelwert
– Symmetrische Abweichung der Quartile um den Mittelwert
Basis-Kurs Statistik und SPSS für Mediziner 80
t-Test
Basis-Kurs Statistik und SPSS für Mediziner 81
t-Test für unverbundene Stichproben
Voraussetzung:
- Die Daten in beiden Gruppen sind normalverteilt
- Die beiden Gruppen sind unabhängig (z.B. verschiedene Patienten)
Es existieren Varianten für gleiche (klassischer t-Test) und ungleiche (Welch-Test)
Varianzen in den beiden Gruppen.
Hypothesen: H0: µ1 = µ2 die Mittelwerte in beiden Gruppen sind gleich
H1: µ1 ≠ µ2 die Mittelwerte sind unterschiedlich
Benötigt:
• Fallzahl in den beiden Gruppen (n1, n2)
• Mittelwerte in den beiden Gruppen ( , )
• Standardabweichung oder Varianz in den beiden Gruppen (s1, s2 bzw. s12, s2
2)
x y
Basis-Kurs Statistik und SPSS für Mediziner 82
t-Test für unverbundene Stichproben - Beispiel
Beispiel Hämoglobingehalt bei Männern und Frauen:
Formulierung der Hypothesen:
H0: Die Mittelwerte in beiden Gruppen sind gleich: µM = µF
H1: Die Mittelwerte in beiden Gruppen unterscheiden sich: µM µF
Festlegung der Irrtumswahrscheinlichkeit (für den Fehler 1. Art):
α= 5%
55,0;5,12;10
90,0;0,13;10
FrauenFrauenFrauen
MännerMännerMänner
sxn
sxn
Basis-Kurs Statistik und SPSS für Mediziner 83
t-Test für unverbundene Stichproben - SPSS
Analysieren Mittelwerte vergleichen T-Test bei unabhängigen Stichproben
Deskriptive Statistiken:
t-Test:
• Teststatistik (t): Differenz der Mittelwerte / Standardfehler der Differenz
• (Levene‘s Test - Test auf Gleichheit der Varianzen: p<0,05 zweite Zeile)
• Sig. (2-tailed): p-Wert
• 95%-Konfidenzintervall für Differenz der Mittelwerte (0 nicht enthalten p<0,05)
Basis-Kurs Statistik und SPSS für Mediziner 84
t-Test für verbundene Stichproben
Voraussetzungen
• Normalverteilung der Differenz der Paare
• Zu jedem Individuum existieren zwei Messungen (x und y)
Hypothesen:
H0: = 0
H1: 0
d.h. es wird getestet, ob eine signifikante Änderung der Werte
beobachtet werden kann.
Um die Wirksamkeit von Therapien zu überprüfen, ist immer eine
Kontrollgruppe nötig, da auch andere Effekte (z.B. Zeit) eine
Änderung der Werte hervorrufen können.
wobei Δ = x-y
Basis-Kurs Statistik und SPSS für Mediziner 85
t-Test für verbundene Stichproben – Beispiel
Messwerte von Materialeigenschaften eines Implantats im Rohzustand (x) und nach
Oberflächenbehandlung (y):
i xi yi i=xi-yi
1 4,0 3,0 1,0
2 3,5 3,0 0,5
3 4,1 3,8 0,3
4 5,5 2,1 3,4
5 4,6 4,9 -0,3
6 6,0 5,3 0,7
7 5,1 3,1 2,0
8 4,3 2,7 1,6
MW ( ) s
4,6 3,5 1,15 1,16
Basis-Kurs Statistik und SPSS für Mediziner 86
t-Test für verbundene Stichproben – SPSS
Deskriptive Analysen
t-Test für verbundene Stichproben
p-Wert
95%-Konfidenzintervall
für den Mittelwert der Differenz
Analysieren Mittelwerte vergleichen T-Test bei verbundenen Stichproben
Basis-Kurs Statistik und SPSS für Mediziner 87
Verbundene vs. unverbundene Stichproben
Vorteil verbundener Stichproben:
• Genauigkeitsgewinn durch Abschätzung der intra-individuellen Streuung
• Voraussetzungen schwächer: Normalverteilung für Differenz (häufig erfüllt)
Nachteil verbundener Stichproben:
• Änderungen innerhalb der Gruppe durch viele Einflüsse möglich
• Fehlende Werte bei einer Messung führen zum Ausschluss der Beobachtungseinheit
• Carry-over Effekte möglich
Basis-Kurs Statistik und SPSS für Mediziner 88
Erweiterungen des t-Tests
• Mehr als zwei Gruppen (unverbunden)
ANOVA (Varianzanalyse), einfaktoriell
• Mehr als zwei wiederholte Messungen (z.B. Zeitpunkte)
ANOVA für Messwiederholungen
• Adjustierter t-Test
ANCOVA (Kovarianzanalyse, entspricht linearer Regression)
• Quantitative Einflussgröße
Regressionsmodell
• Simultaner Einfluss mehrere Einflussgrößen
Regressionsmodell
Basis-Kurs Statistik und SPSS für Mediziner 89
Nichtparametrische Tests
Basis-Kurs Statistik und SPSS für Mediziner 90
Nichtparametrische Tests
• Nichtparametrisch = verteilungsfrei
• KEINE Normalverteilungsannahme
• Es werden keine Originaldaten verwendet, sondern deren Ränge
• Quantitative UND ordinale Merkmalstypen
• Geringere Effizienz im Vergleich zu parametrischen Verfahren
• Keine interpretierbaren Effektschätzer und Konfidenzintervalle
Basis-Kurs Statistik und SPSS für Mediziner 91
Überblick
Vorzeichen-Test Wilcoxon-Test
(Rang-Vorzeichen-Test) Friedman-Test
Mann-Whitney-U Test
/ Wilcoxon-Test (Rangsummen-Test)
Kruskal-Wallis-Test
2 Stichproben > 2 Stichproben 2 Stichproben > 2 Stichproben
verbundene
Stichproben
unverbundene
Stichproben
verteilungsfreie Verfahren
Basis-Kurs Statistik und SPSS für Mediziner 92
Mann-Whitney-U-Test / Wilcoxon-Rangsummentest
• Zwei unverbundene Stichproben
• Basierend auf Rängen
• Bei Vorliegen einer Normalverteilung:
– der t-Test hat bei gegebener Fallzahl eine (etwas) größere Power als der
Mann-Whitney-U-Test
– bzw. für den Mann-Whitney-U-Test ist eine größere Fallzahl nötig, um die
gleiche Power zu erzielen
• H0: Die Beobachtungen der Gruppe A stammen aus der gleichen Verteilung wie
die der Gruppe B (d.h. H0: P(XA > XB) = 50%).
• Bei gleicher Form der Verteilungsfunktion entspricht dies einem Test auf
Gleichheit der Mediane
• Treatment: Steroid-Behandlung bei
schwangeren Frauen
• Zielgröße: Thrombozytenzahl bei den
Neugeborenen (pro mm³)
Basis-Kurs Statistik und SPSS für Mediziner 93
Mann-Whitney-U-Test – Beispiel (Pocock)
hier: keine Normalverteilung, keine Symmetrie
Treatm ent lfd .
N r.
Throm bozyten-
zahl
R ang
1 120.000 12
2 215.000 18
3 90.000 9
4 67.000 8
5 126.000 14
6 95.000 10
7 190.000 17
8 180.000 16
9 135.000 15
m it
S tero iden
10 65.000 7
11 12.000 1
12 124.000 13
13 20.000 3
14 112.000 11
15 399.000 19
16 32.000 4
17 60.000 6
18 40.000 5
ohne
S tero ide
19 18.000 2
ja nein
Basis-Kurs Statistik und SPSS für Mediziner 94
Mann-Whitney-U-Test – SPSS
Analysieren Nichtparametrische Tests Alte Dialogfelder
Zwei unabhängige Stichproben
Bestimmung der Rangsummen
Ausgabe des p-Wertes
p-Wert
Basis-Kurs Statistik und SPSS für Mediziner 95
Vorzeichen-Test (Sign-Test)
• Zwei verbundene Stichproben
• (x1, y1), ... ,(xn, yn): gepaarte Stichprobe der Zufallsvariablen X und Y
• Annahmen
– Differenzen Di = Yi – Xi sind unabhängig
– P(Xi = Yi) = 0 (keine Bindungen)
Testproblem:
H0: P(X<Y) = P(X>Y) = 0.5 (Anteil pos./neg. Änderungen 50%)
H1: P(X<Y) ≠ P(X>Y) (Anteil pos./neg. Änderungen unausgewogen)
Basis-Kurs Statistik und SPSS für Mediziner 96
Vorzeichen-Test - Beispiel
Gewicht vor Diät Nach Diät
80
91
89
95
98
88
85
95
92
92
78
101
90
150
101
95
103
98
92
105
104
93
93
102
78
100
86
120
Delta
-21
-4
-14
-3
6
-17
-19
2
-1
-10
0
1
4
30
Ti
0
0
0
0
1
0
0
1
0
0
1
1
1
T=5
Delta: Differenz(nach-vor)
T: 1, wenn Delta>0
0, wenn Delta<0
Basis-Kurs Statistik und SPSS für Mediziner 97
Häufigkeiten
8
5
1
14
Negative Differenzen a
Positive Differenzen b
Bindungen c
Gesamt
Koerpergewicht nach
Diaet - Koerpergewicht
vor Diaet
N
Koerpergewicht nach Diaet < Koerpergewicht vor Diaeta.
Koerpergewicht nach Diaet > Koerpergewicht vor Diaetb.
Koerpergewicht nach Diaet = Koerpergewicht vor Diaetc.
Vorzeichen-Test - SPSS
Deskriptive Analysen:
Ausgabe des p-Wertes:
Statistik für Test b
,581a
,291
,157
Exakte Signifikanz
(2-seitig)
Exakte Signifikanz
(1-seitig)
Punkt-Wahrscheinlichkeit
Koerpergewi
cht nach
Diaet -
Koerpergewi
cht vor Diaet
Verwendetete Binomialverteilung.a.
Vorzeichentestb.
Analysieren Nichtparametrische Tests Alte Dialogfelder
Zwei verbundene Stichproben Vorzeichen
Basis-Kurs Statistik und SPSS für Mediziner 98
Wilcoxon-Rang-Vorzeichen-Test (signed-rank test)
• Zwei verbundene Stichproben (gepaarte Beobachtungen)
• Zusätzliche Annahme:
Verteilung der Differenzen ist stetig und symmetrisch um den Median Δmed.
• Paare mit Bindungen (xi=yi) werden im Test ignoriert
Testproblem:
H0: Δmed = 0
H1: Δmed ≠ 0
Falls Annahmen für die entsprechenden Tests erfüllt:
• t-Test für verbundene Stichproben ist effizienter als Wilcoxon-Rang-Vorzeichen-
Test
• Wilcoxon-Rang-Vorzeichen-Test ist effizienter als einfacher Vorzeichentest
Basis-Kurs Statistik und SPSS für Mediziner 99
Wilcoxon-Rang-Vorzeichen-Test - - Beispiel
Gewicht vor Diät
80
91
89
95
98
88
85
95
92
92
78
101
90
150
101
95
103
98
92
105
104
93
93
102
78
100
86
120
-21
-4
-14
-3
6
-17
-19
2
-1
-10
0
1
4
30
Nach Diät
Delta |Delta|
21
4
14
3
6
17
19
2
1
10
0
1
4
30
R(|D|)
12
5,5
9
4
7
10
11
3
1,5
8
1,5
5,5
13
T
0
0
0
0
1
0
0
1
0
0
1
1
1
Ti R(|D|)
7
3
1,5
5,5
13
W+=30
Delta: Differenz
|Delta|: Betrag der Differenz
R(|D|): Rang von |Delta|
T: 1, wenn Delta>0
0, wenn Delta<0
Ti×R(|D|): Nur Ränge für T=1
werden gezählt
W+: Summe dieser Ränge
Basis-Kurs Statistik und SPSS für Mediziner 100
Wilcoxon-Rang-Vorzeichen-Test - - SPSS
Deskriptive Statistiken
Ausgabe der Teststatistik
und des p-Wertes
Analysieren Nichtparametrische Tests Alte Dialogfelder
Zwei verbundene Stichproben Wilcoxon
Basis-Kurs Statistik und SPSS für Mediziner 101
Korrelation
Basis-Kurs Statistik und SPSS für Mediziner 102
Korrelation
Korrelationen werden berechnet, um die Stärke eines linearen
(monotonen) Zusammenhangs zwischen zwei stetigen (ordinalen)
Merkmalen X und Y zu erfassen.
Beispiele:
Es soll untersucht werden,
1. ob ein Zusammenhang zwischen Körpergröße und Gewicht besteht,
2. ob sich der Blutdruck/BMI mit dem Alter ändert,
3. ob mit einer höheren Tumorexpression auch ein schlechterer klinischer
Score einhergeht.
Basis-Kurs Statistik und SPSS für Mediziner 103
Korrelation - Beispiel
Beispiel:
Körperfettanteil, Größe, Gewicht und Hüftumfang wurden an 252 Männern erhoben. Ziel der Studie ist es, den Anteil von Körperfett durch einfach zu erhebende Surrogate möglichst genau abzuschätzen.
Basis-Kurs Statistik und SPSS für Mediziner 104
Korrelation - Beispiel
Grafik Diagrammerstellung Streu-/Punktdiagramm
Basis-Kurs Statistik und SPSS für Mediziner 105
Pearson Korrelationskoeffizient r
Voraussetzung:
• 2 normalverteilte (stetige) Variablen
• Vorsicht bei Ausreißern! r nach Spearman als robustes Maß
Eigenschaften:
• Wertebereich: –1 bis +1 (symmetrisches Maß)
• Invariant gegenüber linearen Transformationen
(z.B. egal ob Gewicht in Gramm oder Kilogramm)
Interpretation:
• Misst die Stärke des linearen Zusammenhangs
• r = -1, r = 1: perfekter linearer Zusammenhang
• r ≈ 0: kein linearer Zusammenhang
• r > 0 (r < 0): gleichsinniger (gegensinniger) Zusammenhang
Basis-Kurs Statistik und SPSS für Mediziner 106
Pearson Korrelationskoeffizient - Beispiel
Analysieren Korrelation Bivariat
Basis-Kurs Statistik und SPSS für Mediziner 107
Korrelation – Anmerkungen
Achtung! Viele verschiedene Zusammenhänge
können den gleichen Korrelations-
koeffizienten ergeben, aber trotzdem nicht
den Trend der Punktwolke widerspiegeln.
Problem:
• Es liegt kein linearer oder monotoner
Zusammenhang vor.
• Ausreißer beeinflussen das Ergebnis.
• Die Daten sind nicht normalverteilt.
Lösung:
• Korrelationskoeffizient nach Spearman
• Flexible Modellierung (Regression)
r=0,8
Basis-Kurs Statistik und SPSS für Mediziner 108
Korrelationskoeffizient nach Spearman
Voraussetzung:
• mind. ordinalskalierte Merkmale
Eigenschaften:
• Basiert auf Rängen
• Robust gegenüber Ausreißern
Interpretation:
• Maß für monotonen Zusammenhang
• Berechnung, Interpretation und Auswertung äquivalent zu Pearson
Korrelationskoeffizient.
Analysieren Korrelation Bivariat Spearman
Basis-Kurs Statistik und SPSS für Mediziner 109
Stärke des Zusammenhangs
Ausmaß des Korrelationskoeffizienten:
0.00 bis 0.19 kein / sehr schwacher
0.20 bis 0.39 schwacher
Wenn |r| 0.40 bis 0.69 moderater Zusammenhang
0.70 bis 0.89 starker
0.90 bis 1.00 sehr starker
Signifikanz des Korrelationskoeffizienten:
Beurteilung zum Signifikanzniveau α (meist α = 0,05)
Warnung:
Tests dürfen in explorativen Studien nur als hypothesengenerierend verstanden werden. Für konfirmatorische Aussagen ist eine Korrektur für multiples Testen erforderlich.
Basis-Kurs Statistik und SPSS für Mediziner 110
Korrelation – Anmerkungen
• Korrelationskoeffizienten sind nicht anwendbar für nominale Variablen, auch wenn diese als Zahlen kodiert sind
• Korrelation ≠ Kausalität
• Bei komplexen Zusammenhängen folgt aus r = 0 nicht immer Unabhängigkeit der Variablen (z.B. U-förmiger Zusammenhang).
• Der Begriff „Korrelation“ wird in der Statistik nicht allgemein für alle Arten von Assoziationstests verwendet.
• Wichtig: Betrag des Koeffizienten und p-Wert sind gemeinsam zu interpretieren, denn:
– Bei großem n sind auch kleine r signifikant von 0 verschieden.
– Bei kleinem n können auch große r nicht signifikant sein.
Basis-Kurs Statistik und SPSS für Mediziner 111
Regression
Basis-Kurs Statistik und SPSS für Mediziner 112
Einfache lineare Regression
Die Geradengleichung y = a + bx stellt dabei die Regressionsgleichung dar.
b quantifiziert den Zusammenhang zwischen Y und X.
b
1
b = Anstieg/Slope
(Zu-/Abnahme von Y, wenn X um eine Einheit ansteigt)
a
a = Konstante/Intercept
(Schnittpunkt der Regressionsgeraden mit y-Achse
bzw. y-Wert der Regressionsgeraden bei x=0)
y = vorhergesagter Y Wert ^
^
= Abweichung/Residuum: Die Parameter a und b werden so
bestimmt, dass die Summe der quadrierten Abweichungen
minimal wird „Kleinste Quadrate Schätzer“.
Basis-Kurs Statistik und SPSS für Mediziner 113
Einfache lineare Regression – Beispiel
Annahme:
Körperfett steht in einer linearen
Beziehung zum Brustumfang.
Allgemeine Form der Geradengleichung:
Geschätzter Körperfettanteil = a + b · Brustumfang
Basis-Kurs Statistik und SPSS für Mediziner 114
Einfache lineare Regression – SPSS
Grafik: Grafik Diagrammerstellung Streu-/Punktdiagramm
Regressionsgreade: Doppelklick auf Grafik Elemente Anpassungslinie bei
Gesamtsumme
Basis-Kurs Statistik und SPSS für Mediziner 115
Einfache lineare Regression – SPSS
Analysieren Regression Linear
Steigung (= b)
Konstante (= a)
Zielgröße Y
Geschätzter Körperfettanteil = -51,172 + 0,697·Brustumfang
Die Nullhypothese H0: b = 0, d.h.
„kein Zusammenhang“, kann auf
dem 5%-Signifikanzniveau
abgelehnt werden.
Basis-Kurs Statistik und SPSS für Mediziner 116
Einfache lineare Regression – Beispiel
Die aus den Daten geschätzte Regressionsgleichung kann benutzt werden, um
Körperfett bei Männern abzuschätzen.
z. B. für einen Mann mit 100 cm Brustumfang ergibt sich
Geschätzter Körperfettanteil = -51,172 + 0,697·100 [cm]
= 0,185
= 18,5%
Basis-Kurs Statistik und SPSS für Mediziner 117
Multiple lineare Regression
In einer multiplen Regression lassen sich die Effekte mehrerer Variablen simultan
bestimmen.
• Allgemeine Form der Geraden, um Körperfett aus mehreren Einflussgrößen zu
bestimmen:
Körperfett = b0 + b1·Brustumfang + b2·Übergewicht + b3·Adipositas
• Berechnung der Regressionskoeffizienten auf Basis der Daten ergibt:
Körperfett = -31,454 + 0,480·Brustumfang + 3,864·Übergewicht + 6,290·Adipositas
Basis-Kurs Statistik und SPSS für Mediziner 118
Multiple lineare Regression – Interpretation
Körperfett = -31,454 + 0,480·Brustumfang + 3,864·Übergewicht + 6,290·Adipositas
• Eine (theoretische) Person mit Brustumfang von 0 cm und BMI im
Normalbereich hätte einen erwarteten Körperfettanteil von -31,45%
• Ein normalgewichtiger Mann mit einem Brustumfang von 100 cm hat einen
erwarteten/vorhergesagten Körperfettanteil von -31,454 + 0,480·100 = 8,55%
• Im Vergleich dazu hat ein adipöser Mann mit gleichem Brustumfang einen
vorhergesagten Körperfettanteil von -31,454 + 0,480·100 + 6,290 = 14,84%
Basis-Kurs Statistik und SPSS für Mediziner 119
Gütemaß
Wie gut beschreibt die Regressionsgerade die Daten?
Wie genau kann die abhängige Größe durch das Modell vorhergesagt
werden?
Bestimmtheitsmaß (R2)
Interpretation:
R² gibt an, wie viel Prozent der Streuung der abhängigen Variablen Y durch
die Regressionsgerade erklärt werden kann. Es entspricht in der einfachen
linearen Regression mit einer stetigen Einflussgröße dem quadrierten Pearson
Korrelationskoeffizienten.
Wertebereich: 0 bis 1
Basis-Kurs Statistik und SPSS für Mediziner 120
Gütemaß – SPSS
Modell I: Einflussgröße nur Brustumfang R2 = 0,494
Modell II: Einflussgrößen Brustumfang, Übergewicht, Adipositas R2 = 0,519
Basis-Kurs Statistik und SPSS für Mediziner 121
Lineare Regression: Annahmen
Voraussetzungen für die Durchführung einer linearen Regression:
Die Residuen müssen normalverteilt sein (nicht die Zielgröße) ( Histogramm
der Residuen)
Analysieren Regression linear
Diagramme unter Diagramme der
standardisierten Residuen Haken setzen
bei „Histogramm“
Basis-Kurs Statistik und SPSS für Mediziner 122
Analyse von Überlebenszeiten
Basis-Kurs Statistik und SPSS für Mediziner 123
Typische Beispiele und Problemstellung
• Überlebenszeit oder 1, 2, 3, ... Jahres-Überlebensrate - von Krebspatienten - nach Transplantationen
• Dauer bis zur Schmerzfreiheit nach Knieoperation
• Unterscheiden sich 2 oder mehr Gruppen hinsichtlich der Überlebenszeit?
Überlebenszeit: Zeitspanne T bis zum Eintreten eines bestimmten Ereignisses
Probleme: Ereigniszeiten unvollständig beobachtet
Zensierungsproblematik
z.B. Nachbeobachtungsperioden unterschiedlich lang, manche Patienten scheiden während der Studie aus
Ereignis: Tod, Rezidiv, Remission, ...
Basis-Kurs Statistik und SPSS für Mediziner 124
Beobachtungsmuster
Basis-Kurs Statistik und SPSS für Mediziner 125
Kaplan-Meier-Schätzer
Basis-Kurs Statistik und SPSS für Mediziner 126
Kaplan-Meier-Schätzer
* lebend zum letzten Beobachtungszeitpunkt § Lost to follow up (Studienabbruch)
Überlebenszeiten (in Monaten) von 30 Patienten in einer randomisierten Studie
Therapie vs. Placebo:
Frage: Wie groß ist die
Überlebenswahrscheinlichkeit in
den beiden Gruppen?
Problem:
Zensierungen/unterschiedlich
lange Beobachtungsdauern
Lösung: Kaplan-Meier-Schätzer
Therapie
(n=15)
Placebo
(n=15)
5 143 2 63
12 145* 4 71
56§ 146* 7 90*
68 148 22 100
89 162* 28 146*
96 168* 32 167*
128* 181* 40 182*
141* 54
Basis-Kurs Statistik und SPSS für Mediziner 127
Kaplan-Meier-Schätzer
Idee:
1. Sortieren der Daten nach Ereigniszeiten. Die Ereignisse geben
Beobachtungsintervalle vor.
2. Bestimmung der Personen unter Risiko zu jedem Zeitpunkt: Personen, die
bis unmittelbar vor dem Zeitpunkt gelebt haben und Personen, die
irgendwann nach diesem Zeitpunkt zensiert wurden.
3. Für jedes Zeitintervall Berechnung der (bedingten) Wahrscheinlichkeit, dass
jemand, der bis zu Beginn des Intervalls gelebt hat, bis zum Ende des
Intervalls überleben wird.
4. Berechnung der Überlebenswahrscheinlichkeit zu jedem Zeitpunkt als
Produkt der bedingten Wahrscheinlichkeiten, jedes Zeitintervall zu
überleben.
Basis-Kurs Statistik und SPSS für Mediziner 128
Kaplan-Meier-Schätzer - Beispiel
Zeit-
punkt
Patienten
unter
Risiko
Anzahl
Ereignisse
Wahrscheinlichkeit,
Intervall
zu überleben
Kumulierte
Überlebenswahrscheinlichkeit
5 15 1 14/15 14/15
12 14 1 13/14 14/15 13/14
56§ 13 0
68 12 1 11/12 14/15 13/14 11/12
89 11 1 10/11 14/15 13/14 11/12 10/11
… … … … …
Berechnung am Beispiel Therapiegruppe
Basis-Kurs Statistik und SPSS für Mediziner 129
Kaplan-Meier-Schätzung - SPSS
Analysieren Überleben
Kaplan-Meier
Basis-Kurs Statistik und SPSS für Mediziner 130
Kaplan-Meier-Kurve
Analysieren Überleben
Kaplan-Meier Optionen
unter Diagramme „Überleben“
auswählen
Beispiel: Medianes Überleben
Basis-Kurs Statistik und SPSS für Mediziner 131
Kaplan-Meier-Kurve
Beispiel: 10 Jahres Überleben
Basis-Kurs Statistik und SPSS für Mediziner 131
Basis-Kurs Statistik und SPSS für Mediziner 132
Log-rank Test
Basis-Kurs Statistik und SPSS für Mediziner 133
Log-rank Test
Statistische Hypothesen:
• H0: kein Unterschied in der Verteilung der Überlebenszeiten zwischen
Placebo und Therapiegruppe, d.h.
Todesfälle treten in zufälliger Reihenfolge unabhängig von der
Gruppenzugehörigkeit auf
• H1: Unterschied in der Verteilung der Überlebenszeiten zwischen Placebo und
Therapiegruppe, d.h.
Todesfälle treten in einer Gruppe früher als in der anderen Gruppe auf
Voraussetzung:
Kaplan-Meier-Kurven sollten sich nicht überschneiden
Basis-Kurs Statistik und SPSS für Mediziner 134
Log-rank Test
Idee:
1. Bestimmung der beobachteten Anzahl an Todesfällen in beiden Gruppen
(beobachtete Ereignisse zum Ereigniszeitpunkt tj in den beiden Gruppen: dAj und dBj).
2. Berechnung der unter H0 erwarteten Anzahl von Todesfällen in beiden
Gruppen zu den einzelnen Zeitpunkten tj (E(dAj), E(dBj))
3. Vergleich der beobachteten und erwarteten Anzahlen an Ereignissen einer
Gruppe mittels der Log-rank-Teststatistik:
Bei hinreichend großer Zahl der Ereignisse ist LR annähernd χ2-verteilt.
Faustregel: insgesamt mindestens 30 Ereignisse über beide Gruppen
)( )]([
2
UVar
ULRdEdU
Aj
j
Aj
Basis-Kurs Statistik und SPSS für Mediziner 135
Log-rank Test -- Beispiel
Analysieren Überleben
Kaplan-Meier
Faktor vergleichen
unter Teststatistiken
„Log-Rang“ auswählen
Basis-Kurs Statistik und SPSS für Mediziner 136
Log-rank Test Cox-Regression
Grenzen des Log-rank-Tests:
• Reiner Signifikanztest
liefert keine Effektgrößen
• Lediglich Gruppenvergleiche möglich
(nur eine binäre bzw. kategoriale Einflussgröße)
Cox-Regression „erweitert“ den Log-rank-Test
• Simultaner Effekt mehrerer Einflussgrößen
• Metrische Einflussgrößen
• Adjustierter Gruppenvergleich
• Hazard Ratio als Effektmaß
Basis-Kurs Statistik und SPSS für Mediziner 137
Cox-Regression
Basis-Kurs Statistik und SPSS für Mediziner 138
Cox-Regression - Hazardfunktion
Zielgröße in der Cox-Regression: Hazardrate (Risikofunktion) h(t):
h(t) beschreibt die infinitesimale Wahrscheinlichkeit für ein Ereignis zum Zeitpunkt t,
gegeben das Ereignis ist vor Zeitpunkt t noch nicht eingetreten,
d.h. die Wahrscheinlichkeit, wenn ein Patient bis t überlebt hat, dass er unmittelbar
zum Zeitpunkt t verstirbt.
t
tTttTtPth
t
)|(lim)(
0
Basis-Kurs Statistik und SPSS für Mediziner 139
Cox-Regression (proportional hazards model)
Cox-Modell:
)Xβ...XβXexp( β(t)hh(t)mm22110
Voraussetzung:
Proportionale Hazardraten, d.h. Effekte verschiedener Variablen auf das Überleben
sind über die Zeit konstant!
Basis-Kurs Statistik und SPSS für Mediziner 140
Cox-Regression
h(t): Hazardrate
h0(t): unspezifizierter Baseline-Hazard (beschreibt das Risiko, wenn alle Einflussgrößen gleich 0 sind)
X1,…,Xm: Werte der Einflussgrößen
β1,...,βm: Regressionskoeffizienten
)Xβ...XβXexp( β(t)hh(t)mm22110
Basis-Kurs Statistik und SPSS für Mediziner 141
Cox Regression – Hazard Ratio
• Zwei-Gruppen-Fall (0 vs. 1): HR=exp(β)
Risikoverhältnis zwischen den beiden Gruppen
• Gruppenunterschied von primärem Interesse, weitere Einflussgrößen als
adjustierende Variablen
adjustiertes Risikoverhältnis zwischen den Gruppen
• Stetige Einflussgröße
exp(β) beschreibt die relative Änderung des Risikos bei Änderung
der Einflussgröße um eine Einheit
z.B. exp(ß) = 1.12 Risikoanstieg von 12%
exp(ß) = 0.80 Risikoreduktion um 20%
exp(ß) = 1 kein Risikounterschied
Basis-Kurs Statistik und SPSS für Mediziner 142
Cox-Regression – Beispiel
• Randomisierte Studie mit 158 Patienten (74 mit Standardtherapie, 84 mit neuer Therapie)
• Weitere Einflussgrößen:
– Alter
– Geschlecht (1=männlich, 0=weiblich)
– Score für Gesundheitszustand (0 bis 100, hohe Werte sprechen für guten Zustand)
• Endpunkt: Zeit bis zum Tod / bis Zensierung
• Status (0=zensiert, 1=Ereignis)
ID Beobachtete Zeit Status Therapie Geschlecht Alter Score
1 17 0 0 0 39 14
2 8 1 0 1 46 84
3 41 0 1 1 61 67
4 6 0 0 0 34 8
5 45 1 0 0 25 99
6 8 1 0 1 35 2
7 8 1 1 0 48 58
8 20 1 1 1 46 43
9 3 1 1 0 41 26
Basis-Kurs Statistik und SPSS für Mediziner 143
Cox-Regression - SPSS
• Variablen für Überlebenszeit und Status sowie Einflussgrößen definieren
• Output:
B: Regressionskoeffizient
Exp(B): geschätztes Risikoverhältnis
CI for Exp(B): Konfidenzintervall für das Risikoverhältnis
Sig.: p-Wert
Analysieren Überleben Cox-Regression (bei Optionen „Konfidenzintervall für
Exp(B)“ markieren)
Basis-Kurs Statistik und SPSS für Mediziner 144
Cox- Regression - SPSS
• In den beobachteten Daten führt die neue Therapie zu einer Verringerung des Risikos
(B<0 bzw. Exp(B)<1)
• Risikoverhältnis (=HR) beträgt 0,556 Das Risiko unter der neuen Therapie beträgt das
0,556-fache des Risikos unter der Standardtherapie
• Verringerung des Risikos ist signifikant (p-Wert<0,05 / HR von 1 ist nicht im
Konfidenzintervall enthalten)
• Kein signifikanter Alters- und Geschlechtseffekt
• Signifikanter Einfluss des Scores. Ein Unterschied von einem Punkt spricht für eine
Risikoänderung um den Faktor 0,987
• Ein Unterschied von 10 Scorepunkten führt zu einer Risikoreduktion auf das 0,878-fache:
exp(10·β) = exp(10 ·(-0,013)) = 0,878
Basis-Kurs Statistik und SPSS für Mediziner 145
Publikation der Ergebnisse
Basis-Kurs Statistik und SPSS für Mediziner 146
Publikation der Ergebnisse: Formulierungsfallen I
Häufige Fehlerquellen:
„..age was significant in patient groups (p=0.021)“
das Wort signifikant darf nie alleine stehen, es bezieht sich immer auf einen Unterschied oder einen Zusammenhang, der mit Hilfe eines statistischen Tests auf Zufälligkeit geprüft wurde.
„..age was significantly different in both patient groups (p=0.021)“
auch die Richtung des Unterschiedes sollte erwähnt werden. In diesem Fall: Welche Gruppe war denn älter?
besser: „ … age was significantly higher in group A compared to group B (mean difference: 4 , 95% confidence interval (1.7 – 6.3), p=0.021)“
Das Wort „signifikant“ sollte nur dann verwendet werden, wenn wirklich „statistische Signifikanz“ gemeint ist – nicht klinische Relevanz!
Basis-Kurs Statistik und SPSS für Mediziner 147
Publikation der Ergebnisse: Formulierungsfallen II
„..there was no difference between patient groups..“
Nur weil ein Unterschied statistisch nicht nachgewiesen werden konnte,
bedeutet dies noch lange nicht, dass tatsächlich kein Unterschied besteht.
„..there was no significant difference between patient groups..“
besser: oder
„..patient groups were similar with regard to…“
„..there was a trend towards significantly higher values…
Ein „Trend“ impliziert stets eine zeitliche Entwicklung, hier eher
von einer „Tendenz“ sprechen und auf „significant“ verzichten:
„..there was a tendency to higher values …
Bitte niemals Phrasen wie: „marginally / slightly significant“ benutzen, wenn p
Basis-Kurs Statistik und SPSS für Mediziner 148
Publikation der Ergebnisse
• Auch bei nicht signifikanten Ergebnissen p-Werte berichten
• Signifikante p-Werte hinreichend genau wiedergegeben (nicht nur p<0.05)
• Mehr als 3 bzw. 4 Nachkommastellen sollten vermieden werden
• Für sehr kleine p-Werte (z.B. 0.0000453) schreibt man p<0.001
• Statistische Tests bzgl. sekundärer Studienendpunkte sollten als „explorative
Analysen“ deklariert werden (multiples Testen)
• Wirklicher Nachweis von Signifikanz nur für primäre Endpunkte möglich
• Aus p>0,05 darf niemals Gleichheit der Gruppen bzw. kein Effekt
geschlossen werden
• Es sollte immer auch die klinische Relevanz der Ergebnisse beurteilt werden
Basis-Kurs Statistik und SPSS für Mediziner 149
Empfehlenswerte Literatur
• Beck-Bornholt, Dubben: Der Hund der Eier legt – Erkennen von Fehlinformation
durch Querdenken, rororo, 2001
• Bland: An Introduction to Medical Statistics, Oxford Medical Publications, 2000
• Büning, Trenkler: Nichtparametrische statistische Methoden, de Gruyter, 1978
• Campbell, Machin: Medical Statistics – a commonsense approach, Wiley 1999
• Fahrmeir, Künstler, Pigeot, Tutz: Statistik – Der Weg zur Datenanalyse,
Springer Verlag, 2., verb. Aufl., 1999
• Harms: Biomathematik, Statistik und Dokumentation, Harms Verlag Kiel, 6.,
neub. Auflage
• Pocock: Clinical Trials – A practical approach, Wiley, 1983
• Schumacher, Schlugen: Methodik klinischer Studien. Springer Verlag 2008
Basis-Kurs Statistik und SPSS für Mediziner 150
Empfehlenswerte Literatur
• Machin, Campbell, Fayers, Pinol: „Sample Size Tables for Clinical Studies“
• Fowler J., Cohen L., Jarvis P.: „Practical Statistics for field Biology“
• Sachs L.: „Angewandte Statistik“
• Weiß C.: „Basiswissen medizinische Statistik“
• Diem K. & Lentner C.: Documenta Geigy – „Wissenschaftliche Tabellen“
• Cummings, Arch Pediatr Adolesc MED / VOL 157 2003:
„Reporting Statistical Information in Medical Journal Articles “
• Bender R. Dtsch. Med. Wschr. 2007; 132 (S 01), e1-e73
top related