vorlesung biometrie für studierende der veterinärmedizin 8.2.2007 wiederholung und beispiele
TRANSCRIPT
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Wiederholung und Beispiele
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Biologische Variabilität
• In der belebten Natur gibt es viele Phänomene, die im Einzelfall nicht vorhersehbar sind.
• Verschiedene Menschen und Tiere reagieren verschieden, haben verschiedene Eigenschaften etc.
• Unter exakt gleichen Haltungsbedingungen werden manche Tiere krank, manche bleiben gesund.
• Manche Individuen reagieren auf ein Medikament, manche nicht.
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Biologische Variabilität (2)
Einerseits:• Besonderer Reiz von Phänomenen in der belebten Natur• Weiterentwicklung ohne natürliche Variabilität nicht
möglich
Andererseits:• Erkenntnisse zu gewinnen ist wesentlich schwieriger• Wirkungsmechanismen häufig nicht deterministisch• Absolute Sicherheit bei Prognosen in Einzelfällen oft
unmöglich
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Modell für biologische Variabilität: Wahrscheinlichkeitsrechnung
Aussagen der Form:• „Die Heilungschance ist mit Medikament A
höher als mit Medikament B“• „Nebenwirkungen des Medikaments treten in
1 von 1000 Fällen auf“• „Die Herzfrequenz ist bei schweren
Leguanen im Durchschnitt höher“• „Die Herzfrequenz von gesunden Leguanen
liegt mit einer Wahrscheinlichkeit von 99% unter dem Wert x“
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Wichtige Rechenregeln für Wahrscheinlichkeiten
Gegenereignis: P(AC) = 1- P(A)
Additionssatz : P(A B) = P(A) + P(B) - P(A B) P(A B) = P(A) + P(B) - P(A B)
eispielA = {2,4,6} „gerade“ B = {4,5,6} „groß“A B = {2,4,5,6} „groß oder gerade“ A B = {4,6} „ groß und gerade “
P(A B ) = 4/6 P(A) + P(B) - P(A B) = 3/6+3/6-2/6
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Definition der bedingten Wahrscheinlichkeit
In dem Beispiel betrachten wir das Risiko gegeben „schwerer Fall“: Das Risiko wird berechnet durch
)(
)(
schwerAnzahl
überlebtnichtundschwerAnzahl
)(
)(:)|(
AP
BAPABP
Allgemein definieren wir die Wahrscheinlichkeit von„Ereignis B gegeben A“
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Definition stochastische Unabhängigkeit
)()()(
)()|(
)()|(
BPAPBAP
APBAP
BPABP
Zwei Ereignisse A und B heißen unabhängig, falls gilt:
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Bedingte Wahrscheinlichkeiten
SZ vom 8.2.: Krebshäufigkeit gestiegen Aber: Alterspezifische Krebsraten gefallen Hypothetisches Beispiel:
1960:Jung: 2% Alt : 10% Anteil Jung und Alt jeweils 50% Daraus Gesamtrate 0.5*2%+0.5*10% = 6%
2006: Jung : 1%Alt : 9%Anteil Alt 2/3 Jung 1/3Gesamt: 2/3*9% + 1/3*1% = 6.33%
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Fehlspezifikationswahrscheinlichkeiten
(bedingte) Klassifikationswahrscheinlichkeiten
Diagnose:
Klassifikation
wahrer Status
positiv negativ
positiv
negativ
Sensitivität
Empfindlichkeit
P(T+|K+)
Spezifität
Treffsicherheit
P(T-|K-)
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Medizinische Tests
10 Erkrankt
Personen
Gesund
9 Test P 1 Test N 10 Test P 980 Test N
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Alte Klausur
• Aufgabe 2• Bei einer Krankheit sei bekannt, dass die
Prävalenz bei 10% liegt. Zur Diagnose wird ein Test mit einer Sensitivität von 0.9 und einer Spezifität von 0.8 benutzt.
• Wie groß ist die Wahrscheinlichkeit, dass ein positiv getestetes Tier die Krankheit tatsächlich hat.
• Wie groß ist die Wahrscheinlichkeit, dass ein gesund getestetes Tier tatsächlich gesund ist?
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Lösung
100 Erkrankt
Tiere
Gesund
90 Test P 10 Test N 180 Test P 720 Test N
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Binomialverteilung: Definition
mnm PPm
nmXP
)1()(
Die Zufallsvariable der Summe aus n unabhängigen
0-1-Variablen , heißt binomial-verteilt mit
Parametern n und P, kurz X~Bin(n, P)
Es gilt
n
iiXX
1
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Schwankungsbereiche der Normalverteilung
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Der Median
50% der Daten sind kleiner oder gleich med
50% der Daten sind größer oder gleich med
Zahlganzen
kfallsxx
Zahlganzen
kfallsx
hk
k
2)(
2
12
1
)1()(
)(
)()1( nxx
med =
sind geordnete Werte
Definition: Wert für den gilt
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Das Quantil (Perzentil)
Anteil p der Daten sind kleiner oder gleich xp
Anteil 1-p der Daten sind größer oder gleich xp
Zahlganzenpkfallsxx
nphlkleinsteZakundZahlganzekeinenpfallsx
hk
k
)(2
1 )1()(
)(
Definition: Wert für den gilt
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Das Histogramm
Darstellung der relativen Häufigkeiten durch Flächen
(Prinzip der Flächentreue)
Vorgehen:
1. Aufteilung in Klassen (falls die Daten noch nicht gruppiert sind)
2. Bestimmung der relative Häufigkeiten
3. Bestimmung der Höhen hi , so dass gilt:
wobei bi: Breite der Klasse i.iii fhb
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Boxplot
Beispiel: Hämatokrit bei Mastenten
Maximum75%-QuantilMedian25%-Quantil
Ausreißer
ExtremwerteMinimum
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Boxplot
1. x0.25 = Anfang der Schachtel (Box)x0.75 = Ende der Schachteld = Länge der Schachtel
2. Der Median wird durch den Strich in der Box markiert3. Zwei Linien („whiskers“) außerhalb der Box gehen bis zu xmin und
xmax.
Modifizierter BoxplotDie Linien außerhalb der Schachtel werden nur bis zu xmin bzw. xmax gezogen, falls xmin und xmax innerhalb des Bereichs [zu,zo] der Zäune liegen. zu = x0.25 +1.5d ,zo x= x0.75 +1.5d
Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert innerhalb der Zäune, die außerhalb liegenden Werte werden individuell eingezeichnet.
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Der Mittelwert (arithmetisches Mittel)
n
inx
1
1
• bekanntestes Lagemaß
• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten
ix
Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007
Standardabweichung
Definition:
2
22 )(1
1
SS
xxn
S i
• „Mittlere Abweichung vom Mittelwert“• Manchmal auch 1/n statt 1/(n-1)• Intervallskala Voraussetzung