Simultane Konfidenzintervalle
Werner Brannath
VO Biostatistik im WS 2006/2007
Inhalt
Konfidenzintervall für einzelnen Kontrast
Simultane KonfidenzintervalleDefinitionBonferroni MethodeScheffé MethodeTukey MethodeDunnett Methode
Konfidenzintervall für einzelnen Kontrast
k Gruppen mit EW-Vektor µ = (µ1, . . . , µk ) und Varianz σ2
y = (y1, . . . , yk ) Gruppenmittelwerte
c = (c1, . . . , ck ) mit c1 + · · · ck = 0 ein Kontrast.
Parameter c · µ =∑k
i=1 ci · µi hat Schätzer c · y =∑k
i=1 ci · yi
c · y ∼ N(c · µ, σ2 ·k∑
i=1
c2i
ni)
⇒
c · y − c · µ ∼ N(0, σ2 ·k∑
i=1
c2i
ni)
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
(c · y − δ)2 < d2α · (
k∑i=1
c2i
ni) ·
k∑i=1
ni∑j=1
(yij − yi)2/(N − k)
︸ ︷︷ ︸=s2
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
(c · y − δ)2 < d2α · (
k∑i=1
c2i
ni) · s2
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
|c · y − δ| < dα ·
√√√√ k∑i=1
c2i
ni· s
Test für Hδ0 : c · µ = δ
Wenn c · µ = δ:
T 2c (δ) =
(c · y − δ)2/∑k
i=1c2
ini
)∑ki=1∑ni
j=1(yij − yi)2/(N − k)∼ F1,N−k
Verwerfen Hδ0 : c · µ = δ falls T 2
c (δ) ≥ d2α = QF
1,N−k (1− α)
Akzeptanz von Hδ0 ist gleichbedeutend mit
c · y − dα ·
√√√√ k∑i=1
c2i
ni· s < δ < c · y + dα ·
√√√√ k∑i=1
c2i
ni· s
Konfidenzintervall für einzelnen Kontrast
(1− α)-Konfidenzintervall für einzelnen Kontrast
CI =
c · y − dα ·
√√√√ k∑i=1
c2i
ni· s , c · y + dα ·
√√√√ k∑i=1
c2i
ni· s
Überdeckungswahrscheinlichkeit
P(c · µ ∈ CI ) = P(T 2c (c · µ) < d2
α) = 1− α
Konfidenzintervall für einzelnen Kontrast
(1− α)-Konfidenzintervall für einzelnen Kontrast
CI =
c · y − dα ·
√√√√ k∑i=1
c2i
ni· s , c · y + dα ·
√√√√ k∑i=1
c2i
ni· s
Überdeckungswahrscheinlichkeit
P(c · µ ∈ CI ) = P(T 2c (c · µ) < d2
α) = 1− α
Konfidenzintervall für einzelnen Gruppenvergleich
(1− α)-Konfidenintervall für µi − µj :
CI =
(yi − yj − dα ·
√1ni
+1nj· s , yi − yj + dα ·
√1ni
+1nj· s
)
Überdeckungswahrscheinlichkeit
P(µi − µj ∈ CI ) = P(T 2ij (µi − µj) < d2
α) = 1− α
Konfidenzintervall für einzelnen Gruppenvergleich
(1− α)-Konfidenintervall für µi − µj :
CI =
(yi − yj − dα ·
√1ni
+1nj· s , yi − yj + dα ·
√1ni
+1nj· s
)
Überdeckungswahrscheinlichkeit
P(µi − µj ∈ CI ) = P(T 2ij (µi − µj) < d2
α) = 1− α
Simultane Konfidenzintervalle
Untersuchen m Kontraste gleichzeitig
c(j) = (c(j),1, . . . , c(j),k ), j = 1, . . . , m
Wollen m Konfidenzintervalle CI1, . . . , CIm berechnen,
so dass simultane Überdeckungswahrscheinlichkeit
P(c(j) · µ ∈ CIj für ALLE i = 1, . . . , m
)≥ 1− α
Bonferroni Methode
Bonferroni-TestsTesten der Nullhypothesen
Hδjj,0 : c(j) · µj = δj , j = 1, . . . , k
mit Kontrasttests auf dem Niveau α/m
D.h., wir verwerfen H(j)0 wenn
T 2c(j)(δj) =
(c(j) · y − δj)2
s2 · (∑k
i=1 c2(j),i/ni)
≥ (dBonferroniα )2
mit dBonferroniα =
√QF
1,N−k (1− α/m)
Bonferroni Methode
Bonferroni-TestsTesten der Nullhypothesen
Hδjj,0 : c(j) · µj = δj , j = 1, . . . , k
mit Kontrasttests auf dem Niveau α/m
D.h., wir verwerfen H(j)0 wenn
T 2c(j)(δj) =
(c(j) · y − δj)2
s2 · (∑k
i=1 c2(j),i/ni)
≥ (dBonferroniα )2
mit dBonferroniα =
√QF
1,N−k (1− α/m)
Bonferroni Methode
Bonferroni-TestsTesten der Nullhypothesen
Hδjj,0 : c(j) · µj = δj , j = 1, . . . , k
mit Kontrasttests auf dem Niveau α/m
D.h., wir verwerfen H(j)0 wenn
T 2c(j)(δj) =
(c(j) · y − δj)2
s2 · (∑k
i=1 c2(j),i/ni)
≥ (dBonferroniα )2
mit dBonferroniα =
√QF
1,N−k (1− α/m)
Bonferroni-Konfidenzintervalle
Bonferroni-KonfidenzintervalleDie Intervalle
CIBonferronij =
c(j) · y ± dBonferroniα · s ·
√√√√ k∑i=1
c2(j),i
ni
haben simultane Überdeckungswahrscheinlichkeit ≥ 1− α, d.h.
P(
c(j) · µ ∈ CIBonferronij für alle j
)≥ 1− α
Beispieldatensatz ’cholesterol’
Datensatz cholesterol im R-Package multcomp:
Vergleich von 5 Behandlungen zur Cholesterol-Reduktionin randomisierter Studie mit 10 Patienten pro Gruppe (N=50)
I Gruppe 1: Neues Medikament, 1 mal 20 mg pro TagI Gruppe 2: Neues Medikament, 2 mal 10 mg pro TagI Gruppe 3: Neues Medikament, 4 mal 5 mg pro TagI Gruppe 4: Kontrollmedikament DI Gruppe 5: Kontrollmedikament E.
Insgesamt 5 ∗ 4/2 = 10 Gruppenvergleiche.
Bonferroni Methode – Beispiel ’Cholesterol’
Gruppenmittelwerte
> mws <- tapply(cholesterol$response,cholesterol$trt,mean)> mws1time 2times 4times drugD drugE
5.78 9.22 12.37 15.36 20.95
Standardabweichungen innerhalb der Gruppen
> sds <- tapply(cholesterol$response,cholesterol$trt,sd)> sds1time 2times 4times drugD drugE2.88 3.48 2.92 3.45 3.35
Gemeinsame Varianz
> gvar <- mean(sds^2)> gvar[1] 10.4
Bonferroni Methode – Beispiel ’Cholesterol’
Gruppenmittelwerte
> mws <- tapply(cholesterol$response,cholesterol$trt,mean)> mws1time 2times 4times drugD drugE
5.78 9.22 12.37 15.36 20.95
Standardabweichungen innerhalb der Gruppen
> sds <- tapply(cholesterol$response,cholesterol$trt,sd)> sds1time 2times 4times drugD drugE2.88 3.48 2.92 3.45 3.35
Gemeinsame Varianz
> gvar <- mean(sds^2)> gvar[1] 10.4
Bonferroni Methode – Beispiel ’Cholesterol’
Gruppenmittelwerte
> mws <- tapply(cholesterol$response,cholesterol$trt,mean)> mws1time 2times 4times drugD drugE
5.78 9.22 12.37 15.36 20.95
Standardabweichungen innerhalb der Gruppen
> sds <- tapply(cholesterol$response,cholesterol$trt,sd)> sds1time 2times 4times drugD drugE2.88 3.48 2.92 3.45 3.35
Gemeinsame Varianz
> gvar <- mean(sds^2)> gvar[1] 10.4
Bonferroni Methode – Beispiel ’Cholesterol’
Bonferroni-95%-Konfidenzintervalle:
> B.lower.95 <- cmw - qt(1-0.05/20,df=50-5)*SE> B.upper.95 <- cmw + qt(1-0.05/20,df=50-5)*SE> data.frame(Mean.Diff=cmw,SE=sqrt(gvar/5),B.lower.95,+ B.upper.95)
Mean.Diff SE B.lower.95 B.upper.952times-1time 3.44 1.44 -0.818 7.704times-1time 6.59 1.44 2.332 10.85drugD-1time 9.58 1.44 5.318 13.84drugE-1time 15.17 1.44 10.905 19.434times-2times 3.15 1.44 -1.111 7.41drugD-2times 6.14 1.44 1.875 10.40drugE-2times 11.72 1.44 7.462 15.98drugD-4times 2.99 1.44 -1.275 7.25drugE-4times 8.57 1.44 4.312 12.83drugE-drugD 5.59 1.44 1.325 9.85
Bonferroni Methode – Beispiel ’Cholesterol’
Bonferroni-95%-Konfidenzintervalle:
> B.lower.95 <- cmw - qt(1-0.05/20,df=50-5)*SE> B.upper.95 <- cmw + qt(1-0.05/20,df=50-5)*SE> data.frame(Mean.Diff=cmw,SE=sqrt(gvar/5),B.lower.95,+ B.upper.95)
Mean.Diff SE B.lower.95 B.upper.952times-1time 3.44 1.44 -0.818 7.704times-1time 6.59 1.44 2.332 10.85drugD-1time 9.58 1.44 5.318 13.84drugE-1time 15.17 1.44 10.905 19.434times-2times 3.15 1.44 -1.111 7.41drugD-2times 6.14 1.44 1.875 10.40drugE-2times 11.72 1.44 7.462 15.98drugD-4times 2.99 1.44 -1.275 7.25drugE-4times 8.57 1.44 4.312 12.83drugE-drugD 5.59 1.44 1.325 9.85
Bonferroni Methode – Vor- und Nachteile
+ Kann auf beliebige (gültige) Konfidenzintervalleangewendet werden.
+ Man kann k beliebige Kontraste untersuchen.
- Man muss die zu testenden Kontraste vorab festlegen.
- Die multiple Überdeckungswahrscheinlichkeit ist meisstensecht grösser 1− α. → Es gibt oft andere Verfahren, mitengeren Konfidenzintervallen.
Bonferroni Methode – Vor- und Nachteile
+ Kann auf beliebige (gültige) Konfidenzintervalleangewendet werden.
+ Man kann k beliebige Kontraste untersuchen.
- Man muss die zu testenden Kontraste vorab festlegen.
- Die multiple Überdeckungswahrscheinlichkeit ist meisstensecht grösser 1− α. → Es gibt oft andere Verfahren, mitengeren Konfidenzintervallen.
Bonferroni Methode – Vor- und Nachteile
+ Kann auf beliebige (gültige) Konfidenzintervalleangewendet werden.
+ Man kann k beliebige Kontraste untersuchen.
- Man muss die zu testenden Kontraste vorab festlegen.
- Die multiple Überdeckungswahrscheinlichkeit ist meisstensecht grösser 1− α. → Es gibt oft andere Verfahren, mitengeren Konfidenzintervallen.
Bonferroni Methode – Vor- und Nachteile
+ Kann auf beliebige (gültige) Konfidenzintervalleangewendet werden.
+ Man kann k beliebige Kontraste untersuchen.
- Man muss die zu testenden Kontraste vorab festlegen.
- Die multiple Überdeckungswahrscheinlichkeit ist meisstensecht grösser 1− α. → Es gibt oft andere Verfahren, mitengeren Konfidenzintervallen.
Scheffé-Konfidenzintervalle
Scheffé-KonfidenzintervalleMit dScheffé =
√(k − 1) ·QF
k−1,N−k (1− α) haben die Intervalle
CISchefféc =
cT · y ± dScheffé · s ·
√√√√ k∑i=1
c2i
ni
simultane Überdeckungswahrscheinlichkeit ≥ 1− α, d.h.
P(
cT · µ ∈ CISchefféc für alle Kontraste c
)≥ 1− α
Scheffé Methode – Beispiel ’Cholesterol’
Scheffé-95%-Konfidenzintervall:
> S.lower.95 <- cmw - sqrt(4*qf(1-0.05,df1=4,df2=50-5))*SE> S.upper.95 <- cmw + sqrt(4*qf(1-0.05,df1=4,df2=50-5))*SE> data.frame(B.lower.95=lower.95,S.upper.95=upper.95,+ S.lower.95,S.upper.95)
B.lower.95 B.upper.95 S.lower.95 S.upper.952times-1time -0.818 7.70 -1.19 8.084times-1time 2.332 10.85 1.96 11.23drugD-1time 5.318 13.84 4.94 14.21drugE-1time 10.905 19.43 10.53 19.804times-2times -1.111 7.41 -1.49 7.79drugD-2times 1.875 10.40 1.50 10.77drugE-2times 7.462 15.98 7.09 16.36drugD-4times -1.275 7.25 -1.65 7.62drugE-4times 4.312 12.83 3.94 13.21drugE-drugD 1.325 9.85 0.95 10.22
Scheffé Methode – Beispiel ’Cholesterol’
Scheffé-95%-Konfidenzintervall:
> S.lower.95 <- cmw - sqrt(4*qf(1-0.05,df1=4,df2=50-5))*SE> S.upper.95 <- cmw + sqrt(4*qf(1-0.05,df1=4,df2=50-5))*SE> data.frame(B.lower.95=lower.95,S.upper.95=upper.95,+ S.lower.95,S.upper.95)
B.lower.95 B.upper.95 S.lower.95 S.upper.952times-1time -0.818 7.70 -1.19 8.084times-1time 2.332 10.85 1.96 11.23drugD-1time 5.318 13.84 4.94 14.21drugE-1time 10.905 19.43 10.53 19.804times-2times -1.111 7.41 -1.49 7.79drugD-2times 1.875 10.40 1.50 10.77drugE-2times 7.462 15.98 7.09 16.36drugD-4times -1.275 7.25 -1.65 7.62drugE-4times 4.312 12.83 3.94 13.21drugE-drugD 1.325 9.85 0.95 10.22
Tukey Methode
Simultanes Konfidenzintervall für all Paarvergleiche
Tukey-KonfidenzintervalleMit entsprechender krit. Grenze dTukey haben die Intervalle
CITukeyij =
(yi − yj ± dTukey · s ·
√1ni
+1nj
)
simultane Überdeckungswahrscheinlichkeit ≥ 1− α, d.h.,
P(
µi − µj ∈ CITukeyij für alle i , j
)≥ 1− α
Tukey-Methode – Beispiel ’Cholesterol’
> library(multcomp)Lade nötiges Paket: mvtnorm> summary(simint(response ~ trt, data=cholesterol, type=”Tukey”))
95 % quantile: 2.841
Coefficients:
Estimate 2.5 % 97.5 % t value Std.Err. p raw p Bonf p adj2times-1time 3.44 -0.658 7.54 2.38 1.44 0.021 0.213 0.1384times-1time 6.59 2.491 10.69 4.57 1.44 0.000 0.000 0.000drugD-1time 9.58 5.478 13.68 6.64 1.44 0.000 0.000 0.000drugE-1time 15.17 11.064 19.27 10.51 1.44 0.000 0.000 0.0004times-2times 3.15 -0.952 7.25 2.18 1.44 0.034 0.344 0.205drugD-2times 6.14 2.035 10.24 4.25 1.44 0.000 0.001 0.001drugE-2times 11.72 7.621 15.82 8.12 1.44 0.000 0.000 0.000drugD-4times 2.99 -1.115 7.09 2.07 1.44 0.044 0.443 0.251drugE-4times 8.57 4.471 12.67 5.94 1.44 0.000 0.000 0.000drugE-drugD 5.59 1.485 9.69 3.87 1.44 0.000 0.003 0.003
Tukey’s 95%-Konfidenzintervalle – Beispiel
Tukey contrasts
95 % two−sided confidence intervals
0 5 10 15 20
trtdrugE−trtdrugD
trtdrugE−trt4times
trtdrugD−trt4times
trtdrugE−trt2times
trtdrugD−trt2times
trt4times−trt2times
trtdrugE−trt1time
trtdrugD−trt1time
trt4times−trt1time
trt2times−trt1time
( )●
( )●
( )●
( )●
( )●
( )●
( )●
( )●
( )●
( )●
Tukey Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitdem Bonferroni-Methode.
- Tukey Methode kann nur bei homogener Varianzangewendet werden.
- Man kann nur die k Paarvergleichskontraste schätzen.
Tukey Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitdem Bonferroni-Methode.
- Tukey Methode kann nur bei homogener Varianzangewendet werden.
- Man kann nur die k Paarvergleichskontraste schätzen.
Tukey Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitdem Bonferroni-Methode.
- Tukey Methode kann nur bei homogener Varianzangewendet werden.
- Man kann nur die k Paarvergleichskontraste schätzen.
Dunnett Methode
Dunnett-KonfidenzintervalleMit entsprechender krit. Grenze dDunnett haben die Intervalle
CIDunnetti =
(yi − y1 ± dDunnett · s ·
√1n1
+1ni
)
simultane Überdeckungswahrscheinlichkeit ≥ 1− α, d.h.,
P(
µi − µ1 ∈ CIDunnetti für i ≥ 2
)≥ 1− α
Beispiel: Effektivität von Eniporide
Vergleich von 4 Dosen Eniporide zu Plazebo bei akutemHerzinfarkt in randomisierter Studie mit ingesamt 430 Patienten
I Gruppe 1: Plazebo (88 Pat.)I Gruppe 2: 50 mg Eniporide (86 Pat.)I Gruppe 3: 100 mg Eniporide (91 Pat.)I Gruppe 4: 150 mg Eniporide (74 Pat.)I Gruppe 5: 200 mg Eniporide (91 Pat.)
Dunnett-Methode – Beispiel Eniporide
> zeymer <- read.table(’ZeymerS1.dat’,header=T)> z.var <- sum((zeymer$n-1)*zeymer$HBDH.sd^2)/sum(zeymer$n-1)> covm <- diag(z.var/zeymer$n);> cmatrix <- contrMat(zeymer$n,type="Dunnett");> summary(csimint(estpar=zeymer$HBDH.mean,df=sum(zeymer$n-1),+ covm=covm,cmatrix=cmatrix,alternative=two.sided",ctype="Dunnett"))
Simultaneous 95% confidence intervals: Dunnett contrasts
95 % quantile: 2.453
Coefficients:Estimate 2.5 % 97.5 % t value Std.Err. p raw p Bonf p adj
2-1 1.1 -8.56 10.759 0.279 3.94 0.780 1.000 0.9963-1 -4.0 -13.52 5.524 -1.030 3.88 0.303 1.000 0.6924-1 -10.3 -20.35 -0.253 -2.515 4.10 0.012 0.049 0.0425-1 -0.3 -9.82 9.224 -0.077 3.88 0.938 1.000 1.000
Dunnett’s 95%-Konfidenzintervalle – BeispielEniporide
Dunnett contrasts
95 % two−sided confidence intervals
−20 −15 −10 −5 0 5 10
5−1
4−1
3−1
2−1
( )●
( )●
( )●
( )●
Dunnett Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitder Bonferroni- und Tukey-Methode.
- Dunnett Methode kann nur bei homogener Varianzangewendet werden.
- Erlaubt keine anderen Vergleiche als mit µ1 (oder einemanderen vorab gewählten µi ).
Dunnett Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitder Bonferroni- und Tukey-Methode.
- Dunnett Methode kann nur bei homogener Varianzangewendet werden.
- Erlaubt keine anderen Vergleiche als mit µ1 (oder einemanderen vorab gewählten µi ).
Dunnett Methode – Vor- und Nachteile
+ Man bekommt immer engere Konfidenzintervalle als mitder Bonferroni- und Tukey-Methode.
- Dunnett Methode kann nur bei homogener Varianzangewendet werden.
- Erlaubt keine anderen Vergleiche als mit µ1 (oder einemanderen vorab gewählten µi ).