統計学の勉強ノート - サンプルサイズ

1 power.prop.testの使い方

1.1 第一群の母比率𝑝1=100E-6、第二群の母比率𝑝2=500E-6、第一の過誤𝛼=0.05のときの母比率の差の検定の検出力

ここでは、0.8の検出力に線を引く。

It is proposed here as a convention that, when the investigator has no other basis for setting the desired power value, the value .80 be used.

出典: Statistical Power Analysis for the Behavioral Sciences Second Edition

n <- seq(1,1E5,1000)
alpha <- 0.05
p1 <- 100E-6
p2 <- 500E-6
 
power <- power.prop.test(n = n, p1 = p1, p2 = p2, sig.level = alpha)
plot(power$n,power$power)
abline(h=0.8)

n=29423のとき

n <- 29423
alpha <- 0.05
p1 <- 100E-6
p2 <- 500E-6
power <- power.prop.test(n = n, p1 = p1, p2 = p2, sig.level = alpha)
power$power

[1] 0.7999961

1.2 第一群の母比率𝑝1=100E-6、第二群の母比率𝑝2=10000E-6、第一の過誤𝛼=0.05のときの母比率の差の検定の検出力

n <- seq(1,1E4,100)
alpha <- 0.05
p1 <- 100E-6
p2 <- 10000E-6
 
power <- power.prop.test(n = n, p1 = p1, p2 = p2, sig.level = alpha)
plot(power$n,power$power)
abline(h=0.8)

1.3 観測数𝑛=10、母平均の差𝛿=0.1、標準偏差𝜎=0.05、第一の過誤𝛼=0.05のときの対応のないt検定の検出力

n <- seq(1,100)
alpha <- 0.05
delta <- 0.1
sd <- 0.05
 
power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha)
plot(power$n,power$power)
abline(h=0.8)

1.4 観測数𝑛=10、母平均の差𝛿=0.01、標準偏差𝜎=0.05、第一の過誤𝛼=0.05のときの対応のないt検定の検出力

n <- seq(1,1e3)
alpha <- 0.05
delta <- 0.01
sd <- 0.05

power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha)
plot(power$n,power$power)
abline(h=0.8)

n=392のときの検出力

n <- 392
alpha <- 0.05
delta <- 0.01
sd <- 0.05
power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha)
power$power

[1] 0.7985901

1.5 観測数𝑛=10、母平均の差𝛿=0.1、標準偏差𝜎=0.05、第一の過誤𝛼=0.05のときの対応のあるt検定の検出力

n <- seq(1,100)
alpha <- 0.05
delta <- 0.1
sd <- 0.05
 
power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha,type="paired")
plot(power$n,power$power)
abline(h=0.8)

1.6 観測数𝑛=10、母平均の差𝛿=0.01、標準偏差𝜎=0.05、第一の過誤𝛼=0.05のときの対応のあるt検定の検出力

n <- seq(1,1e3)
alpha <- 0.05
delta <- 0.01
sd <- 0.05

power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha,type="paired")
plot(power$n,power$power)
abline(h=0.8)

n=196のときの検出力

n <- 196
alpha <- 0.05
delta <- 0.01
sd <- 0.05
power <- power.t.test(n = n, delta = delta, sd=sd, sig.level = alpha,type="paired")
power$power

[1] 0.7956606

2 サンプルサイズの計算

2.1 割合の差の検定(カイ2乗検定)

\[ n=\frac{\{Z(\alpha/2)\sqrt{2\overline{p}(1-\overline{p})}+Z(\beta)\sqrt{p_0(1-p_0)+p_1(1-p_1)}\}^2}{d^2} \]

\[ \overline{p}=(p_0+p_1)/2 \]

2.1.1 第一群の母比率𝑝0=100E-6、第二群の母比率𝑝1=500E-6、第一の過誤𝛼=0.05、検出力0.8としたときのサンプルサイズ

alpha <- 0.05
p0 <- 100E-6
p1 <- 500E-6
power<-0.8
beta<-1-power
phat<-(p0+p1)/2
((-qnorm(alpha/2)*sqrt(2*phat*(1-phat))+(-qnorm(beta)*sqrt(p0*(1-p0)+p1*(1-p1))))^2)/((p1-p0)^2)

[1] 29423.29

2.2 対応のないt検定のときのサンプルサイズ

下記で計算する

\[ n=\frac{2\sigma^2\{Z(\alpha/2)+Z(\beta)\}^2}{d^2} \]

2.2.1 標準偏差0.05, 検出すべき差を0.01,検出力0.8、\(\alpha\)を両側5%、検出力\(1-\beta\)を80%とした場合

power<-0.8
alpha <- 0.05
delta <- 0.01
sd <- 0.05
(2*(sd^2)*(-qnorm(alpha/2)+(-qnorm(1-power)))^2)/(delta^2)

[1] 392.444

2.3 対応のあるt検定のときのサンプルサイズ

下記で計算する

\[ n=\frac{\sigma^2\{Z(\alpha/2)+Z(\beta)\}^2}{d^2} \]

2.3.1 標準偏差0.05, 検出すべき差を0.01,検出力0.8、\(\alpha\)を両側5%、検出力\(1-\beta\)を80%とした場合

power<-0.8
alpha <- 0.05
delta <- 0.01
sd <- 0.05
((sd^2)*(-qnorm(alpha/2)+(-qnorm(1-0.8)))^2)/(delta^2)

[1] 196.222

3 参考文献

4 R version

R.version.string

[1] "R version 4.3.0 (2023-04-21)"