ウィルコクソン検定:開業医にとってのスイートスポット

観測結果の処理の実践では、一般母集団の分布が不明であるか、(連続確率変数の場合)正規分布とは異なるため、古典的な統計手法の使用は不合理であり、エラーにつながる可能性があります。この場合、一般母集団の分布に依存しない(または無料の)方法、つまりノンパラメトリック法が使用されます。





この記事では、統一された観点から、実際に頻繁に遭遇する3つの単一サンプル検定について説明します。符号検定、t検定、および符号付きランクウィルコクソン検定です。正規分布のサンプルの場合はt検定であり、サンプルの分布が正規分布に比べて「重いテール」を持っている場合は、t検定の検出力を超えます。





1.定義するためのモデルを次のように位置モデル。ましょうX_1、X_2、\ ldots、X_n-表すランダムなサンプルが得られ、以下の法律に従って





X_i = \ theta + e_i、

ここで、ランダムエラーe_1、e_2、\ ldots、e_nは独立しておりf(t)、ゼロを中心に対称な連続分布密度を持つ均等に分布した確率変数であると想定されています。





2対称性の条件下ではX_i、平均と中央値を含むすべての位置パラメータはに等しくなり\シータます。仮説を検討する





H_0:\ theta = 0、~~~ H_a:\ theta> 0。

3.この仮説を検定するために、実際によく使用される3つの検定、符号検定、t検定、およびウィルコクソン検定を検討します。





3.1。古典的な符号検定(符号検定)は統計に基づいています





S = \ sum_ {i = 1} ^ nsign(X_i)、

ここ符号(t)= --1,0,1で、t <0、t = 0、t> 0それぞれ。しよう





S ^ + = \ #_ i \ {X_i> 0 \}。

S = 2S ^ + --n. , X_i ( , , n). H_0, S ^ + n 1/2. s ^ +S ^ + p-value P_ {H_0}(S ^ + \ geq s ^ +)= 1-F_B(s ^ + -1; n; 0.5), F_B(t; n; p)n p(R pbinom



cdf ).





, S H_0 () f(t).





3.2. t- (t-test) .





T = \ sum_ {i = 1} ^ nsign(X_i)\ cdot | X_i |。

, T f(t). t- t-





t = \ frac {\ bar {X}} {s / \ sqrt {n}}、

\バー{X} s, . , t t- n-1 . t_0 t. p-value t- P_ {H_0}(t \ geq t_0)= 1-F_T(t_0; n-1), F_T(t; \ nu)– t- c \ nu (R pt



cdf t-). p-value , .





3.3. t- , t- .





(signed-rank Wilcoxon test) , . R | X_i | X_i | X_1 |、\ ldots、| X_n |, .





W = \ sum_ {i = 1} ^ nsign(X_i)\ cdot R | X_i |。

t-, W, S H_0 f(t).





W . , W, W ^ +,





W ^ + = \ sum_ {X_i> 0} R | X_i | = \ frac {1} {2} W + \ frac {n(n + 1)} {4}。

p-value P_ {H_0}(W ^ + \ geq w ^ +)= 1-F_ {W ^ +}(w ^ + --1; n), F_ {W ^ +}(x; n)n(R psignrank



cdf W ^ +).





4. . : , t- \シータ. .





4.1. \シータ,





\ hat {\ theta} = med \ {X_1、X_2、\ ldots、X_n \}。

0 <\ alpha <1 \シータ (1- \ alpha)100 \% \左(X _ {(c_1 + 1)}、X _ {(n-c_1)} \右), X _ {(i)}私- , c_1\アルファ/ 2 n p = 1/2. e_i. , - n \アルファ.





4.2. \シータ, t- \バー{X}. \ bar {X} \ pm t _ {\ alpha / 2、n-1} \ cdot [s / \ sqrt {n}], t _ {\ alpha / 2、n-1}\アルファ/ 2 t- n-1 . e_i.





4.3. \シータ, - (Hodges-Lehmann)





\ hat {\ theta} _W = med_ {i \ leq j} \ left \ {\ frac {X_i + X_j} {2} \ right \}。

A_ {ij} =(X_i + X_j)/ 2, i \ leq j (Walsh averages) . A _ {(1)} <\ cdots <A _ {(n(n + 1)/ 2)} . (1- \ alpha)100 \% \シータ \左(A _ {(c_2 + 1)}、A _ {(n(n + 1)/ 2-c2)} \右), c_2\アルファ/ 2 signed-rank Wilcoxon . e_i . , W ^ +\左\ {0,1、...、n(n + 1)/ 2 \右\} n ^ 2. , , , \アルファ .





5. ( ) A B . , ?





, A B. \シータ . R t- H_0:\ theta = 0、H_a:\ theta> 0。





> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75 
      
      



wilcox.test()



W ^ +, p-value , - \シータ 95 \% \シータ. - t.test()



. , 0.05, , A .





, . , t- t- « » .








All Articles