CORRプロシジャ

KendallのTau-b相関係数

サブセクション

KendallのTau-bは、ペアのオブザベーション内の一致と不一致の数に基づく連関性のノンパラメトリックな統計量です。 ペアのオブザベーションの変化が同じ場合に一致が発生します。ペアのオブザベーションの変化が異なる場合に不一致が発生します。 KendallのTau-bは次の公式で表されます。

\[  \tau = \frac{\sum _{i<j} \,  (\mr{sgn}(x_ i-x_ j) \mr{sgn}(y_ i-y_ j))}{\sqrt {(T_0-T_1)(T_0-T_2)}}  \]

ここで、 $T_0= n(n-1)/2$$T_1= \sum _ k \,  t_ k(t_ k-1)/2$$T_2= \sum _ l \,  u_ l(u_ l-1)/2$です。$t_ k$はタイのx値のk番目のグループ内にあるタイのxの数、$u_ l$はタイのy値のl番目のグループ内にあるタイのy値の数、nはオブザベーションの数です。$\mr {sgn}(z)$は次のように定義されます。

\[  \mr{sgn}(z) = \left\{  \begin{array}{ll} 1 &  \mr{if} \, \,  z > 0 \\ 0 &  \mr{if} \, \,  z = 0 \\ -1 &  \mr{if} \, \,  z < 0 \end{array} \right.  \]

CORRプロシジャは、データを順位付けし、Knight (1966)と同様の方法を使用することにより、KendallのTau-bを計算します。最初の変数の値でオブザベーションを順位付けした後、2番目の変数の値でオブザベーションを順位付けすることにより、データが二重に並べ替えられます。CORRプロシジャは、最初の変数の並べ替え後の順位からKendallのTau-bを計算し、タイのペア(XまたはYの値が同じオブザベーションのペア)を修正します。

確率値

KendallのTau-bの確率値は次の式により計算されます。

\[  \frac{s}{\sqrt {V(s)}}  \]

これは標準正規分布から導かれます。ここで、

\[  s=\sum _{i<j} \,  (\mr{sgn} (x_ i-x_ j) \mr{sgn} (y_ i-y_ j))  \]

であり、$V(s)$(sの分散)は次の式で計算されます。

\[  V(s)=\frac{v_0-v_ t-v_ u}{18}+\frac{v_1}{2n(n-1)}+\frac{v_2}{9n(n-1)(n-2)}  \]

ここで、

$v_0=n(n-1)(2n+5)$

$v_ t=\sum _ k \,  t_ k (t_ k-1)(2t_ k+5)$

$v_ u=\sum _ l \,  u_ l (u_ l-1)(2u_ l+5)$

$v_1=(\sum _ k \,  t_ k(t_ k-1)) \,  (\sum u_ i(u_ l-1))$

$v_2=(\sum _ l \,  t_ i(t_ k-1)(t_ k-2)) \,  (\sum u_ l(u_ l-1)(u_ l-2))$

合計は、タイ値のグループに関するものです。ここで、$t_ i$はタイのx値の数、$u_ i$はタイのy値の数です。(Noether, 1967)。Kendallの偏Tau-bの標本分布は不明であるため、確率値は提供されません。