FREQプロシジャ

一致の検定と統計量

TABLESステートメントでAGREEオプションを指定すると、FREQプロシジャは、正方形の表(行数と列数が等しい表)の一致の検定と統計量を計算します。二元表の場合、これらの検定および統計量としては、$2 \times 2$表に対するMcNemarの検定、Bowkerの対称性の検定、単純カッパ係数、重み付きカッパ係数が含まれます。複数の層がある場合(n元表、ここでn > 2)、FREQプロシジャは、全体的な単純カッパ係数および重み付きカッパ係数の計算に加えて、各層間の(単純および重み付き)カッパ係数の同等性の検定も行います。CochranのQは、各変数が2つの水準を持つ多元クロス表、すなわち$h \times 2 \times 2$表に対して計算されます。

TABLESステートメントでAGREEオプションを指定すると、FREQプロシジャは、(単純および重み付き)カッパ係数、それらの漸近標準誤差、およびそれらの信頼限界を計算します。TESTステートメントでKAPPAオプションを指定すると、FREQプロシジャは、単純カッパ係数がゼロに等しいという帰無仮説の漸近的な検定を計算します。同様に、TESTステートメントでWTKAPオプションを指定すると、FREQプロシジャは、重み付きカッパ係数の漸近的な検定を計算します。

このセクションで説明されている漸近検定に加えて、FREQプロシジャは、McNemarの検定、単純カッパ係数の検定、重み付きカッパ係数の検定の正確なp値も計算します 。これらの正確検定を要求するには、EXACTステートメントで対応するオプションを指定します。詳細は、正確な統計量のセクションを参照してください。

次のセクションでは、FREQプロシジャが各AGREE統計量の計算に使用する公式を示します。これらの統計量の解釈に関する詳細は、Agresti (2002, 2007)、Fleiss, Levin, and Paik (2003)、および各統計量の説明で示されているリファレンスを参照してください。

McNemarの検定

AGREEオプションを指定すると、FREQプロシジャは、$2 \times 2$表に対するMcNemarの検定を計算します。McNemarの検定は、2値(yes/no式)応答を持つ一致したサブジェクトのペアからのデータを分析する場合に適しています。これは、周辺等質性の帰無仮説$p_{1 \cdot } = p_{\cdot 1}$を検定するものです。McNemarの検定は次のように計算されます。

\[  Q_{\mi{M}} = (n_{12}-n_{21})^{2} ~  / ~  (n_{12} + n_{21})  \]

帰無仮説の下では、$ Q_{\mi{M}}$は自由度が1の漸近カイ2乗分布に従います。詳細は、McNemar (1947)および前出のリファレンスを参照してください。EXACTステートメントでMCNEMオプションを指定すると、FREQプロシジャは、漸近検定に加えて、McNemarの検定の正確なp値も計算します。

Bowkerの対称性の検定

Bowkerの対称性の検定では、セルの比率が対称であること、またはすべての表セルのペアで$p_{ij} = p_{ji}$であることが帰無仮説となります。$2 \times 2$表の場合、Bowkerの検定はMcNemarの検定と同じになるため、FREQプロシジャは、$2 \times 2$より大きい正方形の表にはBowkerの検定を行います。

Bowkerの対称性の検定は次のように計算されます。

\[  Q_{\mi{B}} = \mathop {\sum \! \sum }_{i < j}~ (n_{ij}-n_{ji})^2 ~  / ~ (n_{ij}+n_{ji})  \]

大きい標本の場合、$Q_{\mi{B}}$は、対称性の帰無仮説の下で自由度が$R(R-1)/2$の漸近カイ2乗分布に従います。詳細はBowker (1948)を参照してください。

単純カッパ係数

単純カッパ係数とは、Cohen (1960)により導入された判定者間一致の統計量です。FREQプロシジャは、単純カッパ係数を次のように計算します。

\[  \hat{\kappa } = \left( P_ o - P_ e \right) ~  / ~  \left( 1-P_ e \right)  \]

ここで、$P_ o = \sum _ i p_{ii}$ および$P_ e = \sum _ i p_{i.} p_{.i}$です。2つの応答変数が、n個のサブジェクトに関する2つの独立した判定として認識される場合、それらの判定間に完全な一致が存在するならば、カッパ係数は+1に等しくなります。観測された一致が偶然に一致する確率を超えている場合、カッパ係数は正数になり、その大きさは一致の強度を反映します。実際にはあまり起こりませんが、観測された一致が偶然に一致する確率よりも低い場合、カッパ係数は負数になります。カッパ係数の最小値は、周辺比率に応じて–1から0までの間になります。

単純カッパ係数の漸近分散は次のように計算されます。

\[  \mr{Var}(\hat{\kappa }) = \left( A + B - C \right) ~  / ~  (1-P_ e)^2~ n  \]

ここで、

\begin{eqnarray*}  A &  = &  \sum _ i p_{ii} \left( 1-(p_{i \cdot } + p_{\cdot i})(1-\hat{\kappa }) \right)^2 \\[.08in] B &  = &  (1-\hat{\kappa })^2 ~  \mathop {\sum \! \sum }_{i \neq j}~  p_{ij} (p_{\cdot i} + p_{j \cdot })^2 \\[.10in] C &  = &  \left( ~  \hat{\kappa } - P_ e (1-\hat{\kappa }) ~  \right)^2 \end{eqnarray*}

詳細は、Fleiss, Cohen, and Everitt (1969)を参照してください。

FREQプロシジャは、単純カッパ係数の信頼限界を次のように計算します。

\[  \hat{\kappa } ~  \pm ~  \bigl ( ~  z_{\alpha /2} \times \sqrt {\mr{Var}(\hat{\kappa })} ~  \bigr )  \]

ここで、$z_{\alpha /2}$は、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。$\alpha $の値は、ALPHA=オプションにより定義されます。この値はデフォルトで0.05であり、99%の信頼限界を生成します。

カッパ係数の漸近検定を計算する場合、FREQプロシジャは、標準化された検定統計量$\hat{\kappa }^\ast $を使用します。この統計量は、重み付きカッパ係数がゼロであるという帰無仮説の下で漸近標準正規分布に従います。標準化された検定統計量は次のように計算されます。

\[  \hat{\kappa }^\ast = \hat{\kappa } ~  / ~  \sqrt {\mr{Var}_0(\hat{\kappa })}  \]

ここで、$\mr{Var}_0(\hat{\kappa })$は、帰無仮説の下でのカッパ係数の分散です。

\[  \mr{Var}_0(\hat{\kappa }) = \left( P_ e + P_ e^2 - \sum _ i p_{i \cdot } p_{\cdot i} (p_{i \cdot } + p_{\cdot i}) \right) ~  / ~  (1 - P_ e)^2 ~  n  \]

詳細は、Fleiss, Levin, and Paik (2003)を参照してください。

FREQプロシジャは、単純カッパ係数の正確検定も提供します。この正確検定を要求するには、EXACTステートメントでKAPPAまたはAGREEオプションを指定します。詳細は、正確な統計量のセクションを参照してください。

重み付きカッパ係数

重み付きカッパ係数は、単純カッパ係数の一般化であり、重みを使用してカテゴリ間の相対的差異を数値化します。$2 \times 2$表の場合、重み付きカッパ係数は単純カッパ係数に等しくなります。FREQプロシジャは、$2 \times 2$より大きい表の場合にのみ、重み付きカッパ係数を表示します。FREQプロシジャは、次のセクションで説明されているCicchetti-Allison重みまたはFleiss-Cohen重みのいずれかを使用して、列スコアからカッパ係数の重みを計算します。重み$w_{ij}$は、すべての$i \not= j$$0 \leq w_{ij}<1$、すべてのi$w_{ii} = 1$、および$w_{ij} = w_{ji}$となるように構成されます。重み付きカッパ係数は次のように計算されます。

\[  \hat{\kappa }_ w = \left( P_{o(w)} - P_{e(w)} \right) ~  / ~  \left( 1-P_{e(w)} \right)  \]

ここで、

\[  P_{o(w)} = \sum _ i \sum _ j w_{ij} p_{ij}  \]
\[  P_{e(w)} = \sum _ i \sum _ j w_{ij} p_{i \cdot } p_{\cdot j}  \]

重み付きカッパ係数の漸近分散は次のようになります。

\[  \mr{Var}(\hat{\kappa }_ w) = \left( \sum _ i\sum _ j p_{ij} \left( w_{ij}-(\overline{w}_{i \cdot }+\overline{w}_{\cdot j}) (1-\hat{\kappa }_ w) \right)^2 - \left( \hat{\kappa }_ w - P_{e(w)}(1-\hat{\kappa }_ w) \right)^2 \right) ~  / ~  (1-P_{e(w)})^2~ n  \]

ここで、

\[  \overline{w}_{i \cdot } = \sum _ j p_{\cdot j}w_{ij}  \]
\[  \overline{w}_{\cdot j} = \sum _ i p_{i \cdot }w_{ij}  \]

詳細は、Fleiss, Cohen, and Everitt (1969)を参照してください。

FREQプロシジャは、重み付きカッパ係数の信頼限界を次のように計算します。

\[  \hat{\kappa }_ w ~  \pm ~  \bigl ( ~  z_{\alpha /2} \times \sqrt {\mr{Var}(\hat{\kappa }_ w)} ~  \bigr )  \]

ここで、$z_{\alpha /2}$は、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。$\alpha $の値は、ALPHA=オプションにより定義されます。この値はデフォルトで0.05であり、99%の信頼限界を生成します。

カッパ係数の漸近検定を計算する場合、FREQプロシジャは、標準化された検定統計量$\hat{\kappa }_ w^\ast $を使用します。この統計量は、重み付きカッパ係数がゼロであるという帰無仮説の下で漸近標準正規分布に従います。標準化された検定統計量は次のように計算されます。

\[  \hat{\kappa }_ w^\ast = \hat{\kappa }_ w ~  / ~  \sqrt {\mr{Var}_0(\hat{\kappa }_ w)}  \]

ここで、$\mr{Var}_0(\hat{\kappa }_ w)$は、帰無仮説の下での重み付きカッパ係数の分散です。

\[  \mr{Var}_0(\hat{\kappa }_ w) = \left( \sum _ i \sum _ j p_{i \cdot } p_{\cdot j} \left( w_{ij} - (\overline{w}_{i \cdot } + \overline{w}_{\cdot j}) \right) ^2 - P_{e(w)}^2 \right) ~  / ~  (1 - P_{e(w)})^2~ n  \]

詳細は、Fleiss, Levin, and Paik (2003)を参照してください。

FREQプロシジャは、重み付きカッパ係数の正確検定も提供します。この正確検定を要求するには、EXACTステートメントでWTKAPPAまたはAGREEオプションを指定します。詳細は、正確な統計量のセクションを参照してください。

重み

FREQプロシジャは、列スコアと2つの利用可能な重みの種類のいずれかを使用して、カッパ係数の重みを計算します。列スコアは、TABLESステートメントのSCORES=オプションにより決定されます。2種類の利用可能な重みは、Cicchetti-Allisonの重みとFleiss-Cohenの重みになります。デフォルトでは、FREQプロシジャはCicchetti-Allisonの重みを使用します。AGREEオプションで(WT=FC)を指定すると、FREQプロシジャは、Fleiss-Cohenの重みを使用して重み付きカッパ係数を計算します。

FREQプロシジャは、Cicchetti-Allisonのカッパ係数重みを次のように計算します。

\[  w_{ij} = 1 - \frac{|C_ i - C_ j|}{C_ C - C_1}  \]

ここで、$C_ i$は列iのスコア、Cははカテゴリ数または列数です。詳細は、Cicchetti and Allison (1971)を参照してください。

TABLESステートメントのSCORES=オプションは、カッパ係数の重み(およびその他のスコアに基づく統計量)の計算に使用される列スコアの種類を指定します。デフォルトはSCORES=TABLEです。詳細は、スコアのセクションを参照してください。数値変数の場合、表スコアは、変数水準の値となります。水準の類似度を反映するように、各水準に数値を割り当てることができます。たとえば、4つの水準があり、それらを類似度に基づいて順序付けるとします。それらの各水準に値0、2、4、10を割り当てた場合、Cicchetti-Allisonのカッパ係数重みは、$ w_{12}$ = 0.8、$ w_{13}$ = 0.6、$ w_{14}$ = 0、$ w_{23}$ = 0.8、$ w_{24}$ = 0.2、および$ w_{34}$ = 0.4になります。2つのカテゴリが存在する場合(すなわち、C = 2である場合)にのみ、重み付きカッパ係数は単純カッパ係数と同じになります。

TABLESステートメントのAGREEオプションで(WT=FC)を指定すると、FREQプロシジャは、Fleiss-Cohenのカッパ係数重みを次のように計算します。

\[  w_{ij} = 1 - \frac{(C_ i - C_ j)^2}{(C_ C - C_1)^2}  \]

詳細は、Fleiss and Cohen (1973)を参照してください。

先述の例では、Fleiss-Cohenのカッパ係数重みは、$ w_{12}$ = 0.96、$ w_{13}$ = 0.84、$ w_{14}$ = 0、$ w_{23}$ = 0.96、$ w_{24}$ = 0.36、および$ w_{34}$ = 0.64になります。

全体のカッパ係数

複数の層が存在する場合、FREQプロシジャは、カッパ係数の層水準の推定値を組み合わせて、共通すると想定される値に対する全体のカッパ係数の推定値にします。q個の層が存在し、$h=1,2,\ldots , q$により添え字付けされるものとします。また、$\mr{Var}(\hat{\kappa }_ h)$$\hat{\kappa }_ h$の分散を表すものとします。全体的なカッパ係数の推定値は次のように計算されます。

\[  \hat{\kappa }_{\mi{T}} = \sum _{h=1}^ q \frac{\hat{\kappa }_ h}{\mr{Var}(\hat{\kappa }_ h)} ~  / ~  \sum _{h=1}^ q \frac{1}{\mr{Var}(\hat{\kappa }_ h)}  \]

詳細は、Fleiss, Levin, and Paik (2003)を参照してください。

FREQプロシジャは、同じ方法により、全体的な重み付きカッパ係数の推定値も計算します。

カッパ係数が等しいかどうかの検定

複数の層が存在する場合、次のようなカイ2乗統計量により、カッパ係数の層水準値が等しいかどうかを検定できます。

\[  Q_{\mi{K}} = \sum _{h=1}^ q \left( \hat{\kappa }_ h - \hat{\kappa }_{\mi{T}} \right)^2 ~  / ~  {\mr{Var}(\hat{\kappa }_ h)}  \]

q個の層でカッパ係数が等しいという帰無仮説の下で、$Q_{\mi{K}}$は自由度がq–1の漸近カイ2乗分布に従います。詳細は、Fleiss, Levin, and Paik (2003)を参照してください。FREQプロシジャは、同じ方法により、重み付きカッパ係数が等しいかどうかの検定も行います。

CochranのQ検定

CochranのQは、各変数が2つの水準を持つ多元クロス表、すなわち$h \times 2 \times 2$表に対して計算されます。CochranのQ統計量は、1次元マージンの等質性の検定に使用されます。mが変数の数を、Nがサブジェクトの合計数を表すものとします。CochranのQ統計量は次のように計算されます。

\[  Q_{\mi{C}} = m (m-1) \left( \sum _{j=1}^ m T_ j^2 - T^2 \right) ~  / ~  \left( mT - \sum _{k=1}^ N S_ k^2 \right)  \]

ここで、$T_ j$は変数jに関する肯定応答の数、Tはすべての変数に関する肯定応答の数、$S_ k$はサブジェクトkに関する肯定応答の数です。この帰無仮説の下では、CochranのQは自由度がm–1の漸近カイ2乗分布に従います。詳細は、Cochran (1950)を参照してください。2つの2値応答変数(m=2)のみが存在する場合、CochranのQはMcNemar検定へと簡略化されます。複数の応答カテゴリが存在する場合、CATMODプロシジャの機能を繰り返し使用することで、周辺等質性に関する検定を実施できます。

ゼロ行とゼロ列を含む表

AGREE統計量は、列数が行数に等しい正方形の表に対してのみ定義されます。正方形でない表の場合、FREQプロシジャはAGREE統計量を計算しません。カッパ統計量の枠組みでは、2人の別々の評価者がn個のサブジェクトのそれぞれにレーティングを割り当てます。ここでは、どちらの評価者が使用可能なr個のレーティング水準をすべて使用しないと想定します。対応する表の行数がrで列数はr–1である場合、その表は正方形ではないため、この表に関してFREQプロシジャはAGREE統計量を計算しません。このような場合に正方形の表を作成するには、WEIGHTステートメントでZEROSオプションを指定します。これにより、FREQプロシジャは、重みがゼロのオブザベーションを分析に含めるようになります。評価者により使用されないレーティング水準を表すには、重みがゼロのオブザベーションを入力データセットに含めます。これにより、この入力データセットに、評価者とレーティングの可能な組み合わせごとに少なくとも1つのオブザベーションが含まれます。この結果、実際には両評価者によりすべての水準が割り当てられていない場合であっても、分析にはすべてのレーティング水準が含められます。結果として生成される表(評価者1×評価者2)は正方形の表であるため、AGREE統計量が計算されます。

詳細は、ZEROSオプションの説明を参照してください。デフォルトでは、FREQプロシジャは、重みがゼロのオブザベーションを処理しません。なぜなら、これらのオブザベーションが合計度数に寄与しないために、結果として生成される重みゼロの行または列により連関性の検定や統計量の多くが定義されなくなるためです。ただし、カッパ統計量は重みがゼロの行または列を含む表に対して定義されるため、ZEROSオプションを指定することで、重みがゼロのオブザベーションを入力し、カッパ係数の計算に必要となる表を構成できます。