FREQプロシジャ

カイ2乗検定と統計量

CHISQオプションは、等質性または独立性に対する各種のカイ2乗検定を実施し、特定のカイ2乗統計量に基づく連関性の統計量を計算します。TABLESステートメント内でCHISQオプションを指定すると、FREQプロシジャは、各二元表に関して各種のカイ2乗検定(Pearsonカイ2乗、尤度比カイ2乗、Mantel-Haenszelのカイ2乗)を計算します。FREQプロシジャは、Pearsonカイ2乗統計量に基づく連関性の統計量として、ファイ係数、一致係数、およびCramerのVを計算します。 $2 \times 2$ テーブルの場合、CHISQオプションを使用することで、Fisherの正確検定および連続性補正カイ2乗統計量を要求できます。一般的な $R \times C$ 表のFisherの正確検定を要求するには、TABLESステートメントまたはEXACTステートメントでFISHERオプションを指定します。

一元表の場合にCHISQオプションを指定すると、FREQプロシジャは、Pearsonカイ2乗適合度検定を実施します。一元表の場合にCHISQ(LRCHI)オプションを指定すると、FREQプロシジャは、一元尤度比カイ2乗検定も実施します。CHISQオプションが生成するその他の検定や統計量は、二元表の場合にのみ利用可能となります。

二元表の場合、カイ2乗検定の帰無仮説は、行変数と列変数間に連関性がないこととなります。標本サイズnが大きい場合、検定統計量は、帰無仮説の下では漸近カイ2乗分布に従います。標本サイズが大きくない場合や、データセットが疎であるかまたは片寄った分布である場合、漸近検定よりも正確検定の方がより適していることがあります。FREQプロシジャは、Fisherの正確検定に加えて、Pearsonカイ2乗、尤度比カイ2乗、Mantel-Haenszelのカイ2乗の各検定の正確なp値を計算します。一元表の場合、FREQプロシジャは、Pearsonカイ2乗適合度検定および尤度比カイ2乗適合度検定の正確なp値を計算します。これらの正確検定を要求するには、EXACTステートメントでオプションを指定します。詳細は、正確な統計量のセクションを参照してください。

Mantel-Haenszelのカイ2乗統計量は、両変数が順序尺度である場合にのみ適用できます。本セクションで説明するその他のカイ2乗検定および統計量は、変数が名義尺度であれ順序尺度であれ適用できます。これ以降の各セクションでは、FREQがカイ2乗検定および統計量の計算に使用する各種の公式を示します。これらの統計量に関する詳細は、Agresti (2007)、Stokes, Davis, and Koch (2012)、およびその他の参考文献を参照してください。

一元表に対するカイ2乗検定

一元度数表の場合、TABLESステートメントでCHISQオプションを指定すると、カイ2乗適合度検定が行われます。Cは、一元表内のクラス数または水準数を表すものとします。 $f_{i}$ は、クラスiの度数(またはクラスi内にあるオブザベーションの数)を表すものとします。ここで、 $i = 1,2,\ldots ,C$ です。FREQプロシジャは、一元表に対するカイ2乗統計量を次の式により計算します。

$Q_{\mi{P}} = \sum _{i=1}^ C ( f_{i} - e_{i})^2 / e_{i}$

ここで、 $e_{i}$ は、帰無仮説の下でのクラスiの期待度数です。

CHISQオプションのデフォルトである等比率に対する検定では、帰無仮説は、合計標本サイズに対する各クラスの比率が等しいとします。この帰無仮説の下では、各クラスの期待度数は、合計標本サイズをクラス数で割った値に等しくなります。

$e_{i} = n ~ / ~ C \hspace{.2in} \mr{for} \hspace{.1in} i = 1,2,\ldots ,C$

FREQプロシジャで指定された度数の検定を計算する場合、TESTF=オプションを使用して帰無仮説の度数を入力すると、期待度数はTESTF=に指定された値になります。FREQプロシジャで指定された寄与率の検定を計算する場合、TESTP=オプションを使用して帰無仮説の寄与率を入力すると、期待度数はTESTP=に指定された寄与率 $p_ i$ に基づいて、次の式により決定されます。

$e_{i} = p_{i} \times n \hspace{.2in} \mr{for} \hspace{.1in} i = 1,2,\ldots ,C$

この帰無仮説(等しい寄与率、指定された度数、指定された寄与率を持つ)の下では、 $Q_{\mi {P}}$ は自由度C–1の漸近カイ2乗分布に従います。

漸近検定に加えて、EXACTステートメントでCHISQオプションを指定すると、一元表に対する正確なカイ2乗検定を要求できます。詳細は、正確な統計量のセクションを参照してください。

二元表に対するPearsonカイ2乗検定

二元表に対するPearsonカイ2乗検定では、観測度数と期待度数間の差異を取り扱います。ここで、期待度数は、独立帰無仮説に基づいて計算されます。Pearsonカイ2乗統計量は次のように計算されます。

$Q_{\mi{P}} = \sum _ i \sum _ j (n_{ij} - e_{ij})^2 / e_{ij}$

ここで、 $n_{ij}$ はテーブルセル(i, j)の測定度数、 $e_{ij}$ はテーブルセル(i, j)の期待度数です。期待度数は、行変数と列変数が独立であるという帰無仮説に基づいて計算されます。

$e_{ij} = ( n_{i \cdot } ~ n_{\cdot j} ) ~ / ~ n$

行変数と列変数が独立である場合、 $Q_{\mi {P}}$ は自由度が(R–1)(C–1)の漸近カイ2乗分布に従います。 $Q_{\mi {P}}$ の値が大きい場合、この検定では帰無仮説ではなく、一般連関性の対立仮説を使用することを推奨します。

漸近検定に加えて、EXACTステートメントでPCHIオプションまたはCHISQオプションを指定すると、正確なPearsonカイ2乗検定を要求できます。詳細は、正確な統計量のセクションを参照してください。

$2 \times 2$ 表の場合、Pearsonカイ2乗を適用することで、2つの二項比率が等しいかどうかも検定できます。 $R \times 2$ 表や $2 \times C$ 表の場合、Pearsonカイ2乗は寄与率の等質性を検定します。詳細は、Fienberg (1980)を参照してください。

標準化残差

一元表や多元クロス表向けのTABLESステートメントでCROSSLIST(STDRES)オプションを指定すると、FREQプロシジャはCROSSLIST表に標準化残差を表示します。

クロス集計表セルの標準化残差は、(度数 – 期待)の標準誤差に対する比率になります。ここで、度数とは表セルの度数であり、期待とは期待されるセル度数の推定値です。期待度数は、行変数と列変数が独立であるという帰無仮説に基づいて計算されます。詳細は、二元表に対するPearsonカイ2乗検定のセクションを参照してください。

FREQプロシジャは、表セル(i, j)の標準化残差を次の式により計算します。

$( n_{ij} - e_{ij} ) ~ / ~ \sqrt { e_{ij} ( 1 - p_{i \cdot } ) ( 1 - p_{\cdot j} ) }$

ここで、 $n_{ij}$ は表セル(i, j)の測定度数、 $e_{ij}$ は同表セルの期待度数、 $p_{i \cdot }$ は行i ( $n_{i \cdot } / n$ )における寄与率、 $p_{\cdot j}$ は列j ( $n_{\cdot j} / n$ )における寄与率です。表セル(i, j)の期待度数は次の式で計算されます。

$e_{ij} = ( n_{i \cdot } ~ n_{\cdot j} ) ~ / ~ n$

独立性の帰無仮説の下では、各標準化残差は漸近標準正規分布に従います。詳細については、Agresti (2007)のセクション2.4.5 を参照してください。

一元表に対する尤度比カイ2乗検定

一元度数表の場合、TABLESステートメントでCHISQ(LRCHI)オプションを指定すると、尤度比カイ2乗適合度検定が行われます。デフォルトでは、この尤度比検定は、一元表のCクラス(水準)において等しい寄与率を持つという帰無仮説に基づきます。CHISQ(TESTP=)またはCHISQ(TESTF=)オプションを使用して、帰無仮説の寄与率または度数を指定した場合、この尤度比検定は、指定した帰無仮説の値に基づきます。

FREQプロシジャは、一元尤度比検定を次のように計算します。

$G^2 = 2 ~ \sum _{i=1}^ C f_ i \ln ( f_ i / e_ i )$

ここで、 $f_ i$ は帰無仮説の下でのクラスiの測定度数、 $e_ i$ は帰無仮説の下でのクラスiの期待度数です。

等しい寄与率を持つという帰無仮説の下では、各クラスの期待度数は、合計標本サイズをクラス数で割った値に等しくなります。

$e_ i = n ~ / ~ C \hspace{.2in} \mr{for} \hspace{.1in} i = 1,2,\ldots ,C$

TABLESステートメントでCHISQ(TESTF=)オプションを指定することにより帰無仮説を設定した場合、期待度数は指定したTESTF=値になります。TABLESステートメントでCHISQ(TESTP=)オプションを指定することにより帰無仮説を設定した場合、FREQプロシジャは期待度数を次のように計算します。

$e_{i} = p_{i} \times n \hspace{.2in} \mr{for} \hspace{.1in} i = 1,2,\ldots ,C$

ここで、寄与率 $p_ i$ は、指定したTESTP=値です。

この帰無仮説(等しい寄与率、指定された度数、指定された寄与率を持つ)の下では、尤度比統計量 $G^2$ は、自由度C–1の漸近カイ2乗分布に従います。

漸近検定に加えて、EXACTステートメントでLRCHIオプションを指定すると、一元表に対する正確な尤度比カイ2乗検定を要求できます。詳細は、正確な統計量のセクションを参照してください。

尤度比カイ2乗検定

尤度比カイ2乗検定では、観測度数と期待度数間の比を取り扱います。尤度比カイ2乗統計量は次のように計算されます。

$G^2 = 2 \sum _ i \sum _ j n_{ij} \ln \left( n_{ij} / e_{ij} \right)$

ここで、 $n_{ij}$ はテーブルセル(i, j)の測定度数、 $e_{ij}$ はテーブルセル(i, j)の期待度数です。

行変数と列変数が独立である場合、 $G^2$ は自由度が(R–1)(C–1)の漸近カイ2乗分布に従います。

漸近検定に加えて、EXACTステートメントでLRCHIオプションまたはCHISQオプションを指定すると、正確な尤度比カイ2乗検定を要求できます。詳細は、正確な統計量のセクションを参照してください。

連続性補正カイ2乗検定

$2 \times 2$ 表に対する連続性補正カイ2乗検定は、Pearsonカイ2乗検定と同じになりますが、カイ2乗分布の連続性が補正される点が異なります。連続性補正カイ2乗検定は、標本サイズが小さい場合に役立ちます。連続性補正の使用に関しては議論が分かれることがありますが、標本サイズが小さい場合には、連続性補正カイ2乗検定がより保守的となります(すなわち、よりFisherの正確検定に近づきます)。標本サイズが大きくなると、連続性補正カイ2乗検定は、Pearsonカイ2乗検定により近づきます。

連続性補正カイ2乗統計量は次のように計算されます。

$Q_{\mi{C}} = \sum _ i \sum _ j \left( ~ \max (0,|n_{ij} - e_{ij}|-0.5) ~ \right)^2 ~ / ~ e_{ij}$

独立性の帰無仮説の下では、 $Q_{\mi {C}}$ は自由度が(R–1)(C–1)の漸近カイ2乗分布に従います。

Mantel-Haenszelカイ2乗検定

Mantel-Haenszelカイ2乗統計量は、行変数と列変数間に線形連関性が存在するという対立仮説を検定します。両変数は順序尺度でなければなりません。Mantel-Haenszelカイ2乗統計量は次のように計算されます。

$Q_{\mi{MH}} = (n-1)r^2$

ここで、rは行変数と列変数間のPearson相関です。Pearson相関の詳細は、Pearsonの相関係数を参照してください。Pearsonの相関統計量およびMantel-Haenszelカイ2乗統計量は、TABLESステートメントのSCORES=オプションに指定されたスコアを使用します。詳細は、Mantel and Haenszel (1959)およびLandis, Heyman, and Koch (1978)を参照してください。

連関性がないという帰無仮説の下では、 $Q_{\mi {MH}}$ は自由度が1の漸近カイ2乗分布に従います。

漸近検定に加えて、EXACTステートメントでMHCHIオプションまたはCHISQオプションを指定すると、正確なMantel-Haenszelカイ2乗検定を要求できます。詳細は、正確な統計量のセクションを参照してください。

Fisherの正確検定

Fisherの正確検定は、行変数と列変数間の連関性を検定する方法の1つです。この検定では、行と列の合計が固定されていると仮定した上で、超幾何分布を使用して観測された行および列合計の条件に応じて可能な表の確率を計算します。Fisherの正確検定は、いかなる標本サイズの大きな分布の仮定にも依存しないため、標本サイズの小さな分布や疎な分布に対しても適用できます。

2 $\times$ 2表

$2 \times 2$ 表の場合、FREQプロシジャはFisherの正確検定に関する情報として、表確率、両側p値、左側p値、右側p値を提供します。表確率は、観測された表の超幾何確率に等しくなります。これは、実際にはFisherの正確検定の検定統計量の値になります。

ここで、pは、観測された行および列の合計を含む特定の表の超幾何確率です。Fisherの正確なp値は、定義された表の集合に関して確率pを合計することにより計算されます。

$\mr{Prob} = \sum _ A p$

両側p値は、観測された表確率以下のすべての可能な表の確率の合計(観測された行および列合計の条件に基づくもの)になります。両側p値の場合、集合Aには、観測された表の確率以下の超幾何確率を持つすべての可能な表が含まれます。小さな両側p値は、行変数と列変数間に連関性があるという対立仮説を支持します。

$2 \times 2$ 表の場合、Fisherの正確検定の片側p値は、表の最初の行と最初の列にあるセル(1,1)の度数として定義されます。観測された(1,1)セルの度数を $n_{11}$ で表すと、Fisherの正確検定の左側p値は、(1,1)セルの度数が $n_{11}$ 以下である確率になります。左側p値の場合、集合Aには、(1,1)セルの度数が $n_{11}$ 以下である表が含まれます。小さな左側p値は、オブザベーションが最初のセルに存在する確率が、行変数と列変数が独立であるという帰無仮説の下で期待される確率よりも低いという対立仮説を支持します。

同様に、右側対立仮説では、Aは、セル(1,1)の度数が観測された同セルの度数以上である表の集合になります。小さい両側p値は、最初のセルの確率が帰無仮説の下での期待確率よりも実際には大きいという対立仮説を支持します。

周辺行および列の合計が固定されている場合、(1,1)セルの度数が完全に $2 \times 2$ 表を決定するため、他のセルの確率やセル確率の比に関して、これらの片側対立仮説を等しく主張できます。左側対立仮説は、1未満のオッズ比に等しくなります。ここで、オッズ比は( $n_{11}n_{22}/n_{12}n_{21}$ )です。また、左側対立仮説は、行1の列1リスクが行2の列1リスクよりも小さいこと( $p_{1|1} < p_{1|2}$ に等しくなります。同様に、右側対立仮説は、行1の列1リスクが行2の列1リスクよりも大きいこと( $p_{1|1} > p_{1|2}$ )に等しくなります。詳細はAgresti (2007)を参照してください。

R $\times$ C表

Fisherの正確検定は、Freeman and Halton (1951)により一般的な $R \times C$ 表へと拡張されました。この検定はFreeman-Halton検定とも呼ばれます。 $R \times C$ 表の場合、両側p値の定義は $2 \times 2$ 表の場合と同じになります。集合Aには、観測された表の確率以下のpを持つすべての表が含まれます。小さなp値は、行変数と列変数間に連関性があるという対立仮説を支持します。 $R \times C$ 表の場合、Fisherの正確検定は本質的に両側検定となります。対立仮説は、線形連関性としてではなく、一般的な連関性としてのみ定義されます。このため、Fisherの正確検定は、一般的な $R \times C$ 表に関しては右側または左側p値を持ちません。

$R \times C$ 表の場合、FREQプロシジャは、Mehta and Patel (1983)のネットワークアルゴリズムを使用してFisherの正確検定を計算します。同アルゴリズムは、すべての組み合わせを列挙していく方法よりも高速で効率の良い解を提供します。詳細は、正確な統計量のセクションを参照してください。

ファイ係数

ファイ係数は、Pearsonカイ2乗統計量から導かれる連関性の統計量です。ファイ係数の範囲は、 $2 \times 2$ 表の場合、 $-1 \leq \phi \leq 1$ になります。 $2 \times 2$ より大きい表の場合、ファイ係数の範囲は $0 \leq \phi \leq \min (\sqrt {R-1}, \sqrt {C-1})$ になります(Liebetrau, 1983)。ファイ係数は次のように計算されます。

$\phi = \left( n_{11} n_{22} - n_{12} n_{21} \right) / \sqrt {n_{1 \cdot } n_{2 \cdot } n_{\cdot 1} n_{\cdot 2}} \hspace{.2in} \mbox{for } 2 \times 2 ~ \mr{tables}$

$\phi = \sqrt {Q_{\mi{P}} / n} \hspace{.2in} \mr{otherwise}$

詳細は、Fleiss, Levin, and Paik (2003, pp. 98–99)を参照してください。

一致係数

一致係数は、Pearsonカイ2乗統計量から導かれる連関性の統計量です。一致係数の範囲は、 $0 \leq P \leq \sqrt {(m - 1)/m}$ になります。ここで、 $m = \min (R,C)$ です(Liebetrau, 1983)。一致係数は次のように計算されます。

$P = \sqrt { Q_{\mi{P}} ~ / ~ (Q_{\mi{P}} + n) }$

詳細は、Kendall and Stuart (1979, pp. 587–588)を参照してください。

CramérのV

CramérのVは、Pearsonカイ2乗統計量から導かれる連関性の統計量です。これは到達可能上限が常に1となるように作られています。CramérのVの範囲は、 $2 \times 2$ 表の場合、 $-1 \leq V \leq 1$ になります。 $2 \times 2$ よりも大きい表の場合、範囲は $0 \leq V \leq 1$ になります。CramérのVは次のように計算されます。