FREQプロシジャ

2x2表に対するオッズ比と相対リスク

オッズ比

オッズ比は、各種の研究デザインにおいて連関性の有益な統計量となります。ケースコントロール研究と呼ばれる後ろ向きデザインでは、オッズ比を使用することで肯定応答が小さい場合の相対リスクを推定できます(Agresti, 2002)。ケースコントロール研究では、2つの独立標本が2値(yes/no式)応答変数に基づいて特定され、2値説明変数の条件付き分布が応答変数の固定水準内において検証されます。詳細は、Stokes, Davis, and Koch (2012)およびAgresti (2007)を参照してください。

行1の肯定応答(列1)のオッズ比は$ n_{11} / n_{12}$になります。同様に、行2の肯定応答のオッズ比は$ n_{21} / n_{22}$になります。オッズ比は、行1のオッズの行2のオッズに対する比として形成されます。$2 \times 2$表に対するオッズ比は次のように定義されます。

\[  \mathit{OR} = \frac{n_{11}/n_{12}}{n_{21}/n_{22}} = \frac{n_{11} ~  n_{22}}{n_{12} ~  n_{21}}  \]

オッズ比は任意の非負数になります。行変数と列変数が独立である場合、オッズ比の真の値は1になります。オッズ比が1より大きい場合、行1の肯定応答のオッズが行2よりも高いことを意味します。オッズ比が1より小さい場合、行2の肯定応答のオッズが行1よりも高いことを意味します。連関性の強度は、1からの偏差で増加します。

変換$G = (\mathit{OR}-1)/(\mathit{OR}+1)$はオッズ比を範囲(–1,1)へと変換します。ここで、$\mathit{OR} = 1$の場合G = 0となり、$\mathit{OR} = 0$の場合G= –1となります。また、ORが無限大に近づとG は1に近づきます。Gはガンマ統計量であり、これはMEASURESオプションを指定した場合にFREQプロシジャにより計算されます。

オッズ比の$100(1-\alpha )$%の漸近信頼限界は次のようになります。

\[  \left( ~  \mathit{OR} \times \exp ( -z \sqrt {v} ), ~ ~  \mathit{OR} \times \exp ( z \sqrt {v} ) ~  \right)  \]

ここで、

\[  v = \mr{Var} (\ln \mathit{OR}) = \frac{1}{n_{11}} + \frac{1}{n_{12}} + \frac{1}{n_{21}} + \frac{1}{n_{22}}  \]

zは、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。4つのセル度数のいずれかがゼロである場合、推定値は計算されません。

オッズ比のスコア信頼限界

オッズ比のスコア信頼限界 (Miettinen and Nurminen, 1985)は、オッズ比のスコア検定を反転することにより計算されます。オッズ比が$\theta $に等しいという帰無仮説に対するスコアに基づくカイ2乗検定統計量は、次のように表されます。

\[  Q(\theta ) = \{  n_{1 \cdot } \left( \hat{p}_1 - \tilde{p}_1 \right) \} ^2 ~  / ~  \{  n / (n-1) \}  ~  \{  1 / \left( n_{1 \cdot } \tilde{p}_1 ( 1 - \tilde{p}_1 ) \right) + 1 / \left( n_{2 \cdot } \tilde{p}_2 ( 1 - \tilde{p}_2 ) \right) \} ^{-1}  \]

ここで、$\hat{p}_1$は観測された行1のリスク(比率)であり、$\tilde{p}_1$および$\tilde{p}_2$は、オッズ比($n_{11} n_{22} / n_{12} n_{21}$)が$\theta $であるという制限の下での行1と行2のリスクの最尤推定値です。詳細は、Miettinen and Nurminen (1985)およびMiettinen (1985, chapter 14)を参照してください。

オッズ比の$100(1-\alpha )$%のスコア信頼区間は、検定統計量$Q(\theta )$が選択域に入る、$\theta $のすべての値により構成されます。

\[  \{  \theta : Q(\theta ) < \chi ^2_{1, \alpha } \}   \]

ここで、$\chi ^2_{1, \alpha }$は、自由度が1であるカイ2乗分布の100$(1-\alpha )$番目のパーセント点です。FREQプロシジャは、反復計算により信頼限界を求めます。スコア信頼限界の詳細は、Agresti (2013)を参照してください。

デフォルトで、スコア信頼限界には、$Q(\theta )$の分母のバイアス補正因子$n/(n-1)$が含まれます(Miettinen and Nurminen, 1985, p. 217)。CL=SCORE(CORRECT=NO)オプションを指定すると、FREQプロシジャは、計算にこの因子を含めません。

オッズ比が$\theta $であるという制約を受けた、$p_1$および$p_2$の最尤推定値は、次のように計算されます。

\[  \tilde{p_2} = \left( -b + \sqrt { b^2 - 4 a c } \right) / 2a \hspace{.15in} \mr{and} \hspace{.15in} \tilde{p_1} = \tilde{p}_2 \theta / \left( 1 + \tilde{p}_2 (\theta - 1) \right)  \]

ここで、

\begin{eqnarray*}  a &  = &  n_{2 \cdot } (\theta - 1 ) \\ b &  = &  n_{1 \cdot } \theta + n_{2 \cdot } - \hat{p}_{\cdot 1} (\theta - 1) \\ c &  = &  - \hat{p}_{\cdot 1} \end{eqnarray*}

詳細は、Miettinen and Nurminen (1985, pp. 217–218)およびMiettinen (1985, chapter 14)を参照してください。

オッズ比の正確な信頼限界

EXACTステートメントでORオプションを指定すると、FREQプロシジャはオッズ比の正確な信頼限界を計算します。これは離散的な問題であるため、正確な信頼区間の信頼係数は、厳密には$(1-\alpha )$ではなく最小で$(1-\alpha )$となります。このため、これらの信頼限界は保守的となります。詳細は、Agresti (1992)を参照してください。

FREQプロシジャは、Thomas (1971)に基づくアルゴリズムを使用してオッズ比の正確な信頼限界を計算します。Gart (1971)も参照してください。次の2つの問題を繰り返し解くことにより、上側および下側の信頼限界である$\phi _1$および$\phi _2$を決定できます。

\begin{eqnarray*}  \sum _{i=n_{11}}^{n_{\cdot 1}} \binom {n_{1 \cdot }}{i} \binom {n_{2 \cdot }}{n_{\cdot 1} - i} ~  \phi _1^ i ~ ~  / ~ ~  \sum _{i=0}^{n_{\cdot 1}} \binom {n_{1 \cdot }}{i} \binom {n_{2 \cdot }}{n_{\cdot 1}-i} ~  \phi _1^ i ~  &  = &  ~  \alpha /2 \\[0.10in] \sum _{i=0}^{n_{11}} \binom {n_{1 \cdot }}{i} \binom {n_{2 \cdot }}{n_{\cdot 1} - i} ~  \phi _2^ i ~ ~  / ~ ~  \sum _{i=0}^{n_{\cdot 1}} \binom {n_{1 \cdot }}{i} \binom {n_{2 \cdot }}{n_{\cdot 1} - i} ~  \phi _2^ i ~  &  = &  ~  \alpha /2 \end{eqnarray*}

オッズ比がゼロである場合(これは$n_{11} = 0$または$n_{22} = 0$の場合に起こる)、FREQプロシジャは、下側の正確な信頼限界をゼロに設定し、水準$\alpha $を使用して上側限界を決定します。同様に、オッズ比が無限大である場合(これは$n_{12} = 0$または$n_{21} = 0$の場合に起こる)、FREQプロシジャは、上側の正確な信頼限界を無限大に設定し、水準$\alpha $を使用して下側限界を決定します。

相対リスク

この相対リスクの統計量は、説明変数の有無に基づいて2つの標本を特定するようなコーホート(前向き)研究デザインで役立ちます。 この研究では、2つの標本が2値(yes/no)の応答変数に対してこれから観測されます。相対リスク統計量は、2変数を同時に観測するクロスセクション研究でも役立ちます。詳細は、Stokes, Davis, and Koch (2012)およびAgresti (2007)を参照してください。

列1の相対リスクは、行1の列1リスクの、行2の列1リスクに対する比率になります。行1の列1リスクは、列1に分類されている行1オブザベーションの比率であり、次のように表されます。

\[  p_1 = n_{11} ~  / ~  n_{1 \cdot }  \]

同様に、行2の列1リスクは次のように表されます。

\[  p_2 = n_{21} ~  / ~  n_{2 \cdot }  \]

列1の相対リスクは次のように計算されます。

\[  \mathit{RR}_1 = p_1 ~  / ~  p_2  \]

相対リスクが1より大きい場合、行1の肯定応答の確率が行2よりも大きいことを意味します。同様に、相対リスクが1より小さい場合、行1の肯定応答の確率が行2よりも小さいことを意味します。連関性の強度は、1からの偏差で増加します。

列1の相対リスクの$100(1-\alpha )$%の漸近信頼限界は、次のように計算されます。

\[  \left( ~  \mathit{RR}_1 \times \exp ( -z \sqrt {v} ) , ~ ~  \mathit{RR}_1 \times \exp ( z \sqrt {v} ) ~  \right)  \]

ここで、

\[  v = \mr{Var} (\ln \mathit{RR}_1) = \bigl ( (1-p_1) / n_{11} \bigr ) ~  + ~  \bigl ( (1-p_2) / n_{21} \bigr )  \]

zは、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。$n_{11}$または$n_{21}$がゼロである場合、推定値は計算されません。

FREQプロシジャは、列2の相対リスクを同じ方法で計算します。

相対リスクのスコア信頼限界

相対リスクのスコア信頼限界(Miettinen and Nurminen, 1985; Farrington and Manning, 1990)は、相対リスクのスコア検定を反転することにより計算されます。相対リスクが$\mathit{R_0}$に等しいという帰無仮説に対するスコアに基づくカイ2乗検定統計量は、次のように表されます。

\[  Q(\mathit{R_0}) = ( \hat{p_1} - \mathit{R_0} \hat{p_2} )^2 ~  / ~  \widetilde{\mr{Var}}(\mathit{R_0})  \]

ここで、$\hat{p}_1$$\hat{p}_2$はそれぞれ、観測された行1と行2のリスク(比率)です。

\[  \widetilde{\mr{Var}}(\mathit{R_0}) = \left( n / (n-1) \right) ~  \left( ~  \tilde{p}_1 (1-\tilde{p}_1) / n_{1 \cdot } ~ +~  \mathit{R_0}^2 ~  \tilde{p}_2 (1-\tilde{p}_2) / n_{2 \cdot } ~  \right)  \]

ここで、$\tilde{p}_1$および$\tilde{p}_2$はそれぞれ、相対リスクが$\mathit{R_0}$に等しいという帰無仮説の下での$p_1$および$p_2$の最尤推定値です。詳細は、Miettinen and Nurminen (1985)およびMiettinen (1985, chapter 13)を参照してください。

相対リスクの$100(1-\alpha )$%のスコア信頼区間は、検定統計量$Q(\mathit{R_0})$が選択域に入る、$\mathit{R_0}$のすべての値により構成されます。

\[  \{  R_0: Q(\mathit{R_0}) < \chi ^2_{1, \alpha } \}  \\  \]

ここで、$\chi ^2_{1, \alpha }$は、自由度が1であるカイ2乗分布の100$(1-\alpha )$番目のパーセント点です。FREQプロシジャは、反復計算により信頼限界を求めます。スコア信頼限界の詳細は、Agresti (2013)を参照してください。

デフォルトで、スコア信頼限界には、$Q(\mathit{R_0})$の分母のバイアス補正因子$n/(n-1)$が含まれます(Miettinen and Nurminen, 1985, p. 217)。CL=SCORE(CORRECT=NO)オプションを指定すると、FREQプロシジャは、計算にこの因子を含めません。

相対リスクが$\mathit{R_0}$であるという制約を受けた、$p_1$および$p_2$の最尤推定値は、次のように計算されます。

\[  \tilde{p}_1 = \left( -b - \sqrt {b^2 - 4ac} \right) / 2a \hspace{.15in} \mr{and} \hspace{.15in} \tilde{p}_2 = \tilde{p}_1 / \mathit{R_0}  \]

ここで、

\begin{eqnarray*}  a &  = &  1 + \theta \\ b &  = &  - \left( \mathit{R_0} ( 1 + \theta \hat{p}_2 ) + \theta + \hat{p}_1 \right) \\ c &  = &  \mathit{R_0} ( \hat{p}_1 + \theta \hat{p}_2 ) \\ \theta &  = &  n_{2 \cdot } / n_{1 \cdot } \end{eqnarray*}

詳細は、Farrington and Manning (1990, p. 1454)およびMiettinen and Nurminen (1985, p. 217)を参照してください。

相対リスクの正確な条件なしの信頼限界

EXACTステートメントでRELRISKオプションを指定すると、FREQプロシジャは、相対リスクの正確な条件なしの信頼限界を計算します。FREQプロシジャは、2つの個々の片側検定(裾を用いる手法)を反転して、信頼限界を計算します。ここで、各検定のサイズは最大で$\alpha /2$であり、信頼係数は最低でも$(1-\alpha )$になります。正確な条件付き方式(正確な統計量のセクションを参照)は、撹乱パラメータが存在するため、相対リスクには適用できません(Agresti, 1992)。条件なしの手法では、すべての可能な値に関してp値を最大化することで、撹乱パラメータを廃止しています(Santner and Snell, 1980)。

デフォルトでは、FREQプロシジャは、信頼限界の計算における検定統計量として、標準化されていない相対リスクを使用します。RELRISK(METHOD=SCORE)オプションを指定すると、同プロシジャは相対リスクのスコア統計量を使用します(Chan and Zhang, 1999)。スコア統計量は生の相対リスクよりも離散的でない統計量であるため、より保守的でない信頼限界を生成します(Agresti and Min, 2001)。正確な信頼限界の計算方法の比較については、Santner et al. (2007)も参照してください。

FREQプロシジャが使用する相対リスクの信頼限界の計算方法については、リスク差の正確な条件なしの信頼限界のセクションを参照してください。相対リスクの計算に使用される検定統計量は、標準化されていない相対リスク(デフォルト)か、または相対リスクのスコア統計量(RELRISK(METHOD=SCORE)オプションを指定した場合)のいずれかになります。FREQプロシジャは、次のような標準化されていない相対リスクの形式を使用します。これは、各度数に対して0.05を加算し、ゼロの表セルが存在する場合でも同統計量が定義されることを保証します(Gart and Nam, 1988)。

\[  \mathit{rr} = \frac{ (n_{11} + 0.5) ~  / ~  ( n_{1 \cdot } + 0.5 ) }{ (n_{21} + 0.5) ~  / ~  ( n_{2 \cdot } + 0.5 ) }  \]

RELRISK(METHOD=SCORE)オプションを指定すると、同プロシジャは相対リスクのスコア統計量を使用します(Miettinen and Nurminen, 1985、Farrington and Manning, 1990)。この検定統計量は次のように計算されます。

\[  z = ( \hat{p_1} - \mathit{R_0} \hat{p_2} ) ~  / ~  \mr{se}(\mathit{rr})  \]

ここで、

\[  \mr{se}(\mathit{rr}) = \sqrt { \tilde{p}_1 (1-\tilde{p}_1) / n_{1 \cdot } ~ +~  \mathit{R_0}^2 ~  \tilde{p}_2 (1-\tilde{p}_2) / n_{2 \cdot } }  \]

ここで、$\tilde{p}_1$および$\tilde{p}_2$は、相対リスクが$\mathit{R_0}$に等しいという帰無仮説の下での$p_1$および$p_2$の最尤推定値です。最尤解は次のようになります。

\[  \tilde{p}_1 = ( -b - \sqrt {b^2 - 4ac} ) / 2a \hspace{.15in} \mr{and} \hspace{.15in} \tilde{p}_2 = \tilde{p}_1 / \mathit{R_0}  \]

ここで、

\begin{eqnarray*}  a &  = &  1 + \theta \\ b &  = &  - \left( \mathit{R_0} ( 1 + \theta \hat{p}_2 ) + \theta + \hat{p}_1 \right) \\ c &  = &  \mathit{R_0} ( \hat{p}_1 + \theta \hat{p}_2 ) \\ \theta &  = &  n_{2 \cdot } / n_{1 \cdot } \end{eqnarray*}

詳細は、Farrington and Manning (1990, p. 1454)およびMiettinen and Nurminen (1985, p. 217)を参照してください。