FREQプロシジャ

リスクとリスク差

TABLESステートメントでRISKDIFFオプションを指定すると、$2 \times 2$表のリスク(二項比率)とリスク差の推定値を計算できます。この分析は、行1と行2が2つのグループに対応し、列が2つの可能な特性または結果に対応しているような2つのグループの特性を比較する場合に適しています。たとえば、行変数が処置または投薬量で、列変数が反応である場合などが挙げられます。詳細は、Collett (1991)、Fleiss, Levin, and Paik (2003)、Stokes, Davis, and Koch (2012)を参照してください。

$2 \times 2$表の度数が次のように表されるとします。

 

列1

列2

合計

行1

$n_{11}$

$n_{12}$

$n_{1 \cdot }$

行2

$n_{21}$

$n_{22}$

$n_{2 \cdot }$

合計

$n_{\cdot 1}$

$n_{\cdot 2}$

N

デフォルトでは、RISKDIFFオプションを指定すると、FREQプロシジャは、行1のリスク(比率)、行2のリスク、全体的なリスクの推定値、および$2 \times 2$表の列1と列2のリスク差を計算します。リスク差は、行1のリスクから行2のリスクを差し引いたものとして定義されます。リスクはこれらの行(行1、行2、または全体)の二項比率であり、それらの標準誤差および信頼限界の計算は、二項比率のセクションに示されている二項比率の計算方法に従います。

行1の列1リスクは、列1に分類される行1オブザベーションの比率であり、次の式で表されます。

\[  \hat{p}_1 = n_{11} ~  / ~  n_{1 \cdot }  \]

これは、行変数の第1水準における列1の反応の条件付き確率を推定します。行2の列1リスクは、列1に分類される行2オブザベーションの比率であり、次の式で表されます。

\[  \hat{p}_2 = n_{21} ~  / ~  n_{2 \cdot }  \]

全体的な列1リスクは、列1に分類されるすべてのオブザベーションの比率であり、次の式で表されます。

\[  \hat{p} = n_{\cdot 1} ~  / ~  n  \]

列1のリスク差は2つの行のリスクを比較するものであり、行1の列1リスクから行2の列1リスクを差し引いたものとして計算されます。

\[  \hat{d} = \hat{p}_1 - \hat{p}_2  \]

iの列1リスクの標準誤差は次のように計算されます。

\[  \mr{se}(\at{p}_ i) = \sqrt { \hat{p}_ i ~  ( 1 - \hat{p}_ i ) ~  / ~  n_{i \cdot } }  \]

全体的な列1リスクの標準誤差は次のように計算されます。

\[  \mr{se}(\hat{p}) = \sqrt { \hat{p} ~  ( 1 - \hat{p} ) ~  / ~  n }  \]

2つの行が独立した二項標本を表している場合、列1のリスク差の標準誤差は次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1 - \hat{p}_1) / n_{1 \cdot } ~  + ~  \hat{p}_2 (1 - \hat{p}_2) / n_{2 \cdot }}  \]

列2のリスクとリスク差も同様に計算されます。

信頼限界

デフォルトでは、RISKDIFFオプションは、リスク(行1、行2、全体)およびリスク差のWald漸近信頼限界を計算します。デフォルトでは、RISKDIFFオプションは、リスクの正確な(Clopper-Pearson)信頼限界も計算します。この情報を表示しないようにするには、NORISKS riskdiff-optionを指定します。riskdiff-optionsを指定すると、リスク差の検定や別の種類の信頼限界を要求できます。詳細は、リスク差の信頼限界およびリスク差の検定の各セクションを参照してください。

各リスクは、それらの対応する行の二項比率に等しくなります。このセクションでは、RISKDIFFオプションを指定した場合にデフォルトで計算されるWald信頼限界について説明します。BINOMIALオプションを指定すると、リスク(二項比率)のその他の信頼限界の種類や検定も計算されます。詳細は、二項分布の信頼限界および二項検定の各セクションを参照してください。

Wald信頼限界は、二項分布の正規近似に基づきます。FREQプロシジャは、リスクとリスク差のWald信頼限界を次のように計算します。

\[  \mr{Est} ~  \pm ~  (~  z_{\alpha /2} \times \mr{se}(\mr{Est}) ~ )  \]

ここで、Estは推定値、$z_{\alpha /2}$は標準正規分布の$100(1-\alpha /2)$番目のパーセント点、$\mr {se}(\mr {Est})$は推定値の標準誤差です。信頼水準$\alpha $は、ALPHA=オプションにより定義されます。この値はデフォルトで0.05であり、95%の信頼限界を生成します。

CORRECT riskdiff-optionを指定すると、FREQプロシジャは、リスクとリスク差の連続性補正Wald信頼限界を計算します。この連続性補正の目的は、正規近似と、離散型分布である二項分布との間の差異を調整することにあります。詳細は、Fleiss, Levin, and Paik (2003)を参照してください。連続性補正Wald信頼限界は次のように計算されます。

\[  \mr{Est} ~  \pm ~  (~  z_{\alpha /2} \times \mr{se}(\mr{Est}) + \mathit{cc} ~ )  \]

ここで、ccは連続性補正です。行1リスクの場合$\mathit{cc} = (1/2n_{1 \cdot })$、行2リスクの場合$\mathit{cc} = (1/2n_{2 \cdot })$、全体的なリスクの場合$\mathit{cc} = (1/2n)$、リスク差の場合$\mathit{cc} = ((1/n_{1 \cdot } + 1/n_{2 \cdot })/2)$になります。列1および列2のリスクの場合、同じ連続性補正を使用します。

デフォルトでは、RISKDIFFオプションを指定すると、FREQプロシジャは、列1のリスク、列2のリスク、全体的なリスクの正確な(Clopper-Pearson)信頼限界も計算します。これらの信頼限界は、二項分布に基づく等尾部検定を反転することにより構成されます。詳細は、正確な(Clopper-Pearson)信頼限界のセクションを参照してください。

リスク差の信頼限界

CL= riskdiff-optionを指定することで、リスク差のその他の信頼限界を要求できます。使用できる信頼限界の種類としては、Agresti-Caffo信頼限界、正確な条件なしの信頼限界、Hauck-Anderson信頼限界、Miettinen-Nurminen(スコア)信頼限界、Newcombe(ハイブリッドスコア)信頼限界、Wald信頼限界があります。連続性補正Newcombe信頼限界およびWald信頼限界も使用できます。

CL= riskdiff-optionにより生成される信頼限界の信頼係数は$100(1-\alpha )$%になります。ここで、$\alpha $の値はALPHA=オプションにより決定されます。デフォルトのALPHA=0.05は、95%の信頼限界を生成します。この信頼限界は、同等性、非劣性、優越性の検定により提供される検定ベースの信頼限界とは異なり、$100(1-2\alpha )$%の信頼係数(Schuirmann, 1999)を持ちます。詳細は、リスク差の検定のセクションを参照してください。

正確な信頼限界の計算方法については、リスク差の正確な条件なしの信頼限界のセクションを参照してください。これらの信頼限界は、2つの個々の片側検定(裾を用いる手法)を反転して求められます。デフォルトでは、検定は標準化されていないリスク差に基づきます。RISKDIFF(METHOD=SCORE)オプションを指定すると、検定はスコア統計量に基づくようになります。

次のセクションでは、リスク差のAgresti-Coull信頼限界、Hauck-Anderson信頼限界、Miettinen-Nurminen(スコア)信頼限界、Newcombe(ハイブリッドスコア)信頼限界、Wald信頼限界の計算方法について説明します。

Agresti-Caffo信頼限界 リスク差のAgresti-Caffo信頼限界は、次のように計算されます。

\[  \tilde{d} ~  \pm ~  ( ~  z_{\alpha /2} \times \mr{se}(\tilde{d}) ~  )  \]

ここで、$\tilde{d} = \tilde{p}_1 - \tilde{p}_2$, $\tilde{p}_ i = ( n_{i1} + 1 ) / ( n_{i \cdot } + 2 )$

\[  \mr{se}(\tilde{d}) = \sqrt { \tilde{p}_1 ( 1 - \tilde{p}_2 ) / ( n_{1 \cdot } + 2 ) ~  + ~  \tilde{p}_2 ( 1 - \tilde{p}_2 ) / ( n_{2 \cdot } + 2 ) }  \]

$z_{\alpha /2}$は、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。

Agresti-Caffo区間は、各標本の種類(成功と失敗)ごとに疑似オブザベーションを追加することで、リスク差のWald区間を調整します。詳細については、Agresti and Caffo (2000)およびAgresti and Coull (1998)を参照してください。

Hauck-Anderson信頼限界 リスク差のHauck-Anderson信頼限界は次のように計算されます。

\[  \hat{d} ~  \pm ~  ( ~  \mathit{cc} ~  + ~  z_{\alpha /2} \times \mr{se}(\hat{d}) ~  )  \]

ここで、$\hat{d} = \hat{p}_1 - \hat{p}_2$であり、$z_{\alpha /2}$は標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。標準誤差は、標本比率から次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1-\hat{p}_1) / (n_{1 \cdot }-1) ~ +~  \hat{p}_2 (1-\hat{p}_2) / (n_{2 \cdot }-1) }  \]

Hauck-Anderson連続性補正ccは次のように計算されます。

\[  \mathit{cc} = 1 ~  / ~ \bigl ( 2 ~  \min ( n_{1 \cdot }, ~  n_{2 \cdot } ) \bigr )  \]

詳細は、Hauck and Anderson (1986)を参照してください。対応する非劣性の検定については、セクション非劣性の検定内のサブセクション"Hauck-Anderson検定"を参照してください。

Miettinen-Nurminen (スコア)信頼限界 リスク差のMiettinen-Nurminen (スコア)信頼限界(Miettinen and Nurminen, 1985)は、リスク差のスコア検定を反転することにより計算されます。リスク差が$\delta $に等しいという帰無仮説に対するスコアに基づく検定統計量は、次のように表されます。

\[  T(\delta ) = ( \hat{d} - \delta ) / \sqrt { \widetilde{\mr{Var}}(\delta })  \]

ここで、$\hat{d}$はリスク差($\hat{p}_1 - \hat{p}_2$)の観測値です。

\[  \widetilde{\mr{Var}}(\delta ) = \left( n / (n-1) \right) ~  \left( ~  \tilde{p}_1(\delta ) ( 1 - \tilde{p}_1(\delta ) ) / n_1 + \tilde{p}_2(\delta ) ( 1 - \tilde{p}_2(\delta ) ) / n_2 ~  \right)  \]

ここで、$\tilde{p}_1(\delta )$および$\tilde{p}_2(\delta )$は、リスク差が$\delta $であるという制限の下での行1と行2のリスク(比率)の最尤推定値です。詳細は、Miettinen and Nurminen (1985, pp. 215–216)およびMiettinen (1985, chapter 12)を参照してください。

リスク差の$100(1-\alpha )$%の信頼区間は、スコア統計量$T(\delta )$が選択域に入る、$\delta $のすべての値により構成されます。

\[  \{  \delta : T(\delta ) < z_{\alpha /2} \}   \]

ここで、$z_{\alpha /2}$は、標準正規分布の$100(1-\alpha /2)$番目のパーセント点です。FREQプロシジャは、反復計算により信頼限界を求めます。この計算は、反復の増分が収束基準を下回った場合か、または最大反復回数に達した場合に停止します。デフォルトでは、収束基準は0.00000001であり、 最大反復回数は100です。

デフォルトでは、Miettinen-Nurminen信頼限界は、バイアス補正因子$n/(n-1)$$\widetilde{\mr{Var}}(\delta )$の計算に含めます(Miettinen and Nurminen, 1985, p. 216)。詳細は、Newcombe and Nurminen (2011)を参照してください。CL=MN(CORRECT=NO) riskdiff-optionを指定すると、FREQプロシジャは、この計算にバイアス補正因子を含めません(Mee, 1984)。Agresti (2002, p. 77)も参照してください。無修正の信頼限界は、表示出力において“Miettinen-Nurminen-Mee”としてラベル付けされます。

リスク差が$\delta $であるという制約を受けた、$p_1$および$p_2$の最尤推定値は、次のように計算されます。

\[  \tilde{p}_1 = 2 u \cos (w) - b/3a \hspace{.15in} \mr{and} \hspace{.15in} \tilde{p}_2 = \tilde{p}_1 + \delta  \]

ここで、

\begin{eqnarray*}  w &  = &  ( \pi + \cos ^{-1}(v / u^3) ) / 3 \\ v &  = &  b^3 / (3a)^3 - bc/6a^2 + d/2a \\ u &  = &  \mr{sign}(v) \sqrt {b^2 / (3a)^2 - c/3a} \\ a &  = &  1 + \theta \\ b &  = &  - \left( 1 + \theta + \hat{p}_1 + \theta \hat{p}_2 + \delta (\theta + 2) \right) \\ c &  = &  \delta ^2 + \delta (2 \hat{p}_1 + \theta + 1) + \hat{p}_1 + \theta \hat{p}_2 \\ d &  = &  -\hat{p}_1 \delta (1 + \delta ) \\ \theta &  = &  n_{2 \cdot } / n_{1 \cdot } \end{eqnarray*}

詳細は、Farrington and Manning (1990, p. 1453)を参照してください。

Newcombe信頼限界 リスク差のNewcombe (ハイブリッドスコア)信頼限界は、2つの個別比率のそれぞれのWilsonスコア信頼限界から構成されます。個別比率の信頼限界は、比率差のWald信頼限界の標準誤差項目として使用されます。詳細は、Newcombe (1998a)およびBarker et al. (2001)を参照してください。

$p_1$および$p_2$のWilson信頼限界は次の根になります。

\[  | p_ i - \hat{p}_ i | = z_{\alpha /2} \sqrt { p_ i (1-p_ i)/n_{i \cdot } }  \]

ここで、$i = 1, 2$です。信頼限界は次のように計算されます。

\[  \left( \hat{p}_ i ~  + ~  z_{\alpha /2}^2/2n_{i \cdot } ~  \pm ~  z_{\alpha /2} \sqrt { \left( \hat{p}_ i (1-\hat{p}_ i) + z_{\alpha }^2 / 4n_{i \cdot } \right) / n_{i \cdot } } ~  \right) ~  / ~  \left( 1 + z_{\alpha /2}^2 / n_{i \cdot } \right)  \]

詳細は、Wilson (スコア)信頼限界のセクションを参照してください。

$p_1$の下側および上側のWilsonスコア信頼限界を$L_1$および$U_1$で表し、$p_2$の下側および上側のWilsonスコア信頼限界を$L_2$および$U_2$で表します。比率の差($d = p_1 - p_2$)のNewcombe信頼限界は次のように計算されます。

\begin{eqnarray*}  d_ L = (\hat{p}_1 - \hat{p}_2) ~  - ~  \sqrt { ( \hat{p}_1 - L_1 )^2 ~ +~  ( U_2 - \hat{p}_2 )^2 } \\[0.10in] d_ U = (\hat{p}_1 - \hat{p}_2) ~  + ~  \sqrt { ( U_1 - \hat{p}_1 )^2 ~ +~  ( \hat{p}_2 - L_2 )^2 } \end{eqnarray*}

CORRECT riskdiff-optionを指定すると、FREQプロシジャは、連続性補正Newcombeスコア信頼限界を計算します。連続性補正$1/2n_{i \cdot }$を含めることにより、個別比率のWilsonスコア信頼限界は次の根として計算されます。

\[  | p_ i - \hat{p}_ i | - 1/2n_{i \cdot } = z_{\alpha /2} \sqrt { p_ i (1-p_ i)/n_{i \cdot } }  \]

続いて、個別比率の連続性補正信頼限界を使用して、比率差の信頼限界$d_ L$および$d_ U$が計算されます。

Wald信頼限界 リスク差のWald信頼限界は次のように計算されます。

\[  \hat{d} ~  \pm ~  ( ~  z_{\alpha /2} \times \mr{se}(\hat{d}) ~  )  \]

ここで、$\hat{d} = \hat{p}_1 - \hat{p}_2$であり、$z_{\alpha /2}$は標準正規分布の$100(1-\alpha /2)$番目のパーセント点でし。標準誤差は、標本比率から次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1-\hat{p}_1) / n_{1 \cdot } ~ +~  \hat{p}_2 (1-\hat{p}_2) / n_{2 \cdot } }  \]

CORRECT riskdiff-optionを指定すると、Wald信頼限界に連続性補正ccが含まれます。

\[  \hat{d} ~  \pm ~  ( ~  \mathit{cc} ~  + ~  z_{\alpha /2} \times \mr{se}(\hat{d}) ~  )  \]

ここで、$\mathit{cc} = (1/n_{1 \cdot } + 1/n_{2 \cdot })/2$です。

対応する非劣性の検定については、セクション非劣性の検定内のサブセクション"Wald検定"を参照してください。

リスク差の検定

riskdiff-optionsを指定すると、リスク(比率)の差異の検定を要求できます。要求できる検定としては、リスク差の等価性、非劣性、優越性、同等性の検定があります。等価性の検定は、連続性補正ありまたは連続性補正なしの標準Wald漸近検定になります。リスク差の非劣性、優越性、同等性の検定では、検定方式として、Wald検定(連続性補正ありまたは連続性補正なし)検定、Hauck-Anderson検定、Farrington-Manning(スコア)検定、Newcombe(連続性補正ありまたは連続性補正なし)検定が使用できます。検定方法を指定するには、METHOD= riskdiff-optionを使用します。デフォルトでは、FREQプロシジャはMETHOD=WALDを使用します。

等価性の検定

EQUAL riskdiff-optionを指定すると、FREQプロシジャは等価性の検定、すなわちリスク差がゼロに等しいという帰無仮説の下での検定を計算します。列1(または列2)のリスク差の場合、この検定は帰無仮説$H_0\colon d = 0$および対立仮説$H_ a\colon d \neq 0$で表されます。ここで、$d = p_1 - p_2$は列1(または列2)のリスク差を表します。FREQプロシジャは、等価性のWald漸近検定を計算します。検定統計量は次のように計算されます。

\[  z = \hat{d} / \mr{se}(\hat{d})  \]

デフォルトでは、標準誤差は、標本比率から次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1-\hat{p}_1) / n_{1 \cdot } ~ +~  \hat{p}_2 (1-\hat{p}_2) / n_{2 \cdot } }  \]

VAR=NULL riskdiff-optionを指定すると、行1と行2のリスクが等しいという帰無仮説に基づいて標準誤差が次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p} (1 - \hat{p}) \times ( 1 / n_{1 \cdot } + 1 / n_{2 \cdot } ) }  \]

ここで、$\hat{p} = n_{\cdot 1} / n$は全体的な列1リスクの推定値です。

CORRECT riskdiff-optionを指定すると、FREQプロシジャは、検定統計量に連続性補正を含めます。$\hat{d} &gt; 0$である場合、連続性補正は、検定統計量の分子の$\hat{d}$から差し引かれます。それ以外の場合、連続性補正は同分子に追加されます。連続性補正値は$(1/n_{1 \cdot } + 1/n_{2 \cdot })/2$になります。

FREQプロシジャは、この検定の片側および両側のp値を計算します。検定統計量zがゼロより大きい場合、FREQプロシジャは、右側のp値を表示します。これは、帰無仮説の下でより大きい値が発生する確率を表します。片側のp値は次のように計算されます。

\begin{equation*}  P_1 = \begin{cases}  \mr{Prob} (Z > z) \quad \mr{if} \hspace{.1in} z > 0 \\ \mr{Prob} (Z < z) \quad \mr{if} \hspace{.1in} z \leq 0 \\ \end{cases}\end{equation*}

ここで、Zは標準正規分布に従います。両側のp値は、$P_2 = 2 \times P_1$として計算されます。

非劣性の検定

NONINF riskdiff-optionを指定すると、FREQプロシジャはリスク差、すなわち2つの比率間の差の非劣性の検定を実施します。非劣性の検定の帰無仮説は、次のようになります。

\[  H_0\colon p_1 - p_2 \leq -\delta  \]

対立仮説は次のようになります。

\[  H_ a\colon p_1 - p_2 > -\delta  \]

ここで、$\delta $は非劣性マージンです。帰無仮説の棄却は、行1のリスクが行2のリスクに対して劣性でないことを示します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

$\delta $の値を指定するには、MARGIN= riskdiff-optionを使用します。デフォルトでは$\delta = 0.2$です。検定方法を指定するには、METHOD= riskdiff-optionを使用します。リスク差の非劣性の分析では、検定方式として、Wald検定(連続性補正ありまたは連続性補正なし)検定、Hauck-Anderson検定、Farrington-Manning(スコア)検定、Newcombe検定(連続性補正ありまたは連続性補正なし)が使用できます。Wald、Hauck-Anderson、Farrington-Manningの各方式は、検定および対応する信頼限界を提供します。Newcombe方式は、信頼限界のみを提供します。METHOD=を省略すると、FREQプロシジャはデフォルトでWald検定を使用します。

検定に基づく信頼限界の信頼係数は$100(1-2\alpha )$%です(Schuirmann, 1999)。ALPHA=を省略すると、これらはデフォルトで90%の信頼限界になります。この信頼限界を非劣性の限界–$\delta $と比較できます。

次のセクションでは、リスク差の非劣性の各種の分析方式について説明します。

Wald検定 METHOD=WALD riskdiff-optionを指定すると、FREQプロシジャはリスク差の非劣性の漸近Wald検定を実施します。これはデフォルトの分析方式でもあります。Wald検定統計量は次のように計算されます。

\[  z = ( \hat{d} + \delta ) ~  / ~  \mr{se}(\hat{d})  \]

ここで、($\hat{d} = \hat{p}_1 - \hat{p}_2$)はリスク差の推定値であり、$\delta $は非劣性のマージンです。

デフォルトでは、Wald検定の標準誤差は、標本比率から次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1 - \hat{p}_1) / n_{1 \cdot } ~ +~  \hat{p}_2 (1 - \hat{p}_2) / n_{2 \cdot } }  \]

VAR=NULL riskdiff-optionを指定すると、標準誤差は、リスク差が–$\delta $に等しいという帰無仮説に基づきます(Dunnett and Gent, 1977)。標準誤差は次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \tilde{p} (1-\tilde{p})/n_{2 \cdot } ~ +~  (\tilde{p} - \delta ) (1-\tilde{p} + \delta ) / n_{1 \cdot } }  \]

ここで、

\[  \tilde{p} = ( n_{11} + n_{21} + \delta n_{1 \cdot } ) / n  \]

CORRECT riskdiff-optionを指定すると、検定統計量に連続性補正が含められます。連続性補正は、検定統計量の分子が正数である場合、同分子から差し引かれます。それ以外の場合、連続性補正は同分子に追加されます。連続性補正値は$(1/n_{1 \cdot } + 1/n_{2 \cdot })/2$になります。

Wald非劣性の検定のp値は$P_ z = \mr {Prob} (Z &gt; z)$であり、ここでZは標準正規分布に従います。

Hauck-Anderson検定 METHOD=HA riskdiff-optionを指定すると、FREQプロシジャは非劣性のHauck-Anderson検定を行います。Hauck-Anderson検定統計量は次のように計算されます。

\[  z = ( \hat{d} + \delta ~  \pm ~  \mathit{cc}) ~  / ~  \mr{se}(\hat{d})  \]

ここで、$\hat{d} = \hat{p}_1 - \hat{p}_2$であり、標準誤差は標本比率から次のように計算されます。

\[  \mr{se}(\hat{d}) = \sqrt { \hat{p}_1 (1-\hat{p}_1) / (n_{1 \cdot }-1) ~ +~  \hat{p}_2 (1-\hat{p}_2) / (n_{2 \cdot }-1) }  \]

Hauck-Anderson連続性補正ccは次のように計算されます。

\[  \mathit{cc} = 1 ~  / ~ \bigl ( 2 ~  \min ( n_{1 \cdot }, ~  n_{2 \cdot } ) \bigr )  \]

非劣性のHauck-Anderson検定のp値は$P_ z = \mr {Prob} (Z &gt; z)$であり、ここでZは標準正規分布に従います。詳細は、Hauck and Anderson (1986)およびSchuirmann (1999)を参照してください。

Farrington-Manning (スコア)検定 METHOD=FM riskdiff-optionを指定すると、FREQプロシジャはリスク差の非劣性のFarrington-Manning(スコア)検定を実施します。リスク差が–$\delta $に等しいという帰無仮説に対するスコア検定統計量は、次のように表されます。

\[  z = ( \hat{d} + \delta ) ~  / ~  \mr{se}(\hat{d})  \]

ここで、$\hat{d}$はリスク差($\hat{p}_1 - \hat{p}_2$)の観測値です。

\[  \mr{se}(\hat{d}) = \sqrt { \tilde{p}_1 (1-\tilde{p}_1) / n_{1 \cdot } ~ +~  \tilde{p}_2 (1-\tilde{p}_2) / n_{2 \cdot } }  \]

ここで、$\tilde{p}_1$および$\tilde{p}_2$は、リスク差が–$\delta $であるという制限の下での行1と行2のリスク(比率)の最尤推定値です。非劣性の検定のp値は$P_ z = \mr{Prob} (Z > z)$であり、ここでZは標準正規分布に従います。詳細は、Miettinen and Nurminen (1985)、Miettinen (1985)、Farrington and Manning (1990)、Dann and Koch (2005)を参照してください。

リスク差が–$\delta $であるという制約を受けた、$p_1$および$p_1$の最尤推定値は、次のように計算されます。

\[  \tilde{p}_1 = 2 u \cos (w) - b/3a \hspace{.15in} \mr{and} \hspace{.15in} \tilde{p}_2 = \tilde{p}_1 + \delta  \]

ここで、

\begin{eqnarray*}  w &  = &  ( \pi + \cos ^{-1}(v / u^3) ) / 3 \\ v &  = &  b^3 / (3a)^3 - bc/6a^2 + d/2a \\ u &  = &  \mr{sign}(v) \sqrt {b^2 / (3a)^2 - c/3a} \\ a &  = &  1 + \theta \\ b &  = &  - \left( 1 + \theta + \hat{p}_1 + \theta \hat{p}_2 - \delta (\theta + 2) \right) \\ c &  = &  \delta ^2 - \delta (2 \hat{p}_1 + \theta + 1) + \hat{p}_1 + \theta \hat{p}_2 \\ d &  = &  \hat{p}_1 \delta (1 - \delta ) \\ \theta &  = &  n_{2 \cdot } / n_{1 \cdot } \end{eqnarray*}

詳細は、Farrington and Manning (1990, p. 1453)を参照してください。

Newcombe非劣性分析 METHOD=NEWCOMBE riskdiff-optionを指定すると、FREQプロシジャは、リスク差のNewcombeハイブリッドスコア信頼限界に基づいた非劣性の分析を実施します。 この信頼限界の信頼係数は$100(1-2\alpha )$%になります(Schuirmann, 1999)。ALPHA=を省略すると、これらはデフォルトで90%の信頼限界になります。この信頼限界を非劣性の限界–$\delta $と比較できます。CORRECT riskdiff-optionを指定すると、信頼限界に連続性補正が含められます。詳細は、セクションリスク差の信頼限界内のサブセクション"Newcombe信頼限界"を参照してください。

優越性の検定

SUP riskdiff-optionを指定すると、FREQプロシジャは、リスク差の優越性の検定を実施します。帰無仮説は次のようになります。

\[  H_0\colon : p_1 - p_2 \leq \delta  \]

対立仮説は次のようになります。

\[  H_ a\colon p_1 - p_2 > \delta  \]

ここで、$\delta $は優越性のマージンです。帰無仮説の棄却は、行1の比率が行2の比率に対して優越していることを示します。$\delta $の値を指定するには、MARGIN= riskdiff-optionを使用します。デフォルトでは、$\delta = 0.2$です。

優越性の分析は非劣性分析と同じですが、帰無仮説で正のマージン値$\delta $を使用するところが違います。優越性の計算は非劣性の検定のセクションに示されている方法に従いますが、–$\delta $ の代わりに$\delta $を使用します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

同等性の検定

EQUIV riskdiff-optionを指定すると、FREQプロシジャはリスク差、すなわち2つの比率間の差の同等性の検定を実施します。同等性の検定の帰無仮説は次のようになります。

\[  H_0\colon p_1 - p_2 \leq -\delta _{\mi{L}} \hspace{.15in} \mr{or} \hspace{.15in} p_1 - p_2 \geq \delta _{\mi{U}}  \]

対立仮説は次のようになります。

\[  H_ a\colon \delta _{\mi{L}} < p_1 - p_2 < \delta _{\mi{U}}  \]

ここで、$\delta _{\mi{L}}$は下限マージン、$\delta _{\mi{U}}$は上限マージンです。帰無仮説の棄却は、2つの二項比率が等しいことを示します。詳細は、Chow, Shao, and Wang (2003)を参照してください。

マージン値$\delta _ L$および$\delta _ U$を指定するには、MARGIN= riskdiff-optionを使用します。MARGIN=を指定しない場合、FREQプロシジャはデフォルトの下限マージンおよび上限マージンとして、それぞれ–0.2および0.2を使用します。単一のマージン値$\delta $を指定すると、FREQプロシジャは下限マージンおよび上限マージンとして、それぞれ–$\delta $および$\delta $を使用します。検定方法を指定するには、METHOD= riskdiff-optionを使用します。リスク差の同等性分析では、検定方式として、Wald(連続性補正ありまたは連続性補正なし)検定、Hauck-Anderson検定、Farrington-Manning(スコア)検定、Newcombe検定(連続性補正ありまたは連続性補正なし)が使用できます。Wald、Hauck-Anderson、Farrington-Manningの各方式は、検定および対応する信頼限界を提供します。Newcombe方式は、信頼限界のみを提供します。METHOD=を省略すると、FREQプロシジャはデフォルトでWald検定を使用します。

FREQプロシジャは、同等性の分析で、2つの片側検定(TOST)を計算します(Schuirmann, 1987)。TOST手法には、下限マージン$\delta _{\mi{L}}$の右側検定と、上限マージン$\delta _{\mi{U}}$の左側検定が含まれます。全体的なp値は、下側および上側の検定における2つのp値のうちの大きい方になります。

リスク差のWald、Hauck-Anderson、Farrington-Manning (スコア)、Newcombeの各検定についての詳細は、非劣性の検定のセクションを参照してください。下限マージンの同等性の検定統計量は、非劣性の検定統計量と同じ形式を持ちますが、前者は-$\delta $のかわりに下限マージン値$\delta _{\mi{L}}$を使用します。上限マージンの同等性の検定統計量は、非劣性の検定統計量と同じ形式を持ちますが、前者は-$\delta $のかわりに上限マージン値$\delta _{\mi{U}}$を使用します。

リスク差の検定ベースの信頼限界は、ユーザーが選択した同等性の検定方式に従って計算されます。 METHOD=WALDと共にVAR=NULLまたはMETHOD=FMを指定すると、下限および上限マージン検定の標準誤差が別々に計算されます。この場合、検定ベースの信頼限界は、これらの標準誤差の最大値を使用して計算されます。これらの信頼限界の信頼係数は$100(1-2\alpha )$%になります(Schuirmann, 1999)。ALPHA=を省略すると、これらはデフォルトで90%の信頼限界になります。検定ベースの信頼限界を同等性の限界$(\delta _{\mi{L}}, \delta _{\mi{U}})$と比較できます。

リスク差の正確な条件なしの信頼限界

EXACTステートメントでRISKDIFFオプションを指定すると、FREQプロシジャは、リスク差の正確な条件なしの信頼限界を計算します。FREQプロシジャは、2つの個々の片側検定(裾を用いる手法)を反転して、信頼限界を計算します。ここで、各検定のサイズは最大で$\alpha /2$であり、信頼係数は最低でも$(1-\alpha )$になります。正確な条件付き方式(セクション正確な統計量を参照)は、撹乱パラメータが存在するため、リスク差には適用できません(Agresti, 1992)。条件なしの手法では、すべての可能な値に関してp値を最大化することで、撹乱パラメータを廃止しています(Santner and Snell, 1980)。

デフォルトでは、FREQプロシジャは、信頼限界の計算における検定統計量として、標準化されていないリスク差を使用します。 RISKDIFF(METHOD=SCORE)オプションを指定すると、同プロシジャはスコア統計量を使用します(Chan and Zhang, 1999)。スコア統計量は生のリスク差よりも離散的でない統計量であるため、より保守的でない信頼限界を生成します(Agresti and Min, 2001)。リスク差の正確な信頼限界の計算方法の比較については、Santner et al. (2007)も参照してください。

FREQは次の信頼限界を計算します。リスク差は、行1と行2のリスク(比率)間の差$d = p_1 - p_2$として定義されます。ここで、$n_1$および$n_2$$2 \times 2$表の行合計を表します。この表の結合確率関数は、表のセル度数、リスク差、撹乱パラメータ$p_2$を使って次のように表されます。

\[  f( n_{11}, n_{21}; n_1, n_2, d, p_2 ) = \binom {n_1}{n_{11}} (d + p_2)^{n_{11}} (1-d-p_2)^{n_1-n_{11}} \times \binom {n_2}{n_{21}} p_2^{n_{21}} (1-p_2)^{n_2 - n_{21}}  \]

リスク差の$100(1-\alpha /2)$%の信頼限界は次のように計算されます。

\begin{eqnarray*}  d_ L &  = &  \sup ~  ( d_\ast : P_ U(d_\ast ) > \alpha /2 ) \\ d_ U &  = &  \inf ~  ( d_\ast : P_ L(d_\ast ) > \alpha /2 ) \end{eqnarray*}

ここで、

\begin{eqnarray*}  P_ U(d_\ast ) &  = &  \sup _{p_2} ~  \bigl ( \sum _{A, T(a) \geq t_0} f( n_{11}, n_{21}; n_1, n_2, d_\ast , p_2 ) ~  \bigr ) \\[0.10in] P_ L(d_\ast ) &  = &  \sup _{p_2} ~  \bigl ( \sum _{A, T(a) \leq t_0} f( n_{11}, n_{21}; n_1, n_2, d_\ast , p_2 ) ~  \bigr ) \end{eqnarray*}

集合Aには、行合計が$n_1$および$n_2$であるすべての$2 \times 2$表が含まれており、$T(a)$Aにおける表aの検定統計量の値を表します。$P_ U(d_\ast )$を計算する場合、($T(a) \geq t_0$)である表の確率が合計に含まれます。ここで、$t_0$は観測された表の検定統計量の値です。$d_\ast $が固定値の場合、$P_ U(d_\ast )$は、$p_2$のすべての可能な値の最大合計値となるように取得されます。

デフォルトでは、FREQプロシジャは、標準化されていないリスク差を検定統計量Tとして使用します。RISKDIFF(METHOD=SCORE)オプションを指定すると、同プロシジャはリスク差のスコア統計量を検定統計量として使用します(Chan and Zhang, 1999)。スコア統計量の計算については、リスク差の信頼限界のセクションを参照してください。詳細は、Miettinen and Nurminen (1985)およびFarrington and Manning (1990)を参照してください。

Barnardの条件なしの正確検定

EXACTステートメントのBARNARDオプションを指定すると、$2 \times 2$表のリスク(比率)の差に対して条件なしの正確検定が実施されます。条件なしの正確検定の参照集合は、観測された表と同じ行合計を含んでいるすべての$2 \times 2$表から構成されます(Barnard, 1945, 1947, 1949)。これは、正確な条件付きの推定の参照集合とは異なります。後者は、観測された表と同じ行合計および同じ列合計を含んでいる表の集合に限定されます。詳細は、Fisherの正確検定および正確な統計量のセクションを参照してください。

この検定統計量は標準化されたリスク差であり、次のように計算されます。

\[  T = d / \sqrt { p_{\cdot 1} ( 1 - p_{\cdot 1} ) ( 1/n_1 + 1/n_2 ) }  \]

ここで、リスク差dは、行1と行2のリスク(比率)間の差$d = ( n_{11} / n_1 - n_{21} / n_2 )$として定義されます。$n_1$および$n_2$は、それぞれ行1および行2の合計です。$p_{\cdot 1}$は、列1における全体的な比率$(n_{11} + n_{21}) / n$です。

リスク差がゼロに等しいという帰無仮説の下で、表の結合確率関数は、表のセル度数、行合計、未知のパラメータ$\pi $を使って次のように表されます。

\[  f( n_{11}, n_{21}; n_1, n_2, \pi ) = \binom {n_1}{n_{11}} \binom {n_2}{n_{21}} \pi ^{n_{11} + n_{21}} (1-\pi )^{n - n_{11} - n_{21}}  \]

ここで、$\pi $はリスク(比率)の共通値です。

FREQプロシジャは、 観測された検定統計量値以上の検定統計量を持つ表の参照集合に関する表確率を合計します。この合計は次のように表されます。

\[  \mr{Prob}( \pi ) = \sum _{A, T(a) \geq t_0} f( n_{11}, n_{21}; n_1, n_2, \pi )  \]

ここで、集合Aには、行合計が$n_1$および$n_2$であるすべての$2 \times 2$表が含まれており、$T(a)$Aにおける表aの検定統計量の値を表します。合計には、($T(a) \geq t_0$)である表の確率が含まれます。ここで、$t_0$は、観測された表の検定統計量の値です。

Prob($\pi $)合計は、未知の値$\pi $により異なります。正確なp値を計算する場合、FREQプロシジャは、すべての可能な$\pi $の値に関してProb( $\pi $)の値を最大化することで、攪乱パラメータ$\pi $を廃止します。

\[  \mr{Prob} = \sup _{ ( 0 \leq \pi \leq 1 ) } { \left( \mr{Prob}( \pi ) \right) }  \]

詳細は、Suissa and Shuster (1985)およびMehta and Senchaudhuri (2003)を参照してください。