例3.5 2x2分割表の分析
この例では、2種類の食習慣における冠状動脈性心臓病の発症リスクを比較するために、カイ2乗検定とFisherの正確な検定を計算します。また、相対リスクを推定し、オッズ比に関する正確な信頼限界も計算します。
データセットFatCompには、高脂肪食と冠状動脈性心臓病の発症リスクに関するケースコントロールスタディの仮説データが含まれています。これらのデータはセルカウントとして記録されるため、変数Countには、曝露量と反応の組み合わせごとの度数が含められます。このデータセットは、変数ExposureおよびResponseに基づいて降順で並べ替えられているため、表の最初のセルには正の曝露と正の反応の組み合わせの度数が含められます。次のFORMATプロシジャは、曝露量と反応のタイプを文字値で識別するための出力形式を作成します。
proc format;
value ExpFmt 1='High Cholesterol Diet'
0='Low Cholesterol Diet';
value RspFmt 1='Yes'
0='No';
run;
data FatComp;
input Exposure Response Count;
label Response='Heart Disease';
datalines;
0 0 6
0 1 2
1 0 4
1 1 11
;
proc sort data=FatComp;
by descending Exposure descending Response;
run;
次のPROC FREQステートメントでは、ORDER=DATAオプションにより、入力データセット内の順番に従って分割表の値を配置するよう指示しています。 TABLESステートメントは、行がExposureで列がResponseの2元表を要求します。CHISQオプションは、複数のカイ2乗検定を要求します。RELRISKオプションは、相対リスク統計量を生成します。EXACTステートメントは、正確なPearsonカイ2乗検定と、オッズ比に関する信頼限界を要求します。
proc freq data=FatComp order=data;
format Exposure ExpFmt. Response RspFmt.;
tables Exposure*Response / chisq relrisk;
exact pchi or;
weight Count;
title 'Case-Control Study of High Fat/Cholesterol Diet';
run;
出力3.5.1の分割表には変数値が示されており、最初の表セルにはデータセット内の最初のセルの度数(正の曝露量と正の応答の組み合わせの度数)が含められます。
出力3.5.2にカイ2乗統計量を示します。一部の表セルの期待カウントは小さいため、FREQプロシジャは、漸近カイ2乗検定は適切でないという警告を表示します。この場合、正確な検定の方が適しています。この分析の対立仮説は、冠状動脈性心臓病は高脂肪食と連関している可能性が高いというものであるため、片側検定を実施する必要があります。Fisherの正確な右側検定は、高脂肪食グループにおける心臓病の発症率が低脂肪食グループにおける心臓病の発症率を超えているかどうかを分析します。この値は小さいため、対立仮説が支持されます。
出力3.5.3に示されているオッズ比は、事象が稀である場合の相対リスクの推定値を表します。この推定値は、心臓病のオッズが、高脂肪食グループでは8.25倍に高まることを示しています
。ただし、信頼限界が広いことは、この推定値の精度が低いことを意味します。
出力3.5.2 カイ2乗統計量
1 |
4.9597 |
0.0259 |
1 |
5.0975 |
0.0240 |
1 |
3.1879 |
0.0742 |
1 |
4.7441 |
0.0294 |
|
0.4644 |
|
|
0.4212 |
|
|
0.4644 |
|
11 |
0.9967 |
0.0367 |
|
0.0334 |
0.0393 |
出力3.5.3 相対リスク
8.2500 |
1.1535 |
59.0029 |
2.9333 |
0.8502 |
10.1204 |
0.3556 |
0.1403 |
0.9009 |
8.2500 |
|
|
1.1535 |
59.0029 |
|
|
0.8677 |
105.5488 |
Copyright © SAS Institute Inc. All rights reserved.