例3.6 カイ2乗統計量の出力データセット
この例では、例3.1に示されているColorデータセットを使って、Pearsonカイ2乗統計量と尤度比カイ2乗統計量をSASデータセットに出力します。次のPROC FREQステートメントは、眼の色と髪の色に関する2元表を作成します。
proc freq data=Color order=data;
tables Eyes*Hair / expected cellchi2 norow nocol chisq;
output out=ChiSqData n nmiss pchi lrchi;
weight Count;
title 'Chi-Square Tests for 3 by 5 Table of Eye and Hair Color';
run;
proc print data=ChiSqData noobs;
title1 'Chi-Square Statistics for Eye and Hair Color';
title2 'Output Data Set from the FREQ Procedure';
run;
EXPECTEDオプションは、期待されるセル度数をクロス集計表に表示します。CELLCHI2オプションは、全体的なカイ2乗統計量に対する各セルの寄与分を表示します。またNOROWオプションおよびNOCOLオプションが指定されているため、行と列のパーセントがクロス集計表に表示されません。CHISQオプションはカイ2乗検定を実施します。
OUTPUTステートメントは、ChiSqData出力データセットを作成すると共に、同データセットに含める統計量を指定します。Nオプションは、欠損値でないオブザベーションの数を要求します。NMISSオプションは欠損値でないオブザベーションの数を保存します。PCHIおよびLRCHIの各オプションは、それぞれPearsonカイ2乗および尤度比カイ2乗統計量を、それらの自由度および値と共に要求します。
上記のステートメントの出力は、出力3.6.1および出力3.6.2になります。出力3.6.1の分割表には、眼の色と髪の色に関する値が、Colorデータセット内にそれらが現れるのと同じ順番で表示されます。出力3.6.2のPearsonカイ2乗統計量は、眼の色と髪の色の間の連関性の根拠(=0.0073)を提供します。このセルのカイ2乗値は、ほとんどの連関性は、目の色がgreenの子供は髪の色がfairまたはredである場合が多く、髪の色がdarkまたはblackである場合は少ないという理由に起因していることを示しています。眼の色がbrownである子供に関しては、上記の逆が成り立ちます。
出力3.6.3に、OUTPUTステートメントが作成する出力データセットを示します。このデータセットには、標本サイズを含んでいる1つのオブザベーション、欠損値の数、カイ2乗統計量とその自由度および値が含まれています(出力3.6.2を参照)。
出力3.6.2 カイ2乗統計量
8 |
20.9248 |
0.0073 |
8 |
25.9733 |
0.0011 |
1 |
3.7838 |
0.0518 |
|
0.1657 |
|
|
0.1635 |
|
|
0.1172 |
|
出力3.6.3 出力データセット
762 |
0 |
20.9248 |
8 |
.007349898 |
25.9733 |
8 |
.001061424 |
Copyright © SAS Institute Inc. All rights reserved.