この例では、例3.1に示されているColor
データセットを使って、Pearsonカイ2乗統計量と尤度比カイ2乗統計量をSASデータセットに出力します。次のPROC FREQステートメントは、眼の色と髪の色の二元表を作成します。
proc freq data=Color order=data; tables Eyes*Hair / expected cellchi2 norow nocol chisq; output out=ChiSqData n nmiss pchi lrchi; weight Count; title 'Chi-Square Tests for 3 by 5 Table of Eye and Hair Color'; run;
proc print data=ChiSqData noobs; title1 'Chi-Square Statistics for Eye and Hair Color'; title2 'Output Data Set from the FREQ Procedure'; run;
EXPECTEDオプションは、期待されるセル度数をクロス集計表に表示します。CELLCHI2オプションは、全体的なカイ2乗統計量に対する各セルの寄与分を表示します。またNOROWオプションおよびNOCOLオプションが指定されているため、行と列のパーセントがクロス集計表に表示されません。CHISQオプションはカイ2乗検定を実施します。
OUTPUTステートメントは、ChiSqData
出力データセットを作成するとともに、同データセットに含める統計量を指定します。Nオプションは、欠損値でないオブザベーションの数を要求します。NMISSオプションは欠損値でないオブザベーションの数を保存します。PCHIおよびLRCHIの各オプションは、それぞれPearsonカイ2乗および尤度比カイ2乗統計量を、それらの自由度およびp値と共に要求します。
前述のステートメントの出力は、出力3.6.1および出力3.6.2になります。出力3.6.1の分割表には、眼の色と髪の色の値が、Color
データセット内にそれらが現れるのと同じ順番で表示されます。出力3.6.2のPearsonカイ2乗統計量は、眼の色と髪の色の間の連関性の根拠(p=0.0073)を提供します。このセルのカイ2乗値は、ほとんどの連関性は、目の色がgreenの子供は髪の色がfairまたはredである場合が多く、髪の色がdarkまたはblackである場合は少ないという理由に起因していることを示しています。眼の色がbrownである子供に関しては、上記の逆が成り立ちます。
出力3.6.3に、OUTPUTステートメントが作成する出力データセットを示します。このデータセットには、標本サイズを含んでいる1つのオブザベーション、欠損値の数、カイ2乗統計量とその自由度およびp値が含まれています(出力3.6.2を参照)。
出力3.6.1: 分割表
Chi-Square Tests for 3 by 5 Table of Eye and Hair Color |
|
|