ヨーロッパの異なる2地域に住んでいる子供の目の色と髪の色をデータセットColorに記録するとします。子供1人につき1つのオブザベーションを記録するのではなく、データをセルカウントとして記録するため、変数Countには、それぞれ15種類の目の色と髪の色の組み合わせを示す子供の数が含められます。このデータセットには欠損値の組み合わせは含まれません。
SASデータセットColorを作成するDATAステップステートメントは次のようになります。
data Color; input Region Eyes $ Hair $ Count @@; label Eyes ='Eye Color' Hair ='Hair Color' Region='Geographic Region'; datalines; 1 blue fair 23 1 blue red 7 1 blue medium 24 1 blue dark 11 1 green fair 19 1 green red 7 1 green medium 18 1 green dark 14 1 brown fair 34 1 brown red 5 1 brown medium 41 1 brown dark 40 1 brown black 3 2 blue fair 46 2 blue red 21 2 blue medium 44 2 blue dark 40 2 blue black 6 2 green fair 50 2 green red 31 2 green medium 37 2 green dark 23 2 brown fair 56 2 brown red 42 2 brown medium 53 2 brown dark 54 2 brown black 13 ;
次のFREQステートメントは、Colorデータセットを読み取り、行がEyesで列がHairの2元表における度数、パーセンテージ、期待セル度数を含む出力データセットを作成します。次のTABLESステートメントは、3つの表を要求しています。すなわち、Eyesの度数表、Hairの度数表、および行がEyesで列がHairのクロス集計表です。OUT=オプションは、クロス集計表の度数を含むFreqCountデータセットを作成します。OUTEXPECTオプションは、表セルの期待度数をFreqCountデータセットに出力します。また、SPARSEオプションはゼロのセル度数をその出力データセットに含めます。WEIGHTステートメントでは、オブザベーションの重みを含む変数としてCountを指定しています。これらのステートメントが生成する出力を出力3.1.1~出力3.1.3に示します。
proc freq data=Color; tables Eyes Hair Eyes*Hair / out=FreqCount outexpect sparse; weight Count; title 'Eye and Hair Color of European Children'; run;
proc print data=FreqCount noobs; title2 'Output Data Set from PROC FREQ'; run;
出力3.1.1に、FREQプロシジャが作成する2つの度数表を示します。1つは眼の色の分布を示すものであり、もう1つは髪の色の分布を示すものです。デフォルトでは、FREQは変数値をアルファベット順にリスト表示します。'Eyes*Hair'という指定は、出力3.1.2に示すような、行が眼の色で列が髪の色が列であるクロス集計表を作成します。眼の色が緑で髪の色が黒のセル度数がゼロであることは、そのような目の色と髪の色の組み合わせがデータ内に存在しないことを意味しています。
出力データセットFreqCount (出力3.1.3)は、TABLESステートメントで最後に要求された行がEyesで列がHairの表における度数カウントとパーセンテージを含んでいます。SPARSEオプションが指定されているため、このデータセットは、度数がゼロのオブザベーションを含みます。また、OUTEXPECTオプションが指定されているため、変数Expectedには期待度数が含められます。
Eye and Hair Color of European Children |
Eye Color | ||||
---|---|---|---|---|
Eyes | Frequency | Percent | Cumulative Frequency |
Cumulative Percent |
blue | 222 | 29.13 | 222 | 29.13 |
brown | 341 | 44.75 | 563 | 73.88 |
green | 199 | 26.12 | 762 | 100.00 |
Hair Color | ||||
---|---|---|---|---|
Hair | Frequency | Percent | Cumulative Frequency |
Cumulative Percent |
black | 22 | 2.89 | 22 | 2.89 |
dark | 182 | 23.88 | 204 | 26.77 |
fair | 228 | 29.92 | 432 | 56.69 |
medium | 217 | 28.48 | 649 | 85.17 |
red | 113 | 14.83 | 762 | 100.00 |
|
|
Eye and Hair Color of European Children |
Output Data Set from PROC FREQ |
Eyes | Hair | COUNT | EXPECTED | PERCENT |
---|---|---|---|---|
blue | black | 6 | 6.409 | 0.7874 |
blue | dark | 51 | 53.024 | 6.6929 |
blue | fair | 69 | 66.425 | 9.0551 |
blue | medium | 68 | 63.220 | 8.9239 |
blue | red | 28 | 32.921 | 3.6745 |
brown | black | 16 | 9.845 | 2.0997 |
brown | dark | 94 | 81.446 | 12.3360 |
brown | fair | 90 | 102.031 | 11.8110 |
brown | medium | 94 | 97.109 | 12.3360 |
brown | red | 47 | 50.568 | 6.1680 |
green | black | 0 | 5.745 | 0.0000 |
green | dark | 37 | 47.530 | 4.8556 |
green | fair | 69 | 59.543 | 9.0551 |
green | medium | 55 | 56.671 | 7.2178 |
green | red | 38 | 29.510 | 4.9869 |