FREQプロシジャは、生データやセルカウントデータを使用して、度数表やクロス集計表を作成します。生データとは、ケースレコードデータとも呼ばれ、1つのサブジェクトや標本メンバにつき1つのレコードとしてデータを報告するものです。セルカウントデータとは、データ値のすべての可能な組み合わせを度数カウントとともに示す表としてデータを報告するものです。この方式によるデータの表示は、印刷結果として頻繁に使用されます。
次のDATAステップステートメントは、生データをSASデータセットに格納します。
data Raw; input Subject $ R C @@; datalines; 01 1 1 02 1 1 03 1 1 04 1 1 05 1 1 06 1 2 07 1 2 08 1 2 09 2 1 10 2 1 11 2 1 12 2 1 13 2 2 14 2 2 14 2 2 ;
同じデータをセルカウントとして格納するには、次のDATAステップステートメントを使用します。
data CellCounts; input R C Count @@; datalines; 1 1 5 1 2 3 2 1 4 2 2 3 ;
変数R
には行の値が、変数C
には列の値が含まれます。変数Count
には、行と列の各組み合わせのセルカウントが含まれます。
Raw
データセットとCellCounts
データセットはどちらも、まったく同じ度数カウント、二元表、および統計量を生成します。CellCounts
データセットを使用する場合、変数Count
にすべてのセルカウントを含めるように指定するWEIGHTステートメントを含める必要があります。たとえば、次のFREQステートメントでは、CellCounts
データセットを使用して二元クロス集計表を作成します。
proc freq data=CellCounts; tables R*C; weight Count; run;