UNIVARIATEプロシジャ

 

例4.23 核密度推定の計算

この例は、核密度推定による非正規データ分布の視覚化を示しています。この例では、例4.15で説明したデータセットChannelを使用します。

核密度推定を計算する場合、当てはめの平滑度と近似度を決定するため、区間幅パラメータをいくつか選択する必要があります。次のステートメントに示すように、KERNELオプションとともに最大5つのC=値のリストを指定して、複数の密度推定を要求できます。

title 'FET Channel Length Analysis';
ods graphics off;
proc univariate data=Channel noprint;
   histogram Length / kernel(c = 0.25 0.50 0.75 1.00
                             l = 1 20 2 34
                             noprint);
run;

L= 2次オプションは曲線の種類を重複しないように指定します(L=の値はC=の値とリスト順に対応します)。出力4.23.1の影響を示しています。一般的に、の値が大きいほど密度推定は平滑になり、この値が小さいほどデータ分布への適合度が高い推定になります。

出力4.23.1 複数の核密度推定
複数の核密度推定

出力4.23.1によって、例4.15のヒストグラムで表示されているデータの強い三峰性がわかります。

この例のサンプルプログラムuniex09.sasは、Base SASソフトウェアのSASサンプルライブラリに含まれています。