UNIVARIATEプロシジャ

例4.23 核密度推定の計算

この例は、核密度推定による非正規データ分布の視覚化を示しています。この例では、例4.15で説明したデータセットChannelを使用します。

核密度推定を計算する場合、それによって当てはめの平滑度と近似度が決定されることから、区間幅パラメータcをいくつか選択して試行する必要があります。次のステートメントに示すように、KERNELオプションとともに最大5つのC=値のリストを指定して、複数の密度推定を要求できます。

title 'FET Channel Length Analysis';
proc univariate data=Channel noprint;
   histogram Length / kernel(c = 0.25 0.50 0.75 1.00
                             l = 1 20 2 34
                             noprint)
                      odstitle = title;
run;

L= 2次オプションは曲線の種類を重複しないように指定します(L=の値はC=の値とリスト順に対応します)。出力4.23.1cの影響を示しています。一般的に、cの値が大きいほど密度推定は平滑になり、この値が小さいほどデータ分布への適合度が高い推定になります。

出力4.23.1: 複数の核密度推定

複数の核密度推定


出力4.23.1によって、例4.15のヒストグラムで表示されているデータの強い三峰性がわかります。

この例のサンプルプログラムuniex09.sasは、Base SASソフトウェアのSASサンプルライブラリに含まれています。