この例は、核密度推定による非正規データ分布の視覚化を示しています。この例では、例4.15で説明したデータセットChannel
を使用します。
核密度推定を計算する場合、それによって当てはめの平滑度と近似度が決定されることから、区間幅パラメータcをいくつか選択して試行する必要があります。次のステートメントに示すように、KERNELオプションとともに最大5つのC=値のリストを指定して、複数の密度推定を要求できます。
title 'FET Channel Length Analysis'; proc univariate data=Channel noprint; histogram Length / kernel(c = 0.25 0.50 0.75 1.00 l = 1 20 2 34 noprint) odstitle = title; run;
L= 2次オプションは曲線の種類を重複しないように指定します(L=の値はC=の値とリスト順に対応します)。出力4.23.1はcの影響を示しています。一般的に、cの値が大きいほど密度推定は平滑になり、この値が小さいほどデータ分布への適合度が高い推定になります。
出力4.23.1によって、例4.15のヒストグラムで表示されているデータの強い三峰性がわかります。
この例のサンプルプログラムuniex09.sasは、Base SASソフトウェアのSASサンプルライブラリに含まれています。