この例は、核密度推定による非正規データ分布の視覚化を示しています。この例では、例4.15で説明したデータセットChannelを使用します。
核密度推定を計算する場合、当てはめの平滑度と近似度を決定するため、区間幅パラメータをいくつか選択する必要があります。次のステートメントに示すように、KERNELオプションとともに最大5つのC=値のリストを指定して、複数の密度推定を要求できます。
title 'FET Channel Length Analysis'; ods graphics off; proc univariate data=Channel noprint; histogram Length / kernel(c = 0.25 0.50 0.75 1.00 l = 1 20 2 34 noprint); run;
L= 2次オプションは曲線の種類を重複しないように指定します(L=の値はC=の値とリスト順に対応します)。出力4.23.1はの影響を示しています。一般的に、の値が大きいほど密度推定は平滑になり、この値が小さいほどデータ分布への適合度が高い推定になります。
出力4.23.1によって、例4.15のヒストグラムで表示されているデータの強い三峰性がわかります。
この例のサンプルプログラムuniex09.sasは、Base SASソフトウェアのSASサンプルライブラリに含まれています。