CDFPLOTステートメント |
CDFPLOTステートメントは、次の定義に従って、変数の観測された累積分布関数(CDF)をプロットします。
は非欠損値のオブザベーション数です。CDFは、が測定値に等しい値を取るたびに垂直方向に急増する、増加型のステップ関数です。CDFは経験累積分布関数(ECDF)とも呼ばれます。
CDFPLOTステートメントは、UNIVARIATEプロシジャ内でいくつでも使用できます。CDFPLOTステートメントの構成要素は次のとおりです。
CDFプロットを作成する変数を指定します。VARステートメントを指定する場合、variablesをそのVARステートメント内に含める必要があります。含めない場合、variablesは、入力データセット内にある任意の数値変数になります。変数のリストを指定しなかった場合、デフォルトではVARステートメント内でリストされた各変数のCDFプロットが作成され、VARステートメントを指定していない場合は、DATA=データセット内の各数値変数のCDFプロットが作成されます。
たとえば、Steelという名前のデータセットに、Length、WidthおよびHeightという、ちょうど3つの数値変数が含まれているとします。次のステートメントは、3つの変数それぞれのCDFプロットを作成します。
proc univariate data=Steel; cdfplot; run;
次のステートメントは、LengthのCDFプロットとWidthのCDFプロットを作成します。
proc univariate data=Steel; var Length Width; cdfplot; run;
次のステートメントは、WidthのCDFプロットを作成します。
proc univariate data=Steel; var Length Width; cdfplot Width; run;
プロットのための理論上の分布を指定するか、またはプロットに機能を追加します。1つ以上の変数を指定した場合、各変数に対してoptionsが等しく適用されます。CDFPLOTステートメントのoptionsは、すべてスラッシュ(/)の後に指定します。分布を指定するoptionsは、各CDFPLOTステートメントで1つだけ指定できます。その他のoptionsはいくつでも指定できます。利用できる分布は表4.2のとおりです。デフォルトでは、このプロシジャは正規分散のプロットを作成します。
表4.2~表4.15は、関数別のCDFPLOToptionsの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。Optionsには次のいずれかを指定します。
1次オプション
2次オプション
一般オプション
表4.2は理論分布を要求するための1次オプションの一覧です。
オプション |
説明 |
---|---|
2パラメータのベータ分布関数(パラメータおよびは既知であることが前提)をプロット |
|
1パラメータの指数分布関数(パラメータは既知であることが前提)をプロット |
|
2パラメータのガンマ分布関数(パラメータは既知であることが前提)をプロット |
|
Gumbel分布(位置パラメータおよび尺度パラメータ)をプロット |
|
逆ガウス分布(平均および形状パラメータ)をプロット |
|
2パラメータの対数正規分布関数(パラメータは既知であることが前提)をプロット |
|
正規分布関数をプロット |
|
一般化パレート分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)をプロット |
|
べき関数分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)をプロット |
|
レイリー分布(しきい値パラメータおよび尺度パラメータ)をプロット |
|
2パラメータのWeibull分布関数(パラメータは既知であることが前提)をプロット |
表4.3~表4.14は、分布のパラメータの指定と理論分布関数の表示の制御を行う、2次オプションの一覧です。これらのオプションは、分布キーワードの後にかっこで囲んで指定します。たとえば、分布の参照線付きの正規確率を要求する場合、次のようなNORMALオプションを指定します。
proc univariate; cdfplot / normal(mu=10 sigma=0.5 color=red); run;
COLOR=オプションは曲線の色を指定し、MU= / SIGMA= normal-optionsは分布関数のパラメータおよびを指定します。これらのパラメータを指定しなかった場合、最尤推定値が計算されます。
オプション |
説明 |
---|---|
理論分布関数の色を指定 |
|
理論分布関数の線の種類を指定 |
|
理論分布関数の幅を指定 |
オプション |
説明 |
---|---|
ベータ分布関数の1番目の形状パラメータを指定 |
|
ベータ分布関数の2番目の形状パラメータを指定 |
|
ベータ分布関数の尺度パラメータを指定 |
|
ベータ分布関数の下限しきい値パラメータを指定 |
オプション |
説明 |
---|---|
指数分布関数の尺度パラメータを指定 |
|
指数分布関数のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
ガンマ分布関数の形状パラメータを指定 |
|
連続推定値の変化を指定(その値でのNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似がの場合の反復の最大数を指定 |
|
ガンマ分布関数の尺度パラメータを指定 |
|
ガンマ分布関数のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
Gumbel分布関数の位置パラメータを指定 |
|
Gumbel分布関数の尺度パラメータを指定 |
オプション |
説明 |
---|---|
逆ガウス分布関数の形状パラメータを指定 |
|
逆ガウス分布関数の平均を指定 |
オプション |
説明 |
---|---|
対数正規分布関数の形状パラメータを指定 |
|
対数正規分布関数のしきい値パラメータを指定 |
|
対数正規分布関数の尺度パラメータを指定 |
オプション |
説明 |
---|---|
正規分布関数の平均値を指定 |
|
正規分布関数の標準偏差を指定 |
オプション |
説明 |
---|---|
一般化パレート分布関数の形状パラメータを指定 |
|
一般化パレート分布関数の尺度パラメータを指定 |
|
一般化パレート分布関数のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
べき関数分布の形状パラメータを指定 |
|
べき関数分布の尺度パラメータを指定 |
|
べき関数分布のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
レイリー分布関数の尺度パラメータを指定 |
|
レイリー分布関数のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
Weibull分布関数の形状パラメータを指定 |
|
連続推定値 の変化を指定(その値で のNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似がの場合の反復の最大数を指定 |
|
Weibull分布関数の尺度パラメータを指定 |
|
Weibull分布関数のしきい値パラメータを指定 |
表4.15はCDFプロットを拡張するための一般オプションの要約です。
オプション |
説明 |
---|---|
ANNOTATE=データセットで要求されたアノテーションをキーセルに対してのみ適用 |
|
ANNOTATE用のデータセットを指定 |
|
軸の色を指定 |
|
枠の色を指定 |
|
行ラベルの枠を塗りつぶす色を指定 |
|
列ラベルの枠を塗りつぶす色を指定 |
|
HREF=で指定した参照線の色を指定 |
|
CDFプロットグループの目次エントリを指定 |
|
度数の棒の割合の色を指定 |
|
テキストの色を指定 |
|
行ラベルの色を指定 |
|
列ラベルの色を指定 |
|
VREF=で指定した参照線の色を指定 |
|
グラフカタログメンバに対する説明を指定 |
|
テキストフォントを指定 |
|
水平軸用のAXISステートメントを指定 |
|
枠外の領域で使用されるテキストの高さを指定 |
|
水平軸の小目盛りの数を指定 |
|
水平軸に垂直な参照線を指定 |
|
HREF=で指定した参照線のラベルを指定 |
|
HREF=で指定した参照線のラベルの位置を指定 |
|
枠領域内のテキストに対してソフトウェアフォントを指定 |
|
枠領域内のテキストの高さを指定 |
|
比較プロットのタイル間の距離を指定 |
|
HREF=で指定した参照線のスタイルを指定 |
|
VREF=で指定した参照線のスタイルを指定 |
|
グラフカタログ内のプロットに対して名前を指定 |
|
比較プロットの列数を指定 |
|
経験(観測された)分布関数のプロットを抑制 |
|
プロット領域の周囲の枠の表示を抑制 |
|
水平軸のラベルを抑制 |
|
垂直軸のラベルを抑制 |
|
垂直軸の目盛りおよび目盛りラベルを抑制 |
|
比較プロットの列数を指定 |
|
異なるクラスレベルのプロットを重ね合わせる(ODS Graphicsのみ) |
|
垂直軸のラベルの文字列を縦書きに |
|
垂直軸用のAXISステートメントを指定 |
|
垂直軸にラベルを指定 |
|
垂直軸の小目盛りの数を指定 |
|
垂直軸に垂直な参照線を指定 |
|
VREF=で指定した参照線のラベルを指定 |
|
VREF=で指定した参照線のラベルの位置を指定 |
|
垂直軸のスケールを指定 |
|
軸と枠の線の太さを指定 |
CDFPLOTステートメント特有のオプションの詳細は次のとおりです。すべてのプロットステートメントに共通するオプションの詳細は、共通オプションのリファレンスのセクションを参照してください。
BETA、GAMMA、PARETO、POWERオプションで要求した分布関数の形状パラメータを指定します。ALPHA=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。 の値を省略すると、最尤推定値が計算されます。例は、BETAおよびGAMMAオプションの項目を参照してください。
CDFプロットに、当てはめたベータ分布関数を表示します。当てはめたCDFの式は次のようになります。
は不完全なベータ関数です。
下限しきい値パラメータ(下限終点)
尺度パラメータ
形状パラメータ
形状パラメータ
ベータ分布の下限はパラメータ で、上限は値 です。およびは、次のステートメントに示すように、THETA= / SIGMA= beta-optionsを使用して指定します。 このステートメントは、50~75の値を取りうるベータ分布を当てはめます。のデフォルト値は0、のデフォルト値は1です。
proc univariate; cdfplot / beta(theta=50 sigma=25); run;
ベータ分布には、2つの形状パラメータ および があります。これらのパラメータが判明している場合、その値をALPHA= / BETA= beta-optionsに指定できます。およびの値を指定しなかった場合、最尤推定値が計算されます。
BETAオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.4は、BETA分布オプションとともに指定できるオプションの一覧です。
BETAオプションで要求したベータ分布関数の2番目の形状パラメータを指定します。BETA=オプションは、BETAキーワードの後にかっこで囲んで指定します。の値を省略すると、最尤推定値が計算されます。例は、前のBETAオプションの項目を参照してください。
WEIBULLオプションで要求したWeibull分布関数の形状パラメータを指定します。C=オプションは、WEIBULLキーワードの後にかっこで囲んで指定します。の値を省略すると、最尤推定値が計算されます。SHAPE=オプションは、C=オプションの別名として指定できます。
CDFプロットに、当てはめた指数分布関数を表示します。適合CDFの式は次のようになります。
ここで、
いき値パラメータ
尺度パラメータ
パラメータ は最小データ値以下でなければなりません。を指定するには、THETA= exponential-optionを使用します。のデフォルト値は0です。を指定するには、SIGMA= exponential-optionを指定します。デフォルトでは、 の最尤推定値が計算されます。たとえば、次のステートメントは、でが最尤推定値の指数分布を当てはめます。
proc univariate; cdfplot / exponential(theta=10 l=2 color=green); run;
指数曲線の色は緑で、線の種類は2です。
EXPONENTIALオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.5は、EXPONENTIALオプションとともに指定できるオプションの一覧です。
CDFプロットに、当てはめたガンマ分布関数を表示します。適合CDFの式は次のようになります。
ここで、
いき値パラメータ
尺度パラメータ
形状パラメータ
ガンマ分布のパラメータは、最小データ値未満でなければなりません。を指定するには、THETA= gamma-optionを使用します。のデフォルト値は0です。また、ガンマ分布は、形状パラメータおよび尺度パラメータを持ちます。これらのパラメータを指定するには、ALPHA= / SIGMA= gamma-optionsを使用します。デフォルトでは、 および の最尤推定値が計算されます。たとえば、次のステートメントは、で、およびが最尤推定値のガンマ分布関数を当てはめます。
proc univariate; cdfplot / gamma(theta=4); run;
の最尤推定値はNewton-Raphson近似を使用して計算されることに注意してください。ALPHADELTA= / ALPHAINITIAL= / MAXITER= gamma-optionsは近似を制御します。
GAMMAオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.6は、GAMMAオプションとともに指定できるオプションの一覧です。
CDFプロットに、当てはめたGumbel分布(Type 1極値分布とも呼ばれます)関数を表示します。適合CDFの式は次のようになります。
位置パラメータ
尺度パラメータ
およびの既知の値を指定するには、MU= / SIGMA= Gumbel-optionsを使用します。デフォルトでは、およびの最尤推定値が計算されます。
GUMBELオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.7は、GUMBELオプションとともに指定できる2次オプションの一覧です。
CDFプロットに、当てはめた逆ガウス分布関数を表示します。適合CDFの式は次のようになります。
ここで、は標準正規累積分布関数です。
平均パラメータ
形状パラメータ
およびの既知の値を指定するには、MU= / LAMBDA= iGauss-optionsを使用します。デフォルトでは、およびの最尤推定値が計算されます。
IGAUSSオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.8は、IGAUSSオプションとともに指定できる2次オプションの一覧です。
IGAUSSオプションで要求した分布関数の形状パラメータを指定します。Enclose the LAMBDA=オプションは、分布を表すキーワードIGAUSSの後にかっこで囲んで指定します。 の値を省略すると、最尤推定値が計算されます。
CDFプロットに、当てはめた対数正規分布関数を表示します。適合CDFの式は次のようになります。
ここで、 は標準正規累積分布関数です。
いき値パラメータ
尺度パラメータ
形状パラメータ
対数正規分布のパラメータは、最小データ値未満である必要があります。を指定するには、THETA= lognormal-optionを使用します。のデフォルト値は0です。また、対数正規分布は、形状パラメータおよび尺度パラメータを持ちます。これらのパラメータを指定するには、SIGMA= / ZETA= lognormal-optionsを使用します。デフォルトでは、およびの最尤推定値が計算されます。たとえば、次のステートメントはで、およびが最尤推定値の対数正規分布関数を当てはめます。
proc univariate; cdfplot / lognormal(theta = 10); run;
LOGNORMALオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.9は、LOGNORMALオプションとともに指定できるオプションの一覧です。
GUMBEL、IGAUSSおよびNORMALオプションで要求した理論累積分布関数のパラメータを指定します。MU=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。逆ガウス分布および正規分布の場合、デフォルト値は標本平均です。Gumbel分布のの値を指定しなかった場合、最尤推定値が計算されます。例は、NORMALオプションの項目を参照してください。
デフォルトで描画される、変数の観測された分布関数(経験累積分布関数)を抑制します。このオプションを使用すると、データ分布を表示せずに理論CDFプロットを作成できます。NOECDFオプションは、理論分布(NORMALオプションなど)でのみ使用できます。
CDFプロットに、当てはめた正規分布関数を表示します。適合CDFの式は次のようになります。
ここで、 は標準正規累積分布関数です。
平均
標準偏差
およびの既知の値を指定するには、次のステートメントに示すように、MU= / SIGMA= normal-optionsを使用します。
proc univariate; cdfplot / normal(mu=14 sigma=.05); run;
デフォルトでは、およびの標本平均および標本標準偏差が計算されます。NORMALオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.10は、NORMALオプションとともに指定できるオプションの一覧です。
CDFプロットに、当てはめた一般化パレート分布関数を表示します。適合CDFの式は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
一般パレート分布のパラメータ は、最小データ値未満でなければなりません。を指定するには、THETA= Pareto-optionを使用します。 のデフォルト値は0です。また、一般パレート分布は、形状パラメータ および尺度パラメータ を持ちます。これらのパラメータを指定するには、ALPHA= / SIGMA= Pareto-optionsを使用します。デフォルトでは、 および の最尤推定値が計算されます。
PARETOオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.11は、PARETOオプションとともに指定できるオプションの一覧です。
CDFプロットに、当てはめたべき分布関数を表示します。適合CDFの式は次のようになります。
ここで、
下限のしきい値パラメータ(下限の終点)
尺度パラメータ
形状パラメータ
べき関数分布の下限はパラメータ で、上限は値 です。およびを指定するには、THETA= / SIGMA= power-optionsを使用します。 および のデフォルト値は、それぞれ0および1です。
形状パラメータの値を指定するには、ALPHA= power-optionを使用します。 の値を省略すると、最尤推定値が計算されます。
べき関数分布は、2番目の形状パラメータ を持つ、ベータ分布の特殊なケースです。
POWERオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.12は、POWERオプションとともに指定できるオプションの一覧です。
CDFプロットに、当てはめたレイリー分布関数を表示します。適合CDFの式は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
レイリー分布のパラメータ は、最小データ値未満でなければなりません。を指定するには、THETA= Rayleigh-optionを使用します。のデフォルト値は0です。 を指定するには、SIGMA= Rayleigh-option を指定します。デフォルトでは、 の最尤推定値が計算されます。
RAYLEIGHオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.13は、RAYLEIGHオプションとともに指定できるオプションの一覧です。
BETA、EXPONENTIAL、GAMMA、LOGNORMAL、NORMAL、WEIBULLオプションで要求した分布関数のパラメータを指定します。SIGMA=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。次の表はSIGMA=オプションの使用方法の要約です。
分布オプション |
SIGMA=に指定する値 |
デフォルト値 |
別名 |
---|---|---|---|
BETA |
尺度パラメータ |
1 |
SCALE= |
EXPONENTIAL |
尺度パラメータ |
最尤推定値 |
SCALE= |
GAMMA |
尺度パラメータ |
最尤推定値 |
SCALE= |
GUMBEL |
尺度パラメータ |
最尤推定値 |
|
LOGNORMAL |
形状パラメータ |
最尤推定値 |
SHAPE= |
NORMAL |
尺度パラメータ |
標準偏差 |
|
PARETO |
尺度パラメータ |
最尤推定値 |
|
POWER |
尺度パラメータ |
1 |
|
RAYLEIGH |
尺度パラメータ |
最尤推定値 |
|
WEIBULL |
尺度パラメータ |
最尤推定値 |
SCALE= |
BETA、EXPONENTIAL、GAMMA、LOGNORMAL、PARETO、POWER、RAYLEIGH、WEIBULLの各オプションで要求した理論累積分布関数の下限しきい値パラメータを指定します。THETA=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。デフォルト値は0です。
垂直軸の尺度を指定します。値PERCENTは、データ単位をデータユニットごとのオブザベーションのパーセントに変換します。値PROPORTIONは、データ単位をデータユニットごとのオブザベーションの比率に変換します。デフォルト値はPERCENTです。
CDFプロットに、当てはめたWeibull分布関数を表示します。適合CDFの式は次のようになります。
ここで、
いき値パラメータ
尺度パラメータ
形状パラメータ
パラメータ は最小データ値未満でなければなりません。を指定するには、THETA= Weibull-optionを使用します。のデフォルト値は0です。また、Weibull分布は、形状パラメータおよび尺度パラメータを持ちます。これらのパラメータを指定するには、SIGMA= / C= Weibull-optionsを使用します。デフォルトでは、およびの最尤推定値が計算されます。たとえば、次のステートメントはで、およびが最尤推定値のWeibull分布関数を当てはめます。
proc univariate; cdfplot / weibull(theta=15); run;
の最尤推定値はNewton-Raphson近似を使用して計算されることに注意してください。CDELTA= / CINITIAL= / MAXITER= Weibull-optionsは近似を制御します。
WEIBULLオプションは、CDFPLOTステートメントに1回だけ指定できます。表4.3および表4.14は、WEIBULLオプションとともに指定できるオプションの一覧です。
LOGNORMALオプションで要求した対数正規分布関数の尺度パラメータの値を指定します。ZETA=オプションは、LOGNORMALキーワードの後にかっこで囲んで指定します。の値を指定しなかった場合、最尤推定値が計算されます。SCALE=オプションは、ZETA=オプションの別名として指定できます。