PPPLOTステートメント |
PPPLOTステートメントは、P-Pプロット(パーセントプロット)を作成します。 P-Pプロットは変数の経験累積分布関数(ECDF)を、指定した正規分布などの理論累積分布関数と比較します。2つの分布が一致する場合、プロット上の点は原点を通り、単位勾配を形成する線形を形成します。したがって、P-Pプロットを使うと、理論分布に測定値の組み合わせのモデルがどの程度当てはまっているかを判定することができます。
PPPLOTステートメントでは次のいずれかの理論分布を指定できます。
ベータ
指数
ガンマ
Gumbel
一般化パレート
逆ガウス
対数正規
正規
べき関数
レイリー
Weibull
注: P-Pプロットを確率プロットと混同しないでください。確率プロットは、並べ替えられた一連の測定値を指定した分布のパーセント点と比較するものです。確率プロットはPROBPLOTステートメントで作成できます。
PPPLOTステートメントは、UNIVARIATEプロシジャ内でいくつでも使用できます。PPPLOTステートメントの構成要素は次のとおりです。
P-Pプロットを作成するプロセス変数です。VARステートメントを指定する場合、variablesをそのVARステートメント内に含める必要があります。含めない場合、variablesは、入力データセット内にある任意の数値変数になります。変数のリストを指定しなかった場合、デフォルトではVARステートメント内でリストされた各変数のP-Pプロットが作成され、VARステートメントを指定していない場合は、入力データセット内の各数値変数のP-Pプロットが作成されます。たとえば、データセットmeasuresが2つの数値変数lengthおよびwidthを含む場合、次の2つのPPPLOTステートメントはそれぞれの変数についてP-Pプロットを作成します。
proc univariate data=measures; var length width; ppplot; run; proc univariate data=measures; ppplot length width; run;
プロットのための理論上の分布を指定するか、またはプロットに機能を追加します。1つ以上の変数を指定した場合、各変数に対してオプションが等しく適用されます。PPPLOTステートメントのoptionsは、すべてスラッシュ(/)の後に指定します。分布を指定するオプションは1つだけ指定できます。その他のオプションはいくつでも指定できます。デフォルトでは、正規分布に基づくP-Pプロットが作成されます。
次の例では、NORMAL、MU=およびSIGMA=オプションを使って、平均値が10、標準偏差が0.3の正規分布に基づくP-Pプロットを要求しています。SQUAREオプションは、正方形の枠内に確率プロットを表示します。CTEXT=オプションはテキストの色を指定します。
proc univariate data=measures; ppplot length width / normal(mu=10 sigma=0.3) square ctext=blue; run;
表4.64~表4.77は、関数別のPPPLOTオプションの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。Optionsには次のいずれかを指定します。
1次オプション
2次オプション
一般オプション
表4.64は、特定の理論分布を要求するための1次オプションの要約です。
オプション |
説明 |
---|---|
ベータP-Pプロットを指定 |
|
指数P-Pプロットを指定 |
|
ガンマP-Pプロットを指定 |
|
Gumbel P-Pプロットを指定 |
|
一般化パレートP-Pプロットを指定 |
|
逆ガウスP-Pプロットを指定 |
|
対数正規P-Pプロットを指定 |
|
正規P-Pプロットを指定 |
|
べき関数P-Pプロットを指定 |
|
レイリーP-Pプロットを指定 |
|
Weibull P-Pプロットを指定 |
表4.65~表4.76は、分布のパラメータの指定と対角方向の分布参照線の表示の制御を行うオプションの要約です。これらのオプションは、分布オプションの後にかっこで囲んで指定します。たとえば、次のステートメントは、NORMALオプションを使用して正規P-Pプロットを要求します。
proc univariate data=measures; ppplot length / normal(mu=10 sigma=0.3 color=red); run;
MU= / SIGMA= normal-optionsは正規分布のおよびを指定し、COLOR= normal-optionは線の色を指定します。
オプション |
説明 |
---|---|
(分布の)参照線の色を指定 |
|
(分布の)参照線の種類を指定 |
|
分布参照線を抑制 |
|
(分布の)参照線の幅を指定 |
オプション |
説明 |
---|---|
形状パラメータ を指定 |
|
形状パラメータ を指定 |
|
尺度パラメータ を指定 |
|
下限しきい値パラメータを指定 |
オプション |
説明 |
---|---|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
オプション |
説明 |
---|---|
形状パラメータ を指定 |
|
連続推定値の変化を指定(その値で のNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似がの場合の反復の最大数を指定 |
|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
オプション |
説明 |
---|---|
位置パラメータを指定 |
|
尺度パラメータを指定 |
オプション |
説明 |
---|---|
形状パラメータを指定 |
|
平均を指定する |
オプション |
説明 |
---|---|
形状パラメータを指定 |
|
しきい値パラメータを指定 |
|
尺度パラメータを指定 |
オプション |
説明 |
---|---|
平均を指定 |
|
標準偏差を指定 |
オプション |
説明 |
---|---|
形状パラメータを指定 |
|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
オプション |
説明 |
---|---|
形状パラメータを指定 |
|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
オプション |
説明 |
---|---|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
オプション |
説明 |
---|---|
形状パラメータを指定 |
|
連続推定値の変化を指定(その値で のNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似がの場合の反復の最大数を指定 |
|
尺度パラメータを指定 |
|
しきい値パラメータを指定 |
表4.77は、プロットの外観を制御するオプションの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。
オプション |
説明 |
---|---|
ANNOTATE=データセットで要求されたアノテーションをキーセルに対してのみ適用 |
|
注釈データセットを提供 |
|
軸の色を指定 |
|
枠の色を指定 |
|
行ラベルの枠を塗りつぶす色を指定 |
|
列ラベルの枠を塗りつぶす色を指定 |
|
HREF=で指定した参照線の色を指定 |
|
P-Pプロットグループの目次エントリを指定 |
|
度数の棒の割合の色を指定 |
|
テキストの色を指定 |
|
行ラベルの色を指定 |
|
列ラベルの色を指定 |
|
VREF=で指定した参照線の色を指定 |
|
グラフカタログ内のプロットに対する説明を指定 |
|
テキストのソフトウェアフォントを指定 |
|
水平軸用のAXISステートメントを指定 |
|
枠外の領域で使用されるテキストの高さを指定 |
|
水平軸の小目盛りの数を指定 |
|
水平軸に垂直な参照線を指定 |
|
HREF=行の線のラベルを指定 |
|
HREF=で指定した参照線のラベルの位置を指定 |
|
枠領域内のテキストに対してソフトウェアフォントを指定 |
|
枠領域内のテキストの高さを指定 |
|
比較プロットのタイル間の距離を指定 |
|
HREF=行の線の種類を指定 |
|
VREF=行の線の種類を指定 |
|
グラフカタログ内のプロットに対して名前を指定 |
|
比較プロットの列数を指定 |
|
プロット領域の周囲の枠の表示を抑制 |
|
水平軸のラベルを抑制 |
|
垂直軸のラベルを抑制 |
|
垂直軸の目盛りおよび目盛りラベルを抑制 |
|
比較プロットの列数を指定 |
|
異なるクラスレベルのプロットを重ね合わせる(ODS Graphicsのみ) |
|
P-Pプロットを正方形の枠の中で表示 |
|
垂直軸のラベルの文字列を縦書きに |
|
垂直軸用のAXISステートメントを指定 |
|
垂直軸にラベルを指定 |
|
垂直軸の小目盛りの数を指定 |
|
垂直軸に垂直な参照線を指定 |
|
VREF=行の線のラベルを指定 |
|
VREF=で指定した参照線のラベルの位置を指定 |
|
軸と枠の線の太さを指定 |
PPPLOTステートメントのオプションの詳細は次のとおりです。すべてのプロットステートメントに共通するオプションの詳細は、共通オプションのリファレンスのセクションを参照してください。
ベータP-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論ベータCDF値になります。
は正規化された不完全なベータ関数で、各値は次のとおりです。
下側いき値パラメータ
尺度パラメータ
1番目の形状パラメータ
2番目の形状パラメータ
次の例に示すように、、、、は、ALPHA= / BETA= / SIGMA= / THETA= beta-optionsで指定できます。
proc univariate data=measures; ppplot width / beta(theta=1 sigma=2 alpha=3 beta=4); run;
これらのパラメータを指定しなかった場合、デフォルトで、、で、およびの最尤推定値が計算されます。
重要:デフォルトの単位間隔(0,1)でデータ範囲が適切に示されない場合は、データが間隔に収まるようにTHETA=およびSIGMA=を指定する必要があります。
データ分布がパラメータ、、、のベータ分布である場合、ALPHA=、BETA=、SIGMA=、THETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したベータ分布が適合していることが証明されます。SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。
BETA分布オプションで要求したP-Pプロットの形状パラメータを指定します。例は、前のBETAオプションの項目を参照してください。
WEIBULLオプションで要求したP-Pプロットの形状パラメータを指定します。例は、WEIBULLオプションの項目を参照してください。
指数P-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値 になります。座標は、次の理論指数CDF値になります。
ここで、
いき値パラメータ
尺度パラメータ
次の例に示すように、およびは、SIGMA= / THETA= exponential-optionsで指定できます。
proc univariate data=measures; ppplot width / exponential(theta=1 sigma=2); run;
これらのパラメータを指定しなかった場合、デフォルトで、で、の最尤推定値が計算されます。
重要: お使いのデータは、下限しきい値以上でなければなりません。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションでを指定します。
データ分布がパラメータおよびの指数分布である場合、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した指数分布が適合していることが証明されます。SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。
ガンマP-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論ガンマCDF値になります。
は正規化された不完全なガンマ関数で、各値は次のとおりです。
いき値パラメータ
尺度パラメータ
形状パラメータ
次の例に示すように、、、およびは、ALPHA= / SIGMA= / THETA= gamma-optionsで指定できます。
proc univariate data=measures; ppplot width / gamma(alpha=1 sigma=2 theta=3); run;
これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。
重要: お使いのデータは、下限しきい値 以上でなければなりません。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションで を指定します。
データ分布がパラメータ、およびのガンマ分布である場合、ALPHA=、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したガンマ分布が適合していることが証明されます。SHAPE=オプションをALPHA=オプションの別名として、SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。
Gumbel P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論Gumbel CDF値になります。
ここで、
位置パラメータ
尺度パラメータ
次の例に示すように、およびは、MU= / SIGMA= Gumbel-optionsで指定できます。
proc univariate data=measures; ppplot width / gumbel(mu=1 sigma=2); run;
これらのパラメータを指定しなかった場合、デフォルトで、およびの最尤推定値が計算されます。
データ分布がパラメータおよびのGumbel分布である場合、MU=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したGumbel分布が適合していることが証明されます。
逆ガウスP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値 になります。座標は、次の理論逆ガウスCDF値になります。
ここで、 は標準正規分布関数です。
平均値パラメータ
形状パラメータ
次の例に示すように、およびは、LAMBDA= / MU= IGauss-optionsで指定できます。
proc univariate data=measures; ppplot width / igauss(lambda=1 mu=2); run;
これらのパラメータを指定しなかった場合、デフォルトで、およびの最尤推定値が計算されます。
データ分布がパラメータおよびの逆ガウス分布である場合、LAMBDA=およびMU=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した逆ガウス分布が適合していることが証明されます。
IGAUSSオプションで要求された適合曲線の形状パラメータを指定します。LAMBDA=オプションは、分布を表すキーワードIGAUSSの後にかっこで囲んで指定します。 の値を省略すると、最尤推定値が計算されます。
対数正規P-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論対数正規CDF値になります。
ここで、は累積標準正規分布関数です。
いき値パラメータ
尺度パラメータ
形状パラメータ
次の例に示すように、、、およびは、THETA= / ZETA= / SIGMA= lognormal-optionsで指定できます。
proc univariate data=measures; ppplot width / lognormal(theta=1 zeta=2); run;
これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。
重要:データは、下限しきい値より大きい必要があります。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションで を指定します。
データ分布がパラメータ、およびの対数正規分布である場合、SIGMA=、THETA=およびZETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した対数正規分布が適合していることが証明されます。SHAPE=オプションをSIGMA=オプションの別名として、SCALE=オプションをZETA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。
GUMBEL、IGAUSSおよびNORMALオプションで要求したP-Pプロットのパラメータを指定します。デフォルトでは、逆ガウス分布および正規分布の場合は標本平均がに使用されます。Gumbel分布の場合、最尤推定値がデフォルトで計算されます。例l4.36を参照してください。
正規P-Pプロットを作成します。デフォルトでは、分布オプションを指定しなかった場合、正規P-Pプロットが表示されます。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論正規CDF値になります。
ここで、 は累積標準正規分布関数です。
位置パラメータまたは平均値
尺度パラメータまたは標準偏差
次の例に示すように、およびは、MU= / SIGMA= normal-optionsで指定できます。
proc univariate data=measures; ppplot width / normal(mu=1 sigma=2); run;
デフォルトでは、およびには標本平均および標本標準偏差が使用されます。
データ分布がパラメータおよびの正規分布である場合、MU=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した正規分布が適合していることが証明されます。例l4.36を参照してください。
一般化パレートP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値 になります。座標は、次の理論一般化パレートCDF値になります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
一般パレート分布のパラメータは、最小データ値未満でなければなりません。 を指定するには、THETA= Pareto-optionを使用します。 のデフォルト値は0です。また、一般パレート分布は、形状パラメータ および尺度パラメータ を持ちます。これらのパラメータを指定するには、ALPHA= / SIGMA= Pareto-optionsを使用します。デフォルトでは、および の最尤推定値が計算されます。
データ分布がパラメータ、およびの一般化パレート分布である場合、THETA=、SIGMA=およびALPHA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した一般化パレート分布が適合していることが証明されます。
べき関数P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論べき関数CDF値になります。
ここで、
下限のしきい値パラメータ(下限の終点)
尺度パラメータ
形状パラメータ
べき関数分布の下限はパラメータ で、上限は値 です。 および を指定するには、THETA= / SIGMA= power-optionsを使用します。 および のデフォルト値は、それぞれ0および1です。
形状パラメータ の値を指定するには、ALPHA= power-optionを使用します。 の値を省略すると、最尤推定値が計算されます。
べき関数分布は、2番目の形状パラメータ を持つ、ベータ分布の特殊なケースです。
データ分布がパラメータ、およびのべき関数分布である場合、THETA=、SIGMA=およびALPHA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したべき関数分布が適合していることが証明されます。
レイリーP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論レイリーCDF値になります。
ここで、
しきい値パラメータ
尺度パラメータ
レイリー分布のパラメータ は、最小データ値未満でなければなりません。 を指定するには、THETA= Rayleigh-optionを使用します。 のデフォルト値は0です。 を指定するには、SIGMA= Rayleigh-option を指定します。デフォルトでは、 の最尤推定値が計算されます。
データ分布がパラメータおよびのレイリー分布である場合、THETA=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したレイリー分布が適合していることが証明されます。
パラメータを指定します。ここで、です。BETA、EXPONENTIAL、GAMMA、GUMBEL、NORMAL、PARETO、POWER、RAYLEIGH、WEIBULLの各オプションとともに使用する場合、SIGMA=オプションは尺度パラメータを指定します。LOGNORMALオプションとともに使用する場合、SIGMA=オプションは形状パラメータを指定します。例l4.36を参照してください。
正方形の枠内にP-Pプロットを表示します。デフォルトは長方形の枠です。例l4.36を参照してください。
BETA、EXPONENTIAL、GAMMA、LOGNORMAL、PARETO、POWER、RAYLEIGH、WEIBULLの各オプションで要求したプロットの下限しきい値パラメータを指定します。
Weibull P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。
座標(番目の点の)は、経験CDF値になります。座標は、次の理論Weibull CDF値になります。
ここで、
いき値パラメータ
尺度パラメータ
形状パラメータ
次の例に示すように、、、およびは、C= / SIGMA= / THETA= Weibull-optionsで指定できます。
proc univariate data=measures; ppplot width / weibull(theta=1 sigma=2); run;
これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。
重要: お使いのデータは、下限しきい値 以上でなければなりません。デフォルトのがデータの下限値として適切でない場合、THETA=オプションでを指定する必要があります。
データ分布がパラメータ、およびのWeibull分布である場合、C=、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したWeibull分布が適合していることが証明されます。SHAPE=オプションをC=オプションの別名として、SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。