UNIVARIATEプロシジャ

 
PPPLOTステートメント

PPPLOT <variables> < / options> ;

PPPLOTステートメントは、P-Pプロット(パーセントプロット)を作成します。 P-Pプロットは変数の経験累積分布関数(ECDF)を、指定した正規分布などの理論累積分布関数と比較します。2つの分布が一致する場合、プロット上の点は原点を通り、単位勾配を形成する線形を形成します。したがって、P-Pプロットを使うと、理論分布に測定値の組み合わせのモデルがどの程度当てはまっているかを判定することができます。

PPPLOTステートメントでは次のいずれかの理論分布を指定できます。

  • ベータ

  • 指数

  • ガンマ

  • Gumbel

  • 一般化パレート

  • 逆ガウス

  • 対数正規

  • 正規

  • べき関数

  • レイリー

  • Weibull

: P-Pプロットを確率プロットと混同しないでください。確率プロットは、並べ替えられた一連の測定値を指定した分布のパーセント点と比較するものです。確率プロットはPROBPLOTステートメントで作成できます。

PPPLOTステートメントは、UNIVARIATEプロシジャ内でいくつでも使用できます。PPPLOTステートメントの構成要素は次のとおりです。

variables

P-Pプロットを作成するプロセス変数です。VARステートメントを指定する場合、variablesをそのVARステートメント内に含める必要があります。含めない場合、variablesは、入力データセット内にある任意の数値変数になります。変数のリストを指定しなかった場合、デフォルトではVARステートメント内でリストされた各変数のP-Pプロットが作成され、VARステートメントを指定していない場合は、入力データセット内の各数値変数のP-Pプロットが作成されます。たとえば、データセットmeasuresが2つの数値変数lengthおよびwidthを含む場合、次の2つのPPPLOTステートメントはそれぞれの変数についてP-Pプロットを作成します。

proc univariate data=measures;
   var length width;
   ppplot;
run;

proc univariate data=measures;
   ppplot length width;
run;
options

プロットのための理論上の分布を指定するか、またはプロットに機能を追加します。1つ以上の変数を指定した場合、各変数に対してオプションが等しく適用されます。PPPLOTステートメントのoptionsは、すべてスラッシュ(/)の後に指定します。分布を指定するオプションは1つだけ指定できます。その他のオプションはいくつでも指定できます。デフォルトでは、正規分布に基づくP-Pプロットが作成されます。

次の例では、NORMAL、MU=およびSIGMA=オプションを使って、平均値が10、標準偏差が0.3の正規分布に基づくP-Pプロットを要求しています。SQUAREオプションは、正方形の枠内に確率プロットを表示します。CTEXT=オプションはテキストの色を指定します。

proc univariate data=measures;
   ppplot length width / normal(mu=10 sigma=0.3)
                         square
                         ctext=blue;
run;

表4.64表4.77は、関数別のPPPLOTオプションの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。Optionsには次のいずれかを指定します。

  • 1次オプション

  • 2次オプション

  • 一般オプション

分布オプション

表4.64は、特定の理論分布を要求するための1次オプションの要約です。

表4.64 理論分布の指定オプション

オプション

説明

BETA(beta-options)

ベータP-Pプロットを指定

EXPONENTIAL(exponential-options)

指数P-Pプロットを指定

GAMMA(gamma-options)

ガンマP-Pプロットを指定

GUMBEL(Gumbel-options)

Gumbel P-Pプロットを指定

PARETO(Pareto-options)

一般化パレートP-Pプロットを指定

IGAUSS(iGauss-options)

逆ガウスP-Pプロットを指定

LOGNORMAL(lognormal-options)

対数正規P-Pプロットを指定

NORMAL(normal-options)

正規P-Pプロットを指定

POWER(power-options)

べき関数P-Pプロットを指定

RAYLEIGH(Rayleigh-options)

レイリーP-Pプロットを指定

WEIBULL(Weibull-options)

Weibull P-Pプロットを指定

表4.65表4.76は、分布のパラメータの指定と対角方向の分布参照線の表示の制御を行うオプションの要約です。これらのオプションは、分布オプションの後にかっこで囲んで指定します。たとえば、次のステートメントは、NORMALオプションを使用して正規P-Pプロットを要求します。

proc univariate data=measures;
   ppplot length / normal(mu=10 sigma=0.3 color=red);
run;

MU= / SIGMA= normal-optionsは正規分布のおよびを指定し、COLOR= normal-optionは線の色を指定します。

表4.65 分布参照線オプション

オプション

説明

COLOR=

(分布の)参照線の色を指定

L=

(分布の)参照線の種類を指定

NOLINE

分布参照線を抑制

W=

(分布の)参照線の幅を指定

表4.66 2次Beta-Options

オプション

説明

ALPHA=

形状パラメータ を指定

BETA=

形状パラメータ を指定

SIGMA=

尺度パラメータ を指定

THETA=

下限しきい値パラメータを指定

表4.67 2次Exponential-Options

オプション

説明

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

表4.68 2次Gamma-Options

オプション

説明

ALPHA=

形状パラメータ を指定

ALPHADELTA=

連続推定値の変化を指定(その値で のNewton-Raphson近似が終了)

ALPHAINITIAL=

の初期値(Newton-Raphson近似がの場合)を指定

MAXITER=

Newton-Raphson近似がの場合の反復の最大数を指定

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

表4.69 2次Gumbel-Options

オプション

説明

MU=

位置パラメータを指定

SIGMA=

尺度パラメータを指定

表4.70 2次IGauss-Options

オプション

説明

LAMBDA=

形状パラメータを指定

MU=

平均を指定する

表4.71 2次Lognormal-Options

オプション

説明

SIGMA=

形状パラメータを指定

THETA=

しきい値パラメータを指定

ZETA=

尺度パラメータを指定

表4.72 2次Normal-Options

オプション

説明

MU=

平均を指定

SIGMA=

標準偏差を指定

表4.73 2次Pareto-Options

オプション

説明

ALPHA=

形状パラメータを指定

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

表4.74 2次Power-Options

オプション

説明

ALPHA=

形状パラメータを指定

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

表4.75 2次Rayleigh-Options

オプション

説明

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

表4.76 2次Weibull-Options

オプション

説明

C=

形状パラメータを指定

CDELTA=

連続推定値の変化を指定(その値で のNewton-Raphson近似が終了)

CINITIAL=

の初期値(Newton-Raphson近似がの場合)を指定

MAXITER=

Newton-Raphson近似がの場合の反復の最大数を指定

SIGMA=

尺度パラメータを指定

THETA=

しきい値パラメータを指定

全般オプション

表4.77は、プロットの外観を制御するオプションの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。

表4.77 一般グラフオプション

オプション

説明

ANNOKEY

ANNOTATE=データセットで要求されたアノテーションをキーセルに対してのみ適用

ANNOTATE=

注釈データセットを提供

CAXIS=

軸の色を指定

CFRAME=

枠の色を指定

CFRAMESIDE=

行ラベルの枠を塗りつぶす色を指定

CFRAMETOP=

列ラベルの枠を塗りつぶす色を指定

CHREF=

HREF=で指定した参照線の色を指定

CONTENTS=

P-Pプロットグループの目次エントリを指定

CPROP=

度数の棒の割合の色を指定

CTEXT=

テキストの色を指定

CTEXTSIDE=

行ラベルの色を指定

CTEXTTOP=

列ラベルの色を指定

CVREF=

VREF=で指定した参照線の色を指定

DESCRIPTION=

グラフカタログ内のプロットに対する説明を指定

FONT=

テキストのソフトウェアフォントを指定

HAXIS=

水平軸用のAXISステートメントを指定

HEIGHT=

枠外の領域で使用されるテキストの高さを指定

HMINOR=

水平軸の小目盛りの数を指定

HREF=

水平軸に垂直な参照線を指定

HREFLABELS=

HREF=行の線のラベルを指定

HREFLABPOS=

HREF=で指定した参照線のラベルの位置を指定

INFONT=

枠領域内のテキストに対してソフトウェアフォントを指定

INHEIGHT=

枠領域内のテキストの高さを指定

INTERTILE=

比較プロットのタイル間の距離を指定

LHREF=

HREF=行の線の種類を指定

LVREF=

VREF=行の線の種類を指定

NAME=

グラフカタログ内のプロットに対して名前を指定

NCOLS=

比較プロットの列数を指定

NOFRAME

プロット領域の周囲の枠の表示を抑制

NOHLABEL

水平軸のラベルを抑制

NOVLABEL

垂直軸のラベルを抑制

NOVTICK

垂直軸の目盛りおよび目盛りラベルを抑制

NROWS=

比較プロットの列数を指定

OVERLAY

異なるクラスレベルのプロットを重ね合わせる(ODS Graphicsのみ)

SQUARE

P-Pプロットを正方形の枠の中で表示

TURNVLABELS

垂直軸のラベルの文字列を縦書きに

VAXIS=

垂直軸用のAXISステートメントを指定

VAXISLABEL=

垂直軸にラベルを指定

VMINOR=

垂直軸の小目盛りの数を指定

VREF=

垂直軸に垂直な参照線を指定

VREFLABELS=

VREF=行の線のラベルを指定

VREFLABPOS=

VREF=で指定した参照線のラベルの位置を指定

WAXIS=

軸と枠の線の太さを指定

オプションのリファレンス

PPPLOTステートメントのオプションの詳細は次のとおりです。すべてのプロットステートメントに共通するオプションの詳細は、共通オプションのリファレンスのセクションを参照してください。

ALPHA=value

BETA、GAMMA、PARETO、POWERオプションで要求したP-Pプロットの形状パラメータを指定します。

BETA<(beta-options)>

ベータP-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論ベータCDF値になります。

     

は正規化された不完全なベータ関数で、各値は次のとおりです。

  • 下側いき値パラメータ

  • 尺度パラメータ

  • 1番目の形状パラメータ

  • 2番目の形状パラメータ

次の例に示すように、は、ALPHA= / BETA= / SIGMA= / THETA= beta-optionsで指定できます。

proc univariate data=measures;
   ppplot width / beta(theta=1 sigma=2 alpha=3 beta=4);
run;

これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。

重要:デフォルトの単位間隔(0,1)でデータ範囲が適切に示されない場合は、データが間隔に収まるようにTHETA=およびSIGMA=を指定する必要があります。

データ分布がパラメータのベータ分布である場合、ALPHA=、BETA=、SIGMA=、THETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したベータ分布が適合していることが証明されます。SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。

BETA=value

BETA分布オプションで要求したP-Pプロットの形状パラメータを指定します。例は、前のBETAオプションの項目を参照してください。

C=value

WEIBULLオプションで要求したP-Pプロットの形状パラメータを指定します。例は、WEIBULLオプションの項目を参照してください。

EXPONENTIAL<(exponential-options)>
EXP<(exponential-options)>

指数P-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値 になります。座標は、次の理論指数CDF値になります。

     

ここで、

  • いき値パラメータ

  • 尺度パラメータ

次の例に示すように、およびは、SIGMA= / THETA= exponential-optionsで指定できます。

proc univariate data=measures;
   ppplot width / exponential(theta=1 sigma=2);
run;

これらのパラメータを指定しなかった場合、デフォルトで、で、の最尤推定値が計算されます。

重要: お使いのデータは、下限しきい値以上でなければなりません。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションでを指定します。

データ分布がパラメータおよびの指数分布である場合、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した指数分布が適合していることが証明されます。SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。

GAMMA<(gamma-options)>

ガンマP-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論ガンマCDF値になります。

     

は正規化された不完全なガンマ関数で、各値は次のとおりです。

  • いき値パラメータ

  • 尺度パラメータ

  • 形状パラメータ

次の例に示すように、、およびは、ALPHA= / SIGMA= / THETA= gamma-optionsで指定できます。

proc univariate data=measures;
   ppplot width / gamma(alpha=1 sigma=2 theta=3);
run;

これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。

重要: お使いのデータは、下限しきい値 以上でなければなりません。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションで を指定します。

データ分布がパラメータおよびのガンマ分布である場合、ALPHA=、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したガンマ分布が適合していることが証明されます。SHAPE=オプションをALPHA=オプションの別名として、SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。

GUMBEL<(Gumbel-options)>

Gumbel P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論Gumbel CDF値になります。

     

ここで、

  • 位置パラメータ

  • 尺度パラメータ

次の例に示すように、およびは、MU= / SIGMA= Gumbel-optionsで指定できます。

proc univariate data=measures;
   ppplot width / gumbel(mu=1 sigma=2);
run;

これらのパラメータを指定しなかった場合、デフォルトで、およびの最尤推定値が計算されます。

データ分布がパラメータおよびのGumbel分布である場合、MU=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したGumbel分布が適合していることが証明されます。

IGAUSS<(iGauss-options)>

逆ガウスP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値 になります。座標は、次の理論逆ガウスCDF値になります。

     

ここで、 は標準正規分布関数です。

  • 平均値パラメータ

  • 形状パラメータ

次の例に示すように、およびは、LAMBDA= / MU= IGauss-optionsで指定できます。

proc univariate data=measures;
   ppplot width / igauss(lambda=1 mu=2);
run;

これらのパラメータを指定しなかった場合、デフォルトで、およびの最尤推定値が計算されます。

データ分布がパラメータおよびの逆ガウス分布である場合、LAMBDA=およびMU=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した逆ガウス分布が適合していることが証明されます。

LAMBDA=value

IGAUSSオプションで要求された適合曲線の形状パラメータを指定します。LAMBDA=オプションは、分布を表すキーワードIGAUSSの後にかっこで囲んで指定します。 の値を省略すると、最尤推定値が計算されます。

LOGNORMAL<(lognormal-options)>
LNORM<(lognormal-options)>

対数正規P-Pプロットを作成します。プロットを作成する場合、非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論対数正規CDF値になります。

     

ここで、は累積標準正規分布関数です。

  • いき値パラメータ

  • 尺度パラメータ

  • 形状パラメータ

次の例に示すように、、およびは、THETA= / ZETA= / SIGMA= lognormal-optionsで指定できます。

proc univariate data=measures;
   ppplot width / lognormal(theta=1 zeta=2);
run;

これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。

重要:データは、下限しきい値より大きい必要があります。デフォルトの がお使いのデータの下限値として適切でない場合、THETA= オプションで を指定します。

データ分布がパラメータおよびの対数正規分布である場合、SIGMA=、THETA=およびZETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した対数正規分布が適合していることが証明されます。SHAPE=オプションをSIGMA=オプションの別名として、SCALE=オプションをZETA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。

MU=value

GUMBEL、IGAUSSおよびNORMALオプションで要求したP-Pプロットのパラメータを指定します。デフォルトでは、逆ガウス分布および正規分布の場合は標本平均がに使用されます。Gumbel分布の場合、最尤推定値がデフォルトで計算されます。例l4.36を参照してください。

NOLINE

対角方向の参照線を抑制します。

NORMAL<(normal-options)>
NORM<(normal-options )>

正規P-Pプロットを作成します。デフォルトでは、分布オプションを指定しなかった場合、正規P-Pプロットが表示されます。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論正規CDF値になります。

     

ここで、 は累積標準正規分布関数です。

  • 位置パラメータまたは平均値

  • 尺度パラメータまたは標準偏差

次の例に示すように、およびは、MU= / SIGMA= normal-optionsで指定できます。

proc univariate data=measures;
   ppplot width / normal(mu=1 sigma=2);
run;

デフォルトでは、およびには標本平均および標本標準偏差が使用されます。

データ分布がパラメータおよびの正規分布である場合、MU=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した正規分布が適合していることが証明されます。例l4.36を参照してください。

PARETO<(Pareto-options)>

一般化パレートP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値 になります。座標は、次の理論一般化パレートCDF値になります。

     

ここで、

しきい値パラメータ
尺度パラメータ
形状パラメータ

一般パレート分布のパラメータは、最小データ値未満でなければなりません。 を指定するには、THETA= Pareto-optionを使用します。 のデフォルト値は0です。また、一般パレート分布は、形状パラメータ および尺度パラメータ を持ちます。これらのパラメータを指定するには、ALPHA= / SIGMA= Pareto-optionsを使用します。デフォルトでは、および の最尤推定値が計算されます。

データ分布がパラメータおよびの一般化パレート分布である場合、THETA=、SIGMA=およびALPHA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定した一般化パレート分布が適合していることが証明されます。

POWER<(Power-options)>

べき関数P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論べき関数CDF値になります。

     

ここで、

下限のしきい値パラメータ(下限の終点)
尺度パラメータ
形状パラメータ

べき関数分布の下限はパラメータ で、上限は値 です。 および を指定するには、THETA= / SIGMA= power-optionsを使用します。 および のデフォルト値は、それぞれ0および1です。

形状パラメータ の値を指定するには、ALPHA= power-optionを使用します。 の値を省略すると、最尤推定値が計算されます。

べき関数分布は、2番目の形状パラメータ を持つ、ベータ分布の特殊なケースです。

データ分布がパラメータおよびのべき関数分布である場合、THETA=、SIGMA=およびALPHA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したべき関数分布が適合していることが証明されます。

RAYLEIGH<(Rayleigh-options)>

レイリーP-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論レイリーCDF値になります。

     

ここで、

しきい値パラメータ
尺度パラメータ

レイリー分布のパラメータ は、最小データ値未満でなければなりません。 を指定するには、THETA= Rayleigh-optionを使用します。 のデフォルト値は0です。 を指定するには、SIGMA= Rayleigh-option を指定します。デフォルトでは、 の最尤推定値が計算されます。

データ分布がパラメータおよびのレイリー分布である場合、THETA=およびSIGMA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したレイリー分布が適合していることが証明されます。

SIGMA=value

パラメータを指定します。ここで、です。BETA、EXPONENTIAL、GAMMA、GUMBEL、NORMAL、PARETO、POWER、RAYLEIGH、WEIBULLの各オプションとともに使用する場合、SIGMA=オプションは尺度パラメータを指定します。LOGNORMALオプションとともに使用する場合、SIGMA=オプションは形状パラメータを指定します。例l4.36を参照してください。

SQUARE

正方形の枠内にP-Pプロットを表示します。デフォルトは長方形の枠です。例l4.36を参照してください。

THETA=value
THRESHOLD=value

BETA、EXPONENTIAL、GAMMA、LOGNORMAL、PARETO、POWER、RAYLEIGH、WEIBULLの各オプションで要求したプロットの下限しきい値パラメータを指定します。

WEIBULL<(Weibull-options)>
WEIB<(Weibull-options)>

Weibull P-Pプロットを作成します。プロットを作成する場合、 非欠損値は昇順に並べられます。

     

座標(番目の点の)は、経験CDF値になります。座標は、次の理論Weibull CDF値になります。

     

ここで、

  • いき値パラメータ

  • 尺度パラメータ

  • 形状パラメータ

次の例に示すように、、およびは、C= / SIGMA= / THETA= Weibull-optionsで指定できます。

proc univariate data=measures;
   ppplot width / weibull(theta=1 sigma=2);
run;

これらのパラメータを指定しなかった場合、デフォルトで、で、およびの最尤推定値が計算されます。

重要: お使いのデータは、下限しきい値 以上でなければなりません。デフォルトのがデータの下限値として適切でない場合、THETA=オプションでを指定する必要があります。

データ分布がパラメータおよびのWeibull分布である場合、C=、SIGMA=およびTHETA=に対するプロット上の点は、デフォルトで表示される対角線上またはその近くにプロットされやすくなります。対角線と点のパターンが一致することにより、指定したWeibull分布が適合していることが証明されます。SHAPE=オプションをC=オプションの別名として、SCALE=オプションをSIGMA=オプションの別名として、THRESHOLD=オプションをTHETA=オプションの別名として指定できます。

ZETA=value

LOGNORMALオプションで要求した対数正規P-Pプロットの尺度パラメータの値を指定します。