UNIVARIATEプロシジャ

当てはめた連続分布の計算式

次のセクションでは、HISTOGRAMステートメントで当てはめることができるパラメトリックな分布族の情報を示します。これらの分布の特性については、Johnson、KotzおよびBalakrishnan (19941995)により説明されています。

ベータ分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} hv \frac{(x-\theta )^{\alpha -1}(\sigma +\theta -x)^{\beta -1}}{ B(\alpha ,\beta )\sigma ^{(\alpha +\beta -1)}} &  \mbox{for }\theta < x < \theta + \sigma \\ 0 &  \mbox{for }x \leq \theta \text { or } x \geq \theta + \sigma \end{array} \right.  \]

ここで、$B(\alpha ,\beta )=\frac{\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$および

  • $\theta =$下限しきい値パラメータ(下限端点パラメータ)

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $\alpha =$ 形状パラメータ$(\alpha >0)$

  • $\beta =$ 形状パラメータ$(\beta >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、ベータ密度関数は次のように記述されています。

\[  p(x) = \left\{  \begin{array}{ll} \frac{(x - a)^{p - 1} (b - x)^{q - 1} }{B(p ,q)(b - a )^{p + q - 1} } &  \mbox{for }a < x < b \\ 0 &  \mbox{for }x \leq a \text { or } x \geq b \end{array} \right.  \]

これら2つのパラメータ化には次のような関係があります。

  • $\sigma = b - a$

  • $\theta = a$

  • $\alpha = p$

  • $\beta = q$

ベータ分布の範囲の下限はしきい値パラメータ$\theta = a$で、上限は$\theta + \sigma = b$です。BETAオプションを使用して当てはめたベータ曲線を指定する場合、$\theta $は最小データ値より小さく、$\theta + \sigma $は最大データ値より大きい必要があります。$\theta $および$\sigma $は、キーワードBETAの後のかっこ内のTHETA= / SIGMA= beta-optionsで指定できます。デフォルトでは、$\sigma =1$および$\theta =0$です。THETA=ESTおよびSIGMA=ESTを指定すると、$\theta $および$\sigma $の最尤推定値が計算されます。ただし、3パラメータおよび4パラメータの最尤推定は、収束するとは限りません。

また、$\alpha $および$\beta $は、それぞれALPHA=および BETA= beta-optionsで指定できます。デフォルトでは、$\alpha $および$\beta $の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータセットに、$\alpha $および$\beta $の最尤推定値を使用するベータ密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / beta(theta=32 sigma=180);

ベータ分布は、Pearson Type IまたはType II分布とも呼ばれます。これには、べき関数分布($\beta =1$)、逆正弦分布($\alpha =\beta =\frac{1}{2}$)、一般化逆正弦分布($\alpha +\beta =1$$\beta \neq \frac{1}{2}$)などが含まれます。

ベータ分布の分位点はDATAステップ関数QUANTILEを使用して、ベータ分布の確率はDATAステップ関数CDFを使用して計算できます。

指数分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{hv}{\sigma } \exp (-(\frac{x - \theta }{\sigma })) &  \mbox{for }x \geq \theta \\ 0 &  \mbox{for }x < \theta \end{array} \right.  \]

ここで、

  • $\theta =$しきい値パラメータ

  • $\sigma =$ 尺度パラメータ $(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

しきい値パラメータ$\theta $は、最小データ値以下である必要があります。$\theta $は、THRESHOLD= exponential-optionで指定できます。デフォルトは、$\theta =0$です。THETA=ESTを指定すると、$\theta $の最尤推定値が計算されます。また、$\sigma $はSCALE= exponential-optionを使用して指定できます。デフォルトでは、$\sigma $の最尤推定値が計算されます。著者によっては、尺度パラメータを$\frac{1}{\sigma }$と定義している場合があります。

指数分布は、特殊なケースのガンマ分布($\alpha =1$の場合)およびWeibull分布($c=1$の場合)です。関連分布は極値分布です。$Y=\exp (-X)$が指数分布である場合、Xは極値分布です。

指数分布の分位点はDATAステップ関数QUANTILEを使用して、指数分布の確率はDATAステップ関数CDFを使用して計算できます。

ガンマ分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{hv}{\Gamma (\alpha )\sigma } (\frac{x - \theta }{\sigma })^{\alpha - 1} \exp (-(\frac{x - \theta }{\sigma })) &  \mbox{for }x > \theta \\ 0 &  \mbox{for }x \leq \theta \end{array} \right.  \]

ここで、

  • $\theta =$しきい値パラメータ

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $\alpha =$ 形状パラメータ$(\alpha >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

しきい値パラメータ$\theta $は、最小データ値未満である必要があります。$\theta $は、THRESHOLD= gamma-optionで指定できます。デフォルトは、$\theta =0$です。THETA=ESTを指定すると、$\theta $の最尤推定値が計算されます。また、$\sigma $および$\alpha $は、それぞれSCALE=およびALPHA= gamma-optionsで指定できます。デフォルトでは、$\sigma $および$\alpha $の最尤推定値が計算されます。

ガンマ分布はPearson Type III分布とも呼ばれ、カイ2乗、指数およびErlangの各分布が含まれます。カイ2乗分布の確率密度関数は次のとおりです。

\[  p(x) = \left\{  \begin{array}{ll} \frac{1}{2\Gamma (\frac{\nu }{2})} \left( \frac{x}{2} \right)^{\frac{\nu }{2} - 1} \exp (-\frac{x}{2}) &  \mbox{for }x > 0 \\ 0 &  \mbox{for }x \leq 0 \end{array} \right.  \]

これは、$\alpha = \frac{\nu }{2}$$\sigma =2$$\theta =0$のガンマ分布であることに注意してください。指数分布は$\alpha =1$のガンマ分布であり、Erlang分布は$\alpha $が正の整数のガンマ分布です。関連分布はレイリー分布です。$R=\frac{\max (X_1,\ldots ,X_ n)}{\min (X_1,\ldots ,X_ n)}$の場合(ここで$X_{i}$は独立した$\chi ^{2}_{\nu }$変数)、$\log R$は次の確率密度関数に従う$\chi _{\nu }$分布になります。

\[  p(x) = \left\{ \begin{array}{ll} \left[2^{\frac{\nu }{2}-1}\Gamma (\frac{\nu }{2})\right] ^{-1}x^{\nu -1} \exp (-\frac{x^2}{2}) &  \mbox{for }x > 0 \\ 0 &  \mbox{for }x \leq 0 \end{array} \right.  \]

$\nu =2$の場合、前述の分布はレイリー分布と呼ばれます。

ガンマ分布の分位点はDATAステップ関数QUANTILEを使用して、ガンマ分布の確率はDATAステップ関数CDFを使用して計算できます。

Gumbel分布

適合する密度関数は次のようになります。

\[  p(x) = \frac{hv}{\sigma }e^{-(x-\mu )/\sigma } \exp \left( -e^{-(x-\mu )/\sigma }\right)  \]

ここで、

  • $\mu =$位置パラメータ

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

$\mu $および$\sigma $は、それぞれMU=およびSIGMA= Gumbel-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

: Gumbel分布はType 1極値分布とも呼ばれます。

: 乱数変数XがGumbel (Type 1極値)分布になるのは、$e^ X$がWeibull分布で$\exp ((X-\mu )/\sigma )$が標準指数分布である場合のみです。

逆ガウス分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} hv \left(\frac{\lambda }{2\pi x^3}\right)^{1/2} \exp (-\frac{\lambda }{2\mu ^2 x}(x-\mu )^2) &  \mbox{for }x > 0 \\ 0 &  \mbox{for }x \leq 0 \end{array} \right.  \]

ここで、

  • $\mu =$ 位置パラメータ$(\mu >0)$

  • $\lambda =$ 形状パラメータ$(\lambda >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

位置パラメータ$\mu $は、0より大きい必要があります。$\mu $は、MU= iGauss-optionで指定できます。また、形状パラメータ$\lambda $は、LAMBDA= iGauss-optionで指定できます。デフォルトでは、$\mu $および$\lambda $の最尤推定値が計算されます。

: 特殊なケース($\mu =1$および$\lambda =\phi $の場合)では、Wald分布に一致します。

逆ガウス分布の分位点はDATAステップ関数QUANTILEを使用して、逆ガウス分布の確率はDATAステップ関数CDFを使用して計算できます。

対数正規分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{hv}{\sigma \sqrt {2\pi }(x - \theta )} \exp \left(-\frac{(\log (x-\theta )-\zeta )^{2}}{2\sigma ^{2}}\right) &  \mbox{for }x > \theta \\ 0 &  \mbox{for }x \leq \theta \end{array} \right.  \]

ここで、

  • $\theta =$しきい値パラメータ

  • $\zeta =$ 尺度パラメータ$(-\infty < \zeta < \infty )$

  • $\sigma =$ 形状パラメータ$(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

しきい値パラメータ$\theta $は、最小データ値未満である必要があります。$\theta $は、THRESHOLD= lognormal-optionで指定できます。デフォルトは、$\theta =0$です。THETA=ESTを指定すると、$\theta $の最尤推定値が計算されます。$\zeta $および$\sigma $は、それぞれSCALE=およびSHAPE= lognormal-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

: 対数正規分布は、Johnson系分布では$S_ L$分布とも呼ばれます。

Note: このマニュアルでは、対数正規分布の形状パラメータを$\sigma $で表記していますが、他の分布の尺度パラメータの表記でも$\sigma $を使用しています。対数正規分布の形状パラメータの表記に$\sigma $を使用するのは、Xが対数正規分布である場合に、$\frac{1}{\sigma }(\log (X-\theta )-\zeta )$が標準正規分布になることに基づいています。この関係に基づき、対数正規分布の分位点はDATAステップ関数PROBIT、確率はDATAステップ関数PROBNORMを使用して計算できます。

正規分布

適合する密度関数は次のようになります。

\[  p(x) = \begin{array}{ll} \frac{hv}{\sigma \sqrt {2\pi }} \exp \left(-\frac{1}{2} (\frac{x - \mu }{\sigma })^{2}\right) &  \mbox{for }-\infty < x < \infty \end{array}  \]

ここで、

  • $\mu =$平均

  • $\sigma =$ 標準偏差$(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

$\mu $および$\sigma $はそれぞれMU=およびSIGMA= normal-optionsで指定できます。デフォルトでは、$\mu $を標本平均で、$\sigma $を標本標準偏差で推定します。

正規分布の分位点はDATAステップ関数QUANTILEを使用して、正規分布の確率はDATAステップ関数CDFを使用して計算できます。

: 正規分布は、Johnson系分布では$S_ N$分布とも呼ばれます。

一般化パレート分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{hv}{\sigma }(1 - \alpha (x-\theta )/\sigma )^{1/\alpha -1} &  \mbox{if } \alpha \neq 0 \\ \frac{hv}{\sigma } \exp (-x/\sigma ) &  \mbox{if }\alpha = 0 \end{array} \right.  \]

ここで、

  • $\theta =$しきい値パラメータ

  • $\alpha =$形状パラメータ

  • $\sigma =$ 形状パラメータ$(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

分布のサポートは、$x>0$ ($\alpha \leq 0 $の場合)および$0<x<\sigma /\alpha $($\alpha >0$の場合)です。

: 特殊なケースのパレート分布($\alpha =0$および$\alpha =1$の場合)は、平均$\sigma $の指数分布および間隔$(0,\sigma )$の一様分布にそれぞれ対応します。

しきい値パラメータ$\theta $は、最小データ値未満である必要があります。$\theta $は、THETA= Pareto-optionで指定できます。デフォルトは$\theta =0$です。$\alpha $および$\sigma $は、それぞれALPHA=およびSIGMA= Pareto-optionsでも指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

: パラメータの最尤推定量は$\alpha <\frac{1}{2}$の場合は有効ですが、それ以外の場合は有効ではありません。この場合、推定量は漸近的に正規分布に従い、漸近的に有効になります。漸近正規分布に従う最尤推定値では、平均は$(\alpha ,\sigma )$となり、分散共分散行列は次のようになります。

\[  \frac{1}{n}\left( \begin{array}{ccc} (1-\alpha )^2 & \sigma (1-\alpha )\\ \sigma (1-\alpha ) & 2\sigma ^2(1-\alpha ) \end{array}\right).  \]

:次の空間で極小がない場合、

\[  \{ \alpha <0,\sigma >0\} \cup \{ 0<\alpha \leq 1,\sigma /\alpha >\max (X_ i)\} ,  \]

最尤推定量は存在しません。最尤推定量の算出方法および推奨アルゴリズムの詳細は、Grimshaw(1993)で説明されています。

べき関数分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} hv \frac{\alpha }{\sigma }\left(\frac{x-\theta }{\sigma }\right)^{\alpha -1} &  \mbox{for }\theta < x < \theta + \sigma \\ 0 &  \mbox{for }x \leq \theta \text { or }x \geq \theta + \sigma \end{array} \right.  \]

ここで、

  • $\theta =$下限しきい値パラメータ(下限端点パラメータ)

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $\alpha =$ 形状パラメータ$(\alpha >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、べき関数分布の密度関数は次のように記述されています。

\[  p(x) = \left\{  \begin{array}{ll} \frac{p}{b-a}\left(\frac{x-a}{b-a} \right)^{p-1} &  \mbox{for }a < x < b \\ 0 &  \mbox{for }x \leq a \text { or }x \geq b \end{array} \right.  \]

これら2つのパラメータ化には次のような関係があります。

  • $\sigma = b - a$

  • $\theta = a$

  • $\alpha = p$

:べき関数分布族は、次の密度関数のベータ分布の部分集合です。

\[  p(x) = \left\{  \begin{array}{ll} hv \frac{(x-\theta )^{\alpha -1}(\sigma +\theta -x)^{\beta -1}}{ B(\alpha ,\beta )\sigma ^{(\alpha +\beta -1)}} &  \mbox{for }\theta < x < \theta + \sigma \\ 0 &  \mbox{for }x \leq \theta \text { or }x \geq \theta + \sigma \end{array} \right.  \]

ここで、$B(\alpha ,\beta )=\frac{\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$であり、パラメータ$\beta =1$です。したがって、ベータ分布の特性および推定手順がすべて適用されます。

べき関数分布の範囲の下限はしきい値パラメータ$\theta = a$で、上限は$\theta + \sigma = b$です。POWERオプションを使用して当てはめたべき関数曲線を指定する場合、$\theta $は最小データ値より小さく、$\theta + \sigma $は最大データ値より大きい必要があります。$\theta $および$\sigma $は、キーワードPOWERの後のかっこ内のTHETA= / SIGMA= power-optionsで指定できます。デフォルトでは、$\sigma =1$および$\theta =0$です。THETA=ESTおよびSIGMA=ESTを指定すると、$\theta $および$\sigma $の最尤推定値が計算されます。ただし、3パラメータの最尤推定は、収束するとは限りません。

また、$\alpha $はALPHA= power-optionを使用して指定できます。デフォルトでは、$\alpha $の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータに、$\alpha $の最尤推定値を使用するべき関数密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / power(theta=32 sigma=180);

レイリー分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} hv \frac{x-\theta }{\sigma ^2}e^{-(x-\theta )^2/(2\sigma ^2)} &  \mbox{for }x \geq \theta \\ 0 &  \mbox{for }x <\theta \end{array} \right.  \]

ここで、

  • $\theta =$下限しきい値パラメータ(下限端点パラメータ)

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

:レイリー分布は、次の密度関数のWeibull分布です。

\[  p(x) = \left\{  \begin{array}{ll} hv \frac{k}{\lambda } \left(\frac{x-\theta }{\lambda }\right)^{k-1} \exp (-(\frac{x-\theta }{\lambda })^ k) &  \mbox{for }x \geq \theta \\ 0 &  \mbox{for }x <\theta \end{array} \right.  \]

形状パラメータは$k=2$で、尺度パラメータは$\lambda = \sqrt {2}\sigma $です。

しきい値パラメータ$\theta $は、最小データ値未満である必要があります。$\theta $は、THETA= Rayleigh-optionで指定できます。デフォルトは$\theta =0$です。また、$\sigma $は、SIGMA= Rayleigh-optionでも指定できます。デフォルトでは、$\sigma $の最尤推定値が計算されます。

たとえば、下限が32のデータセットに$\sigma $の最尤推定値を使用するレイリー密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / rayleigh(theta=32);

Johnson $S_ B$分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{\delta hv}{\sigma \sqrt {2\pi } } \left[ \left( \frac{x - \theta }{\sigma } \right) \left( 1 - \frac{x - \theta }{\sigma } \right) \right]^{-1} \times & \\ \exp \left[ -\frac{1}{2} \left( \gamma + \delta \log ( \frac{x - \theta }{\theta + \sigma -x} ) \right)^2 \right] &  \mbox{for } \theta < x < \theta + \sigma \\ 0 &  \mbox{for } x \leq \theta \text { or } x \geq \theta + \sigma \end{array} \right.  \]

ここで、

  • $\theta =$ しきい値パラメータ$(-\infty < \theta < \infty )$

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $\delta =$ 形状パラメータ$(\delta >0)$

  • $\gamma =$ 形状パラメータ$(-\infty < \gamma < \infty )$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

$S_ B$分布の下限はパラメータ$\theta $で、上限は値$\theta + \sigma $です。パラメータ$\theta $は最小データ値未満である必要があります。$\theta $は、THETA= $S_ B$-optionで指定できます。または、THETA = ESTの$S_ B$ -optionを使用すると、$\theta $の推定を要求できます。$\theta $のデフォルト値は0です。合計$\theta + \sigma $は最小データ値よりも大きくなければなりません。$\sigma $のデフォルト値は0です。$\sigma $は、SIGMA= $S_ B$-optionで指定できます。または、SIGMA = ESTの$S_ B$ -optionを使用すると、$\theta $の推定を要求できます。

デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、$x_{-3z}$$x_{-z}$$x_{z}$$x_{3z}$で表される4つのデータパーセント点に基づいており、変換時に$-3z$$-z$z$3z$で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。

\[  z = \gamma + \delta \log \left( \frac{x - \theta }{\theta + \sigma - x} \right)  \]

zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SBオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。

次の値は、データパーセント値から計算されます。

\[  \begin{array}{lcl} m &  = &  x_{3z} - x_{z} \\ n &  = &  x_{-z} - x_{-3z} \\ p &  = &  x_{z} - x_{-z} \\ \end{array}  \]

これはSlifker and Shapiro (1980)により証明されました。

\[  \begin{array}{ll} \frac{mn}{p^2} > 1 &  \mbox{for any }S_ U\text { distribution} \\ \frac{mn}{p^2} < 1 &  \mbox{for any }S_ B\text { distribution} \\ \frac{mn}{p^2} = 1 &  \mbox{for any }S_ L\text { (lognormal) distribution} \\ \end{array}  \]

プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SBオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。 この基準は、次の不等式を満たすとします。

\[  \frac{mn}{p^2} < 1 - \mbox{tolerance}  \]

$S_ B$分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。

FITMETHOD = MOMENTSを(SBオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SBオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。

Johnson $S_ U$分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} \frac{ \delta hv}{\sigma \sqrt {2\pi } } \frac{ 1 }{ \sqrt { 1 + \left( (x - \theta ) / \sigma \right)^2 } } \times & \\ \exp \left[ -\frac{1}{2} \left( \gamma + \delta \sinh ^{-1} \left( \frac{x - \theta }{\sigma } \right) \right)^2 \right] &  \mbox{for } x > \theta \\ 0 &  \mbox{for } x \leq \theta \end{array} \right.  \]

ここで、

  • $\theta =$ 位置パラメータ$(-\infty < \theta < \infty )$

  • $\sigma =$ 尺度パラメータ$(\sigma > 0)$

  • $\delta =$ 形状パラメータ$(\delta >0)$

  • $\gamma =$ 形状パラメータ$(-\infty < \gamma < \infty )$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

パラメータは、THETA= / SIGMA= / DELTA= / GAMMA= $S_ U$-optionsで指定できます。これらのオプションはSUオプションの後にかっこで囲んで指定します。これらのパラメータを指定しなかった場合は、それぞれ推定されます。

デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、$x_{-3z}$$x_{-z}$$x_{z}$$x_{3z}$で表される4つのデータパーセント点に基づいており、変換時に$-3z$$-z$z$3z$で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。

\[  z = \gamma + \delta \sinh ^{-1} \left( \frac{x - \theta }{\sigma } \right)  \]

zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SUオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。

次の値は、データパーセント値から計算されます。

\[  \begin{array}{lcl} m &  = &  x_{3z} - x_{z} \\ n &  = &  x_{-z} - x_{-3z} \\ p &  = &  x_{z} - x_{-z} \\ \end{array}  \]

これはSlifker and Shapiro (1980)により証明されました。

\[  \begin{array}{ll} \frac{mn}{p^2} > 1 &  \mbox{for any }S_ U\text { distribution} \\ \frac{mn}{p^2} < 1 &  \mbox{for any }S_ B\text { distribution} \\ \frac{mn}{p^2} = 1 &  \mbox{for any }S_ L\text { (lognormal) distribution} \\ \end{array}  \]

プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SUオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。 この基準は、次の不等式を満たすとします。

\[  \frac{mn}{p^2} > 1 + \mbox{tolerance}  \]

$S_ U$分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。

FITMETHOD = MOMENTSを(SUオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SUオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。

Weibull分布

適合する密度関数は次のようになります。

\[  p(x) = \left\{  \begin{array}{ll} hv\frac{c}{\sigma } (\frac{x - \theta }{\sigma })^{c-1} \exp (-(\frac{x- \theta }{\sigma })^ c) &  \mbox{for } x > \theta \\ 0 &  \mbox{for }x \leq \theta \end{array} \right.  \]

ここで、

  • $\theta =$しきい値パラメータ

  • $\sigma =$ 尺度パラメータ$(\sigma >0)$

  • $c =$ 形状パラメータ$(\mi{c} >0)$

  • $h =$ヒストグラム間隔の幅

  • $v =$垂直比率

および

\[  v = \left\{  \begin{array}{ll} n &  \mbox{the sample size, for VSCALE=COUNT} \\ 100 &  \mbox{for VSCALE=PERCENT} \\ 1 &  \mbox{for VSCALE=PROPORTION} \end{array} \right.  \]

しきい値パラメータ$\theta $は、最小データ値未満である必要があります。$\theta $は、THRESHOLD= Weibull-optionで指定できます。デフォルトは、$\theta =0$です。THETA=ESTを指定すると、$\theta $の最尤推定値が計算されます。$\sigma $およびcは、それぞれ、SCALE=およびSHAPE= Weibull-optionsで指定できます。デフォルトでは、$\sigma $およびcの最尤推定値をプロシジャが計算します。

指数分布は、特殊なケースのWeibull分布($c=1$の場合)です。

Weibull分布の分位点はDATAステップ関数QUANTILEを使用して、Weibull分布の確率はDATAステップ関数CDFを使用して計算できます。