当てはめた連続分布の計算式

ベータ分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} hv \frac{(x-\theta )^{\alpha -1}(\sigma +\theta -x)^{\beta -1}}{ B(\alpha ,\beta )\sigma ^{(\alpha +\beta -1)}} & \mbox{for }\theta < x < \theta + \sigma \\ 0 & \mbox{for }x \leq \theta \text { or } x \geq \theta + \sigma \end{array} \right.$

ここで、 $B(\alpha ,\beta )=\frac{\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$ および

$\theta =$ 下限しきい値パラメータ(下限端点パラメータ)
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$\alpha =$ 形状パラメータ $(\alpha >0)$
$\beta =$ 形状パラメータ $(\beta >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、ベータ密度関数は次のように記述されています。

$p(x) = \left\{ \begin{array}{ll} \frac{(x - a)^{p - 1} (b - x)^{q - 1} }{B(p ,q)(b - a )^{p + q - 1} } & \mbox{for }a < x < b \\ 0 & \mbox{for }x \leq a \text { or } x \geq b \end{array} \right.$

これら2つのパラメータ化には次のような関係があります。

$\sigma = b - a$
$\theta = a$
$\alpha = p$
$\beta = q$

ベータ分布の範囲の下限はしきい値パラメータ $\theta = a$ で、上限は $\theta + \sigma = b$ です。BETAオプションを使用して当てはめたベータ曲線を指定する場合、 $\theta$ は最小データ値より小さく、 $\theta + \sigma$ は最大データ値より大きい必要があります。 $\theta$ および $\sigma$ は、キーワードBETAの後のかっこ内のTHETA= / SIGMA= beta-optionsで指定できます。デフォルトでは、 $\sigma =1$ および $\theta =0$ です。THETA=ESTおよびSIGMA=ESTを指定すると、 $\theta$ および $\sigma$ の最尤推定値が計算されます。ただし、3パラメータおよび4パラメータの最尤推定は、収束するとは限りません。

また、 $\alpha$ および $\beta$ は、それぞれALPHA=および BETA= beta-optionsで指定できます。デフォルトでは、 $\alpha$ および $\beta$ の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータセットに、 $\alpha$ および $\beta$ の最尤推定値を使用するベータ密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / beta(theta=32 sigma=180);

ベータ分布は、Pearson Type IまたはType II分布とも呼ばれます。これには、べき関数分布( $\beta =1$ )、逆正弦分布( $\alpha =\beta =\frac{1}{2}$ )、一般化逆正弦分布( $\alpha +\beta =1$ 、 $\beta \neq \frac{1}{2}$ )などが含まれます。

ベータ分布の分位点はDATAステップ関数QUANTILEを使用して、ベータ分布の確率はDATAステップ関数CDFを使用して計算できます。

指数分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{hv}{\sigma } \exp (-(\frac{x - \theta }{\sigma })) & \mbox{for }x \geq \theta \\ 0 & \mbox{for }x < \theta \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

しきい値パラメータ $\theta$ は、最小データ値以下である必要があります。 $\theta$ は、THRESHOLD= exponential-optionで指定できます。デフォルトは、 $\theta =0$ です。THETA=ESTを指定すると、 $\theta$ の最尤推定値が計算されます。また、 $\sigma$ はSCALE= exponential-optionを使用して指定できます。デフォルトでは、 $\sigma$ の最尤推定値が計算されます。著者によっては、尺度パラメータを $\frac{1}{\sigma }$ と定義している場合があります。

指数分布は、特殊なケースのガンマ分布( $\alpha =1$ の場合)およびWeibull分布( $c=1$ の場合)です。関連分布は極値分布です。 $Y=\exp (-X)$ が指数分布である場合、Xは極値分布です。

指数分布の分位点はDATAステップ関数QUANTILEを使用して、指数分布の確率はDATAステップ関数CDFを使用して計算できます。

ガンマ分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{hv}{\Gamma (\alpha )\sigma } (\frac{x - \theta }{\sigma })^{\alpha - 1} \exp (-(\frac{x - \theta }{\sigma })) & \mbox{for }x > \theta \\ 0 & \mbox{for }x \leq \theta \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$\alpha =$ 形状パラメータ $(\alpha >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

しきい値パラメータ $\theta$ は、最小データ値未満である必要があります。 $\theta$ は、THRESHOLD= gamma-optionで指定できます。デフォルトは、 $\theta =0$ です。THETA=ESTを指定すると、 $\theta$ の最尤推定値が計算されます。また、 $\sigma$ および $\alpha$ は、それぞれSCALE=およびALPHA= gamma-optionsで指定できます。デフォルトでは、 $\sigma$ および $\alpha$ の最尤推定値が計算されます。

ガンマ分布はPearson Type III分布とも呼ばれ、カイ2乗、指数およびErlangの各分布が含まれます。カイ2乗分布の確率密度関数は次のとおりです。

$p(x) = \left\{ \begin{array}{ll} \frac{1}{2\Gamma (\frac{\nu }{2})} \left( \frac{x}{2} \right)^{\frac{\nu }{2} - 1} \exp (-\frac{x}{2}) & \mbox{for }x > 0 \\ 0 & \mbox{for }x \leq 0 \end{array} \right.$

これは、 $\alpha = \frac{\nu }{2}$ 、 $\sigma =2$ 、 $\theta =0$ のガンマ分布であることに注意してください。指数分布は $\alpha =1$ のガンマ分布であり、Erlang分布は $\alpha$ が正の整数のガンマ分布です。関連分布はレイリー分布です。 $R=\frac{\max (X_1,\ldots ,X_ n)}{\min (X_1,\ldots ,X_ n)}$ の場合(ここで $X_{i}$ は独立した $\chi ^{2}_{\nu }$ 変数)、 $\log R$ は次の確率密度関数に従う $\chi _{\nu }$ 分布になります。

$p(x) = \left\{ \begin{array}{ll} \left[2^{\frac{\nu }{2}-1}\Gamma (\frac{\nu }{2})\right] ^{-1}x^{\nu -1} \exp (-\frac{x^2}{2}) & \mbox{for }x > 0 \\ 0 & \mbox{for }x \leq 0 \end{array} \right.$

$\nu =2$ の場合、前述の分布はレイリー分布と呼ばれます。

ガンマ分布の分位点はDATAステップ関数QUANTILEを使用して、ガンマ分布の確率はDATAステップ関数CDFを使用して計算できます。

Gumbel分布

適合する密度関数は次のようになります。

$p(x) = \frac{hv}{\sigma }e^{-(x-\mu )/\sigma } \exp \left( -e^{-(x-\mu )/\sigma }\right)$

ここで、

$\mu =$ 位置パラメータ
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

$\mu$ および $\sigma$ は、それぞれMU=およびSIGMA= Gumbel-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

注: Gumbel分布はType 1極値分布とも呼ばれます。

注: 乱数変数XがGumbel (Type 1極値)分布になるのは、 $e^ X$ がWeibull分布で $\exp ((X-\mu )/\sigma )$ が標準指数分布である場合のみです。

逆ガウス分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} hv \left(\frac{\lambda }{2\pi x^3}\right)^{1/2} \exp (-\frac{\lambda }{2\mu ^2 x}(x-\mu )^2) & \mbox{for }x > 0 \\ 0 & \mbox{for }x \leq 0 \end{array} \right.$

ここで、

$\mu =$ 位置パラメータ $(\mu >0)$
$\lambda =$ 形状パラメータ $(\lambda >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

位置パラメータ $\mu$ は、0より大きい必要があります。 $\mu$ は、MU= iGauss-optionで指定できます。また、形状パラメータ $\lambda$ は、LAMBDA= iGauss-optionで指定できます。デフォルトでは、 $\mu$ および $\lambda$ の最尤推定値が計算されます。

注: 特殊なケース( $\mu =1$ および $\lambda =\phi$ の場合)では、Wald分布に一致します。

逆ガウス分布の分位点はDATAステップ関数QUANTILEを使用して、逆ガウス分布の確率はDATAステップ関数CDFを使用して計算できます。

対数正規分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{hv}{\sigma \sqrt {2\pi }(x - \theta )} \exp \left(-\frac{(\log (x-\theta )-\zeta )^{2}}{2\sigma ^{2}}\right) & \mbox{for }x > \theta \\ 0 & \mbox{for }x \leq \theta \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ
$\zeta =$ 尺度パラメータ $(-\infty < \zeta < \infty )$
$\sigma =$ 形状パラメータ $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

しきい値パラメータ $\theta$ は、最小データ値未満である必要があります。 $\theta$ は、THRESHOLD= lognormal-optionで指定できます。デフォルトは、 $\theta =0$ です。THETA=ESTを指定すると、 $\theta$ の最尤推定値が計算されます。 $\zeta$ および $\sigma$ は、それぞれSCALE=およびSHAPE= lognormal-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

注: 対数正規分布は、Johnson系分布では $S_ L$ 分布とも呼ばれます。

Note: このマニュアルでは、対数正規分布の形状パラメータを $\sigma$ で表記していますが、他の分布の尺度パラメータの表記でも $\sigma$ を使用しています。対数正規分布の形状パラメータの表記に $\sigma$ を使用するのは、Xが対数正規分布である場合に、 $\frac{1}{\sigma }(\log (X-\theta )-\zeta )$ が標準正規分布になることに基づいています。この関係に基づき、対数正規分布の分位点はDATAステップ関数PROBIT、確率はDATAステップ関数PROBNORMを使用して計算できます。

正規分布

適合する密度関数は次のようになります。

$p(x) = \begin{array}{ll} \frac{hv}{\sigma \sqrt {2\pi }} \exp \left(-\frac{1}{2} (\frac{x - \mu }{\sigma })^{2}\right) & \mbox{for }-\infty < x < \infty \end{array}$

ここで、

$\mu =$ 平均
$\sigma =$ 標準偏差 $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

$\mu$ および $\sigma$ はそれぞれMU=およびSIGMA= normal-optionsで指定できます。デフォルトでは、 $\mu$ を標本平均で、 $\sigma$ を標本標準偏差で推定します。

正規分布の分位点はDATAステップ関数QUANTILEを使用して、正規分布の確率はDATAステップ関数CDFを使用して計算できます。

注: 正規分布は、Johnson系分布では $S_ N$ 分布とも呼ばれます。

一般化パレート分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{hv}{\sigma }(1 - \alpha (x-\theta )/\sigma )^{1/\alpha -1} & \mbox{if } \alpha \neq 0 \\ \frac{hv}{\sigma } \exp (-x/\sigma ) & \mbox{if }\alpha = 0 \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ
$\alpha =$ 形状パラメータ
$\sigma =$ 形状パラメータ $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

分布のサポートは、 $x>0$ ( $\alpha \leq 0$ の場合)および $0<x<\sigma /\alpha$ ( $\alpha >0$ の場合)です。

注: 特殊なケースのパレート分布( $\alpha =0$ および $\alpha =1$ の場合)は、平均 $\sigma$ の指数分布および間隔 $(0,\sigma )$ の一様分布にそれぞれ対応します。

しきい値パラメータ $\theta$ は、最小データ値未満である必要があります。 $\theta$ は、THETA= Pareto-optionで指定できます。デフォルトは $\theta =0$ です。 $\alpha$ および $\sigma$ は、それぞれALPHA=およびSIGMA= Pareto-optionsでも指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。

注: パラメータの最尤推定量は $\alpha <\frac{1}{2}$ の場合は有効ですが、それ以外の場合は有効ではありません。この場合、推定量は漸近的に正規分布に従い、漸近的に有効になります。漸近正規分布に従う最尤推定値では、平均は $(\alpha ,\sigma )$ となり、分散共分散行列は次のようになります。

$\frac{1}{n}\left( \begin{array}{ccc} (1-\alpha )^2 & \sigma (1-\alpha )\\ \sigma (1-\alpha ) & 2\sigma ^2(1-\alpha ) \end{array}\right).$

注:次の空間で極小がない場合、

$\{ \alpha <0,\sigma >0\} \cup \{ 0<\alpha \leq 1,\sigma /\alpha >\max (X_ i)\} ,$

最尤推定量は存在しません。最尤推定量の算出方法および推奨アルゴリズムの詳細は、Grimshaw(1993)で説明されています。

べき関数分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} hv \frac{\alpha }{\sigma }\left(\frac{x-\theta }{\sigma }\right)^{\alpha -1} & \mbox{for }\theta < x < \theta + \sigma \\ 0 & \mbox{for }x \leq \theta \text { or }x \geq \theta + \sigma \end{array} \right.$

ここで、

$\theta =$ 下限しきい値パラメータ(下限端点パラメータ)
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$\alpha =$ 形状パラメータ $(\alpha >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、べき関数分布の密度関数は次のように記述されています。

$p(x) = \left\{ \begin{array}{ll} \frac{p}{b-a}\left(\frac{x-a}{b-a} \right)^{p-1} & \mbox{for }a < x < b \\ 0 & \mbox{for }x \leq a \text { or }x \geq b \end{array} \right.$

これら2つのパラメータ化には次のような関係があります。

$\sigma = b - a$
$\theta = a$
$\alpha = p$

注:べき関数分布族は、次の密度関数のベータ分布の部分集合です。

$p(x) = \left\{ \begin{array}{ll} hv \frac{(x-\theta )^{\alpha -1}(\sigma +\theta -x)^{\beta -1}}{ B(\alpha ,\beta )\sigma ^{(\alpha +\beta -1)}} & \mbox{for }\theta < x < \theta + \sigma \\ 0 & \mbox{for }x \leq \theta \text { or }x \geq \theta + \sigma \end{array} \right.$

ここで、 $B(\alpha ,\beta )=\frac{\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$ であり、パラメータ $\beta =1$ です。したがって、ベータ分布の特性および推定手順がすべて適用されます。

べき関数分布の範囲の下限はしきい値パラメータ $\theta = a$ で、上限は $\theta + \sigma = b$ です。POWERオプションを使用して当てはめたべき関数曲線を指定する場合、 $\theta$ は最小データ値より小さく、 $\theta + \sigma$ は最大データ値より大きい必要があります。 $\theta$ および $\sigma$ は、キーワードPOWERの後のかっこ内のTHETA= / SIGMA= power-optionsで指定できます。デフォルトでは、 $\sigma =1$ および $\theta =0$ です。THETA=ESTおよびSIGMA=ESTを指定すると、 $\theta$ および $\sigma$ の最尤推定値が計算されます。ただし、3パラメータの最尤推定は、収束するとは限りません。

また、 $\alpha$ はALPHA= power-optionを使用して指定できます。デフォルトでは、 $\alpha$ の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータに、 $\alpha$ の最尤推定値を使用するべき関数密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / power(theta=32 sigma=180);

レイリー分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} hv \frac{x-\theta }{\sigma ^2}e^{-(x-\theta )^2/(2\sigma ^2)} & \mbox{for }x \geq \theta \\ 0 & \mbox{for }x <\theta \end{array} \right.$

ここで、

$\theta =$ 下限しきい値パラメータ(下限端点パラメータ)
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

注:レイリー分布は、次の密度関数のWeibull分布です。

$p(x) = \left\{ \begin{array}{ll} hv \frac{k}{\lambda } \left(\frac{x-\theta }{\lambda }\right)^{k-1} \exp (-(\frac{x-\theta }{\lambda })^ k) & \mbox{for }x \geq \theta \\ 0 & \mbox{for }x <\theta \end{array} \right.$

形状パラメータは $k=2$ で、尺度パラメータは $\lambda = \sqrt {2}\sigma$ です。

しきい値パラメータ $\theta$ は、最小データ値未満である必要があります。 $\theta$ は、THETA= Rayleigh-optionで指定できます。デフォルトは $\theta =0$ です。また、 $\sigma$ は、SIGMA= Rayleigh-optionでも指定できます。デフォルトでは、 $\sigma$ の最尤推定値が計算されます。

たとえば、下限が32のデータセットに $\sigma$ の最尤推定値を使用するレイリー密度曲線を当てはめるには、次のステートメントを使用します。

histogram Length / rayleigh(theta=32);

Johnson $S_ B$ 分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{\delta hv}{\sigma \sqrt {2\pi } } \left[ \left( \frac{x - \theta }{\sigma } \right) \left( 1 - \frac{x - \theta }{\sigma } \right) \right]^{-1} \times & \\ \exp \left[ -\frac{1}{2} \left( \gamma + \delta \log ( \frac{x - \theta }{\theta + \sigma -x} ) \right)^2 \right] & \mbox{for } \theta < x < \theta + \sigma \\ 0 & \mbox{for } x \leq \theta \text { or } x \geq \theta + \sigma \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ $(-\infty < \theta < \infty )$
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$\delta =$ 形状パラメータ $(\delta >0)$
$\gamma =$ 形状パラメータ $(-\infty < \gamma < \infty )$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

$S_ B$ 分布の下限はパラメータ $\theta$ で、上限は値 $\theta + \sigma$ です。パラメータ $\theta$ は最小データ値未満である必要があります。 $\theta$ は、THETA= $S_ B$ -optionで指定できます。または、THETA = ESTの $S_ B$ -optionを使用すると、 $\theta$ の推定を要求できます。 $\theta$ のデフォルト値は0です。合計 $\theta + \sigma$ は最小データ値よりも大きくなければなりません。 $\sigma$ のデフォルト値は0です。 $\sigma$ は、SIGMA= $S_ B$ -optionで指定できます。または、SIGMA = ESTの $S_ B$ -optionを使用すると、 $\theta$ の推定を要求できます。

デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、 $x_{-3z}$ 、 $x_{-z}$ 、 $x_{z}$ 、 $x_{3z}$ で表される4つのデータパーセント点に基づいており、変換時に $-3z$ 、 $-z$ 、z、 $3z$ で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。

$z = \gamma + \delta \log \left( \frac{x - \theta }{\theta + \sigma - x} \right)$

zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SBオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。

次の値は、データパーセント値から計算されます。

$\begin{array}{lcl} m & = & x_{3z} - x_{z} \\ n & = & x_{-z} - x_{-3z} \\ p & = & x_{z} - x_{-z} \\ \end{array}$

これはSlifker and Shapiro (1980)により証明されました。

$\begin{array}{ll} \frac{mn}{p^2} > 1 & \mbox{for any }S_ U\text { distribution} \\ \frac{mn}{p^2} < 1 & \mbox{for any }S_ B\text { distribution} \\ \frac{mn}{p^2} = 1 & \mbox{for any }S_ L\text { (lognormal) distribution} \\ \end{array}$

プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SBオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。この基準は、次の不等式を満たすとします。

$\frac{mn}{p^2} < 1 - \mbox{tolerance}$

$S_ B$ 分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。

FITMETHOD = MOMENTSを(SBオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SBオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。

Johnson $S_ U$ 分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} \frac{ \delta hv}{\sigma \sqrt {2\pi } } \frac{ 1 }{ \sqrt { 1 + \left( (x - \theta ) / \sigma \right)^2 } } \times & \\ \exp \left[ -\frac{1}{2} \left( \gamma + \delta \sinh ^{-1} \left( \frac{x - \theta }{\sigma } \right) \right)^2 \right] & \mbox{for } x > \theta \\ 0 & \mbox{for } x \leq \theta \end{array} \right.$

ここで、

$\theta =$ 位置パラメータ $(-\infty < \theta < \infty )$
$\sigma =$ 尺度パラメータ $(\sigma > 0)$
$\delta =$ 形状パラメータ $(\delta >0)$
$\gamma =$ 形状パラメータ $(-\infty < \gamma < \infty )$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

パラメータは、THETA= / SIGMA= / DELTA= / GAMMA= $S_ U$ -optionsで指定できます。これらのオプションはSUオプションの後にかっこで囲んで指定します。これらのパラメータを指定しなかった場合は、それぞれ推定されます。

デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、 $x_{-3z}$ 、 $x_{-z}$ 、 $x_{z}$ 、 $x_{3z}$ で表される4つのデータパーセント点に基づいており、変換時に $-3z$ 、 $-z$ 、z、 $3z$ で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。

$z = \gamma + \delta \sinh ^{-1} \left( \frac{x - \theta }{\sigma } \right)$

zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SUオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。

次の値は、データパーセント値から計算されます。

$\begin{array}{lcl} m & = & x_{3z} - x_{z} \\ n & = & x_{-z} - x_{-3z} \\ p & = & x_{z} - x_{-z} \\ \end{array}$

これはSlifker and Shapiro (1980)により証明されました。

$\begin{array}{ll} \frac{mn}{p^2} > 1 & \mbox{for any }S_ U\text { distribution} \\ \frac{mn}{p^2} < 1 & \mbox{for any }S_ B\text { distribution} \\ \frac{mn}{p^2} = 1 & \mbox{for any }S_ L\text { (lognormal) distribution} \\ \end{array}$

プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SUオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。この基準は、次の不等式を満たすとします。

$\frac{mn}{p^2} > 1 + \mbox{tolerance}$

$S_ U$ 分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。

FITMETHOD = MOMENTSを(SUオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SUオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。

Weibull分布

適合する密度関数は次のようになります。

$p(x) = \left\{ \begin{array}{ll} hv\frac{c}{\sigma } (\frac{x - \theta }{\sigma })^{c-1} \exp (-(\frac{x- \theta }{\sigma })^ c) & \mbox{for } x > \theta \\ 0 & \mbox{for }x \leq \theta \end{array} \right.$

ここで、

$\theta =$ しきい値パラメータ
$\sigma =$ 尺度パラメータ $(\sigma >0)$
$c =$ 形状パラメータ $(\mi{c} >0)$
$h =$ ヒストグラム間隔の幅
$v =$ 垂直比率

および

$v = \left\{ \begin{array}{ll} n & \mbox{the sample size, for VSCALE=COUNT} \\ 100 & \mbox{for VSCALE=PERCENT} \\ 1 & \mbox{for VSCALE=PROPORTION} \end{array} \right.$

しきい値パラメータ $\theta$ は、最小データ値未満である必要があります。 $\theta$ は、THRESHOLD= Weibull-optionで指定できます。デフォルトは、 $\theta =0$ です。THETA=ESTを指定すると、 $\theta$ の最尤推定値が計算されます。 $\sigma$ およびcは、それぞれ、SCALE=およびSHAPE= Weibull-optionsで指定できます。デフォルトでは、 $\sigma$ およびcの最尤推定値をプロシジャが計算します。

指数分布は、特殊なケースのWeibull分布( $c=1$ の場合)です。

Weibull分布の分位点はDATAステップ関数QUANTILEを使用して、Weibull分布の確率はDATAステップ関数CDFを使用して計算できます。

UNIVARIATEプロシジャ