次のセクションでは、HISTOGRAMステートメントで当てはめることができるパラメトリックな分布族の情報を示します。これらの分布の特性については、Johnson、KotzおよびBalakrishnan (1994、1995)により説明されています。
適合する密度関数は次のようになります。
ここで、および
下限しきい値パラメータ(下限端点パラメータ)
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、ベータ密度関数は次のように記述されています。
これら2つのパラメータ化には次のような関係があります。
ベータ分布の範囲の下限はしきい値パラメータで、上限はです。BETAオプションを使用して当てはめたベータ曲線を指定する場合、は最小データ値より小さく、は最大データ値より大きい必要があります。およびは、キーワードBETAの後のかっこ内のTHETA= / SIGMA= beta-optionsで指定できます。デフォルトでは、およびです。THETA=ESTおよびSIGMA=ESTを指定すると、およびの最尤推定値が計算されます。ただし、3パラメータおよび4パラメータの最尤推定は、収束するとは限りません。
また、およびは、それぞれALPHA=および BETA= beta-optionsで指定できます。デフォルトでは、およびの最尤推定値が計算されます。たとえば、下限が32、上限が212のデータセットに、およびの最尤推定値を使用するベータ密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / beta(theta=32 sigma=180);
ベータ分布は、Pearson Type IまたはType II分布とも呼ばれます。これには、べき関数分布()、逆正弦分布()、一般化逆正弦分布(、)などが含まれます。
ベータ分布の分位点はDATAステップ関数QUANTILEを使用して、ベータ分布の確率はDATAステップ関数CDFを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
ヒストグラム間隔の幅
垂直比率
および
しきい値パラメータは、最小データ値以下である必要があります。は、THRESHOLD= exponential-optionで指定できます。デフォルトは、です。THETA=ESTを指定すると、の最尤推定値が計算されます。また、はSCALE= exponential-optionを使用して指定できます。デフォルトでは、の最尤推定値が計算されます。著者によっては、尺度パラメータをと定義している場合があります。
指数分布は、特殊なケースのガンマ分布(の場合)およびWeibull分布(の場合)です。関連分布は極値分布です。が指数分布である場合、Xは極値分布です。
指数分布の分位点はDATAステップ関数QUANTILEを使用して、指数分布の確率はDATAステップ関数CDFを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
しきい値パラメータは、最小データ値未満である必要があります。は、THRESHOLD= gamma-optionで指定できます。デフォルトは、です。THETA=ESTを指定すると、の最尤推定値が計算されます。また、およびは、それぞれSCALE=およびALPHA= gamma-optionsで指定できます。デフォルトでは、およびの最尤推定値が計算されます。
ガンマ分布はPearson Type III分布とも呼ばれ、カイ2乗、指数およびErlangの各分布が含まれます。カイ2乗分布の確率密度関数は次のとおりです。
これは、、、のガンマ分布であることに注意してください。指数分布はのガンマ分布であり、Erlang分布はが正の整数のガンマ分布です。関連分布はレイリー分布です。の場合(ここでは独立した変数)、は次の確率密度関数に従う分布になります。
の場合、前述の分布はレイリー分布と呼ばれます。
ガンマ分布の分位点はDATAステップ関数QUANTILEを使用して、ガンマ分布の確率はDATAステップ関数CDFを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
位置パラメータ
尺度パラメータ
ヒストグラム間隔の幅
垂直比率
および
およびは、それぞれMU=およびSIGMA= Gumbel-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注: Gumbel分布はType 1極値分布とも呼ばれます。
注: 乱数変数XがGumbel (Type 1極値)分布になるのは、がWeibull分布でが標準指数分布である場合のみです。
適合する密度関数は次のようになります。
ここで、
位置パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
位置パラメータは、0より大きい必要があります。は、MU= iGauss-optionで指定できます。また、形状パラメータは、LAMBDA= iGauss-optionで指定できます。デフォルトでは、およびの最尤推定値が計算されます。
注: 特殊なケース(およびの場合)では、Wald分布に一致します。
逆ガウス分布の分位点はDATAステップ関数QUANTILEを使用して、逆ガウス分布の確率はDATAステップ関数CDFを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
しきい値パラメータは、最小データ値未満である必要があります。は、THRESHOLD= lognormal-optionで指定できます。デフォルトは、です。THETA=ESTを指定すると、の最尤推定値が計算されます。およびは、それぞれSCALE=およびSHAPE= lognormal-optionsで指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注: 対数正規分布は、Johnson系分布では分布とも呼ばれます。
Note: このマニュアルでは、対数正規分布の形状パラメータをで表記していますが、他の分布の尺度パラメータの表記でもを使用しています。対数正規分布の形状パラメータの表記にを使用するのは、Xが対数正規分布である場合に、が標準正規分布になることに基づいています。この関係に基づき、対数正規分布の分位点はDATAステップ関数PROBIT、確率はDATAステップ関数PROBNORMを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
平均
標準偏差
ヒストグラム間隔の幅
垂直比率
および
およびはそれぞれMU=およびSIGMA= normal-optionsで指定できます。デフォルトでは、を標本平均で、を標本標準偏差で推定します。
正規分布の分位点はDATAステップ関数QUANTILEを使用して、正規分布の確率はDATAステップ関数CDFを使用して計算できます。
注: 正規分布は、Johnson系分布では分布とも呼ばれます。
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
形状パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
分布のサポートは、 (の場合)および(の場合)です。
注: 特殊なケースのパレート分布(およびの場合)は、平均の指数分布および間隔の一様分布にそれぞれ対応します。
しきい値パラメータは、最小データ値未満である必要があります。は、THETA= Pareto-optionで指定できます。デフォルトはです。およびは、それぞれALPHA=およびSIGMA= Pareto-optionsでも指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注: パラメータの最尤推定量はの場合は有効ですが、それ以外の場合は有効ではありません。この場合、推定量は漸近的に正規分布に従い、漸近的に有効になります。漸近正規分布に従う最尤推定値では、平均はとなり、分散共分散行列は次のようになります。
注:次の空間で極小がない場合、
最尤推定量は存在しません。最尤推定量の算出方法および推奨アルゴリズムの詳細は、Grimshaw(1993)で説明されています。
適合する密度関数は次のようになります。
ここで、
下限しきい値パラメータ(下限端点パラメータ)
尺度パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、べき関数分布の密度関数は次のように記述されています。
これら2つのパラメータ化には次のような関係があります。
注:べき関数分布族は、次の密度関数のベータ分布の部分集合です。
ここで、であり、パラメータです。したがって、ベータ分布の特性および推定手順がすべて適用されます。
べき関数分布の範囲の下限はしきい値パラメータで、上限はです。POWERオプションを使用して当てはめたべき関数曲線を指定する場合、は最小データ値より小さく、は最大データ値より大きい必要があります。およびは、キーワードPOWERの後のかっこ内のTHETA= / SIGMA= power-optionsで指定できます。デフォルトでは、およびです。THETA=ESTおよびSIGMA=ESTを指定すると、およびの最尤推定値が計算されます。ただし、3パラメータの最尤推定は、収束するとは限りません。
また、はALPHA= power-optionを使用して指定できます。デフォルトでは、の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータに、の最尤推定値を使用するべき関数密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / power(theta=32 sigma=180);
適合する密度関数は次のようになります。
ここで、
下限しきい値パラメータ(下限端点パラメータ)
尺度パラメータ
ヒストグラム間隔の幅
垂直比率
および
注:レイリー分布は、次の密度関数のWeibull分布です。
形状パラメータはで、尺度パラメータはです。
しきい値パラメータは、最小データ値未満である必要があります。は、THETA= Rayleigh-optionで指定できます。デフォルトはです。また、は、SIGMA= Rayleigh-optionでも指定できます。デフォルトでは、の最尤推定値が計算されます。
たとえば、下限が32のデータセットにの最尤推定値を使用するレイリー密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / rayleigh(theta=32);
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
分布の下限はパラメータで、上限は値です。パラメータは最小データ値未満である必要があります。は、THETA= -optionで指定できます。または、THETA = ESTの -optionを使用すると、の推定を要求できます。のデフォルト値は0です。合計は最小データ値よりも大きくなければなりません。のデフォルト値は0です。は、SIGMA= -optionで指定できます。または、SIGMA = ESTの -optionを使用すると、の推定を要求できます。
デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、、、、で表される4つのデータパーセント点に基づいており、変換時に、、z、で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。
zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SBオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。
次の値は、データパーセント値から計算されます。
これはSlifker and Shapiro (1980)により証明されました。
プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SBオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。 この基準は、次の不等式を満たすとします。
分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。
FITMETHOD = MOMENTSを(SBオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SBオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。
適合する密度関数は次のようになります。
ここで、
位置パラメータ
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
パラメータは、THETA= / SIGMA= / DELTA= / GAMMA= -optionsで指定できます。これらのオプションはSUオプションの後にかっこで囲んで指定します。これらのパラメータを指定しなかった場合は、それぞれ推定されます。
デフォルトでは、Slifker and Shapiro (1980)が示したパーセント点の方式を使用して、パラメータが推定されます。この方式は、、、、で表される4つのデータパーセント点に基づいており、変換時に、、z、で表される、標準正規分布の4つの均等間隔のパーセント点にそれらが対応しています。
zのデフォルト値は0.524です。当てはめの結果はzの選択に依存するため、FITINTERVAL=オプションを使用して他の値を(SUオプションの後にかっこで囲んで)指定できます。パーセント点法を使用する場合には、アプリケーションにとって重要なパーセント点に対応するzの値を選択することが必要です。
次の値は、データパーセント値から計算されます。
これはSlifker and Shapiro (1980)により証明されました。
プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SUオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。 この基準は、次の不等式を満たすとします。
分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。
FITMETHOD = MOMENTSを(SUオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。 FITMETHOD = MLEを(SUオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。
適合する密度関数は次のようになります。
ここで、
しきい値パラメータ
尺度パラメータ
形状パラメータ
ヒストグラム間隔の幅
垂直比率
および
しきい値パラメータは、最小データ値未満である必要があります。は、THRESHOLD= Weibull-optionで指定できます。デフォルトは、です。THETA=ESTを指定すると、の最尤推定値が計算されます。およびcは、それぞれ、SCALE=およびSHAPE= Weibull-optionsで指定できます。デフォルトでは、およびcの最尤推定値をプロシジャが計算します。
指数分布は、特殊なケースのWeibull分布(の場合)です。
Weibull分布の分位点はDATAステップ関数QUANTILEを使用して、Weibull分布の確率はDATAステップ関数CDFを使用して計算できます。