当てはめた連続分布の計算式 |
次のセクションでは、HISTOGRAMステートメントで当てはめることができるパラメトリックな分布族の情報を示します。これらの分布の特性については、Johnson、KotzおよびBalakrishnan (1994、1995)で説明されています。
適合する密度関数は次のようになります。
ここでおよび
下限しきい値パラメータ(下限終点パラメータ)
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、ベータ密度関数は次のように記述されています。
これら2つのパラメータ化には次のような関係があります。
ベータ分布の範囲の下限はしきい値パラメータで、上限はです。BETAオプションを使用して当てはめたベータ曲線を指定する場合、は最小データ値より小さく、は最大データ値より大きい必要があります。およびは、キーワードBETAの後のかっこ内のTHETA= / SIGMA= beta-optionsで指定できます。デフォルトでは、およびです。THETA=ESTおよびSIGMA=ESTを指定すると、 および の最尤推定値が計算されます。ただし、3パラメータおよび4パラメータの最尤推定は、収束するとは限りません。
また、およびは、ALPHA= / BETA= beta-optionsでそれぞれ指定できます。デフォルトでは、 および の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータセットに、およびの最尤推定値を使用するベータ密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / beta(theta=32 sigma=180);
ベータ分布は、Pearson Type IまたはType II分布とも呼ばれます。これには、べき関数分布()、逆正弦分布()、一般化逆正弦分布(、)などが含まれます。
ベータ分布の分位点はDATAステップ関数BETAINV、ベータ分布の確率はDATAステップ関数PROBBETAを使用して計算できます。
適合する密度関数は次のようになります。
ここで、
いき値パラメータ
尺度パラメータ
ヒストグラム区間の幅
垂直比率
および
しきい値パラメータは最小データ値以下である必要があります。は、THRESHOLD= exponential-optionで指定できます。デフォルトでは、 です。THETA=ESTを指定すると、 の最尤推定値が計算されます。また、は、SCALE= exponential-optionで指定できます。デフォルトでは、の最尤推定値が計算されます。著者によっては、尺度パラメータをと定義している場合があります。
指数分布は、特殊なケースのガンマ分布(の場合)およびWeibull分布(の場合)です。関連分布は極値分布です。が指数分布である場合、は極値分布です。
適合する密度関数は次のようになります。
説明
いき値パラメータ
尺度パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
パラメータ は最小データ値未満でなければなりません。は、THRESHOLD= gamma-optionで指定できます。デフォルトでは、 です。THETA=ESTを指定すると、 の最尤推定値が計算されます。また、およびは、SCALE= / ALPHA= gamma-optionsで指定できます。デフォルトでは、 および の最尤推定値が計算されます。
ガンマ分布はPearson Type III分布とも呼ばれ、カイ2乗、指数およびErlangの各分布が含まれます。カイ2乗分布の確率密度関数は次のとおりです。
これは、およびのガンマ分布であることに注意してください。指数分布はのガンマ分布であり、Erlang分布はが正の整数のガンマ分布です。関連分布はレイリー分布です。の場合(は独立した変数)、は次の確率密度関数による分布になります。
の場合、前述の分布はレイリー分布と呼ばれます。
ガンマ分布の分位点はDATAステップ関数GAMINV、ガンマ分布の確率はDATAステップ関数PROBGAMを使用して計算できます。
適合する密度関数は次のようになります。
説明
位置パラメータ
尺度パラメータ
ヒストグラム区間の幅
垂直比率
および
およびは、MU= / SIGMA= Gumbel-optionsでそれぞれ指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注: Gumbel分布はType 1極値分布とも呼ばれます。
注:乱数変数がGumbel (Type 1極値)分布になるのは、がWeibull分布でが標準指数分布である場合のみです。
適合する密度関数は次のようになります。
説明
位置パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
位置パラメータは0より大きい必要があります。は、MU= iGauss-optionで指定できます。また、形状パラメータは、LAMBDA= iGauss-optionで指定できます。デフォルトでは、 および の最尤推定値が計算されます。
注:特殊なケース(およびの場合)では、Wald分布に一致します。
適合する密度関数は次のようになります。
説明
いき値パラメータ
尺度パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
パラメータ は最小データ値未満でなければなりません。は、THRESHOLD= lognormal-optionで指定できます。デフォルトでは、 です。THETA=ESTを指定すると、 の最尤推定値が計算されます。およびは、SCALE= / SHAPE= lognormal-optionsでそれぞれ指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注:対数正規分布は、Johnson系分布では分布とも呼ばれます。
注:このマニュアルでは、対数正規分布の形状パラメータをで表記していますが、他の分布の尺度パラメータの表記でもを使用しています。対数正規分布の形状パラメータの表記にを使用するのは、が対数正規分布である場合に、が標準正規分布になることに基づいています。この関係に基づき、対数正規分布の分位点はDATAステップ関数PROBIT、確率はDATAステップ関数PROBNORMを使用して計算できます。
適合する密度関数は次のようになります。
説明
平均
標準偏差
ヒストグラム区間の幅
垂直比率
および
およびは、MU= / SIGMA= normal-optionsでそれぞれ指定できます。デフォルトでは、を標本平均で、を標本標準偏差で推定します。
正規分布の分位点はDATAステップ関数PROBIT、確率はDATAステップ関数PROBNORMを使用して計算できます。
注:正規分布は、Johnson系分布では分布とも呼ばれます。
適合する密度関数は次のようになります。
説明
いき値パラメータ
形状パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
分布のサポートは、の場合は、の場合はです。
注:特殊なケースのパレート分布(およびの場合)は、平均の指数分布および間隔の一様分布にそれぞれ一致します。
パラメータ は最小データ値未満でなければなりません。は、THETA= Pareto-optionで指定できます。デフォルトでは、です。また、およびは、ALPHA= / SIGMA= Pareto-optionsでそれぞれ指定できます。デフォルトでは、これらのパラメータの最尤推定値が計算されます。
注:パラメータの最尤推定はの場合は有効ですが、それ以外の場合は有効ではありません。この場合、推定量は漸近的に正規分布に従い、漸近的に有効になります。最尤推定値の漸近正規分布の平均はで、分散共分散行列は次のとおりです。
注:次の空間で極小がない場合、
最尤推定量は存在しません。最尤推定量の算出方法および推奨アルゴリズムの詳細は、Grimshaw(1993)で説明されています。
適合する密度関数は次のようになります。
説明
下限しきい値パラメータ(下限終点パラメータ)
尺度パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
注: この表記は、HISTOGRAMステートメントを使って当てはめる他の分布の表記と一貫性があります。ただし、Johnson、KotzおよびBalakrishnan (1995)など多くのテキストで、べき関数分布の密度関数は次のように記述されています。
これら2つのパラメータ化には次のような関係があります。
注:べき関数分布族は、次の密度関数のベータ分布の部分集合です。
ここで、で、パラメータです。したがって、ベータ分布の特性および推定手順がすべて適用されます。
べき関数分布の範囲の下限はしきい値パラメータで、上限はです。POWERオプションを使用して当てはめたべき関数曲線を指定する場合、は最小データ値より小さく、は最大データ値より大きい必要があります。およびは、キーワードPOWERの後のかっこ内のTHETA= / SIGMA= power-optionsで指定できます。デフォルトでは、およびです。THETA=ESTおよびSIGMA=ESTを指定すると、 および の最尤推定値が計算されます。ただし、3パラメータの最尤推定は、収束するとは限りません。
また、は、ALPHA= power-optionで指定できます。デフォルトでは、 の最尤推定値が計算されます。たとえば、下限が32、上限が212のデータセットに、の最尤推定値を使用するべき関数密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / power(theta=32 sigma=180);
適合する密度関数は次のようになります。
説明
下限しきい値パラメータ(下限終点パラメータ)
尺度パラメータ
ヒストグラム区間の幅
垂直比率
および
注:レイリー分布は、次の密度関数のWeibull分布です。
形状パラメータはで、尺度パラメータはです。
しきい値パラメータは最小データ値より小さい必要があります。は、THETA= Rayleigh-optionで指定できます。デフォルトでは、です。また、は、SIGMA= Rayleigh-optionで指定できます。デフォルトでは、 の最尤推定値が計算されます。
たとえば、下限が32のデータセットに、の最尤推定値を使用するレイリー密度曲線を当てはめるには、次のステートメントを使用します。
histogram Length / rayleigh(theta=32);
適合する密度関数は次のようになります。
説明
しきい値パラメータ
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
分布の下限はパラメータで、上限は値です。パラメータ は最小データ値未満でなければなりません。は、THETA= -optionで指定できます。または、THETA = EST -optionを使用すると、の推定を要求できます。のデフォルト値は0です。合計は最大データ値より大きい必要があります。のデフォルト値は1です。は、SIGMA= -optionで指定できます。または、SIGMA = EST -optionを使用すると、の推定を要求できます。
デフォルトでは、Slifker and Shapiro (1980)により与えられたパーセント点の方式を使用して、パラメータが推定されます。この方式は、、、、 で表される4つのデータパーセント点に基づいています。これらは、変換時に 、、、 で表される、標準正規分布の4つの均等間隔のパーセント点に対応しています。
のデフォルト値は0.524です。当てはめの結果は の選択に依存します。他の値を指定するには、FITINTERVAL=オプションを使用します(SBオプションの後にかっこで囲んで指定)。パーセント点法を使用する場合には、パーセント点に対応するの値を選択することが、アプリケーションできわめて重要です。
次の値は、データパーセント値から計算されます。
これはSlifker and Shapiro (1980)により証明されました。
プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SBオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。この基準は、非同等性を満足するものと仮定します。
分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。
FITMETHOD = MOMENTSを(SBオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。FITMETHOD = MLEを(SBオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。
適合する密度関数は次のようになります。
説明
位置パラメータ
尺度パラメータ
形状パラメータ
形状パラメータ
ヒストグラム区間の幅
垂直比率
および
パラメータは、THETA= / SIGMA= / DELTA= / GAMMA= -optionsで指定できます。これらのオプションはSUオプションの後にかっこで囲んで指定します。これらのパラメータを指定しなかった場合は、それぞれ推定されます。
デフォルトでは、Slifker and Shapiro (1980)により与えられたパーセント点の方式を使用して、パラメータが推定されます。この方式は、、、、 で表される4つのデータパーセント点に基づいています。これらは、変換時に 、、、 で表される、標準正規分布の4つの均等間隔のパーセント点に対応しています。
のデフォルト値は0.524です。当てはめの結果は の選択に依存します。他の値を指定するには、FITINTERVAL=オプションを使用します(SBオプションの後にかっこで囲んで指定)。パーセント点法を使用する場合、パーセント点に対応するの値を選択する必要があります。これはアプリケーションできわめて重要です。の値は、FITINTERVAL=オプションで指定できます(SUオプションの後にかっこで囲んで指定します)。
次の値は、データパーセント値から計算されます。
これはSlifker and Shapiro (1980)により証明されました。
プラスマイナス1の許容誤差区分を使用することにより、この比条件で3つのファミリ間を区別します。許容誤差は、FITTOLERANCE=オプションで指定できます(SUオプションの後にかっこで囲んで指定します)。デフォルトの許容誤差は0.01です。この基準は、非同等性を満足するものと仮定します。
分布のパラメータを計算するには、Slifker and Shapiro (1980)により導出された明示的な公式を使用します。
FITMETHOD = MOMENTSを(SUオプションの後にかっこで囲んで)指定すると、積率法がパラメータ推定に使用されます。FITMETHOD = MLEを(SUオプションの後にかっこで囲んで)指定すると、最尤法がパラメータ推定に使用されます。ただし、最尤推定値は必ず存在するとは限りません。Johnson分布を当てはめる方法については、Bowman and Shenton (1983)を参照してください。