HISTOGRAMステートメント |
HISTOGRAMステートメントはヒストグラムを作成します。また、オプションで、推定したパラメトリックおよびノンパラメトリックの確率密度曲線を重ねて表示します。WEIGHTステートメントをHISTOGRAMステートメントと併用することはできません。HISTOGRAMステートメントは、PROC UNIVARIATEステートメントの後にいくつでも使用できます。HISTOGRAMステートメントの構成要素は次のとおりです。
ヒストグラムを作成する変数です。VARステートメントを指定する場合、variablesをそのVARステートメント内に含める必要があります。含めない場合、variablesは、入力データセット内にある任意の数値変数になります。VARステートメントまたはHISTGRAMステートメントで変数を指定しなかった場合、デフォルトで、DATA=データセット内の各数値変数のヒストグラムが作成されます。VARステートメントを使用してHISTGRAMステートメントで変数を指定しなかった場合、デフォルトで、VARステートメント内でリストされた各変数のヒストグラムが作成されます。
たとえば、Steelという名前のデータセットに、LengthおよびWidthという、ちょうど2つの数値変数が含まれているとします。次のステートメントはLengthとWidthに対する2つのヒストグラムを作成します。
proc univariate data=Steel; histogram; run;
同様に、次のステートメントはLengthとWidthに対するヒストグラムを作成します。
proc univariate data=Steel; var Length Width; histogram; run;
次のステートメントはLengthに対するヒストグラムのみを作成します。
proc univariate data=Steel; var Length Width; histogram Length; run;
ヒストグラムに機能を追加します。HISTOGRAMステートメントのオプションは、すべてスラッシュ(/)の後に指定します。オプションには次のいずれかを指定します。
当てはめたパラメトリック法の分布および核密度推定に対する1次オプション
当てはめたパラメトリック法の分布および核密度推定に対する2次オプション
グラフおよび出力データセットに対する一般オプション
たとえば、次のステートメントで、NORMALオプションは当てはめた正規分布曲線をヒストグラムに表示し、MIDPOINTS=オプションはヒストグラムの中間点を指定し、CTEXT=オプションはテキストの色を指定します。
proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue; run;
表4.16~表4.33は、関数別のHISTOGRAMオプションの一覧です。詳細は、オプションのリファレンスおよび共通オプションのリファレンスの各セクションを参照してください。
表4.16は、ヒストグラムにパラメトリック法の密度推定を表示する1次オプションです。各1次オプションは、指定したHISTOGRAMステートメントに1回だけ指定できます。また、ヒストグラムに各1次オプションの分布族の複数の曲線を表示できます。
オプション |
説明 |
---|---|
ベータ分布(しきい値パラメータ、尺度パラメータ、形状パラメータおよび)を当てはめ |
|
指数分布(しきい値パラメータおよび尺度パラメータ)を当てはめ |
|
ガンマ分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)を当てはめ |
|
Gumbel分布(位置パラメータおよび尺度パラメータ)を当てはめ |
|
逆ガウス分布(位置パラメータおよび形状パラメータ)を当てはめ |
|
対数正規分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)を当てはめ |
|
正規分布(平均および標準偏差)を当てはめ |
|
一般化パレート分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)を当てはめ |
|
べき関数分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)を当てはめ |
|
レイリー分布(しきい値パラメータおよび尺度パラメータ)を当てはめ |
|
Johnson 分布(しきい値パラメータ、尺度パラメータ、形状パラメータおよび)に適合 |
|
Johnson 分布(しきい値パラメータ、尺度パラメータ、形状パラメータおよび)に適合 |
|
Weibull分布(しきい値パラメータ、尺度パラメータおよび形状パラメータ)を当てはめ |
表4.17~表4.30は、当てはめたパラメトリック法の分布のパラメータの指定と当てはめた曲線の表示の制御を行う、2次オプションの一覧です。これらの2次オプションは、1次分布オプションの後にかっこで囲んで指定します。たとえば、正規分布曲線を当てはめるには、次のようにNORMALオプションを指定します。
proc univariate; histogram / normal(color=red mu=10 sigma=0.5); run;
COLOR= normal-optionは、赤色で曲線を描画します。MU= / SIGMA= normal-optionsは、曲線のパラメータおよびを指定します。MU= / SIGMA= normal-optionsが指定されていない場合は、標本平均および標本標準偏差を使用して、およびがそれぞれ推定されます。
2次オプションの値のリストを指定すると、同じ分布族の複数の当てはめた曲線をヒストグラムに表示できます。オプションの値はリストの位置と一致します。分布パラメータ値のリストで値ESTを指定すると、パラメータの推定値を使用できます。
たとえば、次のコードは2つの正規分布曲線をヒストグラムに表示します。
proc univariate; histogram / normal(color=(red blue) mu=10 est sigma=0.5 est); run;
1番目の曲線は、およびの赤色の曲線です。2番目の曲線は、が標本平均に等しくが標本標準偏差に等しい、青色の曲線です。
HISTOGRAMステートメントで当てはめることができるパラメトリック法の分布族の詳細は、当てはめた連続分布の計算式のセクションを参照してください。
オプション |
説明 |
---|---|
密度曲線の色を指定 |
|
密度曲線グループの目次エントリを指定 |
|
密度曲線の下の領域を塗りつぶし |
|
密度曲線の線の種類を指定 |
|
ヒストグラム間隔の中間点のテーブルを出力 |
|
曲線を要約するテーブルを抑制 |
|
データから計算された分位点と曲線から推定された分位点の表が作成されるパーセントの一覧を表示 |
|
密度曲線の幅を指定 |
オプション |
説明 |
---|---|
1番目の形状パラメータ(ベータ曲線の)を指定 |
|
2番目の形状パラメータ(ベータ曲線の)を指定 |
|
尺度パラメータ(ベータ曲線の)を指定 |
|
下限しきい値パラメータ(ベータ曲線の)を指定 |
オプション |
説明 |
---|---|
尺度パラメータ(指数曲線の)を指定 |
|
しきい値パラメータ(指数曲線の)を指定 |
オプション |
説明 |
---|---|
ガンマ曲線の形状パラメータを指定 |
|
連続推定値 の変化を指定(その値でのNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似が の場合の反復の最大数を指定 |
|
ガンマ曲線の尺度パラメータを指定 |
|
ガンマ曲線のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
EDF適合度検定シミュレーションの標本数を指定 |
|
EDF適合度検定シミュレーションのシード値を指定 |
|
Gumbel曲線の位置パラメータを指定 |
|
Gumbel曲線の尺度パラメータを指定 |
オプション |
説明 |
---|---|
EDF適合度検定シミュレーションの標本数を指定 |
|
EDF適合度検定シミュレーションのシード値を指定 |
|
逆ガウス曲線の形状パラメータを指定 |
|
逆ガウス曲線の位置パラメータを指定 |
オプション |
説明 |
---|---|
対数正規曲線の形状パラメータを指定 |
|
対数正規曲線のしきい値パラメータを指定 |
|
対数正規曲線の尺度パラメータを指定 |
オプション |
説明 |
---|---|
正規曲線の平均を指定 |
|
正規曲線の標準偏差を指定 |
オプション |
説明 |
---|---|
EDF適合度検定シミュレーションの標本数を指定 |
|
EDF適合度検定シミュレーションのシード値を指定 |
|
一般化パレート曲線の形状パラメータを指定 |
|
一般化パレート曲線の尺度パラメータを指定 |
|
一般化パレート曲線のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
べき関数曲線の形状パラメータを指定 |
|
べき関数曲線の尺度パラメータを指定 |
|
べき関数曲線のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
EDF適合度検定シミュレーションの標本数を指定 |
|
EDF適合度検定シミュレーションのシード値を指定 |
|
レイリー曲線の尺度パラメータを指定 |
|
レイリー曲線のしきい値パラメータを指定 |
オプション |
説明 |
---|---|
1番目の形状パラメータ (Johnson 曲線の)を指定 |
|
パーセント方式の 値を指定 |
|
パラメータ推定の方法を指定 |
|
パーセント方式の許容誤差を指定 |
|
2番目の形状パラメータ (Johnson 曲線の)を指定 |
|
形状パラメータ (Johnson 曲線の)を指定 |
|
下限しきい値パラメータ (Johnson 曲線の)を指定 |
オプション |
説明 |
---|---|
1番目の形状パラメータ (Johnson 曲線の)を指定 |
|
パーセント方式の 値を指定 |
|
パラメータ推定の方法を指定 |
|
パーセント方式の許容誤差を指定 |
|
2番目の形状パラメータ (Johnson 曲線の)を指定 |
|
形状パラメータ (Johnson 曲線の)を指定 |
|
下限しきい値パラメータ (Johnson 曲線の)を指定 |
オプション |
説明 |
---|---|
Weibull曲線の形状パラメータcを指定 |
|
連続推定値 の変化を指定(その値で のNewton-Raphson近似が終了) |
|
の初期値(Newton-Raphson近似がの場合)を指定 |
|
Newton-Raphson近似が の場合の反復の最大数を指定 |
|
Weibull曲線の尺度パラメータを指定 |
|
Weibull曲線のしきい値パラメータを指定 |
核密度推定を計算するには、オプションKERNEL(kernel-options)を使用します。次の2次オプションをKERNELオプションの後にかっこで囲んで指定し、KERNELオプションで要求した密度推定の機能を制御します。
オプション |
説明 |
---|---|
標準化区間幅パラメータを指定 |
|
核密度曲線の色を指定 |
|
核密度曲線の下の領域を塗りつぶし |
|
核関数の種類を指定 |
|
核密度曲線に使用する線の種類を指定 |
|
核密度曲線の下限を指定 |
|
核密度曲線の上限を指定 |
|
核密度曲線の線の幅を指定 |
表4.32はヒストグラムの拡張オプションの要約で、表4.33は出力データセットの要求オプションの要約です。
オプション |
説明 |
---|---|
ANNOTATE=データセットで要求されたアノテーションをキーセルに対してのみ適用 |
|
ANNOTATE用のデータセットを指定 |
|
ヒストグラムの棒の上にラベルを作成 |
|
棒の幅を指定 |
|
軸の色を指定 |
|
ヒストグラムの棒の外側の線の色を指定 |
|
曲線の下の領域を塗りつぶす色を指定 |
|
枠の色を指定 |
|
行ラベルの枠を塗りつぶす色を指定 |
|
列ラベルの枠を塗りつぶす色を指定 |
|
グリッド線の色を指定する |
|
HREF=で指定した参照線の色を指定 |
|
ヒストグラムの棒の背後に参照線を描画 |
|
ヒストグラムグループの目次エントリを指定 |
|
度数の棒の割合の色を指定 |
|
テキストの色を指定 |
|
比較ヒストグラムの行ラベルの色を指定 |
|
比較ヒストグラムの列ラベルの色を指定 |
|
VREF=で指定した参照線の色を指定する |
|
グラフカタログ内のプロットに対する説明を指定 |
|
ヒストグラム間隔の終点の一覧を表示 |
|
テキストのソフトウェアフォントを指定 |
|
ヒストグラムの棒の前に参照線を描画 |
|
グリッドを作成 |
|
釣り鐘型ヒストグラムを作成 |
|
水平軸用のAXISステートメントを指定 |
|
枠外の領域で使用されるテキストの高さを指定 |
|
水平軸の小目盛りの数を指定 |
|
水平軸にオフセットを指定 |
|
水平軸に垂直な参照線を指定 |
|
HREF=で指定した参照線のラベルを指定 |
|
HREF=で指定した参照線のラベルの垂直位置を指定 |
|
枠領域内のテキストに対してソフトウェアフォントを指定 |
|
枠領域内のテキストの高さを指定 |
|
ヒストグラムの棒の間の間隔を指定 |
|
タイルの間隔を指定 |
|
グリッド線のタイプを指定 |
|
HREF=で指定した参照線のスタイルを指定 |
|
VREF=で指定した参照線のスタイルを指定 |
|
表示されるビンの最大数を指定 |
|
キーセルのデータの平均から指定した標準偏差値をプライスマイナスした範囲内のビンが表示されるようにビン数を限定 |
|
ヒストグラム間隔の中間点を指定 |
|
グラフカタログ内のプロットに対して名前を指定 |
|
比較ヒストグラムの列数を指定 |
|
ヒストグラム間隔の終点の数を指定 |
|
ヒストグラム間隔の中間点の数を指定 |
|
ヒストグラムの棒を抑制 |
|
プロット領域の周囲の枠の表示を抑制 |
|
水平軸のラベルを抑制 |
|
プロットを抑制 |
|
HISTOGRAMステートメントで作成されるテーブルの目次エントリを抑制 |
|
垂直軸のラベルを抑制 |
|
垂直軸の目盛りおよび目盛りラベルを抑制 |
|
比較ヒストグラムの行数を指定 |
|
曲線の下の領域に対する塗りつぶしパターンを指定 |
|
間隔に右終点を包含 |
|
垂直軸のラベルの文字列を縦書きに |
|
垂直軸用のAXISステートメントまたは値を指定 |
|
垂直軸にラベルを指定 |
|
垂直軸の小目盛りの数を指定 |
|
垂直軸の上端のオフセット長を指定 |
|
垂直軸に垂直な参照線を指定 |
|
VREF=で指定した参照線のラベルを指定 |
|
VREF=で指定した参照線のラベルの水平位置を指定 |
|
垂直軸のスケールを指定 |
|
軸と枠の線の太さを指定 |
|
棒の外側の線の太さを指定 |
|
グリッド線の太さを指定 |
オプション |
説明 |
---|---|
ヒストグラム間隔のテーブルを作成 |
|
ヒストグラム間隔に関する情報を指定 |
|
核密度推定を含むデータセットを作成 |
HISTOGRAMステートメントのオプションの詳細は次のとおりです。†マークが付けられたオプションは、従来的なグラフを作成する場合にのみ適用できます。すべてのプロットステートメントに共通するオプションの詳細は、共通オプションのリファレンスのセクションを参照してください。
BETA、GAMMA、PARETO、POWERオプションで要求した当てはめた曲線の形状パラメータを指定します。ALPHA=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。デフォルトでは(または値ESTを指定した場合、の最尤推定値が計算されます。beta-optionとして使用する場合、A=をALPHA=の別名として指定できます。gamma-optionとして使用する場合、SHAPE=をALPHA=の別名として指定できます。
ヒストグラムの棒の上にラベルを表示します。BARLABEL=COUNTを指定すると、指定した棒に関連付けられたオブザベーションの数がラベルに表示されます。BARLABEL=PERCENTを指定すると、その棒が表すオブザベーションのパーセンテージがラベルに表示されます。BARLABEL=PROPORTIONを指定すると、棒に関連付けられたオブザベーションの比率がラベルに表示されます。
ヒストグラムの棒の幅を画面のパーセンテージ単位で指定します。BARWIDTH=オプションとINTERBAR=オプションが両方指定されている場合、INTERBAR=オプションが優先されます。
当てはめたベータ密度曲線をヒストグラムに表示します。BETAオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、ベータ曲線をいくつでも要求できます。ベータ分布の下限はパラメータ で、上限は値 です。これらのパラメータは、THETA= / SIGMA=beta-optionsを使用して指定します。デフォルトでは、THETA=0およびSIGMA=1になります。THETA=ESTおよびSIGMA=ESTを指定すると、およびの最尤推定値を要求できます。
ベータ分布には、2つの形状パラメータ および があります。これらのパラメータが判明している場合、その値をALPHA= / BETA= beta-optionsに指定できます。デフォルトでは、およびの最尤推定値を計算します。注: 3パラメータおよび4パラメータの最尤推定値は、収束するとは限りません。
表4.17および表4.18は、BETAオプションとともに指定できる2次オプションの一覧です。詳細は、ベータ分布のセクションを参照してください。BETAオプションの使用例は、例4.21を参照してください。
BETAオプションで要求したベータ密度曲線の2番目の形状パラメータを指定します。BETA=オプションは、BETAオプションの後にかっこで囲んで指定します。デフォルトでは(または値ESTを指定した場合、の最尤推定値が計算されます。
WEIBULLオプションで要求したWeibull密度曲線の形状パラメータを指定します。C=Weibull-optionは、WEIBULLオプションの後にかっこで囲んで指定します。デフォルトでは(または値ESTを指定した場合、の最尤推定値が計算されます。SHAPE=Weibull-optionは、C=Weibull-optionの別名として指定できます。
KERNELオプションで要求した核密度推定の標準化区間幅パラメータを指定します。C=kernel-optionは、KERNELオプションの後にかっこで囲んで指定します。複数の推定値を求めるには、値のリストを指定します。値MISEを指定すると、漸近的な平均積分平方誤差(MISE)が最小になる区間幅の推定を作成できます。また、SJPIを指定すると、Sheather-Jonesプラグイン法を使用して区間幅を選択できます。
C= kernel-optionとK= kernel-option (核関数を指定します)を併用して、複数の推定を計算することもできます。指定した核関数がビン幅の指定数よりも多い場合、最後の区間幅が残りの推定に繰り返し利用されます。同様に、指定した区間幅が核関数の指定数よりも多い場合、最後の核関数が残りの推定に繰り返し利用されます。C= kernel-optionを指定しなかった場合、漸近的なMISEが最小となる区間幅がすべての推定に使用されます。
核密度推定の詳細は、核密度推定のセクションを参照してください。
従来的なグラフを作成する場合のヒストグラムの棒の外側の線の色を指定します。このオプションは、ODS Graphics出力には適用されません。
従来的なグラフを作成する場合のヒストグラムの棒(またはFILLオプションも指定していれば、当てはめた密度曲線の下の領域)を塗りつぶす色を指定します。詳細は、FILLおよびPFILL=オプションの項目を参照してください。色の一覧は、SAS/GRAPH: Referenceを参照してください。このオプションは、ODS Graphics出力には適用されません。
従来的なグラフのヒストグラムにグリッドを表示する場合のグリッドの色を指定します。このオプションを指定すると、GRID=オプションが指定されていなくてもグリッドが作成されます。
ヒストグラムの棒の背後に、HREF=およびVREF=オプションで要求した参照線を描画します。従来的なグラフに対してGSTYLEシステムオプションが有効である場合、デフォルトでは棒の前に参照線が描画されます。
密度曲線に関連付けられた目次グループエントリを指定します。CONTENTS=オプションは、分布オプションの後にかっこで囲んで指定します。グループエントリを抑制するには、CONTENTS=を指定します。
SBおよびSUオプションで要求したJohnson およびJohnson 分布関数の1番目の形状パラメータを指定します。DELTA=オプションは、SBまたはSUオプションの後にかっこで囲んで指定します。の値を省略した場合、または値ESTを指定した場合、推定値が計算されます。
GUMBEL、IGAUSS、PARETO、RAYLEIGHオプションで要求した密度曲線のEDF適合度統計量の値の計算に使用する、シミュレーションの標本数を指定します。EDFNSAMPLES=オプションは、分布オプションの後にかっこで囲んで指定します。デフォルト値は500です。
GUMBEL、IGAUSS、PARETO、RAYLEIGHオプションで要求した密度曲線のEDF適合度統計量の値の計算に使用するシミュレーション標本を作成するとき、擬似乱数生成器の開始に使用される整数値を指定します。EDFNSEED=オプションは、分布オプションの後にかっこで囲んで指定します。デフォルトでは、コンピュータの内部時計における時刻の読み取りから生成された乱数シードが使用されます。
ヒストグラムビンの終点を水平軸の目盛り値として使用し、ヒストグラムの棒のビン幅を計算する方法を決定します。valuesは、各ヒストグラム間隔の左右両方の終点を指定します。ヒストグラムの棒の幅は、連続する終点の間の差です。このプロシジャは、すべての変数で同じ値を使用します。
終点の範囲は、データの範囲を含んでいなければなりません。たとえば、
endpoints=2 to 10 by 2
オブザベーションのすべてが、間隔[2,4) [4,6) [6,8) [8,10]に入る必要があります。また、均等間隔の終点を昇順で指定する必要があります。
キーセル内のデータから終点を決定します。終点の数の初期値は、Terrell and Scott (1985)の方法を使用して、キーセル内だけのオブザベーション数を基に決定されます。必要に応じて、データが残りのセルに収まるように、いずれかの方向にキーセルの終点リストが延ばされます。
すべてのオブザベーションを使用し、セルが存在しないものとして終点を決定します。言い換えると、終点の数はTerrell and Scott (1985)の方法を使用して全セルのサンプルサイズを基に決定されます。
CLASSステートメントを使用しない場合、KEYおよびUNIFORMのどちらも適用されません。
ENDPOINTSを省略すると、ヒストグラムの中間点が水平軸の目盛り値として使用されます。ENDPOINTSを指定すると、Terrell and Scott (1985)のアルゴリズムを使用して終点を計算します。この計算は、主に、ほぼ正規分布を示す連続データに適用できます。
MIDPOINTS=とENDPOINTSを両方指定すると、警告メッセージが出力され、終点が使用されます。
RTINCLUDEを指定すると、それぞれのヒストグラム間隔の右の終点が間隔に含められ、左の終点は含められません。
CLASSステートメントを使用し、ENDPOINTSを指定した場合、ENDPOINTS=KEYがデフォルトとして使用されます。ただし、キーセルが空であれば、ENDPOINTS=UNIFORMが使用されます。
当てはめた指数密度曲線をヒストグラムに表示します。EXPONENTIALオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、指数曲線をいくつでも要求できます。パラメータ は最小データ値以下でなければなりません。は、THETA= exponential-optionを使用して指定します。デフォルトでは、THETA=0になります。THETA=ESTを指定すると、 の最尤推定値が計算されます。は、SIGMA= exponential-optionを使用して指定します。デフォルトでは、の最尤推定値を計算します。表4.17および表4.19は、EXPONENTIALオプションとともに指定できるオプションの一覧です。詳細は、指数分布のセクションを参照してください。
あてはめた密度曲線または核密度推定曲線を色とパターンで塗りつぶします。FILLオプションは、1つの当てはめた曲線だけに指定できます。FILLオプションは、密度曲線オプションまたはKERNELオプションの後にかっこで囲んで指定します。CFILL=オプションとPFILL=オプションは、従来的なグラフを作成する場合の曲線の下の領域を塗りつぶす色とパターンを指定します。使用できる色およびパターンの一覧は、SAS/GRAPH: Referenceを参照してください。
ヒストグラムの棒の前に、HREF=およびVREF=オプションで要求した参照線を描画します。従来的なグラフに対してNOGSTYLEシステムオプションが有効である場合、デフォルトではヒストグラムの棒の背後に参照線が描画され、塗りつぶされた棒で隠れる場合があります。
当てはめたガンマ密度曲線をヒストグラムに表示します。GAMMAオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、ガンマ曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。は、THETA= gamma-optionを使用して指定します。デフォルトでは、THETA=0になります。THETA=ESTを指定すると、 の最尤推定値が計算されます。形状パラメータおよび尺度パラメータは、ALPHA= / SIGMA= gamma-optionsを使用して指定します。デフォルトでは、UNIVARIATEプロシジャはおよびの最尤推定値を計算します。の最尤推定値はNewton-Raphson近似を使用して反復的に計算されます。表4.17および表4.20は、GAMMAオプションとともに指定できるオプションの一覧です。詳細は、ガンマ分布のセクションを参照してください。GAMMAオプションの使用例は、例4.22を参照してください。
SBおよびSUオプションで要求したJohnson およびJohnson 分布関数の2番目の形状パラメータを指定します。GAMMA=オプションは、SBまたはSUオプションの後にかっこで囲んで指定します。の値を省略した場合、または値ESTを指定した場合、推定値が計算されます。
ヒストグラムにグリッドを表示します。グリッド線とは、垂直軸の主目盛りの位置に描かれる水平の線です。
当てはめたGumbel密度曲線をヒストグラムに表示します。GUMBELオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、Gumbel曲線をいくつでも要求できます。位置パラメータおよび尺度パラメータは、MU= / SIGMA= Gumbel-optionsを使用して指定します。デフォルトでは、UNIVARIATEプロシジャはおよびの最尤推定値を計算します。表4.17および表4.21は、GUMBELオプションとともに指定できるオプションの一覧です。Gumbel分布の詳細は、Gumbel分布のセクションを参照してください。
図4.7に示すような釣り鐘型ヒストグラムを要求します。
HANGINGオプションは、当てはめた密度曲線を1つだけ要求する場合のみ使用できます。釣り鐘型ヒストグラムでは、ヒストグラムの棒の頂点(線で表示されます)が当てはめた曲線に揃います。線の位置はヒストグラムビンの中間点になります。線が水平軸に近いほどよく適合するという点で、釣り鐘型ヒストグラムは適合度診断です。釣り鐘型ヒストグラムの説明については、Tukey (1977)、Wainer (1974)およびVelleman and Hoaglin (1981)を参照してください。
水平軸の両端のオフセットを画面のパーセンテージ単位で指定します。HOFFSET=0に指定すると、デフォルトのオフセットを破棄できます。
当てはめた逆ガウス密度曲線をヒストグラムに表示します。IGAUSSオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、逆ガウス曲線をいくつでも要求できます。位置パラメータおよび形状パラメータは、MU= / LAMBDA= iGauss-optionsを使用して指定します。デフォルトでは、の標本平均を使用し、の最尤推定値を計算します。表4.17および表4.22は、IGAUSSオプションとともに指定できるオプションの一覧です。詳細は、逆ガウス分布のセクションを参照してください。
ヒストグラムの棒の間隔を画面のパーセンテージ単位で指定します。INTERBAR=オプションとBARWIDTH=オプションが両方指定されている場合、INTERBAR=オプションが優先されます。
核密度推定の計算で使用する核関数(正規、2次、3次)を指定します。複数の推定値を求めるには、値のリストを指定します。このオプションは、KERNELオプションに続けてかっこ内に記述します。K= kernel-optionとC= kernel-optionを併用して、標準化区間幅を指定することもできます。指定した核関数がビン幅の指定数よりも多い場合、最後の区間幅が残りの推定に繰り返し利用されます。同様に、指定した区間幅が核関数の指定数よりも多い場合、最後の核関数が残りの推定に繰り返し利用されます。デフォルトでは、K=NORMALです。
ヒストグラムに、核密度推定値を重ねて表示します。デフォルトでは、AMISE法を使用して核密度推定値を計算します。同一ヒストグラム上に複数の核密度推定値を重ねて表示するには、C=kernel-optionまたはK=kernel-optionに値のリストを指定します。表4.31は、KERNELオプションとともに指定できるオプションの一覧です。核密度推定の詳細は、核密度推定のセクションを参照してください。また、例4.23を参照してください。
IGAUSSオプションで要求された適合曲線の形状パラメータ を指定します。Enclose the LAMBDA=オプションは、分布を表すキーワードIGAUSSの後にかっこで囲んで指定します。 の値を省略すると、最尤推定値が計算されます。
ヒストグラムにグリッドを表示する場合のグリッドの線の種類を指定します。このオプションを指定すると、GRIDオプションが指定されていなくてもグリッドが作成されます。
当てはめた対数正規密度曲線をヒストグラムに表示します。LOGNORMALオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、対数正規曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。は、THETA= lognormal-optionを使用して指定します。デフォルトでは、THETA=0になります。THETA=ESTを指定すると、 の最尤推定値が計算されます。SIGMA= / ZETA= lognormal-optionsを使用して、およびを指定します。デフォルトでは、およびの最尤推定値を計算します。表4.17および表4.23は、LOGNORMALオプションとともに指定できるオプションの一覧です。詳細は、対数正規分布のセクションを参照してください。LOGNORMALオプションの使用例は、例4.22および例4.24を参照してください。
KERNELオプションで要求した核密度推定の下限を指定します。LOWER=オプションは、KERNELオプションの後にかっこで囲んで指定します。指定した核推定が下限よりも多いと、最後の下限が残りの推定に繰り返し利用されます。デフォルトは欠損値で、当てはめた核密度曲線に下限がないことを示します。
比較ヒストグラムに表示されるビンの数を制限します。このオプションは、分布の尺度や範囲が、セルによって大きく異なる場合に有用です。デフォルトでは、キーとなっているセルに対してビンサイズと中間点が決定されます。次に、残りのセルのデータ範囲に合うように中間点が外挿されていきます。ただし、セルの尺度が大幅に異なる場合、結果として作成されるビンの数が膨大になるため、各セルのヒストグラムは狭い領域に縮尺されます。MAXNBIN=を使用してビンの数を制限すると、キーとなっているセルのデータ分布の表示が小さくなりすぎることを回避できます。CLASSステートメントを指定しないと、このオプションは使用できません。MAXNBIN=オプションは、MAXSIGMAS=オプションの代替として使用できます。
キーセルのデータの平均からvalue(標準偏差)をプライスマイナスした範囲内のビンが比較ヒストグラムに表示されるようにビン数を限定します。このオプションは、分布の尺度や範囲が、セルによって大きく異なる場合に有用です。デフォルトでは、キーとなっているセルに対してビンサイズと中間点が決定されます。次に、残りのセルのデータ範囲に合うように中間点が外挿されていきます。ただし、セルの尺度が大幅に異なる場合、結果として作成されるビンの数が膨大になるため、各セルのヒストグラムは狭い領域に縮尺されます。MAXSIGMAS=を使用してビンの数を制限すると、キーとなっているセルのデータ分布の表示が小さくなり過ぎることを回避できます。CLASSステートメントを指定しないと、このオプションは使用できません。
各ヒストグラム間隔の中間点とオブザベーションのパーセンテージを一覧にしたテーブルを要求します。MIDPERCENTSを密度推定オプションの後のかっこ内に指定すると、各間隔の中間点、オブザベーションの観測されたパーセンテージ、(当てはめた分布から)推定された母集団のパーセンテージを一覧にしたテーブルが表示されます。例4.18を参照してください。
ヒストグラム間隔の中間点を決定する方法を指定します。valuesは、ヒストグラムの棒の幅を、隣り合う中間点の間の差として定義します。このプロシジャは、すべての変数で同じ値を使用します。
中間点の範囲は、両端が棒の幅の半分ずつ延長されますが、データ範囲はこの範囲内に収まる必要があります。たとえば、
midpoints=2 to 10 by 0.5
このとき、全オブザベーションが1.75と10.25の範囲内に収まる必要があります。均等間隔の中間点を昇順で指定します。
キーセル内のデータだけから中間点を決定します。中間点の数の初期値は、Terrell and Scott (1985)の方法を使用して、キーセル内だけのオブザベーション数を基に決定されます。必要に応じて、データが残りのセルに収まるように、いずれかの方向にキーセルの中間点リストが延ばされます。
セルが存在しないものとし、すべてのオブザベーションを使用して、中間点を決定します。言い換えると、中間点の数はTerrell and Scott (1985)の方法を使用して全セルのサンプルサイズを基に決定されます。
CLASSステートメントを使用しない場合、KEYおよびUNIFORMのどちらも適用されません。デフォルトでは、CLASSステートメントでMIDPOINTS=KEYを使用しても、キーセルが空だとMIDPOINTS=UNIFORMとなります。それ以外の場合は、Terrell and Scott (1985)のアルゴリズムを使用して中間点を計算します。この計算は、主に、ほぼ正規分布を示す連続データに適用できます。
GUMBEL、IGAUSSおよびNORMALオプションでそれぞれ要求したGumbel、逆ガウスおよび正規密度曲線のパラメータを指定します。MU=オプションは、分布を表すキーワードの後にかっこで囲んで指定します。デフォルトの場合または値ESTを指定した場合、正規分布および逆ガウス分布のの標本平均を使用して、Gumbel分布のの最尤推定値を計算します。詳細は、逆ガウス分布およびGumbel分布を参照してください。
ヒストグラム間隔の終点を水平軸の目盛り値として使用し、ビンの数を決定します。
ヒストグラム間隔の数を指定します。
ヒストグラムの棒の描画を抑制します。これは、当てはめた曲線のみを表示する場合に有用です。
プロット作成を抑制します。このオプションは、当てはめた密度の要約統計量の表だけを作成したい場合や、OUTHISTOGRAM=データセットだけ作成したい場合に使用します。
当てはめた曲線を要約するテーブルを抑制します。NOPRINTオプションは、分布オプションの後にかっこで囲んで指定します。
当てはめた正規密度曲線をヒストグラムに表示します。NORMALオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、正規曲線をいくつでも要求できます。MU= / SIGMA= normal-optionsを使用して、およびを指定します。デフォルトでは、およびの標本平均および標本標準偏差を使用します。表4.17および表4.24は、NORMALオプションとともに指定できるオプションの一覧です。詳細は、正規分布のセクションを参照してください。NORMALオプションの使用例は、例4.19を参照してください。
HISTOGRAMステートメントで作成されるテーブルの目次エントリを抑制します。
ヒストグラムの区間に関する情報を含むSASデータセットを作成します。特に、データセットには、ヒストグラム間隔の中間点(ENDPOINTSオプションを指定した場合は、間隔の下限終点)、各間隔のオブザベーションの観測されたパーセンテージ、(指定した当てはめた曲線それぞれから推定された)各間隔のオブザベーションの推定されたパーセンテージが含まれています。
当てはめた一般化パレート密度曲線をヒストグラムに表示します。PARETOオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、一般化パレート曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。は、THETA= Pareto-optionを使用して指定します。デフォルトでは、THETA=0になります。尺度パラメータおよび形状パラメータは、SIGMA= / ALPHA= Pareto-optionsを使用して指定します。デフォルトでは、UNIVARIATEプロシジャはおよびの最尤推定値を計算します。表4.17および表4.25は、PARETOオプションとともに指定できるオプションの一覧です。詳細は、一般化パレート分布のセクションを参照してください。
データから計算された分位点と当てはめた曲線から推定された分位点の表が作成されるパーセントの一覧を指定します。パーセントは0~100である必要があります。PERCENTS=オプションは、曲線オプションの後にかっこで囲んで指定します。デフォルトのパーセントは、1、5、10、25、50、75、90、95、99です。
従来的なグラフを作成する場合のヒストグラムの棒(またはFILLオプションも指定していれば、当てはめた曲線の下の領域)の塗りつぶしに使用するパターンを指定します。詳細は、CFILLおよびFILL=オプションの項目を参照してください。パターン値の一覧は、SAS/GRAPH: Referenceを参照してください。このオプションは、ODS Graphics出力には適用されません。
当てはめたべき関数密度曲線をヒストグラムに表示します。POWERオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、べき関数曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。THETA= / SIGMA= power-optionsを使用して、およびを指定します。デフォルト値は、それぞれ0および1です。形状パラメータは、ALPHA= power-optionを使用して指定します。デフォルトでは、PROC UNIVARIATEはの最尤推定値を計算します。表4.17および表4.26は、POWERオプションとともに指定できるオプションの一覧です。詳細は、べき関数分布のセクションを参照してください。
当てはめたレイリー密度曲線をヒストグラムに表示します。RAYLEIGHオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、レイリー曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。は、THETA= Rayleigh-optionを使用して指定します。デフォルトでは、THETA=0になります。尺度パラメータは、SIGMA= Rayleigh-optionを使用して指定します。デフォルトでは、PROC UNIVARIATEはの最尤推定値を計算します。表4.17および表4.27は、RAYLEIGHオプションとともに指定できるオプションの一覧です。詳細は、レイリー分布のセクションを参照してください。
当てはめたJohnson 密度曲線をヒストグラムに表示します。SBオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、Johnson 曲線をいくつでも要求できます。THETA= / SIGMA= normal-optionsを使用して、 および を指定します。デフォルトでは、 および の最尤推定値が計算されます。表4.17および表4.28は、SBオプションとともに指定できるオプションの一覧です。詳細は、Johnson 分布のセクションを参照してください。
BETA、EXPONENTIAL、GAMMA、GUMBEL、LOGNORMAL、NORMAL、PARETO、POWER、RAYLEIGH、SB、SU、WEIBULLのいずれかのオプションを要求する場合の当てはめた曲線のパラメータを指定します。
SIGMA=オプションの使用方法の概要は、表4.34を参照してください。このオプションは、密度曲線のオプションに続けてかっこ内に記述します。値ESTを指定すると、の最尤推定値を要求できます。
密度曲線のオプション |
SIGMA=に指定する値 |
デフォルト値 |
別名 |
---|---|---|---|
BETA |
尺度パラメータ |
1 |
SCALE= |
EXPONENTIAL |
尺度パラメータ |
最尤推定値 |
SCALE= |
GAMMA |
尺度パラメータ |
最尤推定値 |
SCALE= |
GUMBEL |
尺度パラメータ |
最尤推定値 |
|
LOGNORMAL |
形状パラメータ |
最尤推定値 |
SHAPE= |
NORMAL |
尺度パラメータ |
標準偏差 |
|
PARETO |
尺度パラメータ |
1 |
|
POWER |
尺度パラメータ |
最尤推定値 |
|
RAYLEIGH |
尺度パラメータ |
最尤推定値 |
|
SB |
尺度パラメータ |
1 |
SCALE= |
SU |
尺度パラメータ |
パーセント点に基づく推定値 |
|
WEIBULL |
尺度パラメータ |
最尤推定値 |
SCALE= |
当てはめたJohnson 密度曲線をヒストグラムに表示します。SUオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、Johnson 曲線をいくつでも要求できます。THETA= / SIGMA= normal-optionsを使用して、 および を指定します。デフォルトでは、 および の最尤推定値が計算されます。表4.17および表4.29は、SUオプションとともに指定できるオプションの一覧です。詳細は、Johnson 分布のセクションを参照してください。
BETA、EXPONENTIAL、GAMMA、LOGNORMAL、PARETO、POWER、RAYLEIGH、SB、SU、WEIBULLオプションで要求した曲線の下限しきい値パラメータを指定します。THETA=オプションは、曲線オプションの後にかっこで囲んで指定します。デフォルトでは、THETA=0になります。値ESTを指定した場合、の推定値が計算されます。
KERNELオプションで要求した核密度推定の上限を指定します。UPPER=オプションは、KERNELオプションの後にかっこで囲んで指定します。指定した核推定が上限よりも多いと、最後の上限が残りの推定に繰り返し利用されます。デフォルトは欠損値で、当てはめた核密度曲線に上限がないことを示します。
垂直軸の上端のオフセットを画面のパーセンテージ単位で指定します。
ヒストグラムの垂直軸の尺度を指定します。値COUNTは、データ単位をデータユニットごとのオブザベーション数に変換するよう要求します。値PERCENTは、データ単位をデータユニットごとのオブザベーションのパーセントに変換するよう要求します。値PROPORTIONは、データ単位をデータユニットごとのオブザベーションの比率に変換するよう要求します。デフォルト値はPERCENTです。
従来的なグラフを作成する場合の棒の外側の線の幅を指定します。このオプションは、ODS Graphics出力には適用されません。
当てはめたWeibull密度曲線をヒストグラムに表示します。WEIBULLオプションは、HISTOGRAMステートメントに1回だけ指定できます。ただし、Weibull曲線をいくつでも要求できます。パラメータ は最小データ値未満でなければなりません。は、THETA= Weibull-optionを使用して指定します。デフォルトでは、THETA=0になります。THETA=ESTを指定すると、の最尤推定値が計算されます。形状パラメータおよび尺度パラメータは、C= / SIGMA= Weibull-optionsを使用して指定します。デフォルトでは、およびの最尤推定値を計算します。表4.17および表4.30は、WEIBULLオプションとともに指定できるオプションの一覧です。詳細は、Weibull分布のセクションを参照してください。WEIBULLオプションの使用例は、例4.22を参照してください。
PROC UNIVARIATEは、Newton-Raphson近似を使用して、の最尤推定値を反復的に計算します。C= / SIGMA= / THETA= Weibull-optionsも参照してください。
従来的なグラフを作成する場合のグリッド線の太さを指定します。このオプションは、ODS Graphics出力には適用されません。
LOGNORMALオプションで要求した対数正規密度曲線の尺度パラメータの値を指定します。ZETA= lognormal-optionオプションは、LOGNORMALオプションの後にかっこで囲んで指定します。デフォルトでは(または値ESTを指定した場合、の最尤推定値が計算されます。SCALE=オプションは、ZETA=オプションの別名として指定できます。