INSETステートメントは、CDFPLOT 、HISTOGRAM 、PPPLOT 、PROBPLOT 、QQPLOT のいずれかのステートメントで作成されたグラフ内に直接、インセットと呼ばれる要約統計量のボックスまたはテーブルを配置します。INSETステートメントは、拡張したいプロットを作成するプロットステートメントの後に使用する必要があります。インセットは、前のプロットステートメントが作成するすべてのグラフに表示されます。
プロットステートメントの後に複数のINSETステートメントを使用すると、複数のインセットをプロットに挿入できます。例4.17を参照してください。
INSETステートメントには、インセットに表示する情報を特定するキーワードを1つ以上指定します。情報はキーワードの要求順に表示されます。次のキーワードを指定できます。
統計キーワード
1次キーワード
2次キーワード
利用できる統計キーワードを表4.10に示します。
表4.10: 統計キーワード
キーワード |
説明 |
---|---|
記述統計キーワード |
|
CSS |
修正済み平方和 |
CV |
変動係数 |
GEOMEAN |
幾何平均 |
KURTOSIS|KURT |
尖度 |
MAX |
最大値 |
MEAN |
標本平均 |
MIN |
最小値 |
MODE |
最も度数の高い値 |
N |
標本サイズ |
NEXCL |
MAXNBIN=またはMAXSIGMAS=オプションによって除外されるオブザベーションの数 |
NMISS |
欠損値の数 |
NOBS |
オブザベーションの数 |
RANGE |
範囲 |
SKEWNESS|SKEW |
歪度 |
STD | STDDEV |
標準偏差 |
STDMEAN | STDERR |
平均の標準誤差 |
SUM |
オブザベーションの合計 |
SUMWGT |
重みの合計 |
USS |
無修正平方和 |
VAR |
分散 |
パーセント点統計キーワード |
|
P1 |
1番目のパーセント点 |
P5 |
5番目のパーセント点 |
P10 |
10番目のパーセント点 |
Q1 |
|
P25 |
下位四分位点(25番目のパーセント点) |
MEDIAN |
|
Q2 |
|
P50 |
中央値(50番目のパーセント点) |
Q3 |
|
P75 |
上位四分位点(75番目のパーセント点) |
P90 |
90番目のパーセント点 |
P95 |
95番目のパーセント点 |
P99 |
99番目のパーセント点 |
QRANGE |
四分位範囲(Q3–Q1) |
分布によらないパーセント点の信頼限界に関するキーワード (CIPCTLDFオプション) |
|
P1_LCL_DF |
1番目のパーセント点の下側信頼限界 |
P1_UCL_DF |
1番目のパーセント点の上側信頼限界 |
P5_LCL_DF |
5番目のパーセント点の下側信頼限界 |
P5_UCL_DF |
5番目のパーセント点の上側信頼限界 |
P10_LCL_DF |
10番目のパーセント点の下側信頼限界 |
P10_UCL_DF |
10番目のパーセント点の上側信頼限界 |
Q1_LCL_DF |
|
P25_LCL_DF |
下位四分位点(25番目のパーセント点)の下側信頼限界 |
Q1_UCL_DF |
|
P25_UCL_DF |
下位四分位点(25番目のパーセント点)の上側信頼限界 |
MEDIAN_LCL_DF |
|
Q2_LCL_DF |
|
P50_LCL_DF |
中央値(50番目のパーセント点)の下側信頼限界 |
MEDIAN_UCL_DF |
|
Q2_UCL_DF |
|
P50_UCL_DF |
中央値(50番目のパーセント点)の上側信頼限界 |
Q3_LCL_DF |
|
P75_LCL_DF |
上位四分位点(75番目のパーセント点)の下側信頼限界 |
Q3_UCL_DF |
|
P75_UCL_DF |
上位四分位点(75番目のパーセント点)の上側信頼限界 |
P90_LCL_DF |
90番目のパーセント点の下側信頼限界 |
P90_UCL_DF |
90番目のパーセント点の上側信頼限界 |
P95_LCL_DF |
95番目のパーセント点の下側信頼限界 |
P95_UCL_DF |
95番目のパーセント点の上側信頼限界 |
P99_LCL_DF |
99番目のパーセント点の下側信頼限界 |
P99_UCL_DF |
99番目のパーセント点の上側信頼限界 |
正規分布を仮定した場合のパーセント点の信頼限界に関するキーワード (CIPCTLNORMALオプション) |
|
P1_LCL |
1番目のパーセント点の下側信頼限界 |
P1_UCL |
1番目のパーセント点の上側信頼限界 |
P5_LCL |
5番目のパーセント点の下側信頼限界 |
P5_UCL |
5番目のパーセント点の上側信頼限界 |
P10_LCL |
10番目のパーセント点の下側信頼限界 |
P10_UCL |
10番目のパーセント点の上側信頼限界 |
Q1_LCL |
|
P25_LCL |
下位四分位点(25番目のパーセント点)の下側信頼限界 |
Q1_UCL |
|
P25_UCL |
下位四分位点(25番目のパーセント点)の上側信頼限界 |
MEDIAN_LCL |
|
Q2_LCL |
|
P50_LCL |
中央値(50番目のパーセント点)の下側信頼限界 |
MEDIAN_UCL |
|
Q2_UCL |
|
P50_UCL |
中央値(50番目のパーセント点)の上側信頼限界 |
Q3_LCL |
|
P75_LCL |
上位四分位点(75番目のパーセント点)の下側信頼限界 |
Q3_UCL |
|
P75_UCL |
上位四分位点(75番目のパーセント点)の上側信頼限界 |
P90_LCL |
90番目のパーセント点の下側信頼限界 |
P90_UCL |
90番目のパーセント点の上側信頼限界 |
P95_LCL |
95番目のパーセント点の下側信頼限界 |
P95_UCL |
95番目のパーセント点の上側信頼限界 |
P99_LCL |
99番目のパーセント点の下側信頼限界 |
P99_UCL |
99番目のパーセント点の上側信頼限界 |
ロバスト統計量キーワード |
|
GINI |
Giniの平均差 |
MAD |
中央絶対偏差 |
QN |
、MADの代替 |
SN |
、MADの代替 |
STD_GINI |
Giniの標準偏差 |
STD_MAD |
MAD標準偏差 |
STD_QN |
標準偏差 |
STD_QRANGE |
四分位範囲標準偏差 |
STD_SN |
標準偏差 |
仮説検定キーワード |
|
MSIGN |
符号統計量 |
NORMALTEST |
正規性の検定 |
PNORMAL |
正規性の検定の確率値 |
SIGNRANK |
符号付き順位統計量 |
PROBM |
符号検定でのより大きな絶対値の確率 |
PROBN |
正規性の検定の確率値 |
PROBS |
符号付き順位検定の確率値 |
PROBT |
スチューデントのt検定の確率値 |
T |
スチューデントのt検定の統計量 |
入力データセットの読み取りに関するキーワード |
|
DATA= |
入力データセットの(ラベル、値の)ペア |
完全にカスタマイズされたインセットを作成するには、DATA=データセットを使用します。
1次キーワードは、当てはめる分布を指定します。これは、パラメトリック法の分布または核密度推定のいずれかになります。 1次キーワードに続いて2次キーワードをかっこで囲んで指定することで、分布に関連付けられている特定の統計量を要求できます。
注: 従来的なグラフ出力を生成する場合、2次キーワードなしで1次キーワードを指定すると、色付きの線や、分布名を密度曲線のキーとして表示できます。
HISTOGRAMステートメントでは、当てはめる分布を同じファミリから複数(たとえば2つの正規分布など)を要求できます。1次キーワードの直後に曲線のインデックスを角かっこで囲んで指定することにより、個々の曲線に対応するインセット統計量を表示できます。
次のステートメントは、3つの当てはめた正規曲線を表示し、さらに2番目の曲線に関してのみ適合度統計量を含むインセットを表示します。
proc univariate data=score; histogram final / normal(sigma=1 2 3); inset normal[2](ad adpval); run;
表4.11に、1次キーワードと、それらを指定できるプロットステートメントを示します。
表4.11: 1次キーワード
キーワード |
分布 |
使用できるプロットステートメント |
---|---|---|
BETA |
BETA |
すべてのプロットステートメント |
EXPONENTIAL |
指数 |
すべてのプロットステートメント |
GAMMA |
GAMMA |
すべてのプロットステートメント |
GUMBEL |
Gumbel |
すべてのプロットステートメント |
IGAUSS |
逆ガウス |
CDFPLOT、HISTOGRAM、PPPLOT |
KERNEL |
核密度推定 |
HISTOGRAM |
LOGNORMAL |
対数正規 |
すべてのプロットステートメント |
NORMAL |
正規 |
すべてのプロットステートメント |
PARETO |
パレート |
すべてのプロットステートメント |
POWER |
べき関数 |
すべてのプロットステートメント |
RAYLEIGH |
レイリー |
すべてのプロットステートメント |
SB |
Johnson |
HISTOGRAM |
SU |
Johnson |
HISTOGRAM |
WEIBULL |
Weibull (3 つのパラメータ) |
すべてのプロットステートメント |
WEIBULL2 |
Weibull (2 つのパラメータ) |
PROBPLOT、QQPLOT |
表4.12に、表4.11に示した1次キーワードと共に使用できる2次キーワードを示します。
表4.12: 2次キーワード
2次キーワード |
別名 |
説明 |
---|---|---|
BETAの2次キーワード |
||
ALPHA |
SHAPE1 |
1番目の形状パラメータ |
BETA |
SHAPE2 |
2番目の形状パラメータ |
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
下限しきい値パラメータ |
EXPONENTIALの2次キーワード |
||
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
GAMMAの2次キーワード |
||
ALPHA |
SHAPE |
形状パラメータ |
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
GUMBELの2次キーワード |
||
MEAN |
当てはめた分布の平均 |
|
MU |
位置パラメータ |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
IGAUSSの2次キーワード |
||
LAMBDA |
形状パラメータ |
|
MEAN |
当てはめた分布の平均 |
|
MU |
平均パラメータ |
|
STD |
当てはめた分布の標準偏差 |
|
KERNELの2次キーワード |
||
AMISE |
カーネル密度の誤差平均平方和(MISE)の機算平均 |
|
BANDWIDTH |
密度推定の区間幅 |
|
BWIDTH |
BANDWIDTHの別名 |
|
C |
密度推定の標準化区間幅 |
|
TYPE |
カーネルの種類:標準、2次、3次 |
|
LOGNORMALの2次キーワード |
||
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SHAPE |
形状パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
ZETA |
SCALE |
尺度パラメータ |
NORMALの2次キーワード |
||
MU |
MEAN |
平均パラメータ |
SIGMA |
STD |
尺度パラメータ |
PARETOの2次キーワード |
||
ALPHA |
形状パラメータ |
|
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
POWERの2次キーワード |
||
ALPHA |
形状パラメータ |
|
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
RAYLEIGHの2次キーワード |
||
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
SBおよびSUの2次キーワード |
||
DELTA |
SHAPE1 |
1番目の形状パラメータ |
GAMMA |
SHAPE2 |
2番目の形状パラメータ |
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
下限しきい値パラメータ |
WEIBULLの2次キーワード |
||
C |
SHAPE |
形状パラメータc |
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
しきい値パラメータ |
WEIBULL2の2次キーワード |
||
C |
SHAPE |
形状パラメータc |
MEAN |
当てはめた分布の平均 |
|
SIGMA |
SCALE |
尺度パラメータ |
STD |
当てはめた分布の標準偏差 |
|
THETA |
THRESHOLD |
既知の下限しきい値 |
すべてのパラメトリック法(KERNEL以外)の分布で使用できるキーワード |
||
AD |
Anderson-Darling EDF検定統計量 |
|
ADPVAL |
Anderson-Darling EDF検定のp値 |
|
CVM |
Cramér-von Mises EDF検定統計量 |
|
CVMPVAL |
Cramér–von Mises EDF検定のp値 |
|
KSD |
Kolmogorov-Smirnov EDF検定統計量 |
|
KSDPVAL |
Kolmogorov-Smirnov EDF検定のp値 |
表4.12に示されているインセット統計量を取得するには、プロットステートメントと各統計量を計算するオプションを要求する必要があります。たとえば、次のステートメントを考えます。
proc univariate data=score; histogram final / normal; inset mean std normal(ad adpval); run;
MEANおよびSTDキーワードは、それぞれfinal
の標本平均および標準偏差を表示します。NORMALキーワードと2次キーワードADおよびADPVALを指定すると、Anderson-Darling適合度検定統計量およびp値がそれぞれ表示されます。HISTOGRAMステートメントでNORMALオプションが要求されるため、NORMALキーワードで指定した統計量のみが使用できます。
KERNELキーワードは、HISTOGRAMステートメントで、核密度推定を要求した場合にのみ利用できます。WEIBULL2キーワードは、PROBPLOTステートメントまたはQQPLOTステートメントで、2パラメータWeibull分布を要求する場合にのみ使用できます。
デフォルトでは、UNIVARIATEプロシジャでは、インセット統計量と該当するラベルが関係付けられ、適切な出力形式を使用して数値が出力されます。ラベルをカスタマイズするには、等号(=)の後にキーワードと目的のラベルを指定し、引用符で囲みます。出力形式をカスタマイズするには、キーワードの後に数値出力形式を指定し、かっこで囲みます。ラベルには、最大24バイト文字まで指定できます。統計量に対してラベルと出力形式の両方を指定する場合は、ラベルの後に出力形式を指定します。たとえば、次のステートメントは、2つの統計のラベルのカスタマイズを要求し、標準偏差をフィールドの幅が5、小数点以下2桁で表示します。
inset n='Sample Size' std='Std Dev' (5.2);
表4.13はINSETステートメントのoptionsのリストで、INSETステートメントでスラッシュ(/)の後に指定します。詳細は、オプションのリファレンスセクションを参照してください。
表4.13: INSETオプション
オプション |
説明 |
---|---|
インセットの背景色を指定 |
|
ヘッダーの背景色を指定 |
|
枠の色を指定 |
|
ヘッダーテキストの色を指定 |
|
影付き色を指定 |
|
インセットのテキスト色を指定 |
|
POSITION=座標のデータ単位を指定 |
|
テキストフォントを指定 |
|
インセット内の値の出力形式を指定 |
|
上下の余白のインセットのとじしろ幅を指定 |
|
ヘッダーテキストを指定 |
|
インセットのテキストの高さを指定 |
|
上下の余白のインセットの列数を指定 |
|
インセットの周囲の枠を抑制 |
|
インセットの位置を指定 |
|
POSITION=座標で配置したインセットの参照ポイントを指定 |