UNIVARIATEプロシジャは、OUTPUTステートメントごとにOUT=データセットを作成します。このデータセットには、BYステートメントの変数の水準の組み合わせごとに1つのオブザベーションが含まれます。BYステートメントが指定されていない場合は、1つのオブザベーションが含まれます。したがって、新しいデータセット内のオブザベーション数は、統計量が計算されるグループの数に対応します。BYステートメントが指定されていない場合、統計量とパーセント点が入力データセット内のすべてのオブザベーションを使用して計算されます。BYステートメントが指定されている場合、統計量とパーセント点が各BYグループ内のオブザベーションを使用して計算されます。
OUT=データセット内の変数は次のとおりです。
出力データセットにパーセント点変数または四分位点変数が含まれている場合、PROC UNIVARIATEステートメントのPCTLDEF=オプションで割り当てたパーセント点定義が、出力データセットラベルに記録されます。例4.8を参照してください。
次の表はOUT=データセットで使用できる変数の一覧です。
表4.36: OUT=データセットで使用できる変数
変数名 |
説明 |
---|---|
記述統計量 |
|
CSS |
平均で修正した平方和 |
CV |
パーセント変動係数 |
KURTOSIS|KURT |
裾の重さの測定 |
MAX |
最大値 |
MEAN |
算術平均 |
MIN |
最小値 |
MODE |
最頻値(重複する場合は、最小モード) |
N |
計算の基準となるオブザベーション数 |
NMISS |
欠損値を含まないオブザベーションの数 |
NOBS |
オブザベーションの合計数 |
RANGE |
最大値と最小値の差 |
SKEWNESS|SKEW |
偏差がある方向で他の方向より大きいという偏差の傾向の測定 |
STD | STDDEV |
標準偏差 |
STDMEAN | STDERR |
平均の標準誤差 |
SUM |
合計 |
SUMWGT |
重みの合計 |
USS |
無修正平方和 |
VAR |
分散 |
分位点統計量 |
|
MEDIAN | Q2 | P50 |
中央値(50番目のパーセント点) |
P1 |
1番目のパーセント点 |
P5 |
5番目のパーセント点 |
P10 |
10番目のパーセント点 |
P90 |
90番目のパーセント点 |
P95 |
95番目のパーセント点 |
P99 |
99番目のパーセント点 |
Q1 | P25 |
下位四分位点(25番目のパーセント点) |
Q3 | P75 |
上位四分位点(75番目のパーセント点) |
QRANGE |
上位四分位点と下位四分位点の差(内側四分位範囲) |
ロバスト統計量 |
|
GINI |
Giniの平均差 |
MAD |
中央値の絶対値差 |
QN |
中央値の絶対値差の2番目の変動 |
SN |
中央値の絶対値差の最初の変動 |
STD_GINI |
Giniの平均差の標準偏差 |
STD_MAD |
中央値の絶対値差の標準偏差 |
STD_QN |
中央値の絶対値差の2番目の変動の標準偏差 |
STD_QRANGE |
四分位範囲に基づく標準偏差の推定値 |
STD_SN |
中央値の絶対値差の最初の変動の標準偏差 |
仮説検定統計量 |
|
MSIGN |
符号統計量 |
NORMAL |
正規性の検定。標本サイズが2000以下の場合は、Shapiro-Wilk W統計量です。それ以外の場合は、Kolmogorov D統計量です。 |
PROBM |
符号検定でのより大きな絶対値の確率 |
PROBN |
データが正規分布からのものである確率 |
PROBS |
符号付き順位検定の統計量でのより大きな絶対値の確率 |
PROBT |
自由度がのスチューデントのt統計量のp値(両側) |
SIGNRANK |
符号付き順位統計量 |
T |
母集団平均がに等しいという帰無仮説を検定するスチューデントのt統計量 |