UNIVARIATEプロシジャ

OUTPUTステートメントのOUT=出力データセット

UNIVARIATEプロシジャは、OUTPUTステートメントごとにOUT=データセットを作成します。このデータセットには、BYステートメントの変数の水準の組み合わせごとに1つのオブザベーションが含まれます。BYステートメントが指定されていない場合は、1つのオブザベーションが含まれます。したがって、新しいデータセット内のオブザベーション数は、統計量が計算されるグループの数に対応します。BYステートメントが指定されていない場合、統計量とパーセント点が入力データセット内のすべてのオブザベーションを使用して計算されます。BYステートメントが指定されている場合、統計量とパーセント点が各BYグループ内のオブザベーションを使用して計算されます。

OUT=データセット内の変数は次のとおりです。

BYステートメント変数。これらの変数の値はDATA=データセット内のBYグループの値に一致し、各オブザベーションで要約されるBYグループを示します。
OUTPUTステートメントで統計量を選択することによって作成される変数。統計量はすべての非欠損データを使用して計算されるか、BYステートメントを使用した場合はBYグループごとに計算されます。
PCTLPTS=オプションで新しいパーセント点を要求することによって作成される変数。これらの新しい変数の名前は、PCTLPRE=およびPCTLNAME=オプションの値によって決まります。

出力データセットにパーセント点変数または四分位点変数が含まれている場合、PROC UNIVARIATEステートメントのPCTLDEF=オプションで割り当てたパーセント点定義が、出力データセットラベルに記録されます。例4.8を参照してください。

次の表はOUT=データセットで使用できる変数の一覧です。

表4.36: OUT=データセットで使用できる変数

変数名	説明
記述統計量
CSS	平均で修正した平方和
CV	パーセント変動係数
KURTOSIS\|KURT	裾の重さの測定
MAX	最大値
MEAN	算術平均
MIN	最小値
MODE	最頻値(重複する場合は、最小モード)
N	計算の基準となるオブザベーション数
NMISS	欠損値を含まないオブザベーションの数
NOBS	オブザベーションの合計数
RANGE	最大値と最小値の差
SKEWNESS\|SKEW	偏差がある方向で他の方向より大きいという偏差の傾向の測定
STD \| STDDEV	標準偏差
STDMEAN \| STDERR	平均の標準誤差
SUM	合計
SUMWGT	重みの合計
USS	無修正平方和
VAR	分散
分位点統計量
MEDIAN \| Q2 \| P50	中央値(50番目のパーセント点)
P1	1番目のパーセント点
P5	5番目のパーセント点
P10	10番目のパーセント点
P90	90番目のパーセント点
P95	95番目のパーセント点
P99	99番目のパーセント点
Q1 \| P25	下位四分位点(25番目のパーセント点)
Q3 \| P75	上位四分位点(75番目のパーセント点)
QRANGE	上位四分位点と下位四分位点の差(内側四分位範囲)
ロバスト統計量
GINI	Giniの平均差
MAD	中央値の絶対値差
QN	中央値の絶対値差の2番目の変動
SN	中央値の絶対値差の最初の変動
STD_GINI	Giniの平均差の標準偏差
STD_MAD	中央値の絶対値差の標準偏差
STD_QN	中央値の絶対値差の2番目の変動の標準偏差
STD_QRANGE	四分位範囲に基づく標準偏差の推定値
STD_SN	中央値の絶対値差の最初の変動の標準偏差
仮説検定統計量
MSIGN	符号統計量
NORMAL	正規性の検定。標本サイズが2000以下の場合は、Shapiro-Wilk W統計量です。それ以外の場合は、Kolmogorov D統計量です。
PROBM	符号検定でのより大きな絶対値の確率
PROBN	データが正規分布からのものである確率
PROBS	符号付き順位検定の統計量でのより大きな絶対値の確率
PROBT	自由度が $n-1$ のスチューデントのt統計量のp値(両側)
SIGNRANK	符号付き順位統計量
T	母集団平均が $\mu _0$ に等しいという帰無仮説を検定するスチューデントのt統計量