UNIVARIATEプロシジャ

OUTPUTステートメントのOUT=出力データセット

UNIVARIATEプロシジャは、OUTPUTステートメントごとにOUT=データセットを作成します。このデータセットには、BYステートメントの変数の水準の組み合わせごとに1つのオブザベーションが含まれます。BYステートメントが指定されていない場合は、1つのオブザベーションが含まれます。したがって、新しいデータセット内のオブザベーション数は、統計量が計算されるグループの数に対応します。BYステートメントが指定されていない場合、統計量とパーセント点が入力データセット内のすべてのオブザベーションを使用して計算されます。BYステートメントが指定されている場合、統計量とパーセント点が各BYグループ内のオブザベーションを使用して計算されます。

OUT=データセット内の変数は次のとおりです。

  • BYステートメント変数。これらの変数の値はDATA=データセット内のBYグループの値に一致し、各オブザベーションで要約されるBYグループを示します。

  • OUTPUTステートメントで統計量を選択することによって作成される変数。統計量はすべての非欠損データを使用して計算されるか、BYステートメントを使用した場合はBYグループごとに計算されます。

  • PCTLPTS=オプションで新しいパーセント点を要求することによって作成される変数。これらの新しい変数の名前は、PCTLPRE=およびPCTLNAME=オプションの値によって決まります。

出力データセットにパーセント点変数または四分位点変数が含まれている場合、PROC UNIVARIATEステートメントのPCTLDEF=オプションで割り当てたパーセント点定義が、出力データセットラベルに記録されます。例4.8を参照してください。

次の表はOUT=データセットで使用できる変数の一覧です。

表4.36: OUT=データセットで使用できる変数

変数名

説明

記述統計量

CSS

平均で修正した平方和

CV

パーセント変動係数

KURTOSIS|KURT

裾の重さの測定

MAX

最大値

MEAN

算術平均

MIN

最小値

MODE

最頻値(重複する場合は、最小モード)

N

計算の基準となるオブザベーション数

NMISS

欠損値を含まないオブザベーションの数

NOBS

オブザベーションの合計数

RANGE

最大値と最小値の差

SKEWNESS|SKEW

偏差がある方向で他の方向より大きいという偏差の傾向の測定

STD | STDDEV

標準偏差

STDMEAN | STDERR

平均の標準誤差

SUM

合計

SUMWGT

重みの合計

USS

無修正平方和

VAR

分散

分位点統計量

MEDIAN | Q2 | P50

中央値(50番目のパーセント点)

P1

1番目のパーセント点

P5

5番目のパーセント点

P10

10番目のパーセント点

P90

90番目のパーセント点

P95

95番目のパーセント点

P99

99番目のパーセント点

Q1 | P25

下位四分位点(25番目のパーセント点)

Q3 | P75

上位四分位点(75番目のパーセント点)

QRANGE

上位四分位点と下位四分位点の差(内側四分位範囲)

ロバスト統計量

GINI

Giniの平均差

MAD

中央値の絶対値差

QN

中央値の絶対値差の2番目の変動

SN

中央値の絶対値差の最初の変動

STD_GINI

Giniの平均差の標準偏差

STD_MAD

中央値の絶対値差の標準偏差

STD_QN

中央値の絶対値差の2番目の変動の標準偏差

STD_QRANGE

四分位範囲に基づく標準偏差の推定値

STD_SN

中央値の絶対値差の最初の変動の標準偏差

仮説検定統計量

MSIGN

符号統計量

NORMAL

正規性の検定。標本サイズが2000以下の場合は、Shapiro-Wilk W統計量です。それ以外の場合は、Kolmogorov D統計量です。

PROBM

符号検定でのより大きな絶対値の確率

PROBN

データが正規分布からのものである確率

PROBS

符号付き順位検定の統計量でのより大きな絶対値の確率

PROBT

自由度が$n-1$のスチューデントのt統計量のp値(両側)

SIGNRANK

符号付き順位統計量

T

母集団平均が$\mu _0$に等しいという帰無仮説を検定するスチューデントのt統計量