このセクションでは、PROC UNIVARIATEステートメントで計算される記述統計量の計算の詳細を示します。 これらの統計量は、OUTPUTステートメントで表4.14にあるキーワードを指定することにより、OUT=データセットに保存することもできます。
標準アルゴリズム(Fisher; 1973)は、積率統計量の計算に使用されます。UNIVARIATEプロシジャで使用される計算方法は、他のSASプロシジャで記述統計量の計算に使用される計算方法との間に一貫性があります。
次のセクションでは、UNIVARIATEプロシジャで計算されるいくつかの統計量の詳細を示します。
ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は変数のi番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式は次のようになります。
合計は、で計算されます。ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は変数のi番目の値に関連付けられた重みです。WEIGHT変数が存在しない場合、この式はになります。
分散は次のように計算されます。
ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は重み付き平均、は変数のi番目の値に関連付けられた重み、dはPROC UNIVARIATE ステートメントのVARDEF=オプションで制御される分母です。
WEIGHT変数が存在しない場合、この式は次のようになります。
標準偏差は次のように計算されます。
ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は重み付き平均、は変数のi番目の値に関連付けられた重み、dはPROC UNIVARIATEステートメントのVARDEF=オプションで制御される分母です。WEIGHT変数が存在しない場合、この式は次のようになります。
標本歪度は、偏差がある方向で他の方向より大きいという偏差の傾向を測定し、VARDEF=オプションに応じて次のように計算されます。
ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は標本平均、sは標本標準偏差、は変数のi番目の値に割り当てられる重みを表します。VARDEF=DFの場合、nは2より大きくする必要があります。WEIGHT変数が存在しない場合、のすべてに対するになります。
標本歪度は正または負の値になります。データ分布の非対称性を測定し、理論歪度を推定します。ここで、およびは、2番目および3番目の中心積率です。オブザベーションが正規分布である場合、歪度は0に近くなります。
標本尖度は、標本の裾の重さを測定し、VARDEF=オプションに応じて次のように計算されます。
ここで、nは変数の値が非欠損値であるオブザベーション数、は変数のi番目の値、は標本平均、は標本標準偏差、は変数のi番目の値に割り当てられる重みを表します。VARDEF=DFの場合、nは3より大きくする必要があります。WEIGHT変数が存在しない場合、のすべてに対するになります。
標本尖度はデータ分布の裾の重さを測定します。で示される調整された理論尖度を推定します。ここで、であり、は4番目の中心積率です。オブザベーションが正規分布である場合、尖度は0に近くなります。