UNIVARIATEプロシジャ

WEIGHTステートメント

  • WEIGHT variable;

WEIGHTステートメントは、統計量計算における分析変数の数値の重みを指定します。UNIVARIATEプロシジャは、WEIGHT変数の値$w_{i}$を使用し、分析変数のi番目の値$x_{i}$の分散が$\sigma ^{2}/w_{i}$に等しいと仮定して、いくつかの要約統計量の計算を変更します。ここで、$\sigma $は未知のパラメータです。WEIGHT変数の値は整数である必要はありませんが、通常は正の数です。デフォルトでは、WEIGHT変数が正ではない値または欠損値であるオブザベーションは、次のように処理されます。

  • 値が0である場合、そのオブザベーションはオブザベーションの合計数にカウントされます。

  • 値が負の数である場合、値は0に変換され、そのオブザベーションはオブザベーションの合計数にカウントされます。

  • 値が欠損値である場合、そのオブザベーションは分析から除外されます。

負およびゼロの重みを含むオブザベーションを分析から除外するには、EXCLNPWGTを使用します。GLMプロシジャなど、ほとんどのSAS/STATプロシジャは、負およびゼロの重みをデフォルトで除外します。重み変数を指定しても、プロシジャによる範囲、モード、外れ値、極値オブザベーション、または欠損値数の決定方法は変更されません。 WEIGHTステートメントを指定した場合、重み付き標準誤差とスチューデントのt検定の重み付きバージョンも計算します。スチューデントのt検定は、分析変数を重み付けした場合にUNIVARIATEプロシジャが計算する位置のみの検定です。

WEIGHT変数を指定した場合、その変数値$w_{i}$を使用して、積率テーブルに示される統計量の重み付きバージョンが計算されます。たとえば、重み付き平均$\overline{x}_{w}$と重み付き分散$s_{w}^{2}$は次のように計算されます。

\[  \overline{x}_{w} = \frac{ \sum _{i} w_{i}x_{i} }{ \sum _{i} w_{i} }  \]

および

\[  s_{w}^{2} = \frac{ 1 }{ d } \sum _{i} w_{i} ( x_{i} - \overline{x}_{w} )^{2}  \]

ここで、$x_{i}$i番目の変数値です。分母dは、PROC UNIVARIATEステートメントのVARDEF=オプションで制御されます。

WEIGHTステートメントは、モード、極値、極値オブザベーション、分析変数の欠損値数の判定には影響しません。ただし、重み付きパーセント点の計算には、重み$w_{i}$が使用されます。WEIGHT変数は、プロットステートメントで作成されるグラフの表示には影響を与えません。

CIPCTLDFCIPCTLNORMALLOCCOUNTNORMALROBUSTSCALETRIMMED=WINSORIZED=オプションは、WEIGHTステートメントでは使用できません。

重み付き歪度または尖度を計算するには、PROCステートメントでVARDEF=DFまたはVARDEF=Nを使用します。

HISTOGRAMPROBPLOTQQPLOT ステートメントを、WEIGHTステートメントとともに指定することはできません。

WEIGHTステートメントを使用するときには、VARDEF=オプションのどの値が適切か考慮してください。詳細は、VARDEF=および重み付き統計量の計算を参照してください。