要約統計量のデータを用いてのt検定

[OS] ALL
[リリース] ALL
[キーワード] STAT, TTEST

[質問]

生データはないのですが、各群における要約統計量は分かっています。理論上は要約統計量のみからもt検定は実行できますが、SASで同様に実行することは可能でしょうか。

[回答]

各群における標本数、平均値、標準偏差(または分散)があらかじめ分かっている場合、生データを使用しなくてもt検定を実行することは可能です。具体的には、群を特定する変数(たとえば、group)、変数_STAT_(_STAT_)、と要約統計量の変数(たとえば、summary)をデータセットに含める必要があります。ここで注意が必要なのは、変数_STAT_です。この変数名は必ず"_STAT_" と指定し、変数値をn、mean、stdとしてください。また、相当する要約統計量(順に標本数、平均値、標準偏差)を変数summaryにて入力してください。このデータセットに対して、以下のサンプルプログラムのようにTTESTプロシジャを実行することにより、t検定の結果を得ることができます。

data test; /* 要約統計量を含む擬似データ*/
  input group _STAT_$ summary @@;
cards;
1 n 10 1 mean 5.2235 1 std 0.8243
2 n 10 2 mean 9.7790 2 std 0.9980
;
run;

proc ttest data=test;
  class group;
  var summary;
run;