パーセント点の計算 |
UNIVARIATEプロシジャは、各分析変数の最小値および最大値と、1番目、5番目、10番目、25番目、50番目、75番目、90番目、95番目、99番目のパーセント点(分位点)を自動的に計算します。これらのデフォルトパーセント点以外のパーセント点を計算するには、OUTPUTステートメントのPCTLPTS=オプションおよびPCTLPRE=オプションを使用します。
PCTLDEF=オプションで、5つのパーセント点計算定義のうち1つを指定できます。は変数の非欠損値の数、は並べ替えられた変数の値を表すとします。また、番目のパーセント点がであるとし、と設定し、次のとおりであるとします。
ここで、はnpの整数部分、はnpの小数部分です。この場合、PCTLDEF=オプションは、番目のパーセント点を次の表の説明のように定義します。
PCTLDEF |
説明 |
公式 |
---|---|---|
1 |
での重み付き平均 |
|
ここで、 は と解釈される |
||
2 |
npに最も近い番号のオブザベーション |
|
3 |
経験分布関数 |
|
4 |
重み付き平均 |
|
を目的とします |
ここで、 は と解釈される |
|
5 |
平均化された経験分布関数 |
|
WEIGHTステートメントを使用する場合、パーセント点は異なる方法で計算されます。100番目の重み付きパーセント点は、平均化された経験分布関数から計算されます。
ここで、はに関連付けられた重みで、は重みの合計です。
PCTLDEF=オプションは、WEIGHTステートメントが使用される場合は適用されません。ただし、この場合、重みがすべて同じであれば、重み付きパーセント点は、WEIGHTステートメントを使用せずにPCTLDEF=5で計算されるパーセント点と同じになります。
CIPCTLNORMALオプションを使用すると、データが正規分布であると仮定して、パーセント点の信頼限界を要求できます。これらの限界については、Hahn and Meeker (1991)のセクション4.4.1で説明されています。 の場合、両側の 信頼限界( 番目のパーセント点に対するもの)は次のようになる
は標本サイズです。 の場合、両側の 信頼限界( 番目のパーセント点に対するもの)は次のようになる
片側の信頼限界は、適切な前の式のをに置き換えて計算されます。因子は非心分布に関連し、Owen and Hua (1977)およびOdeh and Owen (1980)で説明されています。例4.10を参照してください。
CIPCTLDFオプションを使用すると、パーセント点の分布によらない信頼限界を要求できます。特に、データが正規分布であると仮定する必要がありません。これらの限界については、Hahn and Meeker (1991)のセクション5.2で説明されています。番目のパーセント点の両側の信頼限界は次のとおりです。
は、データ値が昇順で並べ替えられている場合の番目の順序統計量です。
下のランクと上のランクは、の前後で対称(またはほぼ対象)な整数です。はの整数部分で、は標本サイズです。また、とは、次の包含確率要件を満たしながら、とができるだけに近くなるように選択されます。
は次の累積二項確率です。
特にが小さく、が0または1に小さい場合は、包含要件を満たすことができないことがあります。対称性の要件を緩和するには、CIPCTLDF(TYPE = ASYMMETRIC)を指定できます。このオプションは、包含要件を満たすことができる場合は対称限界を要求し、それ以外の場合は非対称限界を要求します。
CIPCTLDF(TYPE = LOWER)を指定すると、片側の下位信頼限界がとして計算されます。は次の非同等性を満たす最も大きい整数です。
ただし、とします。同様に、CIPCTLDF(TYPE = UPPER)を指定すると、片側の下位信頼限界がとして計算されます。は次の非同等性を満たす最も大きい整数です。
パーセント点の信頼限界は、WEIGHTステートメントが指定されている場合は計算されません。例4.10を参照してください。