UNIVARIATEプロシジャは、各分析変数の最小値および最大値と、1番目、5番目、10番目、25番目、50番目、75番目、90番目、95番目、99番目のパーセント点(分位点)を自動的に計算します。これらのデフォルトパーセント点以外のパーセント点を計算するには、OUTPUTステートメントのPCTLPTS=オプションおよびPCTLPRE=オプションを使用します。
PCTLDEF=オプションで、5つのパーセント点計算定義のうち1つを指定できます。nは変数の値が非欠損値であるオブザベーション数、は並べ替えられた変数の値を表すとします。また、t番目のパーセント点がyであるとし、と設定した上で、次の式が成り立つとします。
ここで、jはnpの整数部分、gはnpの小数部分です。この場合、PCTLDEF=オプションはt番目のパーセント点yを次の表に記述したように定義します。
PCTLDEF |
説明 |
公式 |
---|---|---|
1 |
での重み付き平均 |
|
ここで、 はと解釈されます。 |
||
2 |
npに最も近い番号のオブザベーション |
|
3 |
経験分布関数 |
|
4 |
重み付き平均 |
|
(での) |
ここで、はと解釈されます。 |
|
5 |
平均化された経験分布関数 |
|
WEIGHTステートメントを使用する場合、パーセント点は異なる方法で計算されます。100p番目の重み付きパーセント点yは、平均化された経験分布関数から計算されます。
ここで、はに関連付けられた重みであり、は重みの合計です。
PCTLDEF=オプションは、WEIGHTステートメントが使用される場合は適用されません。ただし、この場合、重みがすべて同じであれば、重み付きパーセント点は、WEIGHTステートメントを使用せずにPCTLDEF=5で計算されるパーセント点と同じになります。
CIPCTLNORMALオプションを使用すると、データが正規分布であると仮定して、パーセント点の信頼限界を要求できます。 これらの限界については、Hahn and Meeker (1991)のセクション4.4.1で説明されています。の場合、番目のパーセント点の両側の信頼限界は次のようになります。
ここで、nは標本サイズです。の場合、番目のパーセント点の両側の信頼限界は次のようになります。
片側の信頼限界は、適切な前の式のをに置き換えて計算されます。因子は、非心t分布に関連し、Owen and Hua (1977)およびOdeh and Owen (1980)に説明されています。例4.10を参照してください。
CIPCTLDFオプションを使用すると、パーセント点の分布によらない信頼限界を要求できます。特に、データが正規分布であると仮定する必要がありません。これらの限界については、Hahn and Meeker (1991)のセクション5.2で説明されています。番目のパーセント点の両側の信頼限界は次のようになります。
ここで、は、データ値が昇順で並べ替えられている場合のj番目の順序統計量であり、次の式が成り立ちます。
下のランクlと上のランクuは、の前後で対称(またはほぼ対称)な整数です。ここで、はの整数部分であり、 nは標本サイズです。また、lとuは、次の包含確率要件を満たしながら、およびができるだけに近くなるように選択されます。
ここで、累積二項確率であり、次のように表されます。
特にnが小さく、pが0または1に近似している場合、包含要件を満たせないことがあります。対称性の要件を緩和するため、CIPCTLDF(TYPE = ASYMMETRIC)を指定することができます。このオプションは、包含要件を満たすことができる場合は対称限界を要求し、それ以外の場合は非対称限界を要求します。
CIPCTLDF(TYPE = LOWER)を指定すると、片側の下位信頼限界がとして計算されます。ここで、lは次の不等式を満たす最も大きい整数です。
も満たします。同様に、CIPCTLDF(TYPE = UPPER)を指定すると、片側の下位信頼限界がとして計算されます。ここで、uは次の不等式を満たす最も大きい整数です。
パーセント点の信頼限界は、WEIGHTステートメントが指定されている場合は計算されません。例4.10を参照してください。