CORRプロシジャ

偏相関

サブセクション

偏相関は、2変数間の関係を他の変数による影響を補正した上で測定するものです。PARTIALステートメントで他の変数の影響を除外した後の2変数間のPearson偏相関は、これらの影響を除外する変数への回帰を引いた2変数の残差間のPearson相関に等しくなります。

$\mb{y} = ( y_1, y_2, \ldots , y_ v)$を相関変数の集合、$\mb{z} = ( z_1, z_2, \ldots , z_ p)$をコントロール変数の集合とします。$\mb{z}$を考慮した場合のi番目とj番目の$\mb{y}$変数の間の母集団Pearson編相関は、誤差$(y_ i-\mr{E}(y_ i))$$(y_ j-\mr{E}(y_ j))$間の相関になります。ここで、

\[  \mr{E}(y_ i) = {\alpha }_ i + \mb{z} {\bbeta }_ i \, \, \, \,  \, \,  \mr{and} \, \, \, \, \, \,  \mr{E}(y_ j) = {\alpha }_ j + \mb{z} {\bbeta }_ j  \]

上記の式はそれぞれ、コントロール変数$\mb{z}$が与えられた場合の、変数$y_ i$および$y_ j$の回帰モデルとなります。

指定のオブザベーションの例では、$\mb{z}$を考慮した場合の$y_ i$$y_ j$間の標本Pearson偏相関は、残差$y_ i - \hat{y_ i}$$y_ j - \hat{y_ j}$から導かれます。ここで、

\[  \hat{y}_ i = \hat{\alpha }_ i + \mb{z} \hat{\bbeta }_ i \, \, \, \,  \, \,  \mr{and} \, \, \, \, \, \,  \hat{y}_ j = \hat{\alpha }_ j + \mb{z} \hat{\bbeta }_ j  \]

は、$\mb{z}$を考慮した場合の$y_ i$および$y_ j$変数の回帰モデルを使用した当てはめ値です。

$\mb{z}$を考慮した場合の$\mb{y}$の偏修正済み平方和と交差積(CSSCP)は、残差$\mb{y}-\hat{\mb{y}}$の修正済み平方和と交差積になります。これらの修正済み偏差平方和積和を使用することで、偏共分散および偏相関を計算できます。

CORRプロシジャは、Cholesky分解アルゴリズムをCSSCP行列に適用することで、 偏修正済み平方和と交差積行列を導きます。Pearson偏相関の場合、$S$を、2変数$\mb{z}$および$\mb{y}$間の偏CSSCP行列とします。

\begin{eqnarray*}  \Strong{S} &  = &  \left[ \begin{array}{rrr} \Strong{S}_{zz} &  \Strong{S}_{zy} \\ \Strong{S}_{zy}’ &  \Strong{S}_{yy} \\ \end{array} \right] \end{eqnarray*}

CORRプロシジャは、変数影響を除外する変数$\mb{z}$に関連付けられている行に対してCholesky分解アルゴリズムを順番に適用することにより、$\mb{z}$で補正した後の$\mb{y}$の偏CSSCP行列である$S_{yy.z}$を計算します。

変数$\mb{z}$に関連付けられている各行に対してCholesky分解アルゴリズムを適用した後、CORRプロシジャは、$\mb{z}$に関連付けられているすべての大きい番号の対角要素をチェックし、特異性が存在するかどうかを調べます。変数は、対角要素のCholesky分解後の値が、その変数の元の修正済み平方和の$\varepsilon $倍よりも小さい値である場合は、特異と見なされます。特異性の基準$\varepsilon $を指定するには、SINGULAR=オプションを使用します。Pearson偏相関の場合、すでに影響が除外された変数からこの変数を予測する際に$R^2$$1-\varepsilon $を超えるならば、コントロール変数$\mb{z}$は特異であると見なされます。これが発生する場合、CORRプロシジャはその変数を分析から除外します。同様に、コントロール変数から変数を予測する際に$R^2$$1-\varepsilon $を超えるならば、その変数は特異であると見なされます。これが発生する場合、それに関連付けられている対角要素、および対応する行または列内にあるすべての大きい番号の要素はゼロに設定されます。

$\mb{z}$に関連付けられているすべての行に対してCholesky分解アルゴリズムを適用すると、その結果として次の形式を持つ行列が生成されます。

\begin{eqnarray*}  T = \left[ \begin{array}{rrr} \Strong{T}_{zz} &  \Strong{T}_{zy} \\ 0 &  \Strong{S}_{yy.z} \\ \end{array} \right] \end{eqnarray*}

ここで、$ T_{zz}$は、$T’_{zz}T_{zz} = S’_{zz}$$T’_{zz}T_{zy} = S’_{zy}$$S_{yy.z} = S_{yy}- T’_{zy} T_{zy}$である上三角行列です。

$S_{zz}$が正定値である場合、$T_{zy} = {T’_{zz}}^{-1} S’_{zy}$ および偏CSSCP行列$S_{yy.z}$は、次の式から導かれる行列と同じになります。

\[  S_{yy.z}= S_{yy}-S’_{zy} S’^{-1}_{zz}S_{zy}  \]

偏分散/共分散行列は、分散算出用の分母を使用して計算されます(VARDEF=オプション)。CORRプロシジャは、偏分散/共分散行列に対して標準Pearson相関公式を適用することにより、Pearson偏相関行列を計算します。

相関行列が正定値である場合、単一変数zで補正後の変数xy間の偏相関は、次に示す1次偏相関公式から導かれる相関と同じになります。

\[  r_{xy.z}=\frac{r_{xy}-r_{xz}r_{yz}}{\sqrt {(1-r^{2}_{xz})(1-r^{2}_{yz})}}  \]

ここで、$r_{xy}$$r_{xz}$$r_{yz}$は適切な相関です。

より高次の偏相関の公式は、上記の1次偏相関公式を単純に拡張したものです。たとえば、相関行列が正定値である場合、z_1およびz_2で補正したxおよびy間の偏相関は、次に示す2次偏相関公式と同じになります。

\[  r_{xy.z_1z_2} = \frac{r_{xy.z_1}-r_{xz_2.z_1}r_{yz_2.z_1}}{\sqrt {(1-r^2_{xz_2.z_1})(1-r^2_{yz_2.z_1})}}  \]

ここで、$r_{xy.z_1}$$r_{xz_2.z_1}$$r_{yz_2.z_1}$は、指定のz_1における変数xyz_2間の1次偏相関です。

Spearmanの偏順位相関およびKendallの偏Tau-b相関を計算する場合、CORRプロシジャは、Spearmanの順位相関行列およびKendallのTau-b相関行列に対してCholesky分解アルゴリズムを適用し、相関公式を使用します。すなわち、Spearmanの偏順位相関は、影響を除外した後の変数の順位にある、2変数の順位の線形回帰の残差間のPearson相関に等しくなります。このため、PARTIALステートメントでCORR=SPEARMANオプションを指定すると、2変数の順位の残差がプロットに表示されます。偏Tau-b相関の範囲は–1から1までです。ただし、この偏Tau-b相関の標本分布は不明となるため、確率値は提供されません。

確率値

PearsonおよびSpearmanの偏相関の確率値は次の式により計算されます。

\[  \frac{(n-k-2)^{1/2}r}{(1-r^{2})^{1/2}}  \]

これは、自由度が$(n-k-2)$t分布から導かれます。ここで、rは偏相関、kは影響を除外する変数の数です。