Polyserialの相関係数

Polyserialの相関は、1つの変数が直接観測可能でもう1つの変数が観測不能である場合に、2変量正規分布を使用して2つの連続変数の相関を測定します。観測不能変数に関する情報は、観測不能変数の値を離散的な順序値の有限集合へと分類することにより導かれる1つの観測順序変数を通じて取得します(Olsson, Drasgow, and Dorans 1982)。

Xを平均がで分散がの正規分布の観測連続変数、Yを観測不能連続変数、 XYの間のPearson相関とします。また、観測順序変数Dは、次の方法によりYから導かれるものと仮定します。

     

ここで、は観測された順序値であり、は不明な順序しきい値です。

個のオブザベーションの標本から結合分布(X, D)を得るための最尤関数は次の式で表されます。

     

ここで、は、平均がで標準偏差がである正機密度関数(Drasgow 1986)です。

におけるYの条件付き分布は、平均がで分散がの正規分布になります。ここで、は標準正規変量です。一般性を失うことなく、変数Yは標準正規分布を持つと仮定します。その場合、D番目の順序値でならば、結果として得られる密度は次のようになります。

     

ここで、は累積正規分布関数です。

Cox (1972)は、パラメータ、および, ..., のすべてに関する最尤推定値を導出しています。およびに関する最尤推定値は明示的に導出できます。に関する最尤推定値は標本平均となり、に関する最尤推定値は標本分散となります。

     

残りのパラメータ(Polyserial相関およびしきい値, ..., を含む)に関する最尤推定値を計算するには、Cox (1972)により示された反復手順を使用します。に関する最尤推定値の漸近標準誤差は、本手順の後に計算できます。

パラメータのベクトルとして、情報行列はHessian行列(対数尤度に関する第2次導関数の行列)の負定値となります。この行列は、これらのパラメータに関する最尤推定値の計算に使用されます。CORRプロシジャは、観測された情報行列(現在のパラメータ推定値で評価された情報行列)を使用して計算を行います。最尤推定値の導出後、これらのパラメータ推定値の漸近共分散行列が、観測された情報行列(最尤推定値で評価された情報行列)の逆行列として計算されます。

確率値

CORRプロシジャは、Polyserial相関がゼロであるかどうかを判定するために、Wald検定と尤度比(LR)検定という2種類の検定を計算します。

Polyserial相関の最尤推定値がで、漸近標準誤差がである場合、Waldカイ2乗検定統計量は次の式で計算されます。

     

Wald統計量は、自由度が1の漸近カイ2乗分布を持ちます。

LR検定の場合、Polyserial相関がゼロであると仮定する最尤関数も必要となります。である場合、この尤度関数は次のようにまとめられます。

     

この場合、すべてのパラメータに関する最尤推定値を明示的に導出できます。に関する最尤推定値は標本平均となり、に関する最尤推定値は標本分散となります。

     

また、しきい値()の最尤推定値は次の式で表されます。

     

ここで、は順序変数番目の順序グループにおけるオブザベーション数であり、はオブザベーションの総数です。

LR検定統計量は次のように計算されます。

     

ここで、はすべてのパラメータに関する最尤推定値を使用する尤度関数であり、は、ゼロに設定されるPolyserial相関を除くすべてのパラメータに関する最尤推定値を使用する尤度関数です。LR統計量も、自由度が1の漸近カイ2乗分布を持ちます。