Pearsonの積率相関

Pearsonの積率相関は、2変数の連関性についてのパラメトリックな統計量です。これは、線形関係の強度と方向の両者を測定します。ある変数Xが別の変数Yの完全な線形関数である場合、相関が1ならば正の関係が存在し、相関が1ならば負の関係が存在します。2変数間に線形の予測可能性が存在しない場合、相関は0になります。2変数が相関0で正規である場合、これらの2変数は独立です。ただし、基盤となる因果関係が存在しない場合もあるため、相関は因果性を意味しません。

2つのランダムな数値変数間の関係を表示する散布図を図2.4に示します。

図2.4 2変数間の相関
2変数間の相関

上記の散布図は、変数Y1X1間には正の関係が存在し、変数Y1X2間には負の関係が存在すること、および変数Y2X1間には明確な相関が存在しないことを示しています。また、上記の散布図は、Y2X2に従属しているにもかかわらず、変数Y2X2間には明確な相関が存在しないことも示しています。

母集団Pearson積率相関は次の式で表されます。

     


Pearson積率相関や重み付き積率相関などの標本相関は、母集団相関を推定します。標本Pearson積率相関は次の式で表されます。

     

ここで、の標本平均、の標本平均です。重み付きPearson積率相関は次の式で表されます。

     

ここで、は重み、の重み付き平均、の重み付き平均です。

確率値

Pearson相関の確率値は次の式により計算されます。

     

ここでは、自由度がt分布に従います。は標本相関です。