Pearsonの積率相関は、2変数の連関性のパラメトリックな統計量です。これは、線形関係の強度と方向の両者を測定します。ある変数X
が別の変数Y
の完全な線形関数である場合、相関が1ならば正の関係が存在し、相関が-1ならば負の関係が存在します。2変数間に線形の予測可能性が存在しない場合、相関は0になります。2変数が相関0で正規である場合、これらの2変数は独立です。ただし、因果関係が存在しない場合もあるため、相関は因果性を意味するものではありません。
2つのランダムな数値変数間の関係を表示する散布図を図2.4に示します。
上記の散布図は、変数Y1
とX1
間には正の関係が存在し、変数Y1
とX2
間には負の関係が存在すること、および変数Y2
とX1
間には明確な相関が存在しないことを示しています。また、上記の散布図は、Y2
がX2
に従属しているにもかかわらず、変数Y2
とX2
間には明確な相関が存在しないことも示しています。
母集団Pearson積率相関は次の式で表されます。
Pearson積率相関や重み付き積率相関などの標本相関は、母集団相関を推定します。標本Pearson積率相関は次の式で表されます。
ここで、はxの標本平均、はyの標本平均です。重み付きPearson積率相関は次の式で表されます。
ここで、 は重み、 はxの重み付き平均、 はyの重み付き平均です。