相関係数とは?エクセルで相関係数を求める方法

2026-04-23
2024-12-04
相関係数とは?エクセルで相関係数を求める方法

「2つのデータに関係性があるかどうか、どうやって判断すればよいか分からない」
「Excelで相関係数を出したいが、どの関数を使えばよいか分からない」
「相関係数の数値が出たが、それが強い関係なのか弱い関係なのか判断できない」

データ分析において、このような悩みを抱えている方も少なくありません。

相関係数は、2つのデータ間の関係性の強さを数値で表す指標です。これを理解し活用できれば、売上と広告費の関係、気温とアイスの売上、勉強時間と成績など、様々なデータの関係性を客観的に把握できます。

本記事では、相関係数の基本から、Excelでの求め方、数値の解釈方法、散布図での視覚化、注意点まで、実務に役立つ情報をわかりやすく解説します。

※ こちらの音声は、Google NotebookLM によって AI が生成したものです。そのため、発音や内容が正確でない場合があります。

相関分析とは

相関分析とは

相関係数とは、2つのデータ間にどの程度の関係性があるかを数値で表す指標です。-1から1の範囲の値をとり、この数値によって関係性の強さと方向を判断できます。

相関係数でわかること

相関係数を使うと、以下のような分析ができます。

  • 広告費と売上に関係があるか
  • 気温とアイスの売上に関係があるか
  • 勉強時間とテストの点数に関係があるか
  • 身長と体重に関係があるか

これらの関係性を「なんとなく」ではなく、客観的な数値で把握できるのが相関係数の強みです。

相関分析と回帰分析の違い

相関分析と似た手法に「回帰分析」があります。両者の違いは以下の通りです。

相関分析:関係性の強さを知る

  • 2つのデータに関係があるかを調べる
  • 関係の強さを数値化する
  • 例:広告費と売上の関係性の強さを測定

回帰分析:一方から他方を予測する

  • 一方のデータから他方を予測する
  • 予測式を作成する
  • 例:広告費から売上を予測する式を作る

簡単にいえば、相関分析は「関係の有無と強さ」を調べ、回帰分析は「一方から他方を予測する」手法といえます。

相関関係と因果関係の違い

相関関係と因果関係の違い

相関分析を行う際、多くの人が「相関関係」と「因果関係」を混同しがちです。

  • 相関関係:二つのデータが互いに連動して変化することを指します。
    例えば、蚊に刺された件数とアイスクリーム売上には相関関係がありますが、直接の因果関係はありません。両方とも夏という季節が原因ですが、蚊に刺されたからアイスクリームを食べたり、アイスクリームを食べたから蚊に刺されたりすることはありません。
  • 因果関係とは、一方が原因となり他方に影響を及ぼす関係を指します。
    例えば、雨が降ったために地面が濡れるというのは、原因と結果が明確な因果関係です。

このように、相関関係が存在するからといって因果関係があるとは限らない点を理解することが重要です。

相関分析と回帰分析の違い

相関分析と混同されがちな「回帰分析」も、データ分析の重要な手法です。両者の違いを簡単に見てみましょう。

  • 相関分析:二つのデータ間の関連性を確認する手法です。
    因果関係までは特定せず、関連性が強いか弱いかを数値(相関係数)で示します。
  • 回帰分析:独立変数(説明変数)が従属変数(目的変数)にどのような影響を与えるかを分析します。さらに、一方のデータから他方を予測できるという特長があります。
    たとえば、「Y = aX + b」のような数式を使い、予測モデルを構築することが可能です。
    また、回帰分析は分析対象が二つの場合「単回帰分析」、複数の場合「重回帰分析」と呼ばれます。

相関分析が関連性を確認するための手法であるのに対し、回帰分析は予測や因果関係の強さを数値化するための手法です。

相関係数の種類と特徴

相関係数とは

2つの変数間の「相関関係の強さ」や「方向性」を数値で示す指標を相関係数と言います。この指標を活用することで、データ間の関連性を直感的に理解することが可能となります。特に「ピアソンの積率相関係数」は、最も一般的に使用される方法であり、変数同士の線形関係を評価する際に非常に有用です。

ピアソンの積率相関係数

相関係数には、関係性の方向によって3つの種類があります。

3種の相関

相関係数によって示される関係性は、主に以下の3つに分類されます:

正の相関
一方が増えるともう一方も増える関係です。

  • 身長が高いほど体重も重い
  • 勉強時間が長いほどテストの点数が高い
  • 広告費が多いほど売上が増える

相関係数は0から1の値をとり、1に近いほど強い正の相関があるといえます。

負の相関
一方が増えるともう一方が減る関係です。

  • 気温が高いほど暖房器具の売上が減る
  • 価格が高いほど購入者が減る
  • 運動量が多いほど体脂肪率が低い

相関係数は-1から0の値をとり、-1に近いほど強い負の相関があるといえます。

無相関
2つのデータに明確な関係性が見られない状態です。

  • 身長と数学のテストの点数
  • 靴のサイズと英語力
  • 誕生月と年収

相関係数は0に近い値をとり、関係性がほとんどないことを示します。

ピアソンの積率相関係数

ピアソンの積率相関係数は、変数間の線形関係を測定するための最も代表的な方法です。この指標は、-1から1の範囲をとり、値に応じて次のように解釈されます。

相関係数の値相関性
0.8~1.0 (正の値)強い正の相関
0.3~0.7 (正の値)中程度の正の相関
-0.2~0.2相関がほとんどない
-0.3~-0.7 (負の値)中程度の負の相関
-0.8~-1.0 (負の値)強い負の相関
ピアソンの積率相関係数

※注意点

  • 線形関係に限定: ピアソンの積率相関係数は、変数間の線形関係を測定します。非線形の関係が存在する場合、この指標は適切ではありません。
  • 外れ値の影響: データセットに外れ値が含まれると、相関係数が歪む可能性があります。
  • 因果関係の判断不可: 相関関係がある場合でも、それが因果関係を意味するわけではありません。

相関係数を求める方法

相関係数を求める方法

Excelでは、主に3つの方法で相関係数を求められます。

方法1:CORREL関数を使う(推奨)

CORREL関数は、最もシンプルで使いやすい方法です。

CORREL関数=(数値範囲1, 数値範囲2) 
CORREL関数
  • 配列1:1つ目のデータ範囲
  • 配列2:2つ目のデータ範囲

使用例: 「学習時間」と「テストの点数」の相関係数を求めてみましょう。

1.データを入力する
相関係数を算出したいデータを、それぞれ別の行に入力します。今回は「学習時間」を上の行、「テストの点数」を下の行に入力します。

CORREL関数を使う方法

2. 相関係数を表示させたいセルを選択し、関数を入力する
選択したセルに次のように入力します:
=CORREL(C2:I2, C3:I3)
「C2:I2」は「学習時間」のデータ範囲、「C3:I3」は「テストの点数」のデータ範囲を指定しています。

CORREL関数を使う方法

3.Enterキーを押す
結果として、0.95などの値が表示されます。この場合、英語と国語の点数には強い正の相関があるといえます。

CORREL関数を使う方法

方法2:PEARSON関数を使う方法

PEARSON関数は、CORREL関数と同じ結果を返します。どちらを使っても構いません。
基本的な使用方法はCORREL関数と同じですが、違いをあげるとすれば以下の3つが挙げられます。

  • 計算方法がいくつか異なる
  • 古いバージョンのエクセルとの互換性が高い
  • 統計用語として一般的
PEARSON関数=(数値範囲1, 数値範囲2) 
PEARSON関数

使用例: 「通勤距離」と「通勤満足度」の相関係数を求めてみましょう。

1.データを入力する
「通勤距離」のデータを上の行に、「通勤満足度」のデータを下の行に入力します。

PEARSON関数

2. 相関係数を表示させたいセルを選択し、関数を入力する
選択したセルに次のように入力します:
=PEARSON(C7:I7, C8:I8)
「C7:I7」は「通勤距離」のデータ範囲、「C8:I8」は「通勤満足度」のデータ範囲を指定しています。

PEARSON関数

3.Enterキーを押す
計算結果として、指定したセル「A16」に相関係数が表示されました。

PEARSON関数

散布図で相関関係を視覚的に確認する方法

相関係数は数値で関係性を示しますが、散布図を使うと視覚的に関係性を確認できます。

散布図の作成手順

  1. 分析したい2つのデータ範囲を選択
  2. 「挿入」タブ → 「散布図」をクリック
  3. 「散布図(マーカーのみ)」を選択

散布図が表示され、データの分布が視覚的に確認できます。

散布図から読み取れること

  • 右上がりの分布:正の相関
  • 右下がりの分布:負の相関
  • バラバラの分布:無相関

近似線(トレンドライン)の追加

散布図に近似線を追加すると、関係性がより明確になります。

手順

  1. 散布図上のデータ点を右クリック
  2. 「近似曲線の追加」を選択
  3. 「線形近似」を選択
  4. 「グラフに数式を表示する」にチェック(オプション)
  5. 「グラフにR-2乗値を表示する」にチェック(オプション)

近似線が追加され、データの傾向が一目で分かるようになります。

相関係数の注意点

相関係数を使う際には、いくつか注意すべき点があります。

1. 相関関係と因果関係の違い

重要:相関関係があっても、因果関係があるとは限りません。

相関関係:2つのデータに関係性がある
因果関係:一方が他方の原因になっている

例:アイスクリームの売上と水難事故の件数

この2つには正の相関があります(どちらも夏に増える)。しかし、「アイスクリームの売上が増えると水難事故が増える」という因果関係はありません。両者とも「気温」という共通の要因によって変動しているだけです。

このような見せかけの相関を「擬似相関」といいます。相関係数が高くても、必ずしも因果関係があるわけではないことを理解しておく必要があります。

2. 外れ値の影響

相関係数は、極端に大きい値や小さい値(外れ値)の影響を受けやすい特性があります。

例えば、ほとんどのデータが相関している場合でも、1つだけ極端に異なる値があると、相関係数が大きく変わってしまうことがあります。

対処法

  • 散布図で外れ値を視覚的に確認する
  • 外れ値の原因を調査する(入力ミス、特殊なケースなど)
  • 必要に応じて外れ値を除外して再計算する

3. サンプル数の影響

データの数(サンプル数)が少ないと、偶然の要因で相関係数が高くなる場合があります。

一般的には、サンプル数が30以上あることが望ましいとされています。サンプル数が少ない場合は、結果の解釈に注意が必要です。

4. 非線形の関係性

相関係数は、直線的な関係性の強さを測る指標です。曲線的な関係(例:放物線状の関係)は適切に捉えられません。

このような場合は、散布図で関係性の形を確認し、必要に応じて他の分析手法を検討することが重要です。

相関係数の活用シーン

相関係数の活用シーン

相関係数は、データ間の関係性を数値で表す指標として、多くの分野で幅広く活用されています。ただし、数値だけに頼るのではなく、データの背景や方向性を考慮して活用することが重要です。以下では、具体的な活用シーンを分野別に紹介します。

1. マーケティングでの活用

マーケティングでは、広告費売上、またはSNSエンゲージメント新規顧客数などの関係性を分析する際に相関係数が役立ちます。
例えば、広告キャンペーンの投資効果を測定し、次回の施策計画を立てるための根拠を得ることが可能です。

2. 教育分野の活用

教育現場では、生徒の学習時間テストの成績との相関を調べることで、成績向上のために有効な勉強時間や方法を導き出すことができます。
たとえば、「一定時間以上の学習を行うことで成績が向上する」などの結果を基に、学習指導の改善に役立てられます。

3. 健康管理での活用

健康分野では、運動時間健康診断の結果の相関を分析することで、生活習慣の改善ポイントを見つけることが可能です。
例えば、運動時間と体重変化、または運動量と血圧との関係性を明らかにすることで、個人の健康管理計画に反映させることができます。

4. 製造業での活用

製造業では、生産条件(例: 温度や湿度)と製品の品質との相関を分析することで、品質向上のための改善ポイントを見つけ出すことができます。
たとえば、「湿度が一定値以上になると不良率が増加する」などの傾向を把握し、製造プロセスの最適化に役立てることが可能です。

5. 経済分析での活用

経済分析では、消費者支出経済成長率の相関を調べることで、消費動向が経済全体に与える影響を分析できます。
この分析結果は経済予測や政策決定の指針となるので、消費の動向に合わせた戦略策定が可能になります。

まとめ

相関係数は、データ間の関係性を数値で示す指標として有用であり、マーケティングや教育、健康管理、製造業、経済分析など、さまざまな分野で幅広く活用されています。
ExcelのCORREL関数PEARSON関数を使うことで、簡単に相関係数を計算し、データの関係性の強さや方向性を把握できます。
相関係数は因果関係を示すものではないので、データの背景を考慮して活用することが重要です。相関係数を正しく理解し、他の分析と組み合わせることで、より効果的な意思決定が可能になります。

カテゴリー
コラム
タグ
ページトップへ