共分散の公式と求め方を2つ解説!図を使って考えてみよう!

入力した値の共分散を算出します。
値をカンマ(,)で区切って入力後に算出ボタンクリックしてください。

共分散は「Xの偏差×Yの偏差」の平均で表され、
sxy=1nΣ(xi – μx)(yi – μy)となる。

ここで、n : 入力データ数、xi,yi : 各データ値、μxy : x,yの平均値

入力データ数(n):
Xの平均点(μx):
Yの平均点(μy): より

共分散(sxy):

高校生

計算に困っていたので助かりました!

今回はデータの分散に関する悩みを解説します。

「共分散ってなんだっけ?」
「共分散の求め方が分からない」

高校生

共分散の求め方がよく分からなくて…

共分散とは「2組の対応するデータ間の関係を表す数値」です。

共分散の公式

\(x\)と\(y\)の共分散\(s_{xy}\)は次の公式で求める

\[\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\]

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

本記事では、共分散の意味や求め方について解説します。

分散が分かればすぐ理解できるのでしっかり理解しておきましょう!

シータ

気になる見出しをクリックして、
ぜひ最後までご覧ください。

▲スマホから数学の質問ができる
学習アプリ『Rakumon』

アプリをダウンロードする

24時間いつでもチャットで解決!

目次

共分散とは?

共分散とは「2組の対応するデータ間の関係を表す数値」です。

共分散とは?画像

⇒共分散を求めることで「2つのデータの関係性」を分析することができます。

共分散と似たもので「分散」というものがありましたが覚えていますか?

分散は1つのデータの散らばり度合いを表しますが、今回の「共分散」は2つのデータの関係を表します。

分散については別の記事で解説しています。

もっと詳しく

分散の求め方について解説しました

>分散とは?分散の公式と求め方を解説!

共分散の求め方

では共分散の求め方について解説していきますが、共分散には2つの求め方があります。

スムーズに共分散を求めるには、どちらの公式も頭に入れておく必要があります。

高校生

2つも公式覚えられるかな

シータ

たくさん問題を解いて慣れていこう!

共分散の公式①

共分散は「xの偏差×yの偏差」の平均で求めることができます。

偏差とは「データ値と平均値との差」を指します。
⇒詳しくは「偏差値の意味と求め方」で解説しています。

共分散の公式①

\(x\)と\(y\)の共分散\(s_{xy}\)は次の公式で求める

\[\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\]

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

文字では分かりづらいと思うので、具体例を見てみましょう。

共分散の例題

高校生5人が数学と英語のテストを受けました。

\(x\) :数学の点数 , \(y\) :英語の点数

5人の結果は以下のようになりました。

\((x,y)=(40,50)(50,60)(60,80)\)
\((70,60)(80,100)\)

この時の共分散を求めましょう。

与えられた情報を表にまとめました。

共分散の求め方

分散を求めるまでに3つのステップがあります。

共分散の求め方①

  • \(x, y\)の平均値を求める
  • それぞれの偏差を求める
  • 偏差の積の平均値を求める

step
1
\(x, y\)の平均値を求める

まずはそれぞれの平均値を求めましょう。

\(x, y\)の平均値を求めたものが以下の表です。

共分散の求め方

平均値の求め方はこちら

あわせて読みたい
平均値の求め方を解説!中央値との違いはズバリこれ! 入力した値の平均値を算出します。 値をカンマ(,)で区切って入力後に算出ボタンクリックしてください。 入力データ数: 合計: 平均値: 計算に困っていたので助かり...

step
2
それぞれの偏差を求める


平均値が求められたら、それぞれの偏差を求めます。

偏差の計算

偏差=(データ値)ー(平均値)

共分散の求め方

step
3
偏差の積の平均値を求める

最後にそれぞれの偏差を掛け合わせた平均を求めるとそれが共分散です。

共分散の求め方

共分散の公式②

共分散を求める公式はもう1つあります。

共分散の公式②

\(x\)と\(y\)の共分散\(s_{xy}\)は次の公式で求める

\[\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n x_i y_i – \overline{x} \overline{y}\]

すなわち

\[\displaystyle s_{xy}=\overline{xy}- \overline{x} \overline{y}\]

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

こちらの公式でも分散を求めてみましょう。

共分散の例題

高校生5人が数学と英語のテストを受けました。

\(x\) :数学の点数 , \(y\) :英語の点数

5人の結果は以下のようになりました。

\((x,y)=(40,50)(50,60)(60,80)\)
\((70,60)(80,100)\)

この時の共分散を求めましょう。

与えられた情報から表を作りました。

共分散の求め方

こちらの公式でも3つのステップがあります。

共分散の求め方②

  • \(x, y\)の平均値\(\overline{x}, \overline{y}\)を求める
  • \(xy\)の平均値\(\overline{xy}\)と\(\overline{x} \overline{y}\)を求める
  • \(\overline{xy}\)と\(\overline{x} \overline{y}\)の差を求める

step
1
\(x, y\)の平均値\(\overline{x}, \overline{y}\)を求める

5人の点数を元に数学と英語の平均値を求めます。

共分散の簡単な求め方

\(\overline{x}=60 , \overline{y}=70\)だと分かりました。

平均値の求め方が分からない人は「平均値の求め方を解説!」をご覧ください。

step
2
\(xy\)の平均値\(\overline{xy}\)と\(\overline{x} \overline{y}\)を求める

\begin{eqnarray}
\displaystyle \overline{xy}&=&\frac{2000+3000+4800+4200+8000}{5}\\
&=&4400
\end{eqnarray}

共分散の簡単な求め方

そして\(\overline{x} \overline{y}\)も求めます。

\[\overline{x} \overline{y}=60 \cdot 70 =4200\]

step
3
\(\overline{xy}\)と\(\overline{x} \overline{y}\)の差を求める

最後に\(\overline{xy}\)と\(\overline{x} \overline{y}\)の差を求めます。

\begin{eqnarray}
\displaystyle s_{xy}&=&\frac{1}{n} \sum_{i=0}^n x_i y_i – \overline{xy}\\
&=&\overline{xy}-\overline{x} \overline{y}\\
&=&4400 -4200\\
&=&200
\end{eqnarray}

となり、共分散は200と求めることができました。

高校生

共分散の求め方が2つあるなんて知らなかった

シータ

ぼくは公式②の求め方のほうが好きだよ

共分散の値と符号の意味

共分散の値が何を意味するのか解説します。

共分散の符号

共分散の値が大きい⇒xが大きい時、yも大きい
共分散が0⇒xとyの間に関係が見られない
共分散の値が小さい⇒xが大きい時、yは小さい

共分散の符号が正の時は相関の関係で、負の時は逆相関の関係が見られることを意味します。

共分散を表す記号

共分散は英語で「Covariance」というので、xとyの共分散をCov(x,y)と書きます。

また、\(σ_{xy}\)と書くこともあります。

共分散は「xの偏差×yの偏差」の平均でした。

平均値(期待値)を意味するEを用いて、

\(E[(x-\overline{x})(y-\overline{y})]\)

と表すこともあります。

共分散の注意点

共分散の注意点としては、扱っているデータの値が大きいと共分散の値も大きくなる点です。

共分散の値が大きいからといって2つのデータ間に強い相関の関係があるとは限りません。

(x,y)=(40,50)(50,60)(60,80)(70,60)(80,100)
⇒共分散 200(x,y)=(400,500)(500,600)(600,800)(700,600)(800,1000)
⇒共分散 20000

この注意点を解決してくれるのが相関係数です。

相関係数については「相関係数の意味と求め方」でまとめています。

あわせて読みたい
相関係数の意味と求め方を分かりやすく解説! 入力した値の相関係数を算出します。 値をカンマ(,)で区切って入力後に算出ボタンクリックしてください。 X: Y: 2変量データの相関関数 r は以下の公式で表される。 r...

共分散<練習問題>

共分散<練習問題>

共分散を使った練習問題に挑戦してみましょう。

共分散の練習問題

あるクラスで数学と国語のテストを行いました。

\(x\) :数学の点数 \(y\) :国語の点数

\[(x,y)=(30,40)(40,40)(50,70)\)
\((80,70)(100,80)\)

この共分散を求めよう。

共分散<練習問題>

では、共分散の練習問題に取り掛かっていきます。

簡単な流れ

  • \(x, y\)の平均値を求める
  • それぞれの偏差を求める
  • 偏差の積の平均値を求める
共分散<練習問題>

1.x,yの平均値を求める

共分散<練習問題>

2.それぞれの偏差を求める

共分散<練習問題>

3.偏差の積の平均値を求める

したがって、求める共分散は380である。

共分散の求め方 まとめ

今回は数Ⅰデータの分析のなかでも「共分散」について解説しました。

共分散のポイント

🔵共分散の公式①

共分散の公式①

\(x\)と\(y\)の共分散\(s_{xy}\)は次の公式で求める

\[\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\]

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

>>解説に戻る

🔵共分散の公式②

共分散の公式②

\(x\)と\(y\)の共分散\(s_{xy}\)は次の公式で求める

\[\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n x_i y_i – \overline{x} \overline{y}\]

すなわち

\[\displaystyle s_{xy}=\overline{xy}- \overline{x} \overline{y}\]

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

>>解説に戻る

共分散は「データの分析」のなかでも難しいほうです。

まずは解き方を覚えられるように問題集で繰り返し練習しましょう。

データの分析には重要な公式がたくさんあります。

分散相関係数についても別記事でまとめているので合わせてご覧ください。

他にもデータの分析に関する悩みがある方は「データの分析まとめ記事」をご覧ください。

あわせて読みたい
【数学Ⅰ】データの分析重要公式まとめ《完全攻略》 数学Ⅰの最後に学習するのが『データの分析』ですね。 今回はデータの分析に関するこんな悩みを解決します。 データの分析が苦手なので困っています… データの分析の重要...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

当サイトの運営者。
指導歴8年目の数学講師。大学1年生から塾講師バイトを始め、これまで300名以上を指導。オンライン家庭教師のご依頼・お申し込みは、こちらの公式アカウントから承っております。詳しいプロフィール

コメント

コメントする

目次