散布図と相関

ビジネスにおいて変数間の関係性を調べる機会は多々ある。たとえば、店舗面積とひと月あたりの売上高の関係性や駐車場の大きさとひと月あたりの売上高の関係性などがそれにあたる。他にも自動車購入者の個人年収が高くなるほど購買単価も高くなるなるのではないかと仮説を証明したい時などがある。さきほどのたとえでは店舗面積と駐車場のどちらを大きくしたほうが売上高があがる可能性が高いかを調べたいというときなど多々あるはずだ。

散布図は変数間の関係を視覚的に把握するもの
相関係数はその程度を数値として算出したもの

たとえば、あなたが新店舗を出店すると計画しているが、店舗面積を大きくしたほうがいいか、駐車場を大きくしたほうがいいか迷っているとする。
手元には以下の資料がある。

  • 1ヶ月の売上高
  • 店舗面積
  • 駐車場面積
売上高
(百万)
店舗面積
(平方メートル)
駐車場面積
(平方メートル)
店舗01 32 970 420
店舗02 20 680 500
店舗03 16 530 460
店舗04 31 880 250
店舗05 28 740 330
店舗06 29 640 400
店舗07 26 500 260
店舗08 20 480 310
店舗09 26 670 400
店舗10 24 620 200
店舗11 25 630 300
店舗12 28 770 480
店舗13 32 860 490
店舗14 28 560 500
店舗15 30 760 320
店舗16 22 570 170
店舗17 31 800 490
店舗18 30 810 510
店舗19 29 760 500
店舗20 34 910 360

店舗面積と駐車場面積のどちらかを選ばねばならない時、この両方と売上高との関係性を知る必要がある。

相関図が右上がりだと正の相関関係になる。例えば店舗面積を上げたときに売上高も増える関係になる。
逆に相関図が右下がりだと負の相関関係になる。例えば製品価格を上げたときに販売数量が下がるという関係になる。
相関図が右上がり、右下がりどちらともいえず分散している場合は無相関になる。その場合、2つのデータは関係性が弱いということになる。

正の相関関係、負の相関関係どちらとも、2つのデータ間の関係性が強いほど、1つの直線を描くようになる。

まずEXCELにて散布図を作成する。散布図は挿入グラフ散布図で作成できる。
ではそれぞれの散布図を確認してみると、売上高と店舗面積には正の相関関係がありそうだ。一方、売上高と駐車場面積には、関連性がないように見える。

correlation01.jpg
correlation02.jpg

次にこれを主観ではなく、客観的に判断できる数値で関係性を明らかにする。つまり相関係数を算出する。
またまたEXCELにて相関係数を算出するには、ツール分析ツール相関でデータの範囲を指定して作成できる。
※項目名を選択しているときは、先頭行をラベルとして使用にチェックを入れる。すると下のようなデータが算出される。

correlation03.jpg

相関係数の目安は以下のとおりである。

  • 0~0.2:ほとんど関係なし
  • 0.2~0.4:やや関係あり
  • 0.4~0.7:かなり関係あり
  • 0.7~1.0:強い関係あり

相関係数をみると、売上高と店舗面積の関係性が強いことがわかる。
逆に、売上高と駐車場面積はほとんど関係がないことがわかる。

上記の相関係数のEXCELはこちらからダウンロードできます。correlation.xls(20.5MB)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください