ビジネスにおいて変数間の関係性を調べる機会は多々ある。たとえば、店舗面積とひと月あたりの売上高の関係性や駐車場の大きさとひと月あたりの売上高の関係性などがそれにあたる。他にも自動車購入者の個人年収が高くなるほど購買単価も高くなるなるのではないかと仮説を証明したい時などがある。さきほどのたとえでは店舗面積と駐車場のどちらを大きくしたほうが売上高があがる可能性が高いかを調べたいというときなど多々あるはずだ。
散布図は変数間の関係を視覚的に把握するもの
相関係数はその程度を数値として算出したもの
たとえば、あなたが新店舗を出店すると計画しているが、店舗面積を大きくしたほうがいいか、駐車場を大きくしたほうがいいか迷っているとする。
手元には以下の資料がある。
- 1ヶ月の売上高
- 店舗面積
- 駐車場面積
売上高 (百万) |
店舗面積 (平方メートル) |
駐車場面積 (平方メートル) |
|
店舗01 | 32 | 970 | 420 |
店舗02 | 20 | 680 | 500 |
店舗03 | 16 | 530 | 460 |
店舗04 | 31 | 880 | 250 |
店舗05 | 28 | 740 | 330 |
店舗06 | 29 | 640 | 400 |
店舗07 | 26 | 500 | 260 |
店舗08 | 20 | 480 | 310 |
店舗09 | 26 | 670 | 400 |
店舗10 | 24 | 620 | 200 |
店舗11 | 25 | 630 | 300 |
店舗12 | 28 | 770 | 480 |
店舗13 | 32 | 860 | 490 |
店舗14 | 28 | 560 | 500 |
店舗15 | 30 | 760 | 320 |
店舗16 | 22 | 570 | 170 |
店舗17 | 31 | 800 | 490 |
店舗18 | 30 | 810 | 510 |
店舗19 | 29 | 760 | 500 |
店舗20 | 34 | 910 | 360 |
店舗面積と駐車場面積のどちらかを選ばねばならない時、この両方と売上高との関係性を知る必要がある。
相関図が右上がりだと正の相関関係になる。例えば店舗面積を上げたときに売上高も増える関係になる。
逆に相関図が右下がりだと負の相関関係になる。例えば製品価格を上げたときに販売数量が下がるという関係になる。
相関図が右上がり、右下がりどちらともいえず分散している場合は無相関になる。その場合、2つのデータは関係性が弱いということになる。
正の相関関係、負の相関関係どちらとも、2つのデータ間の関係性が強いほど、1つの直線を描くようになる。
まずEXCELにて散布図を作成する。散布図は挿入>グラフ>散布図で作成できる。
ではそれぞれの散布図を確認してみると、売上高と店舗面積には正の相関関係がありそうだ。一方、売上高と駐車場面積には、関連性がないように見える。
次にこれを主観ではなく、客観的に判断できる数値で関係性を明らかにする。つまり相関係数を算出する。
またまたEXCELにて相関係数を算出するには、ツール>分析ツール>相関でデータの範囲を指定して作成できる。
※項目名を選択しているときは、先頭行をラベルとして使用にチェックを入れる。すると下のようなデータが算出される。
相関係数の目安は以下のとおりである。
- 0~0.2:ほとんど関係なし
- 0.2~0.4:やや関係あり
- 0.4~0.7:かなり関係あり
- 0.7~1.0:強い関係あり
相関係数をみると、売上高と店舗面積の関係性が強いことがわかる。
逆に、売上高と駐車場面積はほとんど関係がないことがわかる。
上記の相関係数のEXCELはこちらからダウンロードできます。correlation.xls(20.5MB)