分散(Variance)と標準偏差(Standard Deviation)はともに平均からのデータのバラツキを示すものだ。値が大きいほどバラツキも大きくなる。
分散は、平均と各データとの差(偏差)の2乗の和をデータの個数で割ったものである。
標準偏差は分散の平方根をとったものである。
分散を用いる際には平均と各データとの差を2乗しているのは、偏差には平均よりも大きいものや小さいものがあり、その合計は必ず0になってしう。その問題を回避するために2乗している。ただし分散では、データの元の単位をつけて用いることができないので、平方根をとったものが標準偏差になる。
説明するよりも下記サンプルを参照いただいたほうがわかりやすいと思わる。
下記表はある店舗の月別の売り上げを示したものである。(単位:千円)
方南町店 | 小岩店 | 橋本店 | ||||
売上 | 偏差 | 売上 | 偏差 | 売上 | 偏差 | |
---|---|---|---|---|---|---|
1月 | 12,000 | 1,375 | 8,700 | -500 | 9,700 | 1,825 |
2月 | 13,500 | 2,875 | 9,700 | 500 | 6,400 | -1,475 |
3月 | 7,200 | -3,425 | 9,900 | 700 | 5,400 | -2,475 |
4月 | 9,800 | -825 | 8,500 | -700 | 10,000 | 2,125 |
平均 | 10,625 | 9,200 | 7,875 | |||
分散 | 5,641,875 | 370,000 | 4,036,875 | |||
標準偏差 | 2,375 | 608 | 2,009 |
標準偏差の数値が高いほどバラツキが大きいということになる。
つまりバラツキが大きいものほど安定していないということができる。
ただし標準偏差では安定しているということだけがわかるので、売上も考慮する必要がある。
EXCELでそれぞれの関数は以下になる。
平均は関数の「AVERAGE」
分散は関数の「VARPA」
標準偏差は関数の「SQRT」
上記の表のEXCELはこちらからダウンロードできます。deviation.xls(14.5MB)