分散と標準偏差

分散(Variance)と標準偏差(Standard Deviation)はともに平均からのデータのバラツキを示すものだ。値が大きいほどバラツキも大きくなる。

分散は、平均と各データとの差(偏差)の2乗の和をデータの個数で割ったものである。

標準偏差は分散の平方根をとったものである。

分散を用いる際には平均と各データとの差を2乗しているのは、偏差には平均よりも大きいものや小さいものがあり、その合計は必ず0になってしう。その問題を回避するために2乗している。ただし分散では、データの元の単位をつけて用いることができないので、平方根をとったものが標準偏差になる。

説明するよりも下記サンプルを参照いただいたほうがわかりやすいと思わる。

下記表はある店舗の月別の売り上げを示したものである。(単位:千円)

方南町店 小岩店 橋本店
売上 偏差 売上 偏差 売上 偏差
1月 12,000 1,375 8,700 -500 9,700 1,825
2月 13,500 2,875 9,700 500 6,400 -1,475
3月 7,200 -3,425 9,900 700 5,400 -2,475
4月 9,800 -825 8,500 -700 10,000 2,125
平均 10,625 9,200 7,875
分散 5,641,875 370,000 4,036,875
標準偏差 2,375 608 2,009

標準偏差の数値が高いほどバラツキが大きいということになる。
つまりバラツキが大きいものほど安定していないということができる。
ただし標準偏差では安定しているということだけがわかるので、売上も考慮する必要がある。

EXCELでそれぞれの関数は以下になる。
平均は関数の「AVERAGE」
分散は関数の「VARPA」
標準偏差は関数の「SQRT」

上記の表のEXCELはこちらからダウンロードできます。deviation.xls(14.5MB)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください