平均、メディアン、モード

u01_z19

統計でよく出てくる値に平均、メディアンがあります。

これらの統計量について解説していきます。

平均とメディアン

今回も前回と引き続き、ある組織の身長について考えます。

以下のように、10人の組織の身長のデータがあったとします。

番号 身長[cm]
1 170
2 160
3 161
4 160
5 179
6 163
7 174
8 175
9 172
10 164

 

この組織において、自分は背が高いのかどうかを知りたいとします。そのときに使用する方法としては、平均を計算して比べる方法があります。

平均とは、すべての人の身長を足して、人の総数で割った値です。今回の場合は

平均=(170+160+161+160+179+163+174+175+172+164)/10

となります。これを計算すると

167.8cm

が得られます。よって、167.8cmより身長が高ければ背が高いということができますね。

 

平均についてまとめると以下のようになります。

Nこのデータd_{1},d_{2},\cdots,d_{N}があるときの平均値は

 d_{average}=\left(d_{1}+d_{2}+\cdots+d_{N}\right)/N

となります。

 

平均値ではなくて、中間の値で背が高いかどうかを定義することもできます。たとえば、先ほどの身長の表を小さい順に並べると

番号 身長[cm]
2 160
4 160
3 161
6 163
10 164
1 170
9 172
7 174
8 175
5 169

となります。

この場合、2,4,5,6,10の人を背が低い、1,9,7,8,5の人を背が高いということができます。そして、中央値である170cmをメディアンといいます。

もちろん、164も中央値ですが、慣習から高いほうをとるようにしています。

 

平均値とメディアンは今回のようにおおよそ近い値になります。

しかし、場合によっては大きく異なる場合があるので注意しましょう。

とくに以下の性質は押さえておきましょう。

平均値では異常に大きい値があるとその値へ引きずられるが、メディアンでは問題ない

という性質です。異常値の影響を避けたい場合はメディアンを使うようにしましょう。

モード(最頻値)

最後にモードについて説明します。

モードとはヒストグラムを描いた際の最大度数の値をいいます。

例えば、人口の例でいえば、グラフは次のようになっているので、

u01_z19

(総務省のホームページ「http://www.stat.go.jp/data/kokusei/2010/kouhou/useful/u01_z19.htm」より)

最頻値は男女ともに62歳となります。

著者:安井 真人(やすい まさと)