平均、メディアン、モード
カテゴリ:確率・統計学

統計でよく出てくる値に平均、メディアンがあります。
これらの統計量について解説していきます。
平均とメディアン
今回も前回と引き続き、ある組織の身長について考えます。
以下のように、10人の組織の身長のデータがあったとします。
番号 | 身長[cm] |
1 | 170 |
2 | 160 |
3 | 161 |
4 | 160 |
5 | 179 |
6 | 163 |
7 | 174 |
8 | 175 |
9 | 172 |
10 | 164 |
この組織において、自分は背が高いのかどうかを知りたいとします。そのときに使用する方法としては、平均を計算して比べる方法があります。
平均とは、すべての人の身長を足して、人の総数で割った値です。今回の場合は
平均=(170+160+161+160+179+163+174+175+172+164)/10
となります。これを計算すると
167.8cm
が得られます。よって、167.8cmより身長が高ければ背が高いということができますね。
平均についてまとめると以下のようになります。
このデータ
があるときの平均値は
となります。
平均値ではなくて、中間の値で背が高いかどうかを定義することもできます。たとえば、先ほどの身長の表を小さい順に並べると
番号 | 身長[cm] |
2 | 160 |
4 | 160 |
3 | 161 |
6 | 163 |
10 | 164 |
1 | 170 |
9 | 172 |
7 | 174 |
8 | 175 |
5 | 169 |
となります。
この場合、2,4,5,6,10の人を背が低い、1,9,7,8,5の人を背が高いということができます。そして、中央値である170cmをメディアンといいます。
もちろん、164も中央値ですが、慣習から高いほうをとるようにしています。
平均値とメディアンは今回のようにおおよそ近い値になります。
しかし、場合によっては大きく異なる場合があるので注意しましょう。
とくに以下の性質は押さえておきましょう。
平均値では異常に大きい値があるとその値へ引きずられるが、メディアンでは問題ない
という性質です。異常値の影響を避けたい場合はメディアンを使うようにしましょう。
モード(最頻値)
最後にモードについて説明します。
モードとはヒストグラムを描いた際の最大度数の値をいいます。
例えば、人口の例でいえば、グラフは次のようになっているので、
(総務省のホームページ「http://www.stat.go.jp/data/kokusei/2010/kouhou/useful/u01_z19.htm」より)
最頻値は男女ともに62歳となります。
著者:安井 真人(やすい まさと)
@yasui_masatoさんをフォロー