データの真ん中って何? 平均値、中央値、最頻値
代表値とはデータの特徴を表す指標で、 一般的には平均値、中央値、最頻値といったデータの中心を表します。単に計算できるだけでなく、なぜこういう指標が使われるのか、理解した上で活用しましょう。
以下の例で出てきている「店舗別売上高」のExcelデータを使いたい方は、こちらからダウンロードください。
平均値の計算~AVERAGE関数~
最もなじみが深い計算方法です。データを全部足し合わせてデータの個数で割ったものです(相加平均とも呼ばれます)。Excelでは、AVERAGE関数を使います。例として架空のコンビニ店舗の売上高の平均を求めてみましょう。

適当なセルを選択し、=AVERAGE(売上高の範囲)を指定して、[Enter]キーを押します。
=77.85
売上高の平均値は、77.85(千円)となりました!
中央値の計算~MEDIAN関数~
平均値と同じように、データの中心位置を示す指標です。データを小さい順に並べたとき、ちょうど真ん中(中央)にくる値のことです。ExcelではMEDIAN関数を使います。
例えば、「2、4、5、7、10」の中央値は5です。データが偶数個の場合、「3、5、6、9、13、14」の中央値は、真ん中の2つの値を平均した (6+9)÷2の7.5となります。

適当なセルを選択し、=MEDIAN(売上高の範囲)を指定して、[Enter]キーを押します。
=73.0
売上高の中央値は73.0(千円)になります。
最頻値の計算~MODE関数~
平均値や中央値と同じく、データの中心位置を示す指標で、データの中で最も多く出現する数値のことです。ExcelではMODE関数を使います。

適当なセルを選択し、=MODE(売上高の範囲)を指定して、[Enter]キーを押します。
=64.0
売上高の最頻値は64.0(千円)になります。
ポイント
本稿では、最頻値を求める際に上記売上高の数量データに直接使いましたが、一般的には度数分布をとった上で使用します。その際、最も度数の多い値を最頻値とします。
例えば、4,6,8,8,8,9,9,10,11,13の場合、最頻値は最も度数の高い「8」になります。上記データでは、64.0(千円)が3回出てきており、そのまま使っても問題ありませんでした。
データを正確に区分することは重要です。例えば、身長のデータで考えてみましょう。そのまま最頻値を求めようとすると、小数点を無限大近くまで桁下げすることになり、誰1人同じ身長の人はいなくなります。結果、最頻値は求めることができなくなるわけです。