統計の世界で扱うデータの特性には、大きく2種類あります。数えられるもの(数量データ)と数えられないもの(カテゴリーデータ)です。データの特性によって、使える分析手法が変わってきますので、しっかり頭に入れておいてください。
また、変数の数が増えると、分析する目的や内容が変わってきます。この点についても大まかに解説します。
「数量データ」「カテゴリーデータ」を覚えよう
次の表は、あるコンビニで調査したアイスコーヒーの嗜好調査です。ここには、大きく2種類のデータ「数量データ」「カテゴリーデータ」があります。
売上高や平均気温など、1つひとつの測定された項目のことを「変数」と呼びます。変数は、統計学の学問上では、変数の特性に着目して「名義尺度」「順序尺度」「間隔尺度」「比例尺度」など細かく分類できるのですが、入門段階では、まずはデータが「数えられるデータ」か「数えられないデータ」かの2種類あることを理解すれば問題ありません。数えられるデータを「数量データ」、数えられないデータを「カテゴリーデータ」といいます。
数量データは、単位(個、円、kg、cm)を持つため、データ間の大小関係を比べることができます。
一方、カテゴリーデータは、Excelに取り込んでデータ分析を行っても、文字データのままでは計算できません。そこで「男性は1、女性は2」などと数値化して扱います。一般にカテゴリーデータは、数値化しても分類の意味しかありません。男性1と女性2の平均をとって1.5とすることは当然ながら意味がないのです。
ただし、カテゴリーデータでも、変数「競合商品Aと比べて」に対して、「かなり好き5点、やや好き4点、どちらもともいえない3点、やや嫌い2点、かなり嫌い1点」といったようにデータを得点化することで、数量データとして扱うことができます。この場合、平均を計算することにも意味がでてきます。
数えられないデータを数値化してアンケートなどで使う場合、回答する項目間が均等になるように注意しましょう。「かなり好き」と「やや好き」の間の1点差が、「やや好き」と「どちらともいえない」の差と同じくらいだという意識の間隔がないと、判断を誤るリスクがあります。
カテゴリーデータを解析する場合、数値そのものは大小関係を持ちません。このため、「好き」「嫌い」と回答した人の度数、または割合(比率)に注目して解析を行います。
まとめ
データの種類 | 測定 | 単位 | 大小比較 | どこに注目するか |
---|---|---|---|---|
数量データ | 可能 | あり | 可能 | 平均値、分散、標準偏差等 |
カテゴリーデータ | 不可* | なし | 不可* | 度数、比率 |
カンに頼らない! 2015年8月26日「Excel徹底活用!アンケート設計と分析」講座開催
Webの記事を読むのもいいけれど、リアル末吉正成さんに会って直接講義を受けませんか?
「プッシュ型リサーチの代表「アンケート」を効果的に活用するために必須の、ビジネス統計を学びます。論理的なアンケート設計、マーケティングに必須の統計の知識、Excelを使ったデータ分析の三本柱を身につければ、あなたも明日からデータに強いマーケターになれるはず!