クロス集計と差分を使って3つ以上のデータを比較する
こちらの記事では、引き算とソートを使った“比較”と“データの読み方”のお話をしましたが、比較するものが男vs女の2者だったので単純に引き算とソートで済みました。今回は、年代毎(4グループ)に成績の良かった広告を、クロス集計と差分を使って分析してみます。
さて、3つ以上の場合の比較で、最も簡単な方法は、“全体”と比較させる方法です。さっそくやってみましょう。下表は各広告からの売上(ROAS)をクロス集計(Excelのピボット集計)で年代別の平均を集計したものです。2列目には全体平均を表示しています。
各年代ごとに、単純にソートをかけるだけでも、ある程度の傾向がつかめるとは思いますが、もともとの広告出稿量などに差がある場合などは、“差分”などの処理をすることでより分かりやすいデータに変換できます。まずは、各年代と全体平均の差を計算する列をそれぞれに追加(赤字)します。
「差_20代」の列は、20代の数値と全体平均との差、「差_30代」は30代の数値と全体平均との差を引き算で求めているだけです。差の列は、書式設定で、+、-を表示させると分かりやすいでしょう。
次に、年代ごとに区切り、見出しとしての広告名の列を追加(赤字)し、各年代ごとに、「差」の列で降順ソートします。
これで、各年代に反応の良い広告が高い順に並んでいることになります。せっかくなのでもうちょっと分かりやすくするために、グラフにしましょう。
バーが右に伸びているほど、その年代に特徴的に効果があったもので、左に伸びているほど、効果がマイナスだったものと、一目で分かるグラフができました。ターゲットが30代ならば、「広告2、9は外せない。広告1、19、10、18、15は必要に応じて使おう」なんてことがここから分かるわけです。
また他にも、ここから読み取れることとしては
- 20代は広告4が突出して効果をあげている
- 30代に効果の高い、広告2、9は20代ではワースト1、2になっている
- 50代ではトップ3(広告1、6、20)が拮抗している
などです。後は商材の特性と表現素材などから、なぜそうなったのか、次に何をすべきかを考えてみましょう。