エンゲージメントに影響を与える要因をモデル化
過去に蓄積された500近くのデータを集めて分析を行った。問い合わせ回数、保証の利用、登録状況、コールセンターへのコンタクト回数などの顧客インタラクションに加えて、過去の購買履歴、購買頻度や時期(Recency)、登録後の期間、購買に至ったチャネル、顧客満足度、店舗名、デモグラフィック情報など、既存の各種データが活用された。
これらの線形回帰分析を繰り返した結果、以下がエンゲージメント率に大きな影響を与えると分かったという。
- 最近購買した(リーセンシー)
- 製品登録を行った
- エンゲージしたチャネルの種類が多い
- 高価格帯の製品を購入した
- 年齢が高い
詳細な説明は無かったが、これらの要因の関係性を表す計算式を作り、最終的にはエンゲージメントに至る確率順に並べ替えられた顧客リストが作成された。
モデリングの結果 ― さらなる分析とターゲティングが可能に
顧客リストの作成後、それに基づいた「デシル分析」を行った。デシル分析とは、顧客リストを10等分して、グループごとの構成比を分析する手法だ。実験として全員を対象にメールを送付したところ、トップのグループは平均と比べて2.1倍、ボトムと比べると8倍と高い確率でエンゲージしたことが確かめられた。
モデリング無しでランダムにグルーピングすると、これらはすべて平均値になっていたところだ。過去の結果で並び替えるのは簡単だが、これは事前に結果を予測して並び替え、実際にその通りになった、という点が重要だ。
さらに、エンゲージメントスコアと購買率の相関についても検証を行ったところ、高い相関が見られた。エンゲージメントスコアで並べ替えてデシル分析したところ、最初のグループは平均値の5倍の確率で購買に至っている。
この2種類の検証にあたっては、実験のために全員を対象としたメールが送付されたが、実際のキャンペーンでは一部を対象としたターゲティングを行う。対象となる人数が減るため、予測モデルから別の切り口でリストを抽出し、多様なキャンペーンを実施することで、カバー率を高めることができるだろう。
エンゲージメントのスコアリングに使われたデータも紹介された。最初のグループ(1行目と4行目)の開封率とクリック率が顕著に高いことが分かるだろう。
継続的な改善が重要 ― アクセス解析の応用範囲は拡大している
最後に、今後の予定として次の3点を挙げ、セッションを締めくくった。
- 今回の予測モデルによる結果を、他のモデリングやセグメンテーションに基づく結果と比較検証する
- (十分な期間を経たら)モデリング結果のエンゲージメントスコアと実際の購買率との相関を調べる
- 今後のデータ増加に伴い、モデルを継続的に改善していく
さて、日本では広告の間接効果を把握するための手法として「アトリビューション」が位置付けられることが多いが、今回のイベント全体を通じて「アトリビューション」は手段の一つに過ぎず、各種ツールを活用しながらゴール達成につなげている点が印象的だった。
最後に筆者が重要と感じたポイントをいくつか紹介したい。
- 過去を理解するだけでなく将来の予測まで踏み込むことによって、データに基づく意思決定が可能になる
- 解析の最終目的は、売上増加などのビジネスゴールへの貢献である
- そのためには、データを適切に処理すること(回帰分析など)も必要になる
- 目的を明確にすれば、ツールや手法に振り回されたり、「なるほど」と自己満足で終わらない
- アクセス解析は、全体の平均やトレンド分析から個人にフォーカスしたCRM的な解析へと広がりつつある
- アクセス解析は、ダイレクトマーケティングやデータベースマーケティングなどノウハウが蓄積された他のマーケティング分野ともっと連携していく必要がある
