要因特定や予測に集計やグラフの分析だけでは足りない?
「データサイエンス」という言葉を耳にする機会は増えたものの、中身や実際に何を行っているかについては理解できていないというマーケターも多いのではないだろうか。本講演ではマーケティングにおける顧客分析での適切なアプローチや、KPI策定時に発生しがちな課題など、多くの企業で実際に起きているつまずきポイントの乗り越え方についてデータサイエンティストの目線で解説された。
まずデータ分析の立ち位置についてだ。データ活用を中心としたコンサルティングを提供しているインキュデータの栁下亮平氏は、多くの企業にとってデータ分析は欠かせないものの、うまく活用できていないケースが多いと語る。

データ分析と聞くと、“データを集計して作成した表やグラフから情報を読み解く”と考える人が多いかもしれない。だが、それだけでは解決が困難になる可能性があると栁下氏は指摘する。
「複数の集計やグラフから示唆を得ようとする場合、視点が広がりすぎて包括的な評価が難しいのです。また、何が真の要因か、将来どのように変化するかを人間が考察するには限界があるでしょう」(栁下氏)
このような状況で適用できる可能性が高いのが、統計モデルや機械学習モデルといった「モデル」を用いたアプローチだ。
マーケティングにおけるモデル活用例
一般的な集計・グラフ分析は先述の通り情報が広がりすぎてしまうことから、真の要因や、予測に対する打ち手を人間が判断しにくくなる傾向がある。また、良好な結果のみを抽出して辻褄合わせをするチェリーピッキングも生じやすい。
一方、モデル分析では、Webの行動ログやアンケート、天候、経済データ、競合情報など、多様なデータを包括的に統合して分析できる。
回帰分析モデルを例に説明しよう。まず結果に対する要因の影響度を定量的に評価する。たとえば、説明変数・特徴量(目的変数の原因)がどれほど目的変数(分析対象)に影響しているかを数値化することができる。目的変数(KGI:売り上げなど)に対する要因(KPI)を数値化できるとも言い換えられるだろう。そして、それらを基に将来の動向を予測することが可能だ。

マーケティング領域でよく活用されるのは、分類モデルだ。「購買見込み」や「高LTV顧客」の有無を判別するケースが多く、「購買見込み」や「スコアリング」といった文脈には二値分類のモデルがよく使われる。
具体的な活用シーンを見てみよう。まず要因分析で、説明変数の中からどれが購買行動に影響を与えているかを把握し、その影響の大小を比較することで「購入するユーザ」のプロファイルを作成できる。

このプロファイルはCRMなどに活用し、優良顧客の育成に役立てられる。そして、より購入する顧客を特定するべく予測し、広告媒体と連携したアプローチを行える。
栁下氏と同じくインキュデータでデータサイエンティストとして活躍する矢野 和人氏は、次のように語る。
「モデルは、説明変数(1stパーティデータや社外データなど)が多い場合に特に有用です。モデルを活用せずにひとつひとつの変数の傾向を個別に確認していくと、非常に時間を要してしまうでしょう」(矢野氏)
モデルを活用した顧客分析とKPI分析
続いて、両氏はモデルを活用した顧客分析とKPI分析について説明する。
マーケティング分野におけるKPI策定の一般的なアプローチとしては、集計やグラフによる分析やワークショップなどの議論ベースでKPIツリーを作成し、その後、ダッシュボードで観測する流れが多い。だが、KGIとKPIの関係性が定量化されていないとさまざまな課題が発生する可能性がある。
たとえば、KPIの複雑化だ。どのKPIがKGIに影響しているか関係性が見づらく、結果、どのKPIを優先的に改善すべきかの判断が困難になる。また、経験則に基づきKPIとKGIを設定すると、KPIの向上がKGIに確実に寄与するのか確信が持てない。関係性が定量化されていない場合、KPIをダッシュボードで追跡しても、KGI向上に本当に必要か不明なため、ダッシュボードが形骸化する。
これらの課題に対応するため、有効なのがモデルを活用した定量的なKPI選定のアプローチだ。インキュデータでは、次のステップで実施しているという。
ステップ1
KPIの洗い出し
担当者の知見や経験をもとにした、KGIへ寄与する要因の洗い出し
ステップ2
基礎分析
KPI候補の基礎分析を通じて、回帰分析モデルに加えることが妥当かの可否を分析
ステップ3
重要KPIの定量化と選定
回帰分析モデルを用いてKGIへの寄与度合いを定量化、各種施策へ連携
そして、上記モデルを構築するためには、適切に紐付けできるデータの準備が前提条件となる。矢野氏は企業がよく直面する課題として次の二つを挙げた。
1点目は必要なデータが入手困難であること。これは実際にデータベース内にデータが蓄積されていないケースや、他部署との連携・協力を得てデータを入手する必要があるケースなど、さまざまな状況が考えられる。
2点目は構築後のメンテナンス問題。構築後もビジネス環境は日々変化するため、データも随時更新していく必要がある。しかし、実際にはコストや人員の確保が必要となり、取り組むべき課題となっている。

これらの課題に対応することが、第一歩と言えるだろう。では、そもそも目的変数(KGI)の設定はどのように行えばよいのだろうか?一般的なアプローチとして次の三つの方法が挙げられる。
- 既存の顧客分析フレームワーク(RFM分析やセグメンテーション分析など)を活用し、ディスカッションを通じて定義を決定する方法
- 企業内で既に確立されている優良顧客の定義(例:月間購入金額が一定以上、特定の性別・年齢層など)を活用する方法
- 外部の第三者機関によるインタビュー調査を通じて優良顧客の特性を洗い出す方法
データ分析結果をアクションへ
KPIが選定できたら、重要なKPIを引き上げるために、誰でも簡単に意思決定ができ、アクションへつなげる分析の実施と、それを定常的にモニターできるダッシュボードの構築が重要だ。インキュデータでは次のステップを取っている。
ステップ1
モデルを活用した、KPIの重要度の分析と特定
ステップ2
特定された重要なKPIを引き上げるための具体的アクションポイントの設定
ステップ3
アクションポイントをダッシュボード化し、日々の進捗を追跡する仕組みを構築

ステップ2では専門的モデルではなく、誰でも一目で理解できるようなグラフや集計を用いた分析が有効だ。そして、アクションとダッシュボードの内容を連動させることで、組織全体の目線を集中させることができる。
さらにマーケティング分野では、ブランド力、顧客の購買力、購買意向など数値化しにくい要素=抽象度の高い要因がKGIに影響を与えているケースが多い。このような場合、共分散構造モデルが有効だ。
共分散構造分析では、観測変数(定量化可能なデータ)から潜在変数(ブランド力などの数値化困難な概念)を構成し、それらがKGIにどのように影響しているかをパス係数によって定量的に評価する。これにより、たとえば「顧客の購買力」が「優良顧客」に対して強い影響を与えているといった洞察を得ることができる。

VARモデルをプラスで活用する意味
ここまで説明してきた回帰分析をはじめとする従来の手法には、次の重要な限界が存在する。
第一に、回帰分析では因果関係の正確な把握が困難だ。たとえば、気温低下とおでんの売上増加、気温低下とコートの売上増加の間には相関関係が見られても、おでんの売上増加がコートの売上増加の原因とは言えない。
第二に、回帰分析は定点的な分析になりがちだ。特定期間のデータを収集してモデルを構築するため、時間の経過にともなう変化を考慮することが難しい。マーケティングデータは流行トレンドや季節性による変動が大きいため、この限界は重要な課題だ。
これらの課題を補完する手段として、時系列モデルの活用が推奨される。VAR(ブイエイアール)モデルは複数の時系列データ間の関連性を分析するための統計モデルであり、KPIとKGIの時系列的な関係性や影響の大きさ、妥当性を推定できる。
特にKPI選定においては、要因へのショックがKGIにどのように伝播するかを可視化するインパルス応答(関数)を用いることで、それぞれのKPI候補がKGIに与える影響の大きさと持続時間を比較可能だ。
たとえば、要因AとBが回帰分析で影響があるとわかった場合、インパルス応答(関数)により、要因Aのほうが長時間にわたって大きな効果をもたらすことが判明すれば、KPIとして要因Aを採用するという判断が可能になるだろう。

「結論として、マーケティングデータ分析では、まず担当者の知見や経験を基に要因を洗い出し、回帰分析モデルでKGIへの寄与度を算出することが基本アプローチです。しかし、知見や経験だけでは正確な関係性の特定は難しいため、VARモデルを併用して、回帰モデルで構築したKPIとKGIの関係性の妥当性を補完することが推奨されます」(矢野氏)
「膨大な情報」を「価値ある情報」へ
本講演で説明されたことは、次のようにまとめることができる。
マーケティングにおけるデータ分析の立ち位置
- データを情報に変え、意思決定に結びつけることで初めて価値を生む。
- 一般的な集計やグラフといった分析では解決が困難な課題がある。
- 課題解決や目的に応じた分析手法を選択する必要がある。
モデルを活用した顧客分析とKPI分析
- 経験則や定性的に洗い出した要因を統計モデルで定量化して、KGIとKPIの関係性を明確にすることで適切な情報に変換する。これにより、主観的な判断から客観的かつ明確な意思決定情報へと変換することが可能となる。
- 分析結果を実務に生かすためには、アウトプットを具体的な施策に落とし込み、その効果検証までを一連のプロセスとして捉える必要がある。
この内容が、皆さまのデータ分析と活用の知見を深める機会になれば幸いだ。