要因特定や予測に集計やグラフの分析だけでは足りない?
「データサイエンス」という言葉を耳にする機会は増えたものの、中身や実際に何を行っているかについては理解できていないというマーケターも多いのではないだろうか。本講演ではマーケティングにおける顧客分析での適切なアプローチや、KPI策定時に発生しがちな課題など、多くの企業で実際に起きているつまずきポイントの乗り越え方についてデータサイエンティストの目線で解説された。
まずデータ分析の立ち位置についてだ。データ活用を中心としたコンサルティングを提供しているインキュデータの栁下亮平氏は、多くの企業にとってデータ分析は欠かせないものの、うまく活用できていないケースが多いと語る。

データ分析と聞くと、“データを集計して作成した表やグラフから情報を読み解く”と考える人が多いかもしれない。だが、それだけでは解決が困難になる可能性があると栁下氏は指摘する。
「複数の集計やグラフから示唆を得ようとする場合、視点が広がりすぎて包括的な評価が難しいのです。また、何が真の要因か、将来どのように変化するかを人間が考察するには限界があるでしょう」(栁下氏)
このような状況で適用できる可能性が高いのが、統計モデルや機械学習モデルといった「モデル」を用いたアプローチだ。
マーケティングにおけるモデル活用例
一般的な集計・グラフ分析は先述の通り情報が広がりすぎてしまうことから、真の要因や、予測に対する打ち手を人間が判断しにくくなる傾向がある。また、良好な結果のみを抽出して辻褄合わせをするチェリーピッキングも生じやすい。
一方、モデル分析では、Webの行動ログやアンケート、天候、経済データ、競合情報など、多様なデータを包括的に統合して分析できる。
回帰分析モデルを例に説明しよう。まず結果に対する要因の影響度を定量的に評価する。たとえば、説明変数・特徴量(目的変数の原因)がどれほど目的変数(分析対象)に影響しているかを数値化することができる。目的変数(KGI:売り上げなど)に対する要因(KPI)を数値化できるとも言い換えられるだろう。そして、それらを基に将来の動向を予測することが可能だ。

マーケティング領域でよく活用されるのは、分類モデルだ。「購買見込み」や「高LTV顧客」の有無を判別するケースが多く、「購買見込み」や「スコアリング」といった文脈には二値分類のモデルがよく使われる。
具体的な活用シーンを見てみよう。まず要因分析で、説明変数の中からどれが購買行動に影響を与えているかを把握し、その影響の大小を比較することで「購入するユーザ」のプロファイルを作成できる。

このプロファイルはCRMなどに活用し、優良顧客の育成に役立てられる。そして、より購入する顧客を特定するべく予測し、広告媒体と連携したアプローチを行える。
栁下氏と同じくインキュデータでデータサイエンティストとして活躍する矢野 和人氏は、次のように語る。
「モデルは、説明変数(1stパーティデータや社外データなど)が多い場合に特に有用です。モデルを活用せずにひとつひとつの変数の傾向を個別に確認していくと、非常に時間を要してしまうでしょう」(矢野氏)