ビッグデータが「将来予測」に与えるインパクト

この連載のタイトルにもある「ビッグデータ」が、将来予測にもたらすメリットはどんなことでしょうか。ここではビッグデータを「大量かつ多種(Volume、Variety)なデータに対して高速(Velocity)な処理が施せるようになったテクノロジー」と定義して、話を進めていきます。
ビッグデータは、前述の2つの将来予測アプローチのうち「統計モデルによる予測」に大きなメリットをもたらします。端的に言うと「将来予測がより当たる統計モデルが作れるようになる」ということなのですが、具体的には以下の3つのメリットがあります。
- データが持つ情報量を落とすことなくモデリングできる
- より高度な分析手法が使え、情報をより活かせるようになる
- モデリング時に試行錯誤できる回数が増える
統計モデリングでは、データの量や手法の複雑さに応じて計算量が急激に増大します。そのため手元にあるデータが大量な場合、従来は「データ量を減らす」か「手法を簡素にする」必要がありました。
データ量を減らすとデータが持つ情報の一部を捨てることになりますし、手法を簡素にすると、データが潜在的に持っているせっかくの情報を活かしきれないことになります。その結果、予測精度が落ちてしまいます。
一方、ビッグデータの活用でこれらを回避することができます。またコンピュータの計算速度の向上により、モデリング時の試行錯誤の回数を増すことができ、今まで以上に予測精度の高いモデルを構築できることが期待できます。
ケーススタディ:サイト集客予算配分の効率化
私たちが、統計モデリング(統計分析)を将来予測に活用している実例をご紹介します。
広告宣伝費を「効率的に」削減したい
リクルートグループの某サービスでは、サイトへの誘導のために、オンライン・オフラインでの広告活動を行っています。その費用は年間で数億円単位となり、ビジネス全体へのインパクトも大きい投資となっています。これを効率化し広告宣伝費の削減を行いたい、という課題がありました。
どこにいくら投資するのがよい?
広告は大きく「クリエイティブ」と「媒体」という要素に分けられます。それぞれもさらに細かく分かれますが、ここでは媒体に着目し「どの媒体にいくら投資すればよいか」を考えることにしました。
媒体の粒度もいろいろありますが、ここでは大枠の投資配分への知見を得るために、バナー広告、リスティング広告、マス広告など、粒の大きな単位での分析を行いました。これらの将来のコスト配分を見直すことで、広告宣伝費の投資効率改善を図ることを目指します。
CTR、CPAだけで投資判断をすべきではない
広告宣伝費を各媒体に配分する際、従来は、CTR(コスト・パー・クリック/1クリック当たり広告宣伝費)やCPA(コスト・パー・アクション/1アクション当たり広告宣伝費)といった指標を基準に配分していました。
広告宣伝費を各媒体に配分する際、従来は、CPC(コスト・パー・クリック/1クリック当たり広告宣伝費)やCPA(コスト・パー・アクション/1アクション当たり広告宣伝費)を使っていました。「CPAの低い施策に重点的に投資しよう」などが典型的なアプローチになります。しかしこの方法は、不十分・不正確なのでは、という指摘が以前からありました。具体的には、
- CPAが低いからと言ってそこだけに投資してもよいのか? (コストを増やしても同じCPAが期待できるのか?)
- 景気や季節性の影響を受けていないのか?
- サイト改変の影響を受けていないのか?
- サイト上のコンテンツの影響を受けていないのか?
- 他の集客施策と同時に行われていることによる効果(相乗効果)はないのか?
- そのとき、たまたまその値になっているだけではないのか?
- コスト効果が来期まで残ることもあるのではないか?(ストック効果)
- 将来もその値であると言えるのか?
このように、疑問の声がたくさんあったのです。そこで分析にあたっては、これらも検証できるようにモデルの設計を行い、各施策における広告投資の「正味」の効果を探っていきました。また将来予測の精度向上を目指して、将来のトレンドを予測できるような要素もモデルのなかに組み込むことにしました。このモデルを利用して広告宣伝費の投資配分を決めることで、現状よりも効率のよい投資ができるようになることが期待されました。