ツール(分析手法)に関する失敗例
ツールに関して、特に分析手法に関して述べます。
よくある失敗は分析手法の選択の誤りです。たとえば、何かを既存顧客に売りたいとして、売れる確率が1%くらいだったとします。売れるかどうかの二値を占うには決定木やロジスティック回帰が代表的な2つの分析手法ですが、この場合、後者の手法が好ましいのです。

理由は、稀な事象を占う場合、決定木は分析対象のデータに過適応してしまい(過去の稀な事象に過度に合わせてしまう)、将来を占う際に期待した結果が得られないことが多いのです。これは簡単な例でしたが、目的やデータの特性に応じて、選ぶべき分析手法が変わってくるのです。
また、ひとつの分析手法をすぐあきらめて他の手法に目移りした結果、結局何もものにならない、なんてこともあります。たとえば、自社の全国の店舗を売れ筋でグループ分けしたいとします。あるひとつのクラスタリング手法(例.K-MEANS)を選択し、4つくらいに分けてみたら、最大グループが全体の店舗の80%以上、他の3つが6%ずつ、なんて偏った結果になることがよくあります。
でも、結果が気に入らないからと言ってすぐ別な手法に目移りするのは間違いです。悪いのは手法でなく、それに与えるデータやパラメータ設定であることが多いのです。正しい手法を選び、あきらめずに試行錯誤してください。
コンサルタントやソフトウェアの選択に関する注意事項
説明が前後するのですが、コンサルタントやソフトウェアの選択に関して述べます。コンサルタントが実施することをもう少し詳述すると、アナリティクスと業務ニーズが交わるところを探し出す、取り組む課題に優先順位をつける、課題のアナリティクスによる解決を提示する、具体的には使うデータや適した手法、必要な時間、期待効果などの手ほどきをしてもらう、こんなところになります。これをアナリティクス初心者の方が全部ご自身で実施するのは困難で、時間的なロスが発生します。
皆様が普段お付き合いされているコンサルタントの方がこれらのことを本当にできるのか、また必要な分析手法をソフトウェアが機能として持っているか、この2つは必ずチェックしてください。
データに関する失敗例
よくある誤解は、アナリティクスの開始前にデータウェアハウス(DWH)を準備完了にする必要がある、と思いこんでしまうことです。
第4回で議論したように、アナリティクスではデータから変数を作成する、それもボツがたくさん出るような試行錯誤をすることを必要とします。その試行錯誤の過程でデータ要件を明確にして、DWHの設計仕様とするのがムダもなく最もスムーズです。逆に既存のDWHが存在すると、「アナリティクスを実施した結果、まったく使えないDWHであることがよく分かりました」なんて笑えない結果になりがちです。アナリティクス実施前にDWHの整備に時間を費やすのはムダが多く時間的にもったいないと思います。