ソーシャル・アナリティクスを、いかにリアルな事象に結び付けるか
ソーシャル・アナリティクスを本当の意味で活用する方法を、私なりに一般化してみます。まずアナリティクスの目的となるリアルの事象をよく定義します。さきほどの一眼レフの例では販売数でしたし、選挙ならば当選ですし、CMオンエア直後の売上などもよい例かと思います。
次にそのリアルの事象と相関のあるデータを探索するステップです。期をずらす、データの抽出条件の足し引きをする、どれだけきれいなデータに近づけられるか検討する、などもデータ探索の活動のひとつです。過去のソーシャル・データとリアルのデータの間にある相関性をざっくり検証するのです。使えるデータが特定できたら、ソーシャル・アナリティクスのプロジェクトは半分成功したのと同じです。あとはそのデータでいくつか変数を作ってみて(主題をどんなトピックで語っているのか変数として仕分けするなど)、リアルの事象(目的変数)をそれぞれの説明変数がどれだけよく説明しているかをよく観察します。最近ではトピックの仕分けをナイーブ・ベイズ(Naive Bayes)という技法を使って半自動で実施してくれるソフトもいくつか出てきましたので、活用を考えてみてください。
リアルの事象をソーシャルで説明することができれば、ソーシャル・アナリティクスにビジネス価値を持たせることができますし、会社としての活用が可能になってきます。逆に、リアルと結びつかないソーシャルは永遠に参考情報のままで、そのビジネス価値は限定的なものに留まるでしょう(※5)。
(※5) マーケティング・リサーチのプロセスを正しく踏襲し、そのフィールドワーク部分をウェブで代替している企業もあります。この場合、リサーチ結果は市場全体を正しく語ることができ、それ自身にビジネス価値を持たせることが可能です。ただ、これはソーシャル・アナリティクスの枠外で捉えるべきことでしょう。
ビッグ・データの可能性を引き出すのは、私たちです。
「ビッグ・データ」を考えるとき、ときどき私は”Generation X”という言葉を同時に思い出します。日本語では「新人類」に近いニュアンスですね。この英語の”X”や日本語の「新」の背後にあるのは、ひとつには知的怠惰です。簡単に言えば、上手に定義ができないから”X”や「新」という言葉を用いるわけです。
もうひとつは世の中のスピードの速さです。しっかりとした内容の定義を考えているうちにあっという間に「それ」がリアルな存在感を増していくわけで、よく分からないが何か新しいものが出現していることをいま表現する必要があることは否定しません。わたしはビッグ・データを揶揄するつもりはなく、ぜひ可能性を見出していきたいと思っているのです。でも可能であること・実現できることはひとつずつ作る必要があります。
わたしも取り組んでいきますが、皆さんもぜひ一緒にがんばっていきましょう。ビッグ・データに息を吹き込むのは私たちです。
