テキスト・マイニングとソーシャル・アナリティクス
皆さんこんにちは、SAS Institute Japanの津田です。アナリティクス初心者の方を対象とした連載「はじめての人にもわかるアナリティクス講座」の第5回をお届けします。前回でアナリティクスの「始める」段階は完了し、今回以降は応用編です。今回はテキスト・マイニング、特にソーシャル・アナリティクスに関してお話をいたします。
テキスト・マイニングはアナリティクスの第2段階、「(8)対象データの拡大」(※1)の中で語られることが多いのですが、内容的に基礎というより応用レベルであるため第2段階に入れているだけで、アナリティクスの初心者の方が取り組んではならないということはありません。むしろ、「始める」段階の4つのステップ(企画、データ探索、変数作成、モデル構築)がそのまま当てはまるため、はじめての方にも理解が得やすいと思います。
(※1)もともとアナリティクスはカラムに区切られた構造化データを対象にすることが多かったのですが、昨今のビッグ・データのテクノロジーの進化で非構造化データ、つまりテキストや音声、動画なども新たに分析の対象データになってきました。
ソーシャル・アナリティクスの3つのポイント
昨今のビッグ・データの隆盛の中で、多くの方が「テキスト・マイニング」(※2)という言葉で想起されるのは、ネット上でのコメントを分析して商品開発やマーケティングなどに役立てるソーシャル・アナリティクスではないかと思います。ネット上のコメントを分析して活用するシナリオはいろいろな場面で語られていて、それぞれがとても魅力的です。
(※2)テキスト・マイニングとは、文字列を対象としたデータ分析のこと。自然言語処理の発展と共に先進的な分析が可能になってきました。
マーケティングでは、CMなどマス・メディア訴求に対する消費者反応を測定するなどの活用がよく語られますし、自社や他社ブランドの評判分析、ブランド・ポジショニングを策定するなどの活用シナリオも考えられます。モノ作りの観点では、自社製品の使われ方や感想などを理解して製品開発に活かす、クルマなどの耐久消費財の場合は、故障が大問題になる前に徴候をつかんで早めに対応するという活用法もあります。では、ソーシャル・アナリティクスの何に魅せられるのでしょうか? その魅力を整理してみましょう。
ポイント1:「幅広さ」
ネットにつながることは当たり前になり、誰もがネット上で不特定多数のコメントを読んだり自分でコメントを書き込んだりします。ソーシャル・アナリティクスは多くの人を分析対象にできる、これが魅力の第一、「幅広さ」です。
ポイント2:「深い」
ネット上のコメントはPOSデータとは違って、単にコンビニでおにぎりを買ったという事実だけでなく、食べてみて美味しかった、店員さんの対応が素敵だった、など、もう一段深い心の中の本音を教えてくれます。魅力の第二は、「深い」ということです。
ポイント3:「手に届くところにある」
第三のポイントは、こうした広く・深いデータがマーケターの「手に届くところにある」(少なくともそのように見える)ということです(※3)。
(※3) 著作権や個人情報保護についての考慮は必要です。
「そう思います」というコメントは、どう分析すればいいのですか?
こんなにいいものだったならば、みんながソーシャル・アナリティクスを実施しているはずですよね? それなのに、なぜそんなに広まっていないのでしょうか? 本当に活用するには何をすればいいのでしょうか?
お客様のところに伺ってソーシャル・アナリティクスのお話をすると、必ず聞かれる質問があります。「ツイッターのタイムラインに 『そう思います』 とだけ書いてあるコメントがよくありますが、これをどう分析すれば良いのですか?」 ツイッターでは文字数の制限があるため、主語や目的語、主題(トピック)がよく省略されます。もちろんこんなときも分析の方法はありますが、ここでのポイントはネット上のコメントは必ずしもきれいなデータではないということ。そして、人はしばしばデータ特性に十分注意を払わずにいきなり分析を実施しようとするワナに掛かっている、ということです。