機械学習でテキスト解析する意味は?
津田氏によれば、世の中にあるマーケティングに活用できるデータのうち、20%は「どこで・いつ・何を・いくつ買ったか」といったデータベースに格納できる“構造化データ”である一方、残りの80%は「なぜ買ったのか」といった人間の内面的な動機を示す“非構造化データ”が占めるという。
この“非構造化データ”を見るために有効になるのは、2つ目の活用法である「テキスト解析」だ。今や人々はソーシャルメディアをはじめWeb上で様々なことを投稿している。また、消費者の興味関心のあるジャンルは激しく移り変わるため、事前に想定した仮説が当てはまらないことも多い。その場合、むしろデータから示唆を得た方が確実であり、「特にテキストデータは膨大に蓄積されているため、分析対象としては最適」と津田氏は語る。
「優良顧客やファンになってくれそうな人、中立的な立場の人など、お客さんのタイプを判別する時、テキスト解析はとても役立ちます。構造化データの分析だけでなく、テキスト解析による非構造データの分析を取り入れることで、お客さんの内面を理解し、真に顧客目線の施策を行うことができる。構造化データの分析をした上で、テキスト解析も行えば、顧客の理解度や優良顧客の特定は大幅に進化します」(津田氏)
その一方で対象となるテキストデータは、SNS上の記述や商品レビュー、コールセンターの会話履歴や営業レポートなど日々増大し続けており膨大な量になる。これらを人間が全て読むのは現実には不可能である。そこで注目されているのが機械学習を活用したテキストのサマリーだ。膨大なテキストデータからパターンやトレンド、分類のためのルールや文書に含まれる話題など重要なフレーズだけを、機械学習テクノロジーによって自動的に抽出することで、テキストデータから自動的かつ高速に、精確な洞察を得ることができるようになのだ。
画像解析も今後マーケティング活用へ
最後の「画像解析」だが、まだマーケティング領域における活用はそこまで進んでいないという。しかし、手書きの数字画像データをSASの機械学習で解析した処理ステップを紹介し、「画像解析も十分マーケティングに使える余地がある」と津田氏は語る。
「画像処理に機械学習を使うと、例えば“ある芸能人に最も似ている人”や個性のある顔を抽出するといったことも簡単にできます。今後マーケティングにおいても、Webサイトのデザインによって人々の反応がどう変わるかテストするといったことにも使えると思います」(津田氏)
ここまで、3つの機械学習に関する活用法を解説があったが、津田氏が強調しているのは「データを集めて、ビジネス上の問いを立てること」の重要性である。ほとんどのことを自動化できる機械学習でも、マーケターが何を実現したいのかを考え、それに合ったデータを用意しなければ正しい示唆を導き出せない。津田氏が強調したポイントをマーケターが理解したとき、機械学習がマーケティングにもたらす可能性は、更なる広がりを見せていきそうだ。