SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

おすすめの講座

おすすめのウェビナー

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

『MarkeZine』(雑誌)

第100号(2024年4月号)
特集「24社に聞く、経営構想におけるマーケティング」

MarkeZineプレミアム for チーム/チーム プラス 加入の方は、誌面がウェブでも読めます

マーケターのためのアナリティクス活用講座(AD)

メリットをきちんと理解していますか? 失敗と成功から考える「テキスト・マイニング」の活用方法

無数のWeb記事を興味・関心別にジャンル分けするには?

 スマートフォンのアプリで記事のレコメンドを受けることってよくありますよね? わたしが担当した案件で、とても技術力のあるお客様がいました。スマートフォンのユーザーひとりひとりが今どんなジャンルに興味があるか正しく理解して、その興味ジャンルに近しい内容の記事をレコメンドする。シンプルに言えばこんなことをやっています。この精度が高ければアプリを気に入って使い続けてくれるでしょうし、副次的に色々なビジネス・メリットがありそうです。

 問題は「興味の内容をどのように把握するのか」です。この分析ゴールを念頭に、まずは興味のジャンルにどういったものがあるのかを把握する必要があります。そのために、Web上の膨大な記事を分析対象にして、SVD(※5)というテクニックを使って機械で処理しやすい形に変換します。その上で記事のクラスタリング(記事の内容の近しさでジャンルとして捉える)を行い、興味のジャンルにはどのようなものがあるかを把握します。

 あとはユーザーひとりひとりの記事アクセスと記事のジャンルを照合すれば、ユーザーが興味を持っているジャンルがわかります。何をレコメンドすればよいかは自明というわけです。このマイニング技術の特徴は、ジャンル判定の方法を人間が設定するのでなく、機械に任せている点です。

 例えば最近、化学工場の相次ぐ爆発事故など、あまりにも痛ましい事件が何度も立て続けに起こっており、一つの興味のジャンルとなっています。このことは半年前に全く予想がつかなかったことです。予め人間がジャンル判定の設定などできるわけもなく、常時機械的にクラスタリング処理を実行しているからこそ浮かび上がるジャンルというわけです。

リスキーな健康被害案件を見極めるためには?

 いきなり高度な活用事例が出てきてしまったため、少し身近な例も紹介しましょう。そのお客様は外部から寄せられる健康被害についての情報を収集し、それがどれだけリスキーな事案なのかを判断しています。しかし、テキスト・データが余りにも多いことに閉口した結果、人間がテキストに全部目を通すのでなく、機械に読ませて判断させるという処理をされています。

 実はここでテキスト・マイニングが行なっていることは単純です。テキスト・データを機械で処理しやすい情報に変換する処理をした上で、その情報から「過去にリスキーと判断された/されなかった」を説明するデータマイニングのモデルを構築します。その上で、新しいテキストが外部から寄せられたら都度、それを上記のモデルにかけて「リスキーな状況になりそうか」を予測する、というわけです(※6)。

目指すべきは「データを見たら活用シナリオが浮かぶ」マーケター

 ほかにも多くの事例がありますが、共通しているのはテキスト・マイニングをとても上手に業務に織り込んだ形でビジネス・プロセスの設計をしている点です。かねてからの私の主張でもあるのですが、テキスト・マイニングに限らずデータ分析は業務に活用できて初めて価値を産み出すことが出来るわけで、マーケターの皆様は「データを見ればすぐに活用シナリオが頭に浮かぶ」ように是非なっていただきたいと思います。

 連載は今回で終了ですが、私はECzine Day 2015 Autumn にも講師として参加します。そこでリアルにお会いしましょう。ありがとうございました。

※5 Singular Value Decomposition。情報量を保持したままデータのサイズを小さくする数学的な手法。テキストの冗長なデータをその特徴を保持したまま数値情報に変換しデータサイズを極端に小さくすることで機械が扱いやすくします。
※6 詳細レベルでは他の分析処理も存在していますが、ここでは紙面の制約上単純化しています。

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
関連リンク
マーケターのためのアナリティクス活用講座連載記事一覧

もっと読む

この記事の著者

津田 高治(ツダ タカハル)

USの大学院から経済学修士を取得した後、2001年よりアナリティクスを始める。流通・保険・メディア・製造など各種業界でアナリティック・コンサルティングを実施した後、SAS Institute Japanのソリューション・コンサルティング  シニア・マネージャー(現職)として日夜アナリティクスのお客様適用に研鑽を積む。趣味は料理とショッピング。■講演 Analytics 2013 - SAS® Fo...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2015/10/13 14:00 https://markezine.jp/article/detail/23193

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング