MarkeZine(マーケジン)

記事種別

Jetrunテクノロジ、ビッグデータのフィルタリングにワードデータベースの不適切表現語を強化

2012/08/08 11:50

 ソーシャルメディアをはじめ、コミュニケーションアプリやオンラインゲームにおけるチャット、動画サイトのコメント、ECサイトのユーザレビューなど、ユーザーが発信するテキストデータが、日々ビッグデータとして蓄積されている。その一方で、薬物売買や援助交際、いじめ問題など、サイト内に潜むネットを媒体とした犯罪リスクも増大している。

 こうした状況を踏まえて、Jetrunテクノロジでは各種アプリ・サービスに組み込んで利用できるデータベース提供サービス「WordGRID」の「不適切表現」のワードデータベースを強化。「隠語」や「スラング」を中心に拡充したほか、TwitterやFacebookへの対応のため「英語スラング」を約13000語から約17000語へ拡充した。

 また、蔑称や放送禁止用語、自殺誘導語、アダルト表現などの不適切・不快表現と捉えられるキーワード・カテゴリを拡充。「表記ゆらぎ」にも対応し、その数は総計20万語以上。ユーザーごとに異なる書き方や伏せ字表記にも対応可能となっている。

【関連記事】
広告の文章を入力するだけで薬事法に抵触するかをチェックする「やくじるし」
学校の風評チェックサービス「学校みはりBan」、TwitterやFacebookも解析対象に
テレビでもフィルタリングの時代
複数のFacebookページを解析する「AllFacebook Stats」
ブレインパッドが独自のセマンティック自然言語処理エンジンを開発

  • このエントリーをはてなブックマークに追加
  • プッシュ通知を受け取る

関連リンク


All contents copyright © 2006-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5