MarkeZine(マーケジン)

記事種別

ニフティ、スパムブログのフィルタリング技術を開発、ブログの4割をスパムとして検出

2008/03/26 12:50

 「スパムプログ」とは、アフィリエイトで広告収入を得ることや、特定のサイトへ誘導することを目的として生成されるブログのこと。特定のキーワードを含む記事やニュースサイトなどから転載した記事を機械的に大量に生成して、各種検索サービスからアクセスされるようにすることもあり、コンテンツとして無意味なものも多く存在する。

 ニフティの社内研究機関であるニフティ研究所では、スパムブログを「自動生成系」「アダルト系」の2つに分類。「自動生成系」には、他サイトからコンテンツを自動収集して記事を作成する「引用スパム」、商品写真とそのアフィリエイトリンクを大量に自動掲載する「アフィリエイトスパム」、人が書いているように見えるが、文章をフレーズ単位で機械的に組み合わせただけの「ワードサラダ」、同一記事を複数のブログに大量投稿する「自動マルチポスト」の4つが含まれる。また、「アダルト系」には、「わいせつ記事」、「出会い系」、「ワンクリック詐欺」の3つが分類されている。

 ニフティは、このスパムブログフィルタリングの技術を利用し、ニフティのブログ評判分析サービス「BuzzPulse(バズパルス)」の分析対象である国内の約9割強のブログ、4.5億記事のうち、ブログ記事中に占める、スパムブログ率、その種類についての調査を実施。その結果、分析対象となったブログ記事のうち、2007年10月から、2008年2月の各月ごとにそれぞれ約10万記事をサンプリングして、スパムブログの割合を調査したところ、5か月間の平均で約40%がスパムブログという結果になった。

 ニフティは、このスパムブログフィルタリング技術を、ブログ評判分析サービス「BuzzPulse」、「BuzzPulse」のオンラインサービス「BuzzSeeQer(バズシーカー)」に搭載する予定。

【関連リンク】
FC2ブログ、自動投稿による大量スパムを防止する画像認証機能を追加
日記やスパムの海から良質の記事を自動ピックアップする、AMNの「ブログレーダー」
DAC、アフィリエイトサイト自動監視システム「SITESCREEN」運用開始

  • このエントリーをはてなブックマークに追加
  • プッシュ通知を受け取る


All contents copyright © 2006-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5