SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

おすすめの講座

おすすめのウェビナー

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

『MarkeZine』(雑誌)

第106号(2024年10月号)
特集「令和時代のシニアマーケティング」

MarkeZineプレミアム for チーム/チーム プラス 加入の方は、誌面がウェブでも読めます

水野貴明の“技術から学ぶ”アクセスログの読み方

悪質なボットによるアクセスの見分け方


 前回の記事ではWebサイトにアクセスを残すロボットである「ボット」とはどのようなものであるかについて解説いたしましたが、今回は、悪質なボットによるアクセスの見分け方と、アクセス解析や効果測定の際には、ボットのアクセスをどのように分析すれば良いかについて説明します。【連載バックナンバー】

ボットを見分けるには(見分けづらいボット)

 ユーザーエージェントやIPアドレスが公開されているボットは、無数にあるボットの中でも、かなり良心的というか、素性の良いボットだと言えます。なぜなら、アクセス解析ツールなどを利用することで、サイト管理者がそのボットを判別できるようにしているからです。しかし世の中には、ボットであることを隠してブラウザと見間違うようなアクセスを行うボットもたくさん存在します。

 そうしたボットの中には、それを動かしている人が何らかの後ろめたい気持ちを抱いてい るケースも多く存在します。

 例えば「スパムメールを送信する目的でメールアドレスを収集しているロボット」なんていうのは代表的なもので、それ以外にも、データ取得など何らかの目的で大量にそのサイトのページにアクセスをするけど、それをサイト管理者に知られたくない場合などには、ユーザーエージェントをブラウザが送るものと全く同じにして、ぱっと見ただけではわかりづらくしている場合があります。

 そうしたアクセスはどうしたらわかるのか、というと基本的にはアクセスのパターンや傾向を見ることになります。慣れてくれば、アクセスの生ログや集計結果を見ただけで「コレはなんか怪しい」という勘が働くようになりますが、それではあまりきちんとした解説にはならないので、いくつかそういったものを見分ける方法をここで紹介しておきます。

 まず代表的な方法の1つとして、アクセス元のIPアドレスを集計してみる方法があります。

 ボットのアクセスはサイトに1回アクセスしたら終わり、ということにはあまりならず、短期間に集中的なアクセスをしてくることが多くなります。しかも、その場合同じIPアドレスから、同じユーザーエージェントで大量にアクセスが行われるので、例えば毎日1秒に1回ずっと同じペースで同じIPからアクセスがある、なんて場合は人間には無理な動作なので、間違いなくボットからのアクセスだと言えるでしょう。

 ほかにも、同じIPアドレスからのアクセスの間隔が常にほぼ同じ秒数間隔(1分とか1時間)とかであったり、毎日同じ時間になると同じIPアドレスから集中的なアクセスがあるなどの、およそ人間らしくないきっちりしすぎるアクセスも怪しいと言えます。

 それ以外にも、何度もアクセスしてきているのに、セッションクッキーを絶対に送ってこない、リファラーがまったくない、HTMLだけにアクセスしてJavaScriptやCSS、画像にまったくアクセスしていない、といったアクセスも怪しいと言えます。

 ただしブラウザも設定次第でクッキーやリファラー、画像、JavaScriptなどを切ることができてしまいますし、ボットによってはCSSや画像ファイルにもアクセスしますから、それだけでボットと決めつけるのは早計ですが、そのほかの行動パターンと組み合わせるときの証拠の1つにはなります。

 また、アクセスしてくるURLのパターンからボットを見分けることも可能です。例えば、存在しないページへのアクセスの回数が多すぎる、と言ったケースは、ボットならではのアクセスだと言えるでしょう。それからおそらくプログラムの何らかのバグで、URLの最後に必ず変なゴミが付いているアクセスがあった、なんてケースも筆者は見たことがあります。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
ボットをどう扱うべきなのか

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
水野貴明の“技術から学ぶ”アクセスログの読み方連載記事一覧

もっと読む

この記事の著者

水野 貴明 (ミズノタカアキ)

1973年東京生まれ。バイドゥ株式会社勤務の兼業テクニカルライター。学生のとき に父親が買ってきたパソコン(マイコン)と出会い、コンピュータとの付き合い を開始。大学は有機化学、大学院では分子生物学を学ぶも、就職で再びコンピュータの道を進むことになった。その後インターネットの普及により、様々な方に出会う機会を得て1999年より執筆活動を開始。 http://d.hatena.ne.jp/mizuno_takaaki/

 

著書
『アクセス解析でホームページの集客を極める本』 水野 貴明著、 ソーテック社、2005年3月 
『詳解RSS~RSSを利用したサービスの理論と実践』 水野 貴明著、ディー・アート、2005年8月

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2010/03/31 11:34 https://markezine.jp/article/detail/9834

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング