ボットのアクセスとアクセス解析
ご無沙汰しています、水野です。以前寄稿した第3回前編、第3回後編では、ロボットからのアクセスについて簡単に紹介しました。今回はロボットの詳細について詳しくみていきたいと思います。
まずはじめに、ロボットの定義をおさらいをしておきます。ロボット(以下、ボット)とは、広く一般的には「インターネット上で自動化されたタスクを実行するアプリケーションソフトウェア(Wikipedia)」ということで、Webサイトへのアクセスに限らず、インターネットにアクセスして何らかの処理を自動的に行うプログラムのことを言います。
これはWebページにアクセスすることに限ったものではなく、例えばオンラインゲームでキャラクターを自動的に動かすためのボットや、最近ではTwitterに自動的にさまざまなつぶやきを残すボットなど、さまざまな用途に使われています。
しかし今回触れるのは、ボットの中でももちろんアクセスログに足跡を残す、Webサイトにアクセスしてくるボットのことを言います。上記の定義はややわかりづらいのですが、簡単に言えば「ロボットのように決められた処理を行うことを目的としてプログラムで自動的に行われたアクセス」、さらにわかりやすくおおざっぱに言えば、「ブラウザ以外」のプログラムは全てボットからのアクセスだと考えることができます。
アクセス解析の際にボットの存在をきちんと認識することは非常に重要です。なぜなら、ボットはブラウザからのアクセスではないからです。ということはつまり、たとえアクセスがあったとしても、それはWebページが「人間に見られた」ことにはなりません。
もちろんボットによってダウンロードされたWebページのデータ(HTMLなど)は、そのボットの目的に合わせて何らかの処理に使われるでしょう(例えば検索エンジンのインデックス作成や、そのほかデータ収集など)。しかし、それはあくまで自動的に行われる作業であり、あなたのサイトやページが、PCの画面を通して誰かの目に映っているわけではありません。
もちろん、ボットにはボットの目的があり、それはサイトにとっても有益な場合もあります。そのためボットからのアクセスがサイトの管理者側にとって無駄なアクセスであるというつもりはありません。分かりやすい例で言えば、検索エンジンのクローラーは、検索エンジンにインデックスされるためには不可欠であり、サイト側にも重要なアクセスだと言えます。
ただし、アクセス解析を行って、サイトの効果を測定したり、ユーザーの行動を調べたり、と言った際には、ボットのアクセスが混ざってしまうと、正しい結果を得ることができなくなってしまいます。そのため、アクセス解析をするにあたって、ボットとはどんなもので、アクセス解析にどういった影響を及ぼすかを知っておくことは、とても重要なことなのです。