携帯サイトとボット
また、携帯サイトの場合は、ちょっと事情が異なってきます。なぜなら、携帯電話の場合、携帯電話のアクセスの解析で理解しておきたいこと(前編)、携帯電話のアクセスの解析で理解しておきたいこと(後編)でも解説したように、各キャリアがアクセス元となるIPアドレスの一覧を公開しているからです。
従って、携帯サイトの場合は、IPアドレスで携帯実機かどうかを判断できます。つまり携帯の実機からのアクセスだけを取り出すのは比較的簡単なのです。
ただし、この方法で判断できるのはボットかどうかではなく、携帯実機かどうかですので、アクセス解析の対象が携帯実機だけであれば問題がありませんが、PCのブラウザのアクセスを含めたい場合には、この方法だけではできません。一般的なユーザーエージェント情報を利用するなどの手法を併用する必要は出てきます。
また、最近ソフトバンクのIPアドレスを使って携帯以外からアクセスをする方法が見つかっており、実際筆者もソフトバンクのIPからであるにもかかわらずユーザーエージェントがauの携帯のものであるアクセスを見たことがあります。
このアクセスがその手法を使ったものかどうかはわかりませんし、そうしたアクセスは微々たるものではありますが、そうした手法もあることとは覚えておいた方がよいでしょう。
結局は生ログを自分の目で見ることが1番確か
今回はアクセス解析という観点から、サイトにアクセスしてくるボットについて解説してみました。
ボットの是非はここでは論じませんが、アクセスを解析するにあたっては、確実に区別する必要があるのは事実です。
もちろん、ブラウザもボットもWebにアクセスするプログラムという意味ではまったく同じであり、極限までブラウザに近づけたボットだって存在しますし、その分類が曖昧なものも存在します。
つまり結局はほかの手法と同様に、ボットの区別にしても、アクセス解析では限界があり、「ある程度」であることは踏まえておく必要があります。
最後にそうした曖昧な例を2つほど挙げておきましょう。1つ目は、URLを指定してスクリーンショットを取得できるサービスです。
この場合は、当然ボットを使ってWebページを取得しているわけです。しかし、ブラウザと同様に画像やCSSなどを全て取得し、JavaScriptも実行して取得している場合が多いので、ユーザーエージェントが通常のブラウザのものだった場合には、区別をすることはかなり困難です。

もう1つの例としてPC向けのページを携帯向けに変換する「トランスコーダー」というサービスがあります。
この場合は、次のようにPC向けのページを変換しますが、その際のページの取得を行う処理は、ボットと言えばボットですが、結果はユーザーに表示されますから、ブラウザの一種と言えないこともありません。

つまりWebにアクセスしてくるクライアントの目的はさまざまであり、その全てを分類することはかなり困難です。従って、今回解説したような内容を把握したうえで、その場に応じた対応が必要になるでしょう。より適切にサイトへのアクセスを解析し、解析の効果を上げるため、ボットの存在は常に注意しておくようにしていた方がよいと思います。
ただし繰り返しになりますが、ボットを見分ける最も効果的な方法は、結局は生ログを自分の目で直接見ることです。それを続けていれば、機械にはわからないわずかな違和感から、ボットを見分けることがある程度できるようになります。
これはボットのアクセスに限らずアクセス解析に関する全てのことに言えるとは思いますので、機械的な解析に頼るだけでなく、何か気になることがあったらアクセスログを見てみると良いのではないかと思います。