まとめ
前回と今回にわけて、リファラー情報とユーザーエージェント情報の二つの情報を例に、それがどういう目的で偽装され、それに対してどう向き合っていけばいいのかということについて考えてみました。繰り返しになりますが、アクセス解析は決して100%すべてのログを解析できるわけではなく、たくさんのログを統計的に処理して「おおよそ」の傾向をつかむためのものです。
したがって、おかしなデータが少しくらい混じっているくらいなら、あまり気にせずにいたほうがいい場合もあります。通常ウェブサイトというのは、広く一般に公開しているものですから、ある程度そういったアクセスはあるものです(もちろん、公開範囲を限定しているページに対してのアクセスの場合はまた話が違ってきます)。しかし、あまりに目に余るようなケースでは、解析の際にそれらのログを取り除いたり、時には特定のアクセスに対してアクセス制限をかけたり、といった必要が出てくるかもしれません。
こうしたおかしなアクセスのパターンはさまざまあり、それに気づくには、ある程度の経験は必要になるでしょう。常にアクセスの動向に気を遣い、日々の変化に注意を払っていることで、そうした異常や変化に気づく力もついてきます。また、解析の結果だけでなく、興味を引くような出来事が起こったら、時にはもとのログを見てみる、といったことも、できる限りやっておくと、何か問題が発生した際に、力を発揮できるでしょう。
【この記事とあわせて読みたい!】
アクセス解析を利用した“悪意”ある宣伝手法「リファラースパム」
