Webページへのアクセスは1回ごとに独立している
Webサイトにアクセスした訪問者は、1ページだけを見て去っていくとは限りません。そしてサイト内をできるだけ長く、そして多くのページにアクセスしてもらったほうが、Webサイトの管理者としてはうれしいはずです。何らかの商品を販売しているなら、さらには商品購入にいたってくれることも重要です。
そのため、こうしたサイトにおけるマーケティングを目的としたアクセス解析では、いつ何時何回のアクセスがあったのかということだけでなく、訪れた利用者が、一度の訪問でどれくらいのページにアクセスしたのか、どこのページに最初にアクセスして、どういうページを巡回したのか、1ページに滞在した時間は何秒かといったことや、アクセスしてくれた人が商品購入やユーザー登録などの、そのサイトにとって有益な行動をとってくれたかどうかという目的達成率(コンバージョン率)(注4)などの解析が重要になってきます。
こうした解析を行うには1回1回のアクセスではなく、同じ訪問者による複数回のアクセスを調べなければなりません。しかし「同じ訪問者による複数回のアクセス」を調べることは、Webページへのアクセスのしくみでは、それほど簡単ではありません。なぜなら、HTTPのしくみでは、アクセスは1回1回が完全に独立していて、ある2回のアクセスが、同じ利用者によるものであるかどうかを識別するためのしくみは用意されていないからです。
すでに述べたように、HTTPは一対のリクエストとレスポンスで構成されています。そして、一回ごとのアクセスは完全に独立しています。独立している、とはどういう意味かというと、たとえばあるページにアクセスしたとします。その場合、リクエストとレスポンスのやり取りが行われると、そこでHTTPのやり取りは完全に終了してしまい、もし同じ人がその直後に同じサイトのページにアクセスしたとしても、それは別々のアクセスとして認識されてしまう、ということです。
さらに言えば、HTTPでのアクセスでは、Webページを構成しているHTMLファイルや画像ファイルなどの個々のファイルに対して個別にアクセスを行うため、画像が3枚含まれるWebページであれば、HTMLデータと画像データ3回で計4回の独立したアクセスが行われることになります(図5)。

そしてHTTPの標準的なデータだけでは、それぞれのアクセス同士を完全に結びつける情報を取得することはできないのです。クライアントのアドレス(IPアドレス)や、ブラウザ名、リンク元などからおおよそどのアクセスが同じ利用者によるものかを類推することはできますが、完璧は判断はほとんど不可能となっています。
そのためアクセス解析ツールは、さまざまな類推を行ったり、クッキーなどのしくみを利用するなどして、特定のユーザーがサイト内でどういう行動をとっているのかを解析しています。いわばここがアクセス解析ツールの腕の見せ所といえるでしょう。しかし、アクセス解析ツールごとにその手法は異なるため、同じサイトの解析を複数のアクセス解析ツールによって行った場合、それぞれのツールごとに結果が少しずつ異なってしまいます。複数のページにまたがる解析の手法などについても、今後の連載の中で詳しく触れていくつもりです。
Webの生い立ち
今回は、Webのしくみ、およびそのしくみとアクセス解析の相性について概論を述べました。今でこそWebサイトは商業的にも重要な位置にあり、アクセス解析もマーケティングのための情報を得るために利用されてきています。
しかし、Webサイトのしくみはそもそもヨーロッパ合同素粒子原子核研究機構(CERN)というスイスにある研究機関において学術論文などの情報を共有するためにスタートしており、商業的な利用とは無関係なものでした。そのため非常にシンプルなしくみで開始され、そのシンプルさは多少仕様が改定された現在においてもあまり変わっていません。Webのアクセスがマーケティング的な解析に向いていない理由は、そもそもここにあるわけです。
とはいっても、商業的な利用に注目が集まる以前から、アクセス解析自体は存在していました。しかしそれらは主に技術的な目的で利用されていたのです。技術的な目的とはつまり、余りたくさんのアクセスが集中して、Webサイトのデータを管理するサーバが処理の限界を超える、といったことが無いように監視を行うことや、不正なアクセスが無かったかどうかをチェックする、といったもののことです。
こうした解析においては、どれくらいのアクセスがいつ行われたのか、という純粋なアクセス数やデータ量、時間的な偏りが興味の中心となるため、マーケティング目的のような複雑な解析は必要ではありませんでした。それが現在のようなマーケティング目的に利用されるに当たり、それに加えてさまざまな情報が取得できるように、さまざまな努力や工夫が凝らされるようになったのです。
その過程や結果として生まれた技術は、アクセス解析をよく理解するために重要であるばかりでなく、技術的にも非常に面白いものとなっています。
さて、次回からいよいよ実例などを交えて、さまざまな解析の裏側の技術やその面白さ、困難さなどを紹介していく予定です。