Caffeineの特徴は、「現在の最新のインデックスよりも50%新しい検索結果を提供することができる」ということに尽きる。利用者がGoogleで検索するとき、その時点でのウェブをライブで検索しているわけではなく、Googleが作成したウェブインデックスを検索している。これまでのGoogleのインデックスは、更新頻度の異なる複数のレイヤーに分かれており、メインのレイヤーは2週間ごとに更新されていた。しかし、古いレイヤーを更新するためにはウェブ全体の解析が必要となるため、利用者に提供するまでには遅れが生じることになる。
Caffeineでは、こうしたレイヤー構造ではなく、ウェブを小さなグループに分割して解析し、インデックスを連続的に更新する方法を採用。これによって、新しいウェブページを見つけたとき、即座にそれをインデックスに追加することが可能になる。これを実現するために、Caffeineは、1つのデータベース上で1億ギガバイト近いストレージを利用し、1日数十万ギガバイトの速度で新しい情報を追加している。
【関連記事】
・Google Analyticsのトラッキングを無効化する「オプトアウト アドオン」公開
・Google、第三者に傍受されないセキュアな検索サービスを提供
・Googleが無料で撮影してくれる「おみせフォト」申込みページがオープン