SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

おすすめの講座

おすすめのウェビナー

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

『MarkeZine』(雑誌)

第100号(2024年4月号)
特集「24社に聞く、経営構想におけるマーケティング」

MarkeZineプレミアム for チーム/チーム プラス 加入の方は、誌面がウェブでも読めます

水野貴明の“技術から学ぶ”アクセスログの読み方

第5回 検索エンジンからのアクセスはこうして解析されている(後編)

検索エンジン由来のアクセスを示すURLには、検索に利用されたキーワードが含まれています。後編では、正しく検索キーワードを見極めて解析するための考え方とその技術的な限界について見ていきましょう。

検索キーワード解析は意外と大変

 検索結果ページのURLに「検索キーワード」が含まれている、ということは前編で述べましたが、それを正しく解析するのは結構面倒なものです。実際にリファラー情報に含まれるURLを見てみましょう。

URLから「検索キーワード」を探すには

 以下に示すのは、Googleの検索結果ページのURLです。

図.1 Googleの検索結果ページのURL

 検索キーワードなどのパラメータは「クエリ文字列」と呼ばれ、URLの中で「?」の後に続いて表示されます。クエリ文字列は「データ名 = データ」という形式になっていて、複数のデータが「&」で区切られています。上記の検索結果の場合は、以下のようなデータが入っていることになります。

表.1 URLに含まれる各種データ(Google)
データ名 意味 データ内容
hl 表示言語 ja
q 検索キーワード hatena
btnG 検索時に押されたボタン名 Google+%E6%A4%9C%E7%B4%A2
lr 検索対象言語 値なし

 これらのデータのうち、検索キーワードは「q」というデータ名で表されています。そのほかのデータも、検索エンジンにとっては必要な情報なのですが、キーワードを抽出するためには、それが「q」というデータ名でURLに含まれている、ということを知る必要があります。しかもこのデータ名は、統一されているわけではなく、検索エンジンによってまちまちです。

表.2 検索エンジンと「検索キーワード」を表すデータ名
検索エンジン データ名
Google q
Yahoo! Japan p
goo MT
Excite search

 このため、アクセス解析ツールでは、どのデータ名にキーワードが入っているかをあらかじめ知っておく必要があります。しかし、アクセス解析ツールによっては、実際の検索キーワード以外のデータをキーワードとして集計してしまうものもあるのです。

URLエンコードの問題

 上記のGoogle検索の場合では、「btnG」のデータ内容は「Google+%E6%A4%9C%E7%B4%A2」という文字列になっています。これは「Google 検索」という文字列が「URLエンコード」という手法で変換されたものです。

 URLには日本語を直接記述できません。そのため、日本語の部分はURL表記に使える英数字に変換(エンコード)して埋め込む必要があります。これが「URLエンコード」です。

図.2 「Google 検索」という文字列をURLエンコードすると…

 実はこの「Google 検索」という文字列は、検索キーワードではありません。検索の際にクリックする「ボタンに書かれている文字列」なのです。しかし、こうしたデータを検索キーワードとしてカウントしてしまうわけです。

 それ以外にも、ボタンに書かれた文字列として「検索」や「web」といったデータが含まれる場合があります。これらは同じ検索エンジンであれば、どんな検索キーワードで検索をしても含まれる文字列です。非常に数が多く、まるで「検索」というキーワードで検索を行った人がすごく多いような集計結果になってしまう場合があるのです。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
文字化けと文字コード

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
水野貴明の“技術から学ぶ”アクセスログの読み方連載記事一覧

もっと読む

この記事の著者

水野 貴明 (ミズノタカアキ)

1973年東京生まれ。バイドゥ株式会社勤務の兼業テクニカルライター。学生のとき に父親が買ってきたパソコン(マイコン)と出会い、コンピュータとの付き合い を開始。大学は有機化学、大学院では分子生物学を学ぶも、就職で再びコンピュータの道を進むことになった。その後インターネットの普及により、様々な方に出会う機会を得て1999年より執筆活動を開始。 http://d.hatena.ne.jp/mizuno_takaaki/ 著書 『アクセス解析でホームページの集客を極める本』 水野 貴明著、 ソーテック社、2005年3月  『詳解RSS~RSSを利用したサービスの理論と実践』 水野 貴明著、ディー・アート、2005年8月

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2006/11/17 11:00 https://markezine.jp/article/detail/344

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング