SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

MarkeZine Day(マーケジンデイ)は、マーケティング専門メディア「MarkeZine」が主催するイベントです。 「マーケティングの今を網羅する」をコンセプトに、拡張・複雑化している広告・マーケティング領域の最新情報を効率的にキャッチできる場所として企画・運営しています。

直近開催のイベントはこちら!

MarkeZine Day 2025 Retail

水野貴明の“技術から学ぶ”アクセスログの読み方

第5回 検索エンジンからのアクセスはこうして解析されている(後編)

文字コードを判別するための情報は?

 複数の文字コードを使い分けている検索エンジンの場合、文字コード判別のために、どの文字コードを利用しているかを表す情報がURLに入っていることがあります。とはいえ、それを調べる場合にも、どこにその情報が含まれているのかをあらかじめ情報として持っておく必要があります。

 例えば以下のようなURLの場合、使われている文字コードがなんだかわかりますか?

図.4 ひとつのURLに2つの文字コードが含まれている。

 パラメータを見ると、「ie=EUC-JP」と「oe=Shift_JIS」という2つの文字コードらしき情報が含まれています。どちらが正しいでしょうか。

 正解は「ie=EUC-JP」です。2つの違いを比較してみましょう。

  • 「ie=EUC-JP」…検索キーワードがEUC-JPで表されていることを示す。
  • 「oe=Shift_JIS」…検索結果ページがShift_JISで表されていることを示す。

今回のまとめ

 このように文字コードの判別はかなり煩雑であるため、アクセス解析ツールでも、きちんと解析を行うことができず、一部の解析結果が文字化けしているケースもよくあります。文字化けが起こってしまうと、同じ検索キーワードであっても、文字コードが違うために別々に集計されてしまうなどの問題が発生し、解析の精度が下がってしまいます。

 逆に、検索キーワードがまったく、あるいはほとんど文字化けしていない解析ツールは、かなりがんばっているツールだということもできるでしょう。アクセス解析ツールを選ぶ際、検索キーワードの解析結果は、そのツールの完成度を知るための、よい指標になるともいえます。

この記事は参考になりましたか?

  • Facebook
  • X
  • note
水野貴明の“技術から学ぶ”アクセスログの読み方連載記事一覧

もっと読む

この記事の著者

水野 貴明 (ミズノタカアキ)

1973年東京生まれ。バイドゥ株式会社勤務の兼業テクニカルライター。学生のとき に父親が買ってきたパソコン(マイコン)と出会い、コンピュータとの付き合い を開始。大学は有機化学、大学院では分子生物学を学ぶも、就職で再びコンピュータの道を進むことになった。その後インターネットの普及により、様々な方に出会う機会を得て1999年より執筆活動を開始。 http://d.hatena.ne.jp/mizuno_takaaki/

 

著書
『アクセス解析でホームページの集客を極める本』 水野 貴明著、 ソーテック社、2005年3月 
『詳解RSS~RSSを利用したサービスの理論と実践』 水野 貴明著、ディー・アート、2005年8月

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2006/11/17 11:00 https://markezine.jp/article/detail/344

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング