SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

おすすめの講座

おすすめのウェビナー

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

『MarkeZine』(雑誌)

第83号(2022年11月号)
特集「Web3、メタバース、NFT ── 最新技術が マーケティングに及ぼす影響」

MarkeZineプレミアム for チーム/チーム プラス 加入の方は、誌面がウェブでも読めます

Google アナリティクスのすべらない話

Google アナリティクスのサンプリングを正しく理解し、正しく付き合う方法

 Google アナリティクスを使っている企業のご担当者様に「サンプリングは正確なデータではない」ということで、サンプリングされた集計結果に対して必要以上に構えてしまう方がいらっしゃいます。それなりのアクセス数があるサイトでGoogle アナリティクスを活用している以上、サンプリングという現象は避けられません。本稿はサンプリングを正しく理解していただき、サンプリングされたデータとどのように向き合うべきなのかを解説していきます。

サンプリングとは何か

 サンプリングとは、母集団から偏りがない状態で一部の個体(標本)をランダムで抽出し、そこから母集団の性質を統計学的に推定することを意味します。

 これをGoogle アナリティクスに置き換えてみます。まず集計対象全体のセッションデータからランダムに約25万件が抽出されます。そこから集計対象全体の傾向を推定しているのが、サンプリングされた結果のデータとなります。

 なお、ランダムに抽出されたセッションデータはリクエストごとに毎回ランダムに選択されるわけではありません。特定のセッションデータが常に抽出されるため、サンプリングされたデータがリクエストごとに毎回変動することはありません。

 サンプリングされたレポート結果には画面右上に黄色い帯で上記のように表示されます。例えば上記のメッセージが表示された場合、指定期間に100万件のセッションが存在し、標準状態(約25万件)が集計対象となる場合は「25万÷100万=0.25(25%)」となることを意味しています。

サンプリングが発生する条件

 Google アナリティクスではセッションデータが50万件を越えた場合、かつ下記2つのうちいずれかの条件を満たした場合、サンプリングが発生します。

  • アドバンスセグメント/セカンダリディメンションを使用した時
  • カスタムレポート/APIで標準レポートにない指標とディメンションの組み合わせを設定した時

 なお、フローレポート(ユーザーフロー、ゴールフロー、イベントフロー)はセッションデータが10万件を越えた場合に、マルチチャネル レポートではコンバージョン数が100万件を越えた場合にサンプリングが発生します。

Google アナリティクスは何故サンプリングを行うのか

 標準レポートにおいては、事前処理された結果を使用することでサンプリングされていない結果を出力することができます。しかしアドバンスセグメントやセカンダリディメンションを適用した場合や、カスタムレポート/APIにおいて標準レポートにない組み合わせを選択した場合など、事前に集計されていないデータが要求された場合は、サーバに蓄積されているセッションデータ(生データ)を使って一から集計しなおす必要があります。

 大量のセッションが保存されている場合に全件を処理対象としたら、集計結果を表示するまでに膨大な時間が掛かってしまいます。ユーザーにストレスなくレポート画面を使ってもらうため、Google アナリティクスでは「セッションサンプリング」という手法を利用しているのです。

速度を取るか、精度を取るか、ユーザー側で調整できる

 サンプリングサイズ(集計対象となるセッションの件数)は、レポート画面右上のスライドバーで調整ができます。レポートの表示速度を優先する場合には集計対象が最小で約千件となるため、サンプリングされたデータの精度は下がります。データの精度を優先する場合には、集計対象を最大で約50万件まで増やすことが出来ますが、レポートの表示速度が遅くなります。

 サンプリングサイズは標準レポートとカスタムレポートでのみ調整が可能となります。しかしAPIの場合はサンプリングサイズを調整することばできず、最大値である約50万件が固定となります。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
サンプリングされたデータはどこまで信用できるのか

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
Google アナリティクスのすべらない話連載記事一覧

もっと読む

この記事の著者

大藪 祐一(オオヤブ ユウイチ)

株式会社イー・エージェンシー アナリティクス&オプティマイゼーションチーム  シニア アナリストWeb制作のディレクション業務、IAとしての調査・設計業務を経て、現在はGoogle アナリティクス プレミアムの導入・解析・組織でのデータ活用を推進するアナリストとして活動中。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2013/12/17 08:00 https://markezine.jp/article/detail/18649

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング