「サイトデータ」の生成方法
サイトデータの生成方法は、“手動”と“自動”の2種類に分類できる。
手動でサイトデータを生成する場合、サイトを運営する媒体社自身がサイトデータを定義するのが一般的と言える。この場合、媒体社はコンテンツに関連するカテゴリを自ら選ぶことができる。しかし反面、人が手動でカテゴリを割り振るため、間違いが発生したり、ページ数が多い場合にはサイト単位でカテゴリが括られるケースもある。
対して、自動でサイトデータを生成する場合、まずクローリング等の技術を用いてウェブページごとのコンテンツ情報を収集する。そして収集したコンテンツ情報に対して自然言語処理を行うことで、ウェブページごとに細かくサイトデータを割り振ることができる。機械的に行うことで、大量のウェブページを客観的にカテゴライズできることが大きなメリットだ。筆者が所属するマイクロアドでは、機械的な手法でウェブサイトデータの判断を行うことを好む。
「ユーザーデータ」の生成方法
ターゲティングの際に、1ブラウザを1ユーザーと見立てるときに主に利用されるのは「Cookie」である。Cookieとは、インターネット利用者がブラウザを通じてウェブページを閲覧したときに、ウェブサイト側が(正確にはドメインごとに)設定値を一時的に保存できる"箱"のような仕組みだ。
例を挙げると、旅行予約サイトで以前検索した旅行の目的地が再訪問時にも表示されるなど、都度同じ情報を入力したり、設定する手間を省くためにCookieは利用される。広告配信事業者も同じ技術を活用して、ターゲティングを行う。マイクロアドの場合は、ユニークなIDをブラウザごとに発行し、記録することで1ブラウザを1ユーザーと識別できるようになる。
では、Cookieを利用して1ブラウザーを1ユーザーを見立てたあとは、どのようにしてユーザーデータを生成するのだろうか?
ユーザーデータはそもそも「テクノグラフィック」と呼ばれるIPアドレス、利用ブラウザ、ブラウザの言語設定など、ユーザーが利用しているブラウザのインター ネットアクセス環境から取得できるデータと、「デモグラフィック」と呼ばれるユーザーの年齢、性別、所得、職業などの人口統計学的な属性情報の2種類に分類できる。
マイクロアドではこれらのデータを、Cookieを通してブラウザに保存したユーザーを識別するためのIDに紐付けるかたちでターゲティングを行っている。 ここではデモグラフィックなユーザーデータの生成方法に焦点を当ててみたいと 思う。
(1)自己申告型
デモグラフィックなユーザーデータの生成方法のひとつ目は、インターネット利用者に許諾を得たうえでデータを提供してもらう「自己申告型」である。この場合においても、性別・年齢・職業といった属性情報はあくまでもCookieと紐づくだけであり、個人を特定しないよう配慮する。しかし、実際には自身の属性情報を提供するインターネット利用者は少ない。
(2)類推型
2つ目のパターンは、行動データを利用することでブラウザごとの属性を類推する「類推型」である。ユーザー数が多い媒体社はユーザーに許諾を得るかたちでデモグラフィックなデータを利用することが比較的行いやすい。自社運営のサイトを持たないマイクロアドの場合は、主にインターネット利用者の行動データから属性情報を類推することで、デモグラフィックなデータを利用したターゲティングを提供している。
「行動データ」の生成方法
行動データはさきほども説明したとおり、サイトデータとユーザーデータの掛け合わせで生成される。行動データの生成においても、個人情報ではなくCookieを利用する。
行動データの生成は、ブラウザことに関連するサイトデータを明確化することにあると言ってもよい。特定のブラウザに紐づくサイトデータを分類すると、どのカテゴリのコンテンツをよく閲覧しているかが明らかになる。そこから、そのブラウザを利用している人は当該カテゴリに興味を示していると考えることができる。
マーケティングとプライバシー
ここで注意したいのは、あくまでもマーケティングに利用できる性別・年齢や大まかなアクセス地域などを広告配信に利用することで、インターネット利用者のプライバシー侵害を避ける配慮を行なっている点だ。「個人情報」と「ブラウザのCookie情報」と「属性情報」を切り分けることで、プライバシーの侵害を防ぐようにしなければならない。また、行動履歴を取得されたくないユーザーに対しては「オプトアウト」の手段を提供することも事業者は配慮する必要がある。
広告配信事業者向けのガイドラインとして、日本ではJIAA(インターネット広告推進協議会)が提示する「行動ターゲティング広告ガイドライン」、米国ではIABが提示する"Self-Regulatory Principles For Online Behavioral Advertising"などがある。一度、目を通しておくことをおすすめする。
まとめ
今回はターゲティング広告で主に利用されるサイトデータ・ユーザーデータ・行動データの詳細と生成方法について解説した。次回以降は、ターゲティング広告を実現するうえで重要となるデータ量とデータの質について触れたいと思う。
