理想は「RCT」、マーケでは難しいから「調整」する
RCTにおいては、処置群・対照群の振り分けがランダムに決定されているため、2つのグループの間に他の要因・属性の違いがない、つまり、交絡因子が存在しないデータを作り出すことができます。したがって、単純な差の計算でもセレクションバイアスを除去した効果を特定することができ、理想的な効果測定方法と言えます。
しかし、マーケティングにおいては、効果測定を最優先にしてマーケティング施策の対象者をランダムに処置群・対照群を割り振るのは、あまり現実的とは言えません。
では、観察データしか手に入らないようなケースでは、効果を測定することをあきらめるしかないのでしょうか?
答えはNoであり、むしろこういった状況こそ、因果推論の出番です。というのは、処置群・対照群の単純な差を計算する代わりに、分析手法を工夫することで対処するのです。具体的には、「交絡因子」となりうる属性・要因が同質となった「比較可能」な2群で差を計算し、効果を測定します。
先ほどの例であれば、「ロイヤリティなどの要因が、クーポン獲得者と同じ状況である非獲得者の平均購入金額」を算出します。そして、クーポン獲得者の実際の平均購入金額から、その値を引くことで、クーポンの効果を算出します。このような、第3の要因を同質化させたうえでグループを比較する手続きを「調整する」と言います。

データの特徴ごとに「調整」の手法を見極める
観察データを用いた「調整」では、何が交絡因子なのかの「あたり」をつけ、それを適切に同質化できる手法を選択することが重要です。分析手法は多く存在しますが、大きく2つのアプローチに分類できます。
これらのうち、どちらの手法が使えるかはデータの特徴で異なります。データの特徴を見る上で重要なのは、「同質化させたい属性・要因が『共変量』として入手できるか」「処置前後の結果が入手できるか」という視点です。

1.共変量をバランスさせる手法
最初に確認しなければならないのは「共変量」として取得できるデータの内容です。共変量とは、処置の有無や結果の値以外に取得できるデータを指します。たとえば、広告の効果を測定する場合、個票データとして、広告接触の有無や評価指標の他に性別、年代、居住地などのデモグラフィック属性が取得できていれば、それは共変量となります。同質化させたい交絡因子が共変量として入手できれば、そのデータを利用して直接的に同質化の処理を行うことが可能です。この処理の手続きは専門的には、その共変量を「バランス」させると言います。
クーポンが購入金額に与える効果を測定するケースでは、効果を正しく測定したい場合、交絡因子となり得る「ロイヤリティ」を同質化させる必要があります。このとき、キャンペーン実施時点の「ロイヤリティ」がアンケート調査などで取得でき、共変量として利用できれば、この値をバランスさせる手法を用いて、バイアスを除くことが可能です。

しかし、共変量として取得できないデータが交絡因子と考えられるときは別の手法を検討する必要があります。このような場合は「処置前後の結果が入手できるか」という視点でデータをチェックします。
2.施策の前後で比較する手法
「処置前後の結果が入手できる」とは、同一の集団について、処置が行われる前(プレ)の状態と処置が行われた後(ポスト)の結果の状態が、データとして取得できることを指します。こうしたデータは、プレ・ポスデータ(前後データ)と呼ばれます。
一般的に、マーケティング施策の効果を測る上では、処置が行われた後の結果のみを用いることが多いと思いますが、プレ・ポスデータが利用できる場合、施策の前後差を活用することで、共変量として入手できない因子を部分的に同質化したうえでの比較が可能になります。

プレ・ポスで比較を行う分析手法の特徴は、個人ごとのデータを必要とせず、「処置が行われた集団」と「処置が行われていない集団」の集計値のみでも分析が可能な点です。たとえば、キャンペーンが特定の地域で行われ、地域別に売上の時系列データが得られているといったシーンでも活用することができます。
マーケティング実務の中で効果測定を行う際には、同質化させたい属性・要因と分析するデータの特徴を鑑みて、以上の2つのアプローチから、分析手法を選択することが重要といえます。後編では、これら2つのアプローチの詳細を解説し、そのマーケティング効果測定への応用例を紹介します。