アナリティクスが役立つ場面を紹介します
皆様こんにちは。SAS Institute Japanの津田と申します。今回、3回にわたって「マーケターのためのアナリティクス活用講座」を担当します。簡単に自己紹介をしますと、ちょうど20年前に大学院でエコノメトリクスを勉強する過程で統計学に親しみ、その後業務として2001年よりアナリティクスに従事しています。以前、MarkeZineで「はじめての人にもわかるアナリティクス講座」という連載をしていました。
本コラムでは、マーケティングをする上でアナリティクスが役に立つ場面について紹介していきます。具体的には「ターゲティング」、「ウォレットサイジング」、「テキストマイニング」の3つの手法をピックアップし、目的や方法、適用例などを紹介します。統計学やアナリティクスの専門知識は前提とせず、可能な限りマーケティング用語で語るようにします。アナリティクスの勉強を始めたばかり、というかたも安心して読み進めて頂ければと思います
マーケティングはとても範囲が広いため、まずは本コラムで扱う場面設定をします。企業向け・消費者向けの製品を販売しているA社が舞台です。販売チャネルは300名のセールスとコールセンターで構成され、マーケティングはその両方をサポートするミッションがあるとします。そして、残念ながらA社は毎年ジリジリと売上を落としている状態です。
それでは、早速、A社の様子を見ていきましょう。
正しくても「適切でないターゲティング」に注意
A社では全国の顧客とターゲット含めた6万社を300名のセールスが担当する状況にあり、活動にメリハリをつけることが求められています。この会社では、セミナーが案件獲得の最も有効な手段です。しかし、マーケティングで企業向けの無料セミナーを実施する場合、セミナールームの広さは有限ですし、セミナー・アンケートから見込み客のフォローをするにしてもセールス人数が限られています。そのため、集客時のターゲティングが重要です。かつては以下のような条件で対象を抽出していました。
- 以前のセミナーに来場してくれたこと
- 直近の3年間で購買額の大きい会社
- 会社の規模が一定以上であること(売上規模や従業員数)
これは顧客に優先順位をつけるための手法であるRFMの考え方を利用した立派なターゲティングです。しかし、RFMは簡単に言えば優良顧客を捉える考え方です。毎年ジリジリと売上を落としている状態で、過去の優良顧客にまた買ってもらおうというアプローチでは先細りになってしまいます(リピート購買にも限度があるのです)。つまり、A社にはもう少し広い視点が必要です。
そこでA社では少し発想を変えて、以下のようなターゲティングを考えることとしました。
- セミナーに参加して購買意欲が高まり案件化しそうな顧客を狙う
- セミナーに参加しても案件化しそうにない顧客は対象外
アナリティクスによるターゲティングを行うには
アナリティクスによるターゲティングが通常のターゲティングと異なる点は、より案件化率の高い顧客を客観的根拠に基づき予測すること。その結果、より少ないコストでより大きな案件化率を得るという効果がある、ということです。予測をどのようにして実施するのか、効果があるとなぜ言えるのか、少し手順を追って見ていきましょう。
案件化に至るのはどんな顧客なのか、法則性を見つけモデルにすることが大きなテーマです。「法則性」とか「モデル」とかと聞いて難しそう、と敬遠しないでください。実際にしていることは単純で、案件化した顧客としなかった顧客を選び出し、その2つの顧客グループの違いを各種データ(顧客属性や購買履歴、セールス・マーケティングのコンタクト履歴など)で説明付けることです。
この場合「案件化した/しなかった」を目的変数、各種データを説明変数と呼びます。このコラムでもその用語を使いますので、頭に留めておいてください。それでは、次のページからアナリティクスによるターゲティングの、具体的なステップを説明します。
ステップ1 データの準備
アナリティクスによるターゲティングの、最初のステップはデータ準備です。
手順1:現時点(tとします)で案件化した顧客と、しなかった顧客を選ぶ(顧客IDが必須です)
手順2:ひとつ前の時点(t-1)の各種データを取得し、顧客IDで手順1のデータと結合する
「時点」とは何? と思われたかたもいるかと思います。ここで「時点」の考え方をご説明します。
現在が時点(t)とすると、(t)時点の案件化した/しなかったという事実を、それより以前(t-1)の各種情報で説明します。この法則性を、現在(t)の各種情報に当てはめることで将来(t+1)の案件化が予測できる、という考え方に立っています。このデータ準備は時間がかかりますが、これが終わればあとはラクです。
ステップ2 モデル作成
次のステップはいよいよモデル作成、法則性を見つける作業です。
手順1:左列から顧客ID、案件化フラグ0/1、各種情報を順に並べてひとつのデータにします
手順2:手順1を統計ソフトで開き、案件化フラグを目的変数に、各種情報を説明変数に設定します。
(目的変数=「案件化した/しなかった」、説明変数=各種データ、でしたね)
手順3:ロジスティック回帰、ツリー分析(決定木)などの手法を選びモデル作成を実行します。
たいていの統計ソフトは、ユーザーが「モデル作成の実行」をすれば自動でモデル作成を完了してくれます(※)。ここでは、ロジスティック回帰とツリー分析(決定木)の2つの手法を例としました。ターゲティング目的では多くの場合、どちらかを使ってモデルを作ればOKです。ロジスティック回帰は稀な事象でもよく説明できる利点があり、ツリー分析(決定木)はアウトプットがグラフィカルで理解がしやすいのが特徴です。両方試してみて次のステップで比較することも有効です。
手順2では、何を説明変数とするか工夫すると良いでしょう。例えば、マーケティングの顧客に対する活動履歴を説明変数に入れて、「案件化する/しない」を説明するモデルを作成できれば、どんなマーケティング活動が案件化につながりやすいか等の示唆を得られるかもしれません。その他、セールス活動を説明変数にする、顧客属性を説明変数にする、それらの組み合わせなどいくつかパターンを作り、違いを見てみると色々な発見が得られるはずです。
※統計ソフトが自動実行した内容に満足できない場合は、ご自身で手を入れる必要が出てきます。その際は、統計学の知識やアナリティクスの経験が必要になります。
ステップ3 忘れないように! モデルの検証と比較
忘れられがちなのが次のステップ、「モデルの検証と比較」です。モデルの作成ステップで発見された「法則性」が未来にも当てはまるためには、別なデータでも法則性が当てはまることを確認するほうが安全なのです(※1)。そのステップを要約すると、3つに分けられます。
手順1:モデル作成ステップの手順1データを「学習データ」と「検証データ」に分ける(※2)
手順2:「学習データ」で作られたモデルを「検証データ」に当てはめる
手順3:「検証データ」のモデル精度が「学習データ」と同じくらい良いことを確認する
学習データとはモデル作成の際に使うデータです。つまり、案件化した顧客としなかった顧客の違いを各種データで説明付けるという、コンピュータによる学習の材料となるデータです。 検証データとはモデル作成を実施した後に、作られたモデルできちんと予測ができているか検証するためのデータです。後述の手順2で検証データをどう使うか説明しています。
過去データを学習と検証の2つのデータに分けますが、その方法には無作為に抽出する、など数多くの方法があります。ここでは詳細には触れませんが、最近の統計ソフトはこれも自動実行しますので、ご心配なく。
手順2の「当てはめる」とは、学習データで発見された説明変数と目的変数の間の法則性(モデル)が、「検証データ」でも同じように当てはまるかを確認することです。具体的には検証データの説明変数にその法則性を当てはめて、「案件化する/しない」(目的変数)をモデルに予測させ、それが実際の値と十分に一致しているかをチェックします。
手順3の精度の確認ですが、「可能性が高いと予測された顧客100社からは実際に多くの案件化が得られ、可能性が低いと予測された顧客100社からは案件化の数が少ない」、などのメリハリがあることを確認します。また、そのメリハリの付き方が「学習データ」と「検証データ」の両方で同じように見られることを確認します(※3)。
上記の精度のチェックはステップ2のモデル作成の最後で紹介したいくつかのパターンの複数モデルの比較をする上でも大切なプロセスです。
最近の統計ソフトの中には、「モデルの検証」の全ステップを「モデルの作成」と同時に自動的に実行しレポート作成までしてくれるものがあります。適宜ご活用ください。
ステップ4 予測とビジネス活用
最後のステップはいよいよ「予測」です。現時点(t)の各種情報を説明変数にして、将来の「案件化する/しない」を予測します。
会社によっては予測結果を実際のセールス・マーケティングのアクションに移す前に、マネージャーの了承が必要な場合もあるでしょう。
その場合、アナリティクスによるセミナー案内と従来の方法とを数字で比較すると論理的で説得力があります。例えば、従来なら100名のセミナールームをいっぱいにしても、そこからセールスコールにつながるのが5社程度。そこから案件化するのは1社あるかないか、だったとします。それに対し、アナリティクスを活用すれば100社から8社案件化が可能となれば、売上増加メリットもコスト削減メリットも訴えることが可能です。
1回のセミナーを実施する同じコストで得られる案件化額が増大するという表現も可能ですし、同じ案件化額を得るために必要なセミナー開催コストの削減という表現もまた可能でしょう。
おわりに
さて、今回のテーマ「ターゲティング」はいかがでしたでしょうか。実際のステップは意外にシンプルであることがお分かり頂けるかと思います。弊社SASでは、今回のステップ全てを一瞬で実行できるツールをご提供していますので、ご興味のある方はこちらをご参照ください。
次回は「ウォレットサイジング」がテーマです。今回扱った「案件化しやすい顧客」に「案件化する価値のある顧客」という観点を加え、より立体的な議論をしたいと思います。お楽しみに。
※1統計学者の中には統計数値の正しい評価をしさえすればモデルの検証としても十分と言う人も存在しますが、少しハードルが高いかもしれません。この記事では簡易な方法を紹介します。
※2「学習データ」と「検証データ」は別々の時点データを使うことも多いのですがここでは説明を簡略化しています
※3これらを統計的にきちんと検証するために、多くの手法やレポート方法が開発されています(ROC、リフト、誤分類率など)。ご興味のある方は、マーケター向けAnalyticsゼミナールのサイトをご活用下さい。