見落とされがちなデータの収集・蓄積・加工
メンバーズ データ アドベンチャー カンパニーは、データ活用戦略から分析基盤構築、運用定着化までを支援する「データ領域プロフェッショナル常駐サービス」を提供している。データアナリスト、データエンジニア、データサイエンティストなどのデータのプロフェッショナルが顧客企業の部署・チームの一員として常駐し、データ活用による顧客企業のビジネス成果向上を支援するサービスだ。非デジタル系の大手企業からデジタルサービス系のメガベンチャーまで多数の導入実績を持つ。
今回の講演では、同社を率いる白井氏が、データ活用によりビジネス上の成果を出すために押さえておくべき考え方について紹介した。
データ活用から成果創出までのプロセスを俯瞰すると、データ活用戦略策定やデータ可視化・分析に関する情報は書籍やWebを探せば入手しやすい。一方、間の工程にあたる、データの収集・蓄積・加工の情報はあまりない。しかし、全工程でポイントを押さえる必要があると白井氏は語る。
「成果につなげるためにはすべての工程が必要です。見落とされがちなデータの収集・蓄積・加工といった工程がなぜ重要か、またそれをする際にどういったところに気をつければいいのか、お話していきます」(白井氏)
「データの取り直し」が頻発している
データ活用は、次の4つのステップを踏む。近年では4つ目である「データを可視化するダッシュボードを構築」している企業も増えてきた。
- データ活用未着手・構想がない
- ばらばらにデータが蓄積されている
- データを統合蓄積する基盤がある
- データを可視化するダッシュボードを構築
しかし、ここから次のステップを考える際にぶつかる壁がある。それが「ダッシュボードでグラフや数値を見ていても何をしていいかわからない、成果につながっていない」というものだ。
この悩みに対して同社がまず行うのは、ビジネス上のゴールからくる「成果」の認識合わせだ。データ活用の結果得られる成果とは、データから出てくるものではなくビジネス上の要請によるものだ。そのため、データ活用の結果、何を目指すのかをビジネス上のゴールから考えなければならない。まずは、成果とは何か共通認識をもうける必要がある。
次に、データ活用の現状や蓄積しているデータを調査する。現状を把握することで、できること・できないことを整理し、課題解決策を立案、実行していく。この結果、「データの取り直し」が必要になるケースが非常に増えているという。
では、データの取り直しの問題点は何か?
データの取り直しは当然、金銭的・人員的コストがかかる。また、これまで保有していたデータとの連続性が失われる。さらに新たなデータが蓄積されるまで時間がかかる上に、過去のデータを取り直すことはできない……と様々な問題が起きる。
特に問題視すべきは「新たなデータが蓄積されるまで時間がかかる」こと、「過去のデータを取り直すことができない」ことだ。これは、該当データに関わるすべての分析がその日からスタートすることを意味する。たとえば、去年の実績と比較して今年の計画を立てるといったことが一切できなくなる。
せっかく早いうちからデータ活用を進めてきていたとしても、その優位性が崩れてしまう。そのため、素早いリカバリーが必要だ。反対に、データ活用が後手に回っている企業は、先行者の失敗から、あらかじめデータの取り直しが発生しないように備えれば、遅れを取り戻せる可能性もある。
データの取り直しを回避するための考え方
データの取り直しを回避するためには、戦略的なデータ基盤が必要だ。そもそも、データの取り直しが発生する背景には、データを取得するときに、データの具体的な使い道が決められていない状況がある。とりあえず取っておこう、使い方は後で考えようと取得・収集されたデータが、世の中にはたくさんあるのだ。テクノロジーが発達し、データの取得やダッシュボード作成が簡単にできるようになった弊害ともいえる。
使い道(ユースケース)を決めずに取得・蓄積したデータは、ダッシュボードで可視化したところで使い道がない。白井氏はユースケースなきデータ基盤を家の建築にたとえ、「できあがる家を想定せず、とりあえず近くにある材料を集めて、そこから作れそうなパーツを作ってみた状態」だと説明する。
データ基盤はすぐに改修できるが、データを溜めるには時間がかかる。データ活用はとりあえずあるものから始めるのではなく、最初にきちんと設計をする必要があるのだ。
「デジタルマーケティングでは、素早く打ち手を変更していくことが成果につながりやすいと思います。その感覚から比較すると、データ基盤は重いものだととらえていただいたほうが良いでしょう」(白井氏)
データ活用の順番は決まっている。まず、データのユースケースと成果を定義し、実現に必要なデータを定義した上でデータ基盤の設計・構築を行う。このフェーズがデータの取得にあたる。そして、ダッシュボード構築など得たデータの利活用を通して成果を創出していく。手元にあるデータは何か?取れるデータは何か?から逆算しないことが重要だ。
では、データのユースケースと成果の定義とは具体的に何か。白井氏は「データのユーザーと協議をして、データを業務上の意思決定にどう組み込むかを検討して決定すること」だという。データのユーザーとは、実際にそのデータを見て自分の業務に反映する人のことで、データアナリスト、マーケター、営業、経営者がこれにあたる。
ユースケースと成果が決まったら、データのユーザーが意思決定するために必要な情報を定義していく。なお、情報とデータの区別については、営業がすぐ受注につながりそうな顧客を知りたい場合を例にすると、その顧客から優先的に訪問するという意思決定をするもの=「情報」、すぐ受注してくれる顧客をあらわす指標や集計項目=「データ」だと考えるとわかりやすい。
必要なデータを定義したら、ユースケースに対して適切なデータの取得・加工・蓄積の設計を行い、データ基盤を構築する。その基盤ができれば、データからダッシュボードや予測モデル、レポートなどのアウトプットを生成する。最後に、そのアウトプットをもとに意思決定を行って実行に移し、成果を得る。
多数のユースケースを集め、それらに適合するデータ基盤を作る
「ユースケースの定義とは、最後の成果創出が具体的にどう行われるのかをあらかじめ定義することです。つまり、誰がどんな情報をもとにどんな意思決定を行い、どんな成果を得るかのパターンの洗い出しができれば、ユースケースの定義ができるということになります」と白井氏。
つまり、ユースケースを作るには「誰が」「どんな情報をもとに」「どんな意思決定を行い」「どんな成果を得るか」を埋めればいい。これをたくさん集めて、それらに適合するデータ基盤を作ることができれば、データの取り直しを回避できる。
たとえば次のユースケースを考えてみよう。
誰が | どんな情報をもとに | どんな意思決定を行い | どんな成果を得るか |
---|---|---|---|
経営が | 事業ごとの成長性をもとに | 今年度の投資事業・撤退事業を決め | 利益を増加させる |
この場合、まず事業ごとの成長性を評価・予測できる実績データを蓄積する必要がある。意思決定は年度で行われるため、意思決定時にデータが更新されていれば良く、頻繁にバッチを回す必要はない。
また次の場合はどうだろうか。
誰が | どんな情報をもとに | どんな意思決定を行い | どんな成果を得るか |
---|---|---|---|
マーケターが | ロイヤルユーザーと類似の特徴を持つ新規ユーザーのリストに対し | 優先的に施策を打ち | ロイヤルユーザー化させ、売上を増加させる |
まずロイヤルユーザーを指標によって定義し、新規ユーザーを同一指標で評価するためのデータを蓄積する必要がある。また、ロイヤルティのスコアリングなど、新規ユーザーがロイヤルユーザー化するまでの進捗を追えるデータが必要だ。スコアの進捗を見ながら、マーケターは自分たちの施策を調整していくことができるデータのアウトプットを作るための基盤を作ることになる。
人間は無意識にユースケースからデータを定義している
とはいえ、ユースケースから必要なデータを定義することは難しい。ここがデータのプロの腕の見せ所ともいえる。「しかし、個人レベルならば無意識に同様のことをしています」と語り、白井氏はユニークな例でユースケースからデータを定義するための思考プロセスを説明する。
恋人からのLINEの返信が遅いと、「愛されていないのではないか、愛されていないなら別れよう」と考えたとする。「愛されているかどうか」が意思決定に必要な情報であり、「別れる」は意思決定だ。この場合は「LINEの返信速度」がデータとなる。「LINEの返信速度」という計測可能なデータによって「愛されているかどうか」という評価しづらいものを評価し、意思決定に役立てるのがデータ分析だ。
これができると、LINEの返信が遅いたびに「愛されていないのか、別れたほうがいいのか」と悩まなくても、たとえば「5回連続でLINEの返信が1日以上かかった場合は別れる」といったトリガー設定をすることができる。つまり、意思決定にかかるコスト、揺らぎを圧縮することができる。
実務では意思決定に必要な情報の定義が難しい場合も多い。白井氏によると、意思決定者が決めることもあれば、データ分析者が意思決定者と話をしながら定義を作ることもあるという。定義を策定するためのコミュニケーションも、データ活用から成果を生むための肝になる部分だ。
データ基盤をユースケースとともに運用することが必要
以上の話をまとめると、成果に紐づくユースケースからデータ基盤を作ること、つまり使い道から逆算してデータを取得・蓄積することが、データを成果につなげるために大事なことだといえる。
そして、ユースケースは、考え得る限り多数作る必要がある。ケースの数=使い道となり、データから成果を生み出せる可能性の数になるからだ。1つのユースケースに複数の使い方を代用させるのではなく、具体的な1つずつの使い方に対してユースケースがそれぞれあるという状態が理想だ。
しかし、変化の激しい環境では、すべてのユースケースを最初から抜け漏れなく定義するのは不可能だ。データを成果につなげるためには、ユースケースなきデータ基盤を作らないこと、成果から逆算してデータを取得することが大事だが、ユースケースの改廃をし続ける、つまりデータ基盤をユースケースとともに運用することも必要になってくる。データの取り直しが起きないよう努力しつつ、ビジネス環境の変化に即応し、データ基盤を運用し続けることが大事なわけだ。
しかし、ユースケースとともにデータ基盤を運用するのはデータエンジニアリングと分析の専門知識が必要であり、片手間で行うのは非常に難しい。
「メンバーズ データ アドベンチャーなら常駐でデータ活用を運用していくので、データのプロがデータ活用・運用やスキルトランスファーによる内製化支援まで一貫して対応します」と白井氏。自社や自部門にデータに詳しい人材がいない、多忙でリソースが避けない、データ基盤の保守運用ができない、といった課題に寄り添うことが可能だという。
白井氏は「データ活用について相談したい方や事例が知りたい方、今日の内容についてもっと聞きたいことがある方がいらっしゃいましたら、ぜひご連絡ください」と呼びかけ、講演を終えた。