本記事は『データ利活用の教科書 データと20年向き合ってきたマクロミルならではの成功法則』(マクロミル、渋谷智之)の「はじめに」と「第2章 データ利活用に必要な知識・スキル」から一部を抜粋したものです。掲載にあたって編集しています。
大事なのは、データの「活用」ではなく「利活用」
DXの進展により、組織に蓄積されたデータを統合し、ビジネスに活用していく動きが活発になっています。ただ、思うようなビジネス成果に結びついていないケースが散見されます。
その理由として、データ「利活用」ではなく、「活用」に留まっていることが大きいと感じています。辞書で調べると、活用は「活かして用いること」、利用は「利益になるように用いること」とあります。データの文脈では、データ活用は「今あるデータを活かすこと」、データ利活用は「(今あるデータを問わず)利益になるようにデータを用いて活かすこと」と捉えることができます。
目的に応じて、組織に蓄積されたデータだけでなく、新たに計測・収集するなど、データを創り出していくことも必要です。データ活用に留まっていると、ビジネス成果に結びつかない可能性が高くなります。
データは「手段」。出発点は「課題の明確化」
「データがあるから有効な活用方法を考えてほしい」「社内に蓄積されているデータを使って、何か面白いことはできませんか?」。データ利活用に関する相談でよくある悩ましい言葉です。
今あるデータありきでデータ利活用を考えると、途中で頓挫するか、担当者に分析結果を出しても「それは知っていることだから、他に何か新しい発見はないの?」と言われる確率が高くなります。
データ利活用とは「ビジネス課題を解決するために、データを収集・蓄積・加工・分析・活用していくプロセス」です(図2.1.1)。
最初に考えるべきは、「解決すべき課題は何か?」といった「課題の明確化」です。その課題の中で「データを活用できるところはないか?」と考えていきます。データはビジネス課題を解決するための「手段」です。今あるデータを使うことを前提に考えると、無意識のうちに視野が狭くなります。
データ分析に基づいて問題解決を行うステップに「PPDACサイクル」があります(図2.1.2)。これは小学校の学習指導要領にも使われています。自ら問題を設定して、計画を立ててデータを収集する。そして、結論を考えることを小学生に求めているのです。大人のデータ利活用も全く同じです。
「マーケティング視点」でデータ利活用を考える
ビジネスの世界では、データ利活用の課題として、どのようなものが設定されるのでしょうか。企業が持続的に成長していくためには、既存事業の「売上を増やす」もしくは「費用を下げる」ことが必要です。また、「新規事業を創出する」ことも企業の成長には不可欠です。これらはマーケティングの領域です。つまり、マーケティング視点でデータ利活用を考えていくことが成功の鍵を握ります。
データサイエンティストに求められるスキル
米国LinkedInが2019年に発表した「有望な職種ランキング」において、データサイエンティストは第1位を獲得しています。日本でもデータサイエンス関連の書籍やセミナーが活況を呈しています。
ただ、データサイエンティストのイメージは、人によって様々です。データサイエンティスト協会(DS協会)は、データサイエンティストを「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」と定義しています。
上記を踏まえ、DS協会はデータサイエンティストに求められるスキルとして、「ビジネス力」「データサイエンス力」「データエンジニア力」の3つをあげています(図2.2.1)。
図2.2.2に、各スキルで必要とされるスキルカテゴリーを整理しています。求められるスキルが多岐にわたるため、いずれかに軸足を持つメンバーでチームを構成して運用することが多いです。
データ利活用の全体を俯瞰できる人材が必要
従来は、ITシステム部門などのデータを蓄積する側がデータ利活用を主導することが多く、データ統合しても活用に結びつかないケースが散見されました。最近では、Chief Data Officer(最高データ責任者)を設置する企業が増えています。ビジネス課題の解決にデータを利活用することを考慮すると、ビジネス力に優れたリーダーが就任することが望ましいです。
現場でも、ビジネスに精通した人材が全体を俯瞰し、データ利活用を推進していくことが望ましいです。チームメンバーも、ビジネス力、データサイエンス力、データエンジニア力のいずれかに強みがあることを前提に、各領域を最低限理解し、共通言語のもとに仕事を進めていくことがデータ利活用の成功には重要です。
統計解析、分析手法・ツールを学んでも意味がない?
データ利活用、データ分析のスキルを高めたいとき、統計解析や分析手法・ツールの勉強を頑張る方も多いと思います。その努力は素晴らしいですが、思うような結果が得られないことも多いのではないでしょうか。
統計学の有名な言葉に「GIGO(Garbage In Garbage Out)」があります。ゴミを入れれば、ゴミが出てくるという意味です。インプットするデータがゴミならば、どんなに素晴らしい解析をしても、出てくる結果はゴミになります。つまり、インプットするデータを価値あるものに高めていくスキルが重要なのです(図2.3.1)。
データ利活用に必要な知識・スキル
図2.3.2に、データ利活用に必要な知識・スキルを掲載しています。各ステップについて説明していきます。
【①課題を設定する】ステップでは、売れ続ける仕組みを構築するマーケティングの理解が必要です。また、ロジカル・シンキング、仮説思考、問題解決ステップなど、課題を正しく考えるためのスキルも必要になります。これらはデータ分析においても非常に役立つスキルです。
【②データを収集・蓄積する】ステップでは、課題解決に必要なデータを計画・収集し、データ統合基盤に集約・整理していきます。足りないデータは、自ら企画して1次データを収集する必要があります。
【③データを加工・分析する】ステップでは、分析目的・課題に合わせてデータを加工・分析します。機械学習の理解も必要になります。
【④適切に伝える】ステップでは、優れた分析結果も活用されないと意味がありません。ロジカル・コミュニケーション、レポーティング、プレゼンのスキルをもとに、分析結果をわかりやすく伝えていく必要があります。
本書は「データ利活用の共通言語を体系的に整理した基本書」です。なお、一冊で全てを説明するには限界があるため、各領域の深い知識・スキル、ツールは専門書を参照してください。
データ利活用に必要な知識・スキルの習得ステップ
本書は、データ利活用のプロセスに沿って章立てしています。本節では、これからデータ利活用のスキルを高めていきたい人向けに、知識・スキルの習得ステップを説明します(図2.4.1)。個々人、環境が異なるため、参考としてお読みください。
最初に「データ分析の流れをざっくり理解する」
出発点は、9.2、9.6で「データ分析のステップ」「クロス集計」を理解します。データ分析は「クロス集計の表側と表頭に、何の数字を設定して、どのような意味合いを抽出するか」に帰結します。自社データ、調査会社の自主調査などを使って、クロス集計に慣れることが重要です。
その後は、第4章「ロジカル・シンキング、コミュニケーション」を勉強します。クロス集計の前後に必要な「問いの設定」「So What?、根拠の展開パターン」を理解することで、データ分析の流れをざっくり掴みます。
ベースを作ったら「課題を設定する」ための知識・スキルを身につける
最初に、第3章「マーケティング」を勉強します。マーケティングの至る所で、データが利活用されています。顧客を起点に考える思考法を理解し、リサーチを中心とするデータ利活用のイメージを掴みましょう。特に、クロス軸に該当する「セグメンテーションの切り口」は暗記しましょう。
その後、第5章「仮説思考」、第6章「問題解決ステップ」を勉強します。仮説思考は、良い仮説の条件、仮説を生み出す発想法を理解します。問題解決ステップは、ステップごとのデータ活用イメージを掴みましょう。
【STEP3】で「データ分析の全体像」を押さえる
第9章「データ分析」、第10章「レポーティング、プレゼン」を勉強します。データ分析関連の書籍は、統計解析や分析手法の説明が多いですが、「空・雨・傘」による意味合いの抽出まで理解することが重要です。
また、調査会社が公開している自主調査を使って、レポートを作成し、プレゼンする機会を設けることをお勧めします。筆者がアンケートを推奨するのは、データの前処理が少なく、集計が簡単にできるためです。奇麗なデータで何度も練習するのがデータ分析を上達させるポイントです。
最後に「必要なデータを収集・加工する」必要性、ツールを覚える
データを利活用するには、必要なデータが手元にあることが前提になります。ただし、実際はデータが不足している、前処理が必要になることが大半です。そこで、第7章「データ統合基盤・データ活用規制の動き」、第8章「リサーチを活用した1次データの収集」を勉強します。SQL、Pythonなどのツール類は、オンライン学習などを活用して、目的に合わせて使えるようにしておきましょう。