機械がやる仕事、人がやる仕事
インターネットをベースとしたテクノロジーの発展で、手に入るデータの量や質が格段に高まったことは言うまでもありません。その恩恵を最大限に活かしたいと、多くの企業や自治体が考えるのは当然のことですよね。
そして、今ではそのスキルを社会人になる前の早い段階から身につけたい、身につけさせたいという流れも活発です。具体的には、多くの大学でデータ分析や統計学を学ぶコースが準備されていますし、高校生の授業の中でもデータ分析やデータ活用を目的とした内容を徐々に目にするようになりました。
確かに、こうしたスキルは今、そしてこれからの世の中で必要とされ、活躍するための必須スキルの一つと言えるでしょう。でもちょっと待ってください。その身につけるべき「中身」について、しっかり考えたことはあるでしょうか。
例えば、「多くのデータの中から何かしらの特徴を読み出す」。
これは多くの方が身につけたいと考えるスキルの一つだと思います。ではこのスキルの中身にはどういうものがあるのでしょうか。別な言い方をすれば、この目的を達成するためには何が必要となるのでしょうか。
具体的な答えを考える前に、ここではクライアントから私によく寄せられるお悩みの具体例をお話しします。皆さんにもこのような経験、身に覚えがありませんか?
「データを活かして成果を出したいと考える人が、ネットや身の回りで手に入るデータをかき集め、それをグラフや表などに加工し、その結果を眺めては、『そこから何が言えるか』を見い出すことに四苦八苦。気がつくと、いくつもの折れ線グラフや棒グラフ、平均値の表などが目の前に並んでいる」
「一体ここから何が言えるんだ?」
「もっと良いやり方はないのかなぁ……」
この悩みを解決しようと、多くの人は目の前のデータの中に答えがあるという前提で「どうすれば、今使っている目の前のデータから情報を引き出せるか」という方法論に着目します。その具体例としてよく挙がるのが、「統計」や「分析手法」、「データサイエンス」などです。
もちろん、これらの知識やスキルがゼロでは何もできないことは明白です。
そこで、多くの人が次のような内容を「データ活用のために学ぶ必要がある」と考えます。
- 統計学の知識
- 分析手法の理屈・やり方
- データの加工や分析作業方法(Excelやツールの使い方を含む)
機械のほうが圧倒的に得意な仕事が既に世の中にある中で
ではこの中で、人ではなくツールや機械(AIなどもその一部と考えます)などに必要なことをプログラミング、入力することで実現できてしまうものはどれでしょう。
おそらく、いずれのケースでも「実現可能」という答えになるのではないでしょうか。それと同時に、それらのツールや機械を入手すること、使うことのコストも加速度的に下がってきているのが現状です。そして、この傾向は今後も続くことでしょう。
例えば、多くの統計知識を正確に理解し記憶することや、正確に大量の計算を高速で実行し表示することなどは、既に人が行うよりも圧倒的に機械のほうが上手です。人は、記憶したことを忘れます。入力ミスをします。計算間違いや勘違いをします。大量のデータや情報を適切に把握することが苦手です。マニュアルで作業を行えば、その分、時間と労力(そして人件費)がかかります。
ではなぜ、人が機械に対して太刀打ちできないスキルを今から時間とコストをかけて身につける必要があるのでしょうか。その結果、機械に勝る価値を生み出すことはできるのでしょうか。
私は、この答えは「NO」だと考えています。そう考える理由を述べておきましょう。
世の中では同様のことが既に完了しています。例えば、今から駅の改札の切符切りのスキルを学ぼうとするでしょうか。ATMが立ち並ぶ中、銀行窓口でのマニュアル伝票処理のやり方を、今からあえて積極的に学ぶでしょうか。車の運転技術でさえ、近い将来、人があえて身につけるスキルではなくなる可能性があります。
私は、データ分析の作業スキルや知識そのものは、これらに近いものがあると考えているからです。
重要なのは、これからの自分に必要なスキルを見極めること
もちろん、機械にどのような情報を記憶させるか(統計理論や分析方法など)や理屈はどういうものなのかといったことに対する理解は、無いよりも有るに越したことはありません。自分が利用するツールの仕組みを知っていることで、機械を適切に使えているかのチェックができるかもしれません。また逆に、そのツールや機械を開発する人(データサイエンティストや開発者など)にとっては、特に必須の知識だと言えます。
ただ、このような専門職種ではない、自分の目的や問題に対してデータを活用したいと考えるその他大勢のユーザーであるならば、本当に欠かせない必須なものは何かをよく考え、身につけるべきでしょう。
つまり、「機械に任せてしまえること」「任せるほうが良いこと」と、「機械ができないこと」「人がすべきこと」を区別し、後者のスキルを身につけて磨き、必要な形で機械を有効活用することで、アウトプットの最大化を目指したい、というのが私の主張です。
価値あるアウトプットを導き出すために
では、「どんどん便利になる機械やツールがあり、その使い方や操作法さえわかれば、あとは『お任せ』で欲しいものが手に入るのか」と言うと、そうでは(残念ながら)ないのです。
実は、機械やツール(そしてその操作方法の知識)だけあっても成果が出ないことに気づいている人は多くありません。この点が「統計は学んだのに」「分析手法は本や研修で身につけたのに」、仕事などの現場で活かせていない、使えていないという悩みの、主な原因でもあるのです。
データを最大限に活かし価値あるアウトプットを導き出すためには、機械やツールの操作への理解を深めることとは別に、人が身につけるべき高度で価値あるスキルが必要となるのです。
統計を学んでも統計を「使える」ようにはならない
機械やツールの他に、「データ活用」という目的を達成するために何が必要なのか、考えてみましょう。
ここまで述べた機械やツールを、作業をする「箱」だとします。その箱は、いかに素晴らしい機能を有していても、目的に沿って必要な情報やゴールが与えられていないと有効に動きません。
「データをもっと活用できるようになりたいのに、現状はできていない」というお悩みを私のところに持ってこられる企業や自治体のクライアント、どうしたら学生にもっとデータ活用リテラシーを身につけさせることができるのかと考えている大学や高校の先生方に、私はこの図1で説明しています。
統計知識や分析手法など、機械やツールが得意とする部分が、中央の(2)の箱です。この箱は、その左にある(1)の「分析前の問題・目的定義と仮説構築」という「インプット」によって、初めて有効となります。
また、(2)によって出てきたアウトプットは、あくまで計算や分析の「結果」に過ぎません。「結果」は、(1)で定めた目的や問題に対する直接の答えにはなりにくく、そのため、相手に伝える際にも理解や納得がされにくいことになります。
そこで、その「結果」に目的や問題に沿った解釈を加え、「ストーリー」すなわち結論に置き換えます。これが(3)の作業です。
私は、この一連のプロセスこそ「データを活用する」ために必要だと説明しています。
価値あるスキルとは
既にお話した通り、多くのクライアントは当初、データ活用ができない理由を(2)のスキルや方法論の不足にあるのでは?と考えています。
確かにそれ自体に問題があることも稀にありますが、仮に問題があったとしても、それこそ人が分析作業のスキルを上げるよりも、機械に任せてしまうことで解決できるケースが多いのです。
その一方、話を聞けば聞くほど、図1の(1)と(3)の欠落、もしくは不適切であったり不十分であったりという問題が、(2)を活かせていない本質であるケースがほとんどなのです。
つまり、(2)の代表例である統計学やデータ分析手法そのものをさらに積み上げることそれ自体は、お悩みに対する本質的な解決になりません。野球のルールを知っていても、ヒットを打てないのと同じです。代わりに、(1)や(3)で示している統計や分析手法を活かすための「考え方」が必要となります。
そして、これらは決してマニュアルや教科書に書いてある通りに見よう見まねで試してみたり、機械のスタートボタンをポンっと押したりすることで答えが出てくるものではありません。むしろ、そうでないために難しく、だからこそ(1)や(3)は価値が高いスキルだと言えるのです。まさに生き残りのためのスキルがこれだと、私は確信しています。
身につけるべきスキルは何か、再度確認する
さて、先ほどの三つの箱の上にある文字に注目してください。「考える」部分と「作業する」部分を明確に区別していることにお気づきでしょうか。「作業する」部分がすなわち、機械のほうが圧倒的に、正確かつ速く実現できる内容です。人が価値を生み出すところが「考える」部分、すなわち(1)と(3)に相当します。
あなたは一体、作業者としてのスキル(2)を向上させたいのでしょうか? それとも、(2)を活かすためのインプットとアウトプットを「考える」スキルである(1)と(3)を向上させたいのでしょうか?
まずは、それをはっきり認識しましょう。
本書では、(1)と(3)のスキルを、価値が高い「データ活用リテラシー」と定義し、深掘りしていきます。
このスキルの具体的な中身やそれを高めるための考え方、テクニックはあとの章で具体的に紹介していきますが、次節ではその前に、それを阻んでいるよくある状況について確認しておきましょう。
皆さんも自己チェックとして確認してみてください。
「まずデータを見る」を止める~データの中に答えなんかない~
私の研修やワークショップでは、例えば図2のようなグラフが出てきます。
皆さんは、このデータ(グラフ)をどのように活用しようと考えるでしょうか?
参加者からは、このグラフから言えることとして、例えば「燕市の子供の人口密度は、新潟市よりも小さい」「三条市よりも2倍以上大きい」などという意見が出ます。
では、このアプローチで本当にデータを活かすことはできるのでしょうか。そこから導いた結論が有用な情報をもたらすと感じられるでしょうか。
「データから何が言えるか」だけで、本当にビジネスの現場で勝負できるのでしょうか。
実際のワークショップでこれを見ながら参加者に考えてもらうのは、「このグラフから何が言えますか?」ではなく、「このグラフを作ってみようと思った人は、(グラフ作成の前に)何が言いたかったのでしょう?」ということです。皆さんは、この二つの問いの意図の違いにお気づきでしょうか?
前者は「データやグラフ有りき思考」を前提とした質問で、誰かが作ったデータやグラフを読み解くことだけを求めています。ここでは、そもそも自分が知りたいこと(目的)も、その目的に合ったデータの選択も、そのデータの必要な見方も考えられてはいません。
一方、後者の質問は「目的思考」と言えます。データ作業の前に、そもそも何を言いたいのか(知りたいのか)を考えた上で、必要なデータを用いて必要な作業を行うアプローチです。
私が目指すデータ活用リテラシーとは、まさにこの後者のことです。
「データを活用できない」人に共通する課題・問題点
前節に掲載した図1の(1)や(3)の必要性を認識していない、または必要性を理解していても適切に実践できていないという課題を持つ方達には、ある共通点があります。その一つは、「目の前のデータを見てみることから始める」ということです。並んだ数字を見たら、まずはグラフを作ってみる、平均値や合計を出してみる……といった行為に、身に覚えはないでしょうか?
実はそれがあなたを「データを活用できない」人にしているのです。
データ分析を実務で活かせていない人は、「目の前のデータを適切にいじると、何か有用なものが見えてくるはず。何も見えてこないのは、分析方法や知識が欠如しているからだ」と思っています。つまり、データや作業がまず先に有りき なのです。
ここで、とても重要なことをお伝えしておきましょう。データがあなたに答えを持ってきてくれることはありません。どんなに高度な統計や分析を駆使しようとも、です。
そうではなく、代わりに、「あなたは何を知りたいのか。それを知って何をしたいのか。そのためには、どんなデータ(指標)が必要なのか」を具体的に考えることが、とにもかくにもまず必要です。これが、図1の(1)で必要としていることに他なりません。この部分がすっぽり抜けたままデータを眺めたところで、使えないグラフが量産されるだけなのです。
この問題の本質は次の図3で説明できます。仮に「知りたいこと・言いたいこと(目的)」や「解決したいこと(問題)」が明確になったとして、そのために必要な情報の範囲が一番外側の枠で示されるとします。
その目的や問題に関連していそうなデータが目の前にあるとして、思考停止したままそれを使うとどうなるでしょう?
そのデータは真ん中の枠の情報しか持ち合わせていないかもしれません。それでも無理やりそのデータに分析手法や統計手法を当てはめて、何かしらの計算結果を出すこと自体は可能です。ただし、その計算結果を見たあなたが知り得る情報は、一番小さな白い枠に留まります。
この状況がどういうことなのか、少し考えてみましょう。「関連するデータから情報を読み取れた」とは言えるでしょう。しかし、「本質的に必要な情報を網羅的に取得できた」とは言えないはずです。そして、分析した本人であるあなたは、自分が冒しているその問題に気づくこともありません。
私は研修や講演などで、このことをややセンセーショナルに伝えるために、「データの中に答えなんかない(あると思ってデータを触り始めるから、データをいじくり倒すことに終始してしまう)」と表現しています。
これからの時代に本当に必要な知識とは
特に高校生や大学生など、これからの時代に価値ある成果を出し、生き残っていくための武器を身につける立場にある人や、それを教えている方々には、「方法論や知識」と「その活用法」のどちらが必要なのか、をまずは確認頂くことが重要だと思います。わかりやすい例で言えば、「グローバルな環境で、必要なコミュニケーションが取れること」が目的の場合に、英単語と詳細な文法だけを学ぶ(教える)ことで目的を達成できるか、という問いと同じです。実際、今の日本ではそれが達成できていないですよね。
最低限の単語と文法は必要ですが、もっと重要なスキルは、それらを使ってコミュニケーションができることです。そのスキルを身につけることは、さらなる単語と文法の追加習得では実現しないのと同じです(もちろん、英文学者やプロの通訳・翻訳家になることがゴールであれば話は別です。プロのデータサイエンティストになりたいのであれば、高度な統計や分析、機械学習、プログラミングなどの習得が必要であるのと同じ解釈です)。
本書がお伝えすること
データ分析は目的化されやすい。
私が痛感していることです。データやデータ分析は、目的を達成するためのツールに過ぎません。あくまで言いたいことや解決したいことがあって、その上でその目的に対するインフラやツールとしてデータを活用するわけです。インフラやツールが単独で事を成すことはないのです。
読者の皆さんには、「既存のデータの読み方、分析の仕方(データ有りきアプローチ)」のテクニックや高度な方法論ではなく、自分の目的や問題に対して適切なデータを適切に活かして価値あるアウトプットにたどり着くための、考え方とテクニックをご紹介したいと考えています。
ここまでの内容を元に、是非、皆さんの現状の「データ分析・活用」のレベルを確認してみてください。実務経験がない方は、これまで「データ分析・活用」と聞いてイメージしていたものを当てはめてみてください。
ここで注意していただきたいのは、決して「レベル1⇒2⇒3」の順にスキルアップするものではないという点です。本章の結論は、「レベル3をすぐに始めましょう」です。
レベル1≒グラフありき
何となくテーマに合っていそうなグラフなどをかき集めて、そこから読み取れたことを結論とするものです。自ら問題意識や具体的テーマを持ちづらい高校生などが陥りがちなパターンと言えるでしょう。
グラフから情報を読み取ること自体は分析と呼ぶにはふさわしくありませんし、複数のグラフを無理やり結びつけただけの結論は論理が破綻します。
レベル2≒データありき
レベル1との違いは、手元にあるデータを自らグラフなどに加工するステップが入ることです。自分の手による作業が入ることで「分析している」感は出てきますが、そこから得られるものは、レベル1と大差ありません。
レベル3≒目的ありき
「既存のグラフやデータから何が言えるか」ではなく、あくまで自分の知りたいこと(目的)に沿ったデータで分析を行い、結果を検証し、結論につなげることができるものです。
本書で用いるデータ活用のプロセス
レベル3をすぐに開始するために必要な、データ活用のプロセスが図8です。第2章からはこのプロセスに沿って一緒にスキルを上げていきたいと思います。
現時点ではプロセスの一つ一つに対する理解は不要です。このような流れで考えるのだな、くらいに捉えておいてください。