「データサイエンティスト」とは何者か
ビッグデータ時代の今、データサイエンティストの存在がビジネスに不可欠だと誰もが感じているだろう。一方で、どんな仕事をするのか、何が能力として求められるのか、具体的にイメージできる人は多くはない。はたして「データサイエンティスト」とは何者なのか。
「多くのかたがデータサイエンティストを“特殊な仕事”と考えています。そろそろ、その認識を改めた方がいいかもしれません」そう語るのは、立教大学経営学部で教鞭をとる佐々木宏氏だ。
佐々木氏は経営コンサルタントとしての経歴を持ち、現在は大学教授としてビッグデータやIoTなど新しいテクノロジーの普及過程を研究しつつ、学生に対してマーケティング・リサーチ手法を教えている。長きにわたり、ビジネスと学術の両現場でデータ活用に携わってきた人物だ。
「かつての企業とデータの関係を振り返ると、データアナリストあるいはリサーチャーなどと呼ばれる、ごく少数の専門家が各部門の依頼に応じてデータを整理・分析し、結果をレポートにまとめ、経営陣などへ提案する。一般に、こういう形で業務を遂行してきました。
もちろん、この形態もまったく無くなったわけではありませんが、これから求められるデータサイエンティストは、もっと身近で現場に近い存在でしょう。デジタルデータが氾濫している今日、これまで以上に期待が高まる職種であることは間違いありません」(佐々木氏)
需要高まる「問題解決型データサイエンティスト」
データサイエンティストとはどのような職業か。新しいアルゴリズムやツールを開発し、世の中を変革するプロフェッショナル『イノベーター』が存在する。いわば0から1を作り出すトップレベルの仕事だ。他にも、現在、需要が高まっている存在として『問題解決型』データサイエンティストがあげられる。こちらは、ビジネスの現場で起きている課題解決の糸口を、データ分析からから見つけ出すことを主とする。
「問題解決型データサイエンティスト」が求められる背景には、あらゆる“モノ”から多様で大量なデータを、リアルタイムかつ誰もが容易に取得できるものになってきているという環境の変化がある。
これらのデータはまさに「宝の山」であり、その中からビジネスの鍵となる「宝石=真実」を実務にいち早く役立てることが期待される。さらに、データの収集や分析のツールも増え、技術やコスト面でのハードルが格段に下がってきた。
つまり、一般のビジネスマンでも専門家に依頼せず、自身で分析し、解を得られる時代になってきたというわけだ。では、「問題解決型データサイエンティスト」に必要なスキルにはいったいどのようなものがあるのか。
「問題解決型データサイエンティスト」に必要なスキル
データサイエンティストに求められるスキルには、一般にどのようなものがあるのか。データサイエンティスト協会では、必要とされるスキルセットとして「データサイエンス力」「データエンジニアリング力」「ビジネス力」として3つの分類を定めている。
では、問題解決型データサイエンティストでは、何がキーポイントになるのか。佐々木氏は「交渉力」や「解決すべき課題を捉える力」、また「課題解決によりどれだけの効果が期待できるのかを見極める力」などの「ビジネス力」をあげる。
「ビジネスの現場では、データの取得や分析ニーズを的確に把握するために社内外との折衝や、コミュニケーション力が不可欠です。分析業務の効率性や費用対効果なども鑑みる必要があります。
取り組みの効果は、できる限り定量化することが望ましいですが、必ずしもそればかりではなく、長期的な価値や意義も含めて各部門や経営層に伝えるプレゼンテーション力が求められるでしょう」(佐々木氏)
ここまで聞くと、「データサイエンティストになるには、こんなにいろいろスキルが必要なのか」と腰が引けてしまう人もいるだろう。しかし、佐々木氏は「それらを必ずしも1人で受け持つ必要はない」と語る。
つまり、組織なら複数で連携し、トータルでデータサイエンティストの機能を担えばよい。個人では、自身の実務において、何の目的で、どのような成果を出すためにデータを扱う必要があるのかを考え、必要なスキルを学べばよいのだ。
たとえば、事業の戦略を考え、提案をする立場であれば、「ビジネス力」「データエンジニア力」を中心に、結果から意味を読み取り、ツールで可視化して伝える力を養うとよいだろう。
一方、KPI(重要業績評価指標)を計算するための分析モデルを考えたり、実装をしたりすることが求められるならば、「データサイエンス力」「データエンジニア力」を中心に、プログラミング言語などを駆使して高度な解析から実装までをできる力を養うとよい。
文系マーケターがスキルを磨くために有効なアプローチ
では、データサイエンティストになるためのスキルを磨くためにどうすべきか。佐々木氏は、理系・文系など学んできた内容によって、有効なアプローチは異なるのだという。
数学的素養があるならば、オーソドックスに統計学から入り実践を積み上げてゆくアプローチが適している。一方で数学に触れてこなかった場合は、まず分析ツールを用いて実践するとよい。利用を繰り返すうちに「分析の勘所」といった直感的な感覚が体得できるというのだ。
「昨今のツールは、比較的容易に分析を行うことができます。さらに、視覚的に分かりやすくレポートしてくれるものも多い。試行錯誤しながら、結果の見方や判断の仕方を学んだり、結果から逆算して理論を理解したりすることで、実践的なスキルを身につけることができます。ExcelのマクロやVBAなどから、プログラミングの世界に足を踏み入れていくのも、高度な分析の“実感”を養うために効果的だと思います」(佐々木氏)
ただし、自己流で突き進むのはリスクも伴う。結果の見方や判断の仕方など解釈を誤ってしまう可能性があり、分析を熟知した人のアドバイスや正誤判定が受けられる環境が不可欠だ。
「最近では、オンラインで学べる講座も登場してきています。必要に応じてフィードバックも受けられますし、短時間で効率的に学べるので特に忙しいかたにおすすめです。
注意していただきたいことは、ツールや言語はそれぞれ特徴や、得意・不得意がある点です。たとえば、「Power BI」や「Tableau」などのBIツール(ビジネスインテリジェンスツール:データを蓄積・分析・加工して意思決定につなげるツール)はデータを可視化し、意味を読み取りたいケースに適しています。それこそ、先ほど申し上げた文系のかたが扱うのに向いています。
逆に、いきなり「R」や「python」などのツールに触れると最初は敷居の高さを感じるかもしれません。こちらは統計モデルの理解やプログラミングの知識が求められるので。ただ、慣れてくれば部品を自由に組み合わせてモノづくりをするような楽しさを味わうことができます。
また、一口にBIツールといっても様々です。自社の環境や利用者の声などを参考にツールを選ぶと、ミスマッチは減らせるでしょう。
とはいえ、まずはデータサイエンスがどのような世界なのか、第一歩を踏み出して覗いてみていただきたいと思いますね」(佐々木氏)
はじめの一歩を踏み出すために
佐々木氏の言葉の通り、データサイエンティストを志すならば、勇気を出してはじめの一歩を踏み出すことが必要だろう。そこで最後に、取材でも出てきた「Power BI」「Tableau」「python」について佐々木氏および利用者の声に加え、ベネッセが日本版の展開を担うオンライン学習プラットフォーム『Udemy』で提供されている「データサイエンティスト養成講座」中のオススメ講座を紹介したい。
同講座はMarkeZine読者限定で2016年6月5日まで、特別価格で受講が可能だ。好評につき割引期間を2016年6月15日(水)まで延長。皆様の学習のスタートラインになれば幸いだ。(※本記事は2016年5月に公開された記事です)。
Excelライクで親和性高くスムーズに導入、可視化で容易に共有「Power BI」
Power BIを活用する最大のメリットは、自社のビジネス課題をチームメンバーや会社全体で容易に共有できる点です。直感的なインターフェイスで分析軸を自由に切り替えられ、分析アプローチと連携して視覚化することが可能です。短期間のうちに様々な分析結果を比較・検討できることも大きな魅力です。
また、Azure ML(Machine Learning)やSQL Serverと連携させると、機械学習による知見をPower BI上で視覚化できるため、作成モデルの予測結果の確認や精度検証を高速に実施しやすくなります。
<佐々木教授のワンポイントアドバイス>
ExcelライクなGUIでビジネスユーザーとの親和性は高いです。Excelでは物足りないという人に、ぜひ触ってみてほしいツールです。クラウドベースのPower BIなら無料で手軽に試せる点も学習向きです。
「Power BI」を学べるオンライン講座
Power BIで学ぶ、データサイエンティストの 分析プロセス入門(1時間)
Power BI を使用したデータ分析入門講座(2時間)
学習概要
・大量データを抽出、加工できるようになる。
・基礎的な分析、可視化をできるようになる。
・データエンジニアリングの基礎を身につけることができる。
こんな人にオススメ
・分析、データ活用をしたい
・プログラミングをせず、ExcelライクなGUIで分析・データ活用を学びたい
VBAやマクロが気になるかたは、こちらもオススメです!
直感的な操作で分析・可視化、データ統合でモニタリングも容易に「Tableau」
Tableauの最大の魅力は、専門スキルがなくても直感的な操作で簡単にデータを分析・可視化して、さまざまな知見を得られる点だと思います。導入前はユーザー部門の要望をもとにITマネジメント室がレポートを開発・提供していましたが、多くの時間を要し、細かな分析ニーズへの対応が難しいという課題も抱えていました。今では、ユーザー部門でレポートの修正・追加をすばやくできるようになりました。そのため、全社や各組織のPDCAサイクルが加速しています。
また、システムで管理しているデータと各組織が個別に管理しているデータをTableauで一元的かつ簡単にモニタリングできるようになりました。
<佐々木教授のワンポイントアドバイス>
BIツールとしての性能もさることながら、レポートのビジュアル訴求力が秀逸。有料ですが既に会社でライセンスを保有している場合もあるので、確認してみるとよいでしょう。
「Tableau」を学べるオンライン講座
Tableau(タブロー)で実践!ビジネスユーザのためのデータ集計・視覚化・分析 基礎編(4.5時間)
Tableau(タブロー)で実践!ビジネスユーザのためのデータ集計・視覚化・分析 応用編(4時間)
学習概要
・データから問題点や、新しいチャンスを発見することをスピーディに、楽しみながらできるようになる
・データを視覚的に把握できるダッシュボードを作ることができるようになる。
こんな人にオススメ
・日々の業務で、データを活用してみたいと思っているかた
・Tableauを初めて使う方、使い始めて間もないかた
・Tableauを使ってみたが最初の段階でつまずいてしまった方、もっと使いこなしたいかた
ライブラリの充実で分析速度アップ、プログラミング初心者にもおすすめ「Python」
主にがん研究分野における大規模データの解析をPythonで行っています。Pythonはデータ解析に関するライブラリ(プログラムの部品)が豊富なので、すぐに目的のものを作る事ができます。たとえば、Web上のデータを持ってきて、加工し、見やすく可視化した画像を作る一連の作業をすべてPythonで行えるのです。ツールを併用していた時に比べ、仕事のスピードは格段に上がったと思います。
Pythonは、覚えやすく書きやすいプログラミング言語なので、初学者にも向いています。今後、データ解析が中心となる世の中で、学んでおいて損はないスキルだと思います。
<佐々木教授のワンポイントアドバイス>
簡便なプログラミングで多彩な形式のデータ統合をすることができます。各部門、各チームで様々に分析している結果やナレッジを、1つにまとめたいという方に特におすすめです。
「Python」を学べるオンライン講座
学習概要
・Pythonを使った基本的なプログラミングができるようになる。
・データの統計的な処理や可視化、機械学習アルゴリズムの基本がわかるようになる。
・JSON、HTML、Excelシートなどのデータ形式をPythonで扱えるようになる。
こんな人にオススメ
・Pythonを使ったプログラミングを学びたいかた
・Pythonプログラミングだけでなく、データサイエンスやデータの可視化に興味があるかた
・応用範囲の広いデータ解析のスキルを身につけたいかた