アナリティクスで必要になる3つのロール
皆さんこんにちは、SAS Institute Japanの津田です。アナリティクス初心者の方を対象とした連載「はじめての人にもわかるアナリティクス講座」の第3回をお届けします。
今回はアナリティクスの人材やスキルについて議論したいと思います。私は、アナリティクスの人材に関してお客様から質問をお受けすることが多くあるのですが、そこで断片的にしている話をまとめてお伝えいたします。組織論に関して、つまり人材をアナリティクスの発展段階に応じていかに組織として機能させるかに関しては次回以降に譲りたいと思います。
3つのロールとアクティビティ「データ・分析・活用」
人材論に入る前に、まずアナリティクスのアクティビティをざっとおさらいしましょう。
1. データ: 分析する対象のデータを用意する
2. 分析: 統計分析ツールなどでデータを分析する
3. 活用: 分析結果を説明し業務で活用してもらう
上記はほぼ自明かと思います。データを用意し、分析し、使ってもらう。シンプルに言えば3つのアクティビティなわけです。アナリティクスに必要な人材も大きなカテゴリーではこの3つとなります。データを用意する人、データ分析をする人、活用を働きかける人です。それぞれのロールで必要なスキルをかいつまんで見てみましょう。
※ 初心者の方のために、ここではロールの3つの大きなカテゴリーを示しますが、業務の性質に応じて、各ロールがさらに細分化することも多いと思います。
データ・ロール:「データを用意する」
アナリティクスのスタートは、分析するデータを用意すること。前回は「手元にあるデータだけで考えていませんか」というテーマでお送りしましたが、分析を実りあるものにするために、必要なデータをきちんとそろえることは大切な作業です。1つめの役割データ・ロールに必要なスキルは以下の2つです。
業務やデータに精通していること
必要なデータが会社のどこにあるのかに始まって、各データの信頼性や粒度・鮮度、コードの意味など細かいことにまでデータや業務の内容に精通している必要があります。
データベース技術
データソースからデータを集めてきて分析に適した形に成型するために必須の技術です。「ビッグ・データ」と共に語られる最新テクノロジーの多くはここに関係しています。
前者は必須のスキルです。間違ったデータの理解に基づいてデータ分析を実施しても、間違った結論に行き着くだけですよね。データを用意する人には、会社や業界の長い経験が求められます。一方、後者のデータベース技術は日進月歩の世界ですので、それにキャッチアップしつつ業務に精通するのは大変なこと。だからこそ、やりがいのある、頼りにされるロールと言えます。
私の失敗談:データに紛れ込んでいた、ある項目
データ理解の重要さを具体的にご理解いただくために、私の過去の失敗例をひとつご紹介したいと思います。あるIT企業のお客様から、大規模なサービス契約が取れる確率の高い顧客をリストアップしたい、というリクエストを受けたことがあります。
私が作ったモデルはかなり予測精度も高く、意気揚々と発表の場に臨んだのですが、説明変数(将来の契約を占う情報)として「ERP(Enterprise Resource Planning)製品の購買が数か月前にあったこと」というのが紛れ込んでいると指摘されました。購買データのカテゴリーコードの振り方が前年から変わっていて、ERPがそれと気づかれないまま紛れ込んでいたのです。
お客様からは、「ERP購買の数か月後に大規模サービスが売れるなんて当たり前」と言われてしまいました。単なるドジに聞こえるでしょうが、そのレベルのデータ確認を予め行うのはなかなか大変です。データ・ロールの人とは普段からよくコミュニケーションを取っていただきたいと思います。