豊澤栄治氏の人気連載「実践!WebマーケターのためのR入門」を書籍化した『楽しいR』の発売を記念して、前編に続いて、豊澤氏とアトラエの井端 康氏の対談をお届けします。
初心者がつまずきやすいポイントとは
豊澤 僕は学生の時に数学や統計の勉強を専門でしていたわけではないのですが、以前勤めていた会社は、まわりが真の理系集団で。例えば「ノーベル物理学賞を受賞した研究室にいました」とか普通で、みんな「理系でドクター(博士号)持ってます」とか「趣味は数学です」とか、そんな方々ばかりでした。
そんな中にぽーんと入っちゃって本当に苦労したんですけど、数学の勉強もあらためてしました。ただ「数学的な理論的背景を完璧に理解できなくとも、ポイントを押さえて実務上間違いなく使えればいい」という話も一方にはあります。そうだとすると、社会人の頑張りでもある程度はできるんじゃないかと思ってます。
―豊澤さんから見ると、データ分析で初心者がつまずきやすいところって何かありますか?
豊澤 これは僕がSPSS時代のデキる先輩から聞いた話で、「初心者は手元にあるデータが、どういう種類のものかわかってない」と。まずわかることが大事で、手元にあるデータと知りたいことがあれば使う手法はおのずと決まってくるんですよ。あとは、分析に使う手法に合ったデータの持ち方になっているか。さらに「知りたいことが何か」が決まれば使うアプローチも決まります。そのアプローチがいくつもあるので、コードを入れ替えて試してみると、Rはポンっとアウトプットを出してくれるので、その結果をきちんと解釈すればいい。
―すごい理系集団の中にいる時は、同僚に質問はできない雰囲気だったのでしょうか。
豊澤 いや、あんときは本当きつかったですね(笑)。でも、上司がものすごいできる人だったんです。締切が設定されていて、たとえば3週間ぐらい分析期間があるとするじゃないですか。僕なりに右往左往しながらやっていって締切が近づいてくると、上司がちょこちょこ僕を見てるんですよね。週末に会社来ると上司もいたりして。で、いよいよ残り3日ぐらいになったところで、「いやー、ちょっと危ないなって思ってたんだよねー」とか言いながら、「じゃあ、やるか」とか言って(笑)。その人が「うおー!」ってSASでコード書くと、ものの2時間ぐらいで終わってしまって(笑)。
―俺のこれまでの作業は何だったの(笑)。
豊澤 僕にとって、その上司、すごい神様みたいな人ですけどね。中間ゴールは設定しといて、ペースがあまりよくないと、最後に自分がやればできるだけのバッファ取っといて、だめだったら全部ケツふきにくるっていう。
―すごい上司ですね。
豊澤 スタンフォード大学を出てる人で、本当にすごい方なんですけど、プラズマテレビは早く買い過ぎたと後悔されていましたね。
一同 (笑)