広告の運用に割く時間は全体の「0.5割」
―豊澤さんが、Rを使うようになったきっかけは?
豊澤 ロックオンには、SASのようないわゆる統計解析ツールはなく、かといって高価なツールを入れることもできなかったので使い始めました。Rと、処理を自動化するのに便利なPythonというプログラミング言語を合わせて使っています。
井端 Pythonはよく話に出ますが、どういうフェーズで使うんでしょう。データの整形とか、データを取ってくるところですか?
豊澤 Pythonはそこも一貫してできちゃうので、システムに組み込みやすいというのがあります。実は僕、Rはちょっと苦手だったりするんです。でも、RはRでどんどんパッケージが進化していって、現在ではしのぎを削ってるのかなという感じがありますね。
―井端さんのメインの作業というのは?
井端 以前は広告の運用がメインの仕事だったのですが、今は全業務の多分0.5割くらい、1割を切ってます。現在のメインはどちらかというとウェブサイトの運営の方です。サイトのUIをどう変えるか、ユーザーの動線設計が中心。あとは何か問題がないか定期的に数値を見て、何か見つかったらドリルダウンしていくという、体系化しづらい調査がメインですね。
―広告運用の仕事が0.5割くらいになっているのは、Rを使って効率的に仕事をしているからとも言えるのでしょうか?
井端 そうですね。今は上司を説得してBIツールのTableauを入れたので、Rで僕が3か月くらいかけて組んだ処理が、全部Tableauに入れ替わりました(笑)。「うわ、要らなかった」と思って。今はモデルを使った分析作業みたいなところに時間を割いています。
―「Rを使うと何が便利になるのかな」と疑問を持っている人は多いと思うのですが。
井端 僕の理解も正確ではないと思いますが、以前はどちらかというと作業の自動化に使っていました。でも、それがRの一番の強みではないなと。どちらかというと、持ってるデータから、人の目では直感的には判断し得ないものを抽出する作業に、Rを使うのが妥当なんだろうなと思っています。今も勉強中なので、その認識は動いてたりしますが。「あ、これ、こういう使い方のほうがうちには合ってるな」とか。
これはもうRは全然関係ないんですけど、Greenという転職サイトの場合、事業の特性上、「広告を使ってユーザーを獲得したら終わり」ではないんですね。その人たちが実際に企業に応募して就職が決まってはじめて、僕たちはお金がもらえるんですよ。なので、一番知りたいのは、「いくらでその人の採用が決定したのか」という単価が知りたいんです。
でも、何もしないでいるとデータとして出てくるのは、登録の単価だけ。その数値から最終的な採用単価を出すのですが、その計算を手でやっていた。それをいったん自動化したいというのが課題としては一番優先度が高かったですね。何か高度なモデルを使ってどうこうっていうよりは。それができるようになった後で、広告の効果に興味を持ち始めたんですけど、まだちゃんとしたモデルを作ってやるところまで行ってないですね。
分散処理も可能に、進化し続ける「R」
―豊澤さんにとってのRとは?
豊澤 道具。けっこう何にでも使える道具ですね。どんな使い方をしてもいいし、しかもフリーっていう。で、やる気になれば「パッケージ」がある。パッケージを作った人のサイトに行って、より詳しい情報を見たり、場合によっては作った人に質問もできちゃう。深堀りしようと思えばどんどんできる。
余談ですけど、「Rは分散処理が得意ではない」と言われていたのですが、大規模データに対応したパッケージや専門書籍も出てきていますね。どんどん日進月歩で進化している。グラフをキレイに出すのが簡単にできるというところから、分散処理まで本当に汎用性が広いなと思っています。
―その汎用性の高さが、初心者にとってはつかみどころがないように見えるのかもしれませんね。
豊澤 おそらく業務ごとにRが役立つところが違うんですね。自分の業務で効果がすごく出そうなところにポイントを絞って勉強すると、はじめの2、3日だけで、もう目指す効果の半分ぐらい行っちゃうんじゃないか、という気はしますけど。
井端 僕の場合は、そもそもオモチャみたいな感覚でRを使っていた(笑)。だから、事業に活かそうと思ってはいるんですけど、「活かせたらたらいいな」くらいの感覚でやっていた部分はありますね。今もオモチャとして認識してます。正直、使える部分があったらラッキーぐらいに考えてる。
―その距離感がいいのかもしれないですね。
井端 Rの本も、面白そう、使えそうなのがあったら週末読んでみる。だからRを理解しなきゃいけないともあんまり思ってないんです(笑)。良くも悪くも、今の業務を100%変えるものではなかったりするので。ただ、単純に「アウトプットが面白いな」っていうのはすごく感じています。直感に反するアウトプットが出てくるものって、ゲームもしかりだと思うんですけど、僕はすごい面白いなと思ってて。そのテレビゲームの感覚に比較的近いんですよね(笑)。
豊澤 どちらかというと、僕の場合は追い詰められてやってる(笑)。会社の中で新しいソリューションを開発するというミッションがあるので。ヤル気のある若手の教育を含めて、誰でも分析して解釈できる土台を作る、ということにチャレンジしています。
今すごく注目されてる分野で言うと、マスとデジタルの統合ですね。まだテレビはテレビ、ウェブはウェブというふうに縦割りになってますけど、実はテレビでCM打つと、ウェブの方に跳ね返ってくる。これは現場のマーケッターの方々は皆さん感じていらっしゃると思います。
オンラインとオフラインを統合した効果測定というのは、シングルソースパネルなどを使えばできるんです。でも一人一人にアンケート取ったりすると、お金も時間もなかなかのコストになってしまう。そういうものをもっと簡易にやることが、30年ぐらい前の計量経済学の手法などを使うと可能なんです。それらを「R」っていうソフトを使うとすぐできますよと伝えたいんですが、なかなか難しい。本当に理解してもらうには、こちらからもかなり歩み寄らないといけない。
―後編では、さらに現場の危機意識について突っ込んでお聞きしたいと思います。
本の内容を豊澤さんが紹介しているインタビューも公開中です。こちらからどうぞ。
データの扱い方・読み解き方がわかる!『楽しいR』2月9日発売!
『楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人のためのR統計分析入門』
豊澤栄治 著、翔泳社、A5判/208ページ、本体:2200円+税
全国の書店、オンライン書店(翔泳社/Amazon)で発売中! 2月20日発売の電子版はこちらから予約受付中!
第1章 とっつきにくいけど実はExcel 以上に賢いヤツ
フリー統計解析ソフトウェア「R」を触ってみよう ~Rイズム~
第2章 Rで分析を始める前に データに異常値がないかを確認しよう ~人はなぜ間違うのか?~
第3章 時系列データを分析すると何がわかる?
時系列分析を使ったデータ分解で「変動要因」の特定に挑戦! ~偶然を言い訳にしない~
第4章 R のパッケージを使って イケてるグラフをサクッと作成しよう ~おいでパッケージ~
第5章 正しい分析手法を選ばないと時間のムダ
顧客属性とコンバージョンデータを使って、打ち手を効率よく考える ~気づいたらコンバージョン~
第6章 「ダミー変数」でデータをまとめてクラスター分析
単位が違うデータは「標準化/基準化」でGo! ~走れ!scale()~
第7章 どれだけ○○したら◎◎できるのか? 数値による定量化で「因果関係」を分析する ~君の名は回帰~
第8章 総まとめ! コンバージョンに影響を与えたコンテンツは何かを分析してみよう ~何度目の決定木か~
付録 豊澤栄治(ロックオン)×井端康(アトラエ)
ツールを使いこなすだけでなく、さらに高いレベルを目指したい。~ここじゃないどこか~
※各章タイトルの末尾の一言は、豊澤さんがこの対談記事のために特別に添えたものです。ピンときた方は、豊澤さんが執筆したこちらの連載もご覧ください。