Hadoopを導入することで得られる3つのメリット
さて、ここでHadoopについて簡単に解説しておこう。Hadoopは分散コンピューティングを支援する「MapReduce」というフレームワークと、HDFSというファイルシステムで成り立っている。1つの集計処理をする際に、まずデータをバラバラに分割し、それぞれのパーツをサーバに渡して、分散して処理をする。その処理結果を今度は合体させ、集計する。Hadoopの処理をおおまかに説明するとこんなイメージだ。
分散処理することで、高速に計算できることがHadoopの1番のメリットだが、もちろん他にもある。2つ目にオープンソースの技術であるために、従来のオラクルなどのデータウェアハウスの製品と比べると、非常にコストが安いこと。また3つ目のメリットとしては、スケーラブルであることが挙げられる。

「これまでは処理性能が足りなくなった場合、より大きなサーバを買って置き換えていました。また足りなくなったら、さらに大きなサーバに買い換えるという対応でした。Hadoopなら、横にスケールしていくことができます。たとえば最初に3台のサーバで構築を始め、処理性能が足りなくなれば、3台足して6台に増やす。さらに足りなくなれば、10台、100台に増やすといった具合に、買い足すことで処理性能を横にスケールできるのです」(米谷氏)
あるデータを処理するのに、従来の仕組みなら8時間かかっていたが、サーバ2台構成のHadoopで処理することにより、30分に短縮できたと仮定しよう。スケーラブルというのは、このサーバを倍の4台にすると処理時間を半分の15分に圧縮できるということだ。さらに8台に増やせば、8~9分に縮められる。きっちり2分の1になるわけではないが、かなりキレイにスケールしていくのがHadoopの特徴であるという。
扱えるデータ量も使い道も無限、マーケターは事例を勉強せよ
これからは、事業運営に携わる企画職やマーケターも、このようなテクノロジーを理解しておく必要があるだろう。データ分析なしに、ビジネスを成功させることはできないからだ。
とはいえ、非エンジニア職にHadoopの使い方をマスターしろというのは酷な話である。そこで米谷氏は、どんな事例があるかだけでも頭に入れておいた方がいいとアドバイスする。
「海外にも、国内にも、面白い事例がいくつもあります。たとえばある会社は、FacebookやTwitterのログから、自社製品に対するユーザーの噂を分析しています。この膨大な量のデータを処理するのに、Hadoopを活用しているのです。他社の活用例を知っておくと、自分の事業での画期的な使い道がひらめくかもしれないでしょう」(米谷氏)
データの活用にゴールはない。たとえば広告の効果を計測するときに、1つのバナーの結果を見るだけなら単純だ。だが、ユーザーはそのバナーを見る前に、ダイレクトメールを受け取っていたかもしれない。さらに、その前には、ウェブ検索で何らかの情報を得ていたかもしれない。一体何が貢献して、ユーザーはバナーをクリックしたのか。分析を深めていけば、必然的にデータ量は増える。
こうした分析項目の策定からHadoopの運用まで、すべてを技術部門だけで担当するのは難しい。理想的なのは、マーケッターがHadoopの能力を踏まえた上で分析項目を設定し、エンジニアがHadoopの技術的なチューニングを行うことだ。いま、こうした共同作業が求められていると米谷氏は語る。
「Hadoopにはまだまだ潜在能力がありますが、それは企画職やマーケターの使い方次第です。もっとアイデアを出してほしいし、活用する人も増えてほしい。Hadoopはあくまでツールです。いかに活用するかが、もっとも重要なことです」と米谷氏。非エンジニア職の人こそ、Hadoopをいかに活用できるか検討してみてほしいと語った。