誰も手をつけなかったCMのデータベース化
なぜこれまで全国のCMデータベースを構築したサービスはなかったのか。籠屋氏によると、CMの取引額を決める観点では必要なデータは存在していたものの、全国のCMをマーケティングデータとして扱い、それを収集するという発想自体がテレビや広告の業界に乏しかったという。
しかも、技術的にも困難だった。日本のテレビ放送は県ごとに放送局が分かれており、それらすべての放送データを集めようとすると、膨大なデータ量になる。地方局の放送を録画できる機器を各都道府県別に設置し、データ収集・分析を行うシステムを構築しようとすると、相当なコストがかかる。しかも、正確なデータを集められるかどうかもやってみなければわからない。そんな無茶なことに投資しようとする人や企業は現れなかった。ではなぜPTPではMadisonの開発に至ったのか。
元々PTPでは、テレビ番組を全録し、検索できるサービス「SPIDER」を行っている。広報や宣伝などの法人ニーズに沿うように専門に開発された機器およびサービスだ。市販の全録レコーダーとは異なり、高い検索精度と安定性を備えている。
「10年以上サービスを提供している法人用のSPIDER PROでは、業務用に全テレビ番組をコーナー単位でキーワード検索できますが、それに加えて、関東と関西では、CMも検索することができました。しかし、我々が計画している一般家庭用のSPIDERを全国津々浦々の視聴者に楽しんでもらうためには、地方のCMデータがどうしても必要でした。それがCMデータベース開発のきっかけです」(籠屋氏)
膨大なデータに耐えるシステムを構築
前例がないサービスだけにMadisonの開発には様々な苦労があった。まず、そもそもシステムを安定稼働させることが難題だったと籠屋氏は振り返る。
「テレビはほぼ24時間、ずっと放送されています。全国で動いているシステムが止まることなく録画を続け、データとして記録する。それを安定稼働させなければなりません。災害やアクシデントがあっても、データが欠けることは許されません。しかも、集まるデータは日々どんどん膨れ上がっていきます。データの蓄積を始めてから現在で5年近く、もう1億レコード(1レコード=1CM)以上になっています。多重のバックアップ体制と、クラウドシステムによってMadisonが誕生しました」
実際にデータを収集し始めると、同じ素材を使ったCMでも局の放送設備によってシグナルに微妙な違いがあることが判明した。人間が見る分には同じCMでも、機械的にデータ化するとシグナルの違いから「別のCM」と判定されるケースもある。また、地方によっては同じCMでもナレーションだけ地元のタレントを起用するなどしていることもあった。
「そうした違いもうまく吸収し、“同じCM”として見なさないといけません。これを技術的に解決するのも大きな課題でした。私がロボットビジョン(動画像認識)の研究をしていたときに使っていた分類技術を応用することで、実現に目途をつけることができました。さらに、広告主や広告業界の方からもフィードバックをいただき、精度を高めてきました」(籠屋氏)
籠屋氏は東北大学の大学院で、ロボットの知能化に関する研究を行っていた。その一方で、在学中から起業し、カスタマイズ性の高いマニア向けコンセプトのサーバー機能を兼ねたHDDレコーダーを開発していたという。そのプロダクトは評判を集め、あるとき技術誌で取り上げられた記事がPTP代表の有吉昌康氏の目に留まった。それが籠屋氏の同社参画のきっかけとなった。