定量×定性で分析を進めると、高評価CMの「型」が見えてきた
1.事前分析:評価の高いテレビCMの「要因」「要素」を探索
先に少し触れた通り、「Best HIT DB with TVCM評価AI」では博報堂DYグループが保有するデータベース「Best HIT」が活用されている。Best HITは2007年から稼働しているデータベースで、テレビCM表現に関する定点観測調査のデータを蓄積。2007年10月以降に聴取したテレビCM約20万素材以上を対象に、CM全体の評価や個別表現要素に対する好感度など、テレビCMの広告効果を検証するのに有用な評価データを幅広く網羅・収録している。内山氏らは、まずこれらのデータをもとに、評価の高いテレビCMの要素分解をすることから始めたそうだ。
例として紹介されたのが、大手食品流通企業のテレビCMのスコア。テレビCMの評価における重要指標は、商品購入喚起度や表現好感度など複数あるが、中でも魅力演出度が突出して高いのが、このCM素材だった。そこで、どんな要素が魅力演出度を押し上げているのかを定量的に分析していったという。
ただ、魅力的な演出をする際、その“魅力”に繋がる要素は色々ある。必ずしも、定量分析ですべての要素を見つけられるとは限らないだろう。そのため、分析モデルの構築にあたっては、各指標に影響する表現要素をクリエイター、データサイエンティストとともに洗い出すという定性的な分析も行われた。
「どのような動画表現が、どのように各指標に影響するか? プロダクトの開発に協力してもらっているクリエイターと一緒に定性的に洗い出しました。一例で紹介した大手食品流通チェーン店のテレビCMの場合は、シズル感が強調されたカットや絶妙なコピー、黒い背景に商品が映し出されたカットなどが、CMの魅力的な演出に貢献していると解釈しました」(内山氏)
2.人間による定性的な解釈・作業を含めたアノテーション
およそ100の素材を対象に、AIによる事前分析と人間による定性的な解釈を繰り返していくと「CMの評価に影響を与える表現要素にある程度の“型”が見えてきた」と内山氏。
そこで、発見された型を分類し、テレビCM動画において重要な表現要素を定義。テレビCM動画を評価する際のベースとなるタグリストを作成した。
以降のプロセスも多大な労力を要するもので、前述のタグリストをもとに、約1,200の素材一つひとつにアノテーションタグを付与していったという。
3.機械学習モデルの構築
最終的にはアノテーションされたタグを説明変数とし、テレビCMを評価指標=目的変数とすることで機械学習モデルを構築した。実際、注目喚起度を目的変数にする場合と、魅力演出度を目的変数にする場合とでは、評価指標に重要な要素が以下のように異なっている。「これを見ると、クリエイターもマーケターも肌感として納得感が持てるのではないか」と、内山氏も自信がある様子だ。