日本語に特化したAI基盤モデル「HyperCLOVA」とは
前述の通り、現在AIのパラダイムシフトの中心にあるのは、様々な用途に活用可能な基盤モデル。そして、今回LINEがNAVERと共同開発した「HyperCLOVA」も大規模言語の基盤モデルである。
永野氏は、このHyperCLOVAを“日本語を最もよく理解するAI”と紹介する。
日本語は世界的に見ても難しい言語であり、米国国務省が公表する取得難易度ランキングでは最高難易度とされている。日常生活に必要な語彙数も英語は3,000語なのに対し、日本語は2倍以上の8,000語となっており、文字の種類も多い。日本語をよく理解し、自然で豊かな基盤モデルを開発するには、高品質かつ多様な大量の学習用データと、自然言語処理やAI技術に精通したエンジニアが必要になるのだ。その点、HyperCLOVAの開発にあたって用いられた学習データは、新聞にたとえると、約2,700年分もの膨大な日本語データである。
HyperCLOVAの用途は様々に考えられるが、たとえばマーケティングでは次のような活用例がある。
1.広告文/キャッチコピー生成
2.メール文言/SNS文言/LP文言の生成
3.カスタマーセンターでの問い合わせ要約/FAQ自動検索/自動応答分析
どれがAI生成で、どれが人間が作ったものかわからない?
LINE広告を利用する企業へのアンケートで、広告担当者がクリエイティブ考案において困っているのは、レイアウトの配置やビジュアル素材の充足よりも「キャッチコピー制作」の部分であることがわかっている。そこでLINEは、HyperCLOVAのキャッチコピー制作における活用可能性を検証。まずは、HyperCLOVAを活用することで広告コピーの制作時間がどれだけ短縮されるかを検証したところ、人間が作成する時間に対して30分の1から80分の1へ大幅な時間短縮が確認できた。
また、Yahoo! Japanとの実証実験では商品キャッチコピーの制作における活用可能性を実験。Yahoo! Japanトップページに掲載される、ヤフーショッピングの誘導枠で6種の商品のキャッチコピーを生成し、品質評価と配信評価を行った。
下図は、実証実験で用いたノートPCスタンドの商品キャッチコピーである。どれを人間が作成し、どれをHyperCLOVAが作成したか、見分けられるだろうか?
正解は、真ん中の「作業環境に合わせて選ぶノートPCスタンド」だけが人間が作ったコピー。他はすべてHyperCLOVAが制作したものだ。「私もこれを見た時は、見分けがつきませんでした」と永野氏は話す。
品質は、文法や表記の正しさ、煽りや誇大表現を含まないなど、7つの観点にて評価。そのうち5つにて高評価を獲得し、制作意図に見合う自然な表現のコピーであるとの結果が出た。ABテストでの配信評価でも、人間作成のコピーよりHyperCLOVA生成のコピーのほうがCTRが平均110%向上し、最大139%の向上も見られたそうだ。
「このように、HyperCLOVAでは自然な表現のコピーが生成でき、業務の効率化や、実運用で効果を出せる可能性が十分にあります」(永野氏)