Googleは、2024年5月14日(米国時間)に、大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入すると発表した。
「Gemini 1.5 Pro」はアップデートにより、Geminiが会話の流れを理解するために参照する文章の量である「コンテキストウィンドウ」が100万トークン以上に拡張された。これは一般ユーザー向けの会話型 AI の中で最長で、より的確で自然な回答や複雑なタスクの処理が可能になった。たとえば、最大1,500ページの複数のドキュメントを理解したり、100件の電子メールを要約したりできる。
複数のGoogleドキュメント、PDF、Wordファイルを、Googleドライブやデバイスからアップロードして、文書の要約や分析を行うこともできる。この際、ユーザーのファイルデータはモデルのトレーニングに使用されない。
さらに音声による自然な会話ができる機能の「Gemini Live」を、数か月以内に公開する予定だ。この機能により、直感的で人間らしいコミュニケーションが可能になる。さらに2024年後半にはカメラ機能が追加され、周囲の情報を共有しながら会話ができるようになる予定だ(英語のみ)。
他にも旅行などの複雑な計画を簡単にする機能や、よりパーソナルな要望に合わせてGeminiをカスタマイズできる機能も導入される予定だ。
Gemini 1.5 Proは日本語を含む35以上の言語、150か国以上において、有料プランのGemini Advancedの契約者が利用できる。
【関連記事】
・WACUL、「AIアナリストSEO」の見出し制作に生成AIを活用 高品質SEOコンテンツを効率的に
・ギブリー、生成AIを活用し顧客対応業務を自動化する「DECA AI接客」の提供を開始
・アドインテ、生成AIによるペルソナ・広告キャッチコピー作成機能を開発 リテールメディア事業で活用開始
・ニッセンら3社、衣類着用パターンの自動生成の実証実験を実施 画像生成AIを活用
・朝日広告社、生成AIを活用しクリエイティブディレクターと新規事業を共創する「AIDL」をリリース