【ダイジェスト】
Googleは、AI業界のトップを目指して開発した大規模言語モデル「Gemini」の後継モデル「Gemini 1.5」を発表しました。この新しいモデルは、開発者と企業ユーザー向けに提供され、一般消費者向けの完全なロールアウトが間もなく行われる予定です。Gemini 1.5は、ベンチマークテストの87%で前モデルを上回る性能を示しました。また、「Mixture of Experts」(MoE)という技術を使用しており、クエリを送信する際にモデル全体ではなく一部のみを処理することで、使用者にとっての速度とGoogleにとっての効率の両方を向上させています。
特に注目されているのは、Gemini 1.5が持つ非常に大きなコンテキストウィンドウです。これにより、はるかに大きなクエリを処理し、一度に多くの情報を見ることができます。このコンテキストウィンドウは100万トークンに達し、これはOpenAIのGPT-4の128,000トークンや現在のGemini Proの32,000トークンと比較して著しく大きいです。GoogleのCEO、Sundar Pichaiは、この大きなコンテキストウィンドウがビジネスにとって非常に有用であると考えています。例えば、映画製作者が自分の映画全体をアップロードしてGeminiにレビューを予測させたり、企業が大量の財務記録をGeminiで分析させるなどの用途が想定されています。
現時点では、Gemini 1.5はビジネスユーザーと開発者に向けてのみ提供され、GoogleのVertex AIとAI Studioを通じて利用可能です。将来的にはGemini 1.0を置き換え、gemini.google.comやGoogleのアプリで一般に提供されるGemini Proの標準バージョンが1.5 Proになり、128,000トークンのコンテキストウィンドウを持つことになります。100万トークンのコンテキストウィンドウを利用するには追加料金が必要です。また、Googleはこの新しい大きなコンテキストウィンドウに関連するモデルの安全性と倫理的な境界をテストしています。
【ニュース解説】
GoogleがAI業界のリーダーを目指して開発した大規模言語モデル「Gemini」の後継モデルである「Gemini 1.5」が発表されました。この新しいモデルは、開発者や企業ユーザーに先行して提供され、一般消費者向けの完全なロールアウトが近い将来予定されています。Gemini 1.5は、前モデルと比較してベンチマークテストの87%で優れた性能を示し、特に「Mixture of Experts」(MoE)技術を使用しており、クエリ処理時にモデル全体ではなく一部のみを動作させることで、効率と速度の向上を実現しています。
このモデルの最も注目すべき特徴は、100万トークンにも及ぶ巨大なコンテキストウィンドウを持つことです。これにより、従来のモデルでは考えられなかった規模のクエリを処理し、一度に大量の情報を扱うことが可能になります。この機能は、映画製作者が作品全体に関するレビュー予測を求めたり、企業が膨大な財務記録を分析するなど、多岐にわたる用途での活用が期待されています。
現在、Gemini 1.5はビジネスユーザーと開発者限定で提供されており、GoogleのVertex AIとAI Studioを通じてアクセス可能です。今後、このモデルはGemini 1.0を置き換え、一般ユーザー向けには1.5 Proが提供される予定で、こちらは128,000トークンのコンテキストウィンドウを持ちます。100万トークンのコンテキストウィンドウを利用するには追加料金が発生します。また、Googleはこの新しい大規模コンテキストウィンドウに関連する安全性と倫理的な問題についても検証を進めています。
この技術の進化は、AIが扱える情報の量と質を大幅に向上させることで、ビジネスや研究、個人の利用においても新たな可能性を開くことになります。しかし、大量のデータを処理する能力が高まることで、プライバシーやセキュリティ、倫理的な問題が新たに浮上する可能性もあります。これらの課題に対して、適切な規制やガイドラインの整備が求められるでしょう。また、この技術の発展は、AIを取り巻く競争環境にも影響を与え、Googleだけでなく他の企業も同様の技術革新を追求することになるかもしれません。長期的には、このような技術の進化が人間の生活や社会にどのような変化をもたらすか、注目されています。
from Gemini 1.5 is Google’s next-gen AI model — and it’s already almost ready.