Googleは、プログラミングコミュニティStack Overflowとの取引を通じて、そのGeminiチャットボットのバージョンを強化する。この取引は、AIデータのライセンス契約の新たな流れの一環であり、ウェブサイトが生成AIブームから利益を得ようとしている。Stack Overflowは、チャットボットの訓練に使用されるコンテンツへのアクセスに対してAI大手から料金を請求する最初のウェブサイトの一つとなった。この取引により、Googleのクラウド部門はStack OverflowのGoogle Cloudサービスに関する質問と回答を使用して、コーディング支援と技術サポートを提供する。また、Google Cloudのコマンドラインインターフェースを通じて質問をすることも可能になる。
GeminiはStack Overflowから引用した回答を独自の言葉で要約し、企業のロゴ、元の資料へのリンク、および情報を提供したサイトのユーザー名を含める。このシステムは、4月に開催されるGoogle Cloud Nextでデモンストレーションされ、その後すぐにローンチされる予定である。Stack Overflowのデータは、大規模な言語モデルや他のAIシステムの訓練に使用できる。
Googleと他のAI開発者は以前、Stack Overflowや他のウェブサイトからデータをほとんど気付かれずに収集していた。しかし、生成AI技術への需要が高まり、それを開発する企業の評価が急上昇する中、基礎となるテキストを提供するウェブサイトは、自分たちが公正な取り分を得るべきだと主張し始めた。Stack Overflowのデータは、コンピュータコードを生成するAIシステムに特に有益であり、ソフトウェアエンジニアに人気があり、MicrosoftとOpenAIにとって重要な収入源となっている。
Stack Overflowが提供するOverFlowAPIの料金は、提供されるデータの種類によって異なる。基本的な59万の質問と回答のリポジトリの他に、投稿カテゴリやユーザーが提出した回答の投票履歴などのメタデータ層、質問の種類に関するトレンド、特定のプログラミング言語に関する質問など、微調整に役立つ特別な情報の提供にはより多くの料金がかかる。Stack OverflowのデータをMetaとAIスタートアップMistralのオープンソース言語モデルでチューニングした内部テストでは、技術的な質問への回答の正確性が20パーセンテージポイント向上した。
【ニュース解説】
GoogleがプログラミングコミュニティのStack Overflowとの間で行った取引は、AI技術の発展においてデータの価値が高まっていることを示す最新の事例です。この取引により、GoogleのGeminiチャットボットはStack Overflowの豊富な質問と回答のデータベースを活用して、Google Cloudサービスに関するコーディング支援と技術サポートを提供することが可能になります。このようなAIデータのライセンス契約は、生成AIブームから利益を得ようとするウェブサイトにとって新たな収益源となり得ることを示しています。
この取引の背景には、AI開発者がこれまで大量の書籍やウェブサイトからデータを収集してきたが、その多くが著作権者から適切な報酬を受け取っていないという問題があります。Stack Overflowのようなプラットフォームは、自らのコンテンツがAIによって代替されることによる脅威を感じつつ、自身のデータの価値を認識し、それに見合った対価を求めるようになりました。
この取引は、AI技術におけるデータの重要性を浮き彫りにします。特に、Stack Overflowのデータは、コンピュータコードを生成するAIシステムにとって非常に価値が高く、技術的な質問への回答の正確性を大幅に向上させることができます。これは、AIがより正確で信頼性の高い情報を提供するためには、質の高いデータが不可欠であることを示しています。
しかし、このような取引には潜在的なリスクも伴います。データの使用に関する透明性やプライバシーの問題、著作権の扱い、そしてAIによるコンテンツの生成が元のコンテンツ提供者に与える影響など、多くの課題があります。また、AI技術の発展に伴い、これらのデータをどのように公平に、かつ適切に利用するかについての規制やガイドラインの整備が求められます。
長期的には、このようなデータライセンス契約が増えることで、AI技術の発展が加速される一方で、データの所有権や利用に関する新たなビジネスモデルや法的枠組みが形成される可能性があります。これは、AI技術の進化とともに、社会や産業に大きな変革をもたらすことになるでしょう。
from Google’s Deal With StackOverflow Is the Latest Proof That AI Giants Will Pay for Data.