from ‘Impossible’ to create AI tools like ChatGPT without copyrighted material, OpenAI says.
OpenAIは、著作権で保護された素材なしには、ChatGPTのようなAIツールを作成することは不可能だと述べています。これは、AI企業が製品のトレーニングに使用するコンテンツに対する圧力が高まる中での発言です。ChatGPTやStable Diffusionのような画像生成ツールは、インターネットから得られた膨大なデータをもとに「トレーニング」されており、その多くは著作権で保護されています。先月、ニューヨーク・タイムズはOpenAIとその主要投資家であるMicrosoftを、製品作成における「不法な使用」で訴えました。しかし、OpenAIは英国の庶民院通信・デジタル選抜委員会への提出書類で、著作権作品へのアクセスなしにはGPT-4モデルのような大規模言語モデルをトレーニングできないと主張しています。著作権がほぼあらゆる人間の表現をカバーしているため、著作権素材を使用せずに現代のAIモデルをトレーニングすることは不可能だと述べています。また、著作権のない古い書籍や図面のみをトレーニング素材に限定すると、現代の市民のニーズに応えるAIシステムは作れないと付け加えています。OpenAIは、著作権法がトレーニングを禁じていないと信じており、「フェアユース」という法的原則に基づいて著作権素材の使用を擁護しています。また、OpenAIはAIシステムの安全性を第三者研究者がテストする「レッドチーミング」を支持し、最も強力なモデルの安全性試験に政府と協力することに同意しています。