AI(人工知能)ニュース

新法案、AIトレーニングデータの著作権開示を義務化

アダム・シフ議員が提案した法案は、AIモデルのトレーニングに使用される著作権付き素材の開示を義務付けます。この「Generative AI Copyright Disclosure」法案は、AI開発者にデータセットの詳細報告を要求し、著作権侵害への対策を強化します。WGAやRIAAなど複数の業界団体が支持し、AIと著作権の問題に新たな光を当てます。【用語解説とAIによる専門的コメントつき】

Published

on

アダム・シフ議員が提出した新しい法案は、AIモデルのトレーニングに使用されるデータセット内の著作権付き素材について開示を義務付けることを目指しています。この「Generative AI Copyright Disclosure」法案は、AIのトレーニングデータセットを作成する者に対し、データセットの内容に関する詳細な報告を著作権登録所に提出することを要求します。報告には、データセット内の著作権付き素材の詳細な要約と、データセットが公開されている場合はそのURLを含める必要があります。また、データセットに変更が加えられた場合にもこの要件が適用されます。

公開前のAIモデルがトレーニングデータセットを使用する30日前までに報告を提出することが義務付けられています。ただし、この法案は既存のAIプラットフォームには遡及せず、法律が施行された後にそのトレーニングデータセットに変更が加えられた場合のみ適用されます。

シフ議員の法案は、著作権付きの素材が許可なくAIモデルのトレーニングに使用されているという、アーティストや著者などのクリエイターからの不満に対処しています。AIと著作権の問題は常に複雑であり、AIモデルが保護されたコンテンツをどの程度変更または模倣するかについてはまだ解決されていません。クリエイターは自身の権利を主張するために訴訟に訴えています。AIモデルの開発者は、モデルが公開データに基づいてトレーニングされていると主張していますが、膨大な情報量のため、どのデータが著作権で保護されているかを具体的に知ることはありません。企業は、著作権付きの素材はフェアユースの範囲内であると述べています。一方で、著作権侵害で訴えられた場合に一部の顧客に法的保護を提供し始めている企業もあります。MicrosoftとGoogleです。

シフ議員の法案は、Writers Guild of America (WGA)、Recording Industry Association of America (RIAA)、Directors Guild of America (DGA)、Screen Actors Guild – American Federation of Television and Radio Artists (SAG-AFTRA)、Authors Guildなど、複数のエンターテイメント業界団体から支持を得ています。著作権付き作品の海賊行為から保護する動きを通常支持するMotion Picture Association (MPA)は、支持団体リストに含まれていません。

また、トレーニングデータセットにもっと透明性をもたらそうとする他の団体もあります。Fairly Trainedというグループは、著作権データの使用許可を求めたことを証明するAIモデルにラベルを付けることを提案しています。

【編集部追記】— 記事の内容について検証しました —

専門用語の解説
記事中の「著作権登録所」は、アメリカ合衆国著作権局(U.S. Copyright Office)のことを指します。著作権に関する登録や記録を管理する政府機関です。
「遡及」とは、法律の効力を過去に遡って及ぼすことを意味します。この法案の場合、施行後に変更が加えられた既存のAIトレーニングデータセットにも適用されます。

別の視点からの解説
この法案は、AIの発展と著作権者の権利保護のバランスを取ることを目指しています。AIの学習に用いられる著作物の詳細を開示させることで、著作権者が自身の権利を主張しやすくなります。一方で、AIの開発者からすると、膨大なデータから著作権情報を特定するのは容易ではありません。法案の実効性を高めるには、著作権管理のシステム整備も必要になるでしょう。

参考情報
Fairly Trainedというグループが、著作権データの使用許可を得たAIモデルにラベルを付ける案を提案しています。
https://www.fairlytrained.org/

読者の皆様へ
AIと著作権の問題は、技術の進歩とともに今後も議論が続くと思われます。クリエイターの権利を守りつつ、AIの可能性を活かす方策を模索していくことが重要です。読者の皆様も、このような法整備の動向に関心を持っていただければと思います。AIを起点とするテクノロジーの進化に焦点を当てている当メディアとしても、引き続き最新情報をお伝えしていきます。

【ニュース解説】

アダム・シフ議員が提案した新しい法案は、AIモデルのトレーニングに使用されるデータセット内の著作権付き素材についての開示を義務付けることを目的としています。この「Generative AI Copyright Disclosure」法案は、AIのトレーニングデータセットを作成する際に、その内容に関する詳細な報告を著作権登録所に提出することを要求します。これには、データセット内の著作権付き素材の詳細な要約と、データセットが公開されている場合はそのURLも含まれます。データセットに変更が加えられた場合にも、この要件は適用されます。

この法案は、AIモデルが公開される30日前までに、使用されるトレーニングデータセットに関する報告を提出することを義務付けています。ただし、この法案は既存のAIプラットフォームには遡及せず、法律が施行された後にトレーニングデータセットに変更が加えられた場合にのみ適用されます。

この法案の背景には、AIモデルが著作権付きの素材を許可なくトレーニングに使用しているという、アーティストや著者などのクリエイターからの不満があります。AIと著作権の問題は複雑で、AIモデルが保護されたコンテンツをどの程度変更または模倣するかについてはまだ明確な解決策がありません。クリエイターは自身の権利を主張するために訴訟に訴えることもありますが、AIモデルの開発者は、モデルが公開データに基づいてトレーニングされていると主張しています。しかし、膨大な情報量のため、どのデータが著作権で保護されているかを具体的に知ることは難しいとされています。

この法案は、Writers Guild of America (WGA)、Recording Industry Association of America (RIAA)、Directors Guild of America (DGA)、Screen Actors Guild – American Federation of Television and Radio Artists (SAG-AFTRA)、Authors Guildなど、複数のエンターテイメント業界団体から支持を得ています。これらの団体は、クリエイターの権利を保護し、AIの発展が著作権を侵害することなく行われることを望んでいます。

この法案が施行されれば、AIモデルのトレーニングに使用されるデータの透明性が高まり、著作権付き素材の不正使用を防ぐことにつながる可能性があります。しかし、実際には、データセットの報告と管理に関する新たな負担がAI開発者に課されることになります。また、フェアユースの範囲と著作権保護のバランスをどのように取るかが、今後の大きな課題となるでしょう。この法案は、AI技術の発展とクリエイターの権利保護の間でバランスを取るための一歩となり得ますが、その実施には多くの挑戦が伴うことが予想されます。

from A new bill wants to reveal what’s really inside AI training data.

Trending

モバイルバージョンを終了