[No.143]ニューヨーク・タイムズはOpenAIを著作権侵害で訴訟したが情勢は芳しくない?和解の道を選択か?言語モデルの教育に関しルールの制定が求められる

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で提訴した。

これに対し、OpenAIは公式にコメントを発表し、AIモデルは著作権法に違反していないとの解釈を示した。一方、欧州連合のAI規制法は、AI企業に教育で使ったデータを開示することを求めており、これが事実上の国際規格と解釈されている。

AI企業とメディア企業の間で教育データに関する新たなルールの制定が求められる。

出典: GPT-4
出典: GPT-4

ニューヨーク・タイムズの訴訟

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で提訴した。

OpenAIはニューヨーク・タイムズの記事で言語モデルを開発し、AIモデルは記事の内容をそのまま出力し、報道事業を脅かすと主張する。ニューヨーク・タイムズは訴状で実例を多数示し、特定なプロンプトを入力すると、GPT-4が記事をそのまま出力し、著作権法に違反すると主張している。

具体的には、プロンプトに記事のURLと最初の文章を入力すると(下の写真上段、黒字の部分)、GPT-4は記事をそのまま出力する(下段左側、赤字の部分)。

これはオリジナルの記事(下段右側、赤字の部分)と同じ文章となっている。

出典: New York Times
出典: New York Times

OpenAIの主張

これに対し、OpenAIは訴訟に関し公式な見解を発表し、AIモデルの教育は合法的に実施されたと主張している。

これは四つのポイントから成り:

  1. OpenAIはメディア企業と共同で新しい形態のビジネスを生みだしている
  2. モデルの教育はフェアユースでメディア企業にオプトアウトする選択肢を提供している
  3. 記事をそのまま出力するのはバグで修正を続けている
  4. ニューヨーク・タイムズはすべてを語っていない

OpenAIの主張のポイント

技術的な観点から、訴訟ではモデルの「教育」と「実行」が争点となる。

  • モデルの教育:新聞記事など著作物でアルゴリズムを開発することの合法性が議論となる。
  • モデルの実行:モデルが出力した内容が問われる。

OpenAIは、モデルの「教育」は著作権に抵触しておらず、モデルの「実行」はバグであり、問題点を修正していると主張する。

モデルの教育

OpenAIは、著作物で言語モデルを教育するのは「フェアユース(Fair Use)」で、著作権侵害には当たらないと主張する。

この解釈は業界で定着しており、著作者と開発者の双方にメリットがある。また、AIモデルを著作物で教育する手法は、アカデミアや業界団体や著作者団体などから支持されている。

更に、OpenAIはメディア企業にアクセスを禁止するオプションを提示しており、実際に、ニューヨーク・タイムズはOpenAIのクローラーが記事を収集するのを禁止ている。

出典: OpenAI
出典: OpenAI

モデルの実行

モデルの実行関しては、アルゴリズムは著作物を学習し、学んだ内容を出力するが、これは記事全体ではなくその一部であり、法令で許容された範囲内であると主張する。

また、訴状の中でGPT-4が記事全体を出力する事例が提示されているが、OpenAIはこれに対してはAIモデルのバグであり、問題解決を進めているとしている。

EU AI Actの解釈は

欧州連合はAI規制法「AI Act」の最終合意に至り、この法令が今年から順次、施行されることになる。

OpenAIがEU域内で事業を展開する際は、AI Actに準拠することが求められる。著作権に関しては、AI Actはモデルの教育で使ったデータを公開することを求めている。

また、著作物を教育データとして使う場合は、所有者に許諾を得ることを義務付けている。

この二つの条項が著作権に関する事実上の国際標準と解釈されており、ニューヨーク・タイムズの訴訟で重要な指針となる。

ビジネス拡大に寄与

現在、ニューヨーク・タイムズはOpenAIが記事をスクレーピングすることを禁止しており、GPT-4は最新記事に関する情報は学習していない。

Sam AltmanはGPT-4などの言語モデルが、メディア企業のビジネスに貢献しているとの解釈を示している。モデルが記事の要約を出力し、その出典を示すことで、ニューヨーク・タイムズの記事の閲覧回数が上がるとの考え方である。

Google検索エンジンが読者をサイトに誘導するのと同じコンセプトで、AIモデルがニューヨーク・タイムズのページビューを増やすとしている。(下の写真、最新モデルのGPT-4はニューヨーク・タイムズの記事は出力しないで、記事へのリンクを示している。)

出典: OpenAI
出典: OpenAI

両社の合意は近い?

ニューヨーク・タイムズがOpenAIを提訴したのは、著作権に関する交渉を有利に進めるための手段とみられている。

ニューヨーク・タイムズは法廷で勝訴することが目的ではなく、著作物のライセンス料を高値で合意することを目指している。OpenAIはメディア企業と提携を進めているが、著作物を教育で使うために100万ドルから500万ドルを支払っているとの情報もある。

ニューヨーク・タイムズは記事のライセンス条件についての交渉を進めているが、両社の合意は近いとの見方もある。