紐約時報開出第一搶,與OpenAI的著作權訴訟可能改變AI技術的未來

0

2022年末 OpenAI 正式進入公眾視野以來,利用他人著作物訓練 AI 是否構成著作權侵權,便一直是 AI 科技領域一個難以解決的問題。眾多創作者認為,大多數 AI 是在未經授權的情況下,利用了無數創作者的心血來訓練並營利,這無疑屬於侵權行為。

因此,面對這類 AI 公司的著作權侵害行為,創作者提起訴訟的情況也越來越普遍。

例如2022年9月,美國作家協會代表多名作家對 OpenAI 等 AI 公司提起訴訟,這些公司被指控在未經授權的情況下,將他人的著作物用來訓練 AI 模型。其中包括像是《冰與火之歌:權力遊戲》的作者喬治‧馬汀(George R. R.Martin)、 知名作家強納森.法蘭岑(Jonathan Franzen)等眾多作家、視覺藝術家,都認為這些公司擅自將網路上的書籍、文章資訊用作為AI訓練資料,已經嚴重違反了著作權法的規定,當然必須賠償原著作人的損失。

雖然這些創作者們都不斷嘗試爭取自身權益,然而面對 AI 浪潮的趨勢,多數訴訟最終都不了了之。不過就在2023年的年末,傳統媒體龍頭《紐約時報》的參戰,卻象徵著新舊媒體間戰爭的正式開打。


紐約時報 v. OpenAI

在 2023 年 12 月 27 日,一場媒體界與人工智慧科技之間的重大訴訟案在《紐約時報》(NYT)正式向 OpenAI 及其合作夥伴微軟提起訴訟時達到了高潮。

這場訴訟被視為傳統媒體業對抗 AI 技術浪潮的重要標誌。《紐約時報》提出的主張是,OpenAI 未經授權,使用了其旗下的數百萬篇新聞文章、深度調查報告、評論和操作指南等,以「搭便車」的方式利用《紐約時報》在新聞行業中的巨大影響力,並將這些內容用於AI模型的訓練。

對此,OpenAI 則回應稱,根據美國著作權法第 107 條,將他人著作物用於 AI 的大型語言模型(LLM)訓練中,應屬於合理使用範的行為。理由在於,生成式 AI 並不僅僅只是重製輸入的資料,而是會將內容轉化,以此產生新的創作物,而這種所謂的「轉化性利用」,一直都是著作權法爭議中的爭論焦點。

然而,與以往的 AI 公司被控告案件不同,此次《紐約時報》提供了一些幾乎逐字複製的文章作為證據,這些證據直接顯示了 AI 在訓練和生成過程中存在重製和改作的事實。這點便與先前 Getty Images 先前針對 Stability AI 提起的圖片生成侵權訴訟在性質上有所不同,可以明顯證明 AI 產出的內容,確實包含了原有著作的某部分。

面對這樣的反駁,OpenAI 則選擇在 2024 年 1 月 8 日通過其網站的部落格文章回應這些指控。在這篇罕見的聲明中,OpenAI 指出如果禁止使用他人的書籍或新聞文章來訓練 AI,則人工智慧科技的未來將受到嚴重限制。公司強調,不使用受版權保護的材料幾乎不可能訓練出最先進的 AI 模型。此外,OpenAI 也強調他們一直在努力與出版商協商授權協議,以盡量減少對文字工作者的潛在損害。同時,他們聲稱《紐約時報》的訴訟毫無根據,暗示該報在法庭上並未提供事件的完整供述,並對此表示遺憾。

OpenAI 紐約時報


轉化性的判斷

說到底,Open AI 將未經授權使用的著作物作為 AI 模型訓練的輸入資料,真的會構成侵權行為嗎?

由於AI模型的訓練過程中,勢必會有將原著作物輸入並進行改寫、分析的機器學習過程,也因此這樣的行為確實有可能構成著作權法中重製權與改作權的侵害,也就是說,AI訓練的過程確實可能屬於一種侵權行為,而其產出的文字內容更可能直接構成原著作人重製或改作權的侵害。

問題是,這類的 AI 模型訓練,是否能夠構成合理使用的要件?

更具體的,這樣的侵權行為,是否因轉化性利用已經阻卻違法了呢?

依據美國著作權法第107條規定,應於特定個案判定著作的使用是否為合理使用,而考量的因素包括了以下 4 點:

(1)使用之目的與性質,包括該使用是否為商業性質或為非營利教育之目的。

(2)遭利用著作的性質。

(3)遭利用部份的質與量。

(4)對於遭利用著作潛在市埸或價值的影響。

從上面這幾點觀察,不難發現整體與我國著作權法第65條第二項關於合理使用的要件幾乎一致。


著作之利用是否合於第四十四條至第六十三條所定之合理範圍或其他合理使用之情形,應審酌一切情狀,尤應注意下列事項,以為判斷之基準:

一、利用之目的及性質,包括係為商業目的或非營利教育目的。

二、著作之性質。

三、所利用之質量及其在整個著作所占之比例。

四、利用結果對著作潛在市場與現在價值之影響。

而若從要件上觀察,可以發現當我們要判斷 AI 的協助使用行為是否構成合理使用,其中的灰色空間真的非常大,有很多尚無定論的解釋空間。

尤其當 AI 技術仍處在發展階段,其中無論是利用的性質、對於潛在市場價值的影響甚至是實際利用的佔比,幾乎無時無刻都在隨著技術的演進發生變化。

而在這之中,最難解決的其實還是在於「模型訓練」的過程其實非常難定義。

如果僅僅是將著作物投放給 LLM 進行訓練,那麼界定這一行為是否構成合理使用就會變得格外複雜。這是因為在AI訓練過程中,著作物不僅被使用來提升模型的理解和生成能力,而且在這一過程中產生的新內容往往並非直接複製原始作品。


生成式 AI 的轉化性特質

首先,AI 模型訓練中生成新產物的行為是否有轉化性,這是問題的核心之一。

轉化性利用是指原始作品被用於創建全新的作品,透過後創作人的巧思與轉化利用,使這些新作品在某種程度上不再與原始作品相似。例如像是加入作者的觀念、想法或是創意等,都可能因為經由轉化後使得新著作物與原著作物有所區分。

然而在 AI 的情況中,這個問題便顯得特別複雜,因為在多數人的共識中,現階段的 AI 模型通常被認無法提供新內容或觀點,更接近於大量不同著作物的拼貼與排列,難謂具有「轉化性」。

這可能便意味著,即使AI模型在訓練過程中使用了受著作權保護的材料,生成的結果仍不被視為是一種新的、轉化後的創作,便可能無法受到合理使用的保護。


法律與技術之間的落差

目前,著作權法在涉及 AI 技術時面臨著顯著挑戰。

各國的法律通常是在沒有考慮到 AI 這類新興技術的情況下制定,因此在應對 AI 技術所帶來的特殊情況時往往顯得力不從心。

例如,AI 本身是否能作為創作主體?又或者使用 prompt(文字提示) 進行 AI 生成得出的產物是否稱的上將內心思想、情感以個別獨具之創意表現於外的「創作行為」,這些問題目前都仍無法取得學界與實務界的共識,更難論於實際經濟行為中判斷後續法律問題。


AI著作權爭議的未來

事實上,就在紐約時報正式提出訴訟的幾個月前,如同 OpenAI 聲稱,他們確實已經與如 Axel Springer、美聯社等大型媒體公司達成部分授權協議,但始終無法與《紐約時報》達成共識。因此有部分人士也認為,本次訴訟更多的應該是《紐約時報》的一種談判策略,而不是真的想嘗試進行索賠,僅是要透過這種方式與 OpenAI 達成授權協議上的優勢。

不過,無論案件未來將如何進展,本場訴訟都可能對傳統媒體和 AI 技術的未來發展有著重要影響。

從這次訴訟中可以看出,當今的著作權法律在面對 AI 技術時,是否具備適應性與彈性,成為了一大討論焦點。

紐約時報的訴訟挑戰了傳統著作權法對於 AI 技術的應用範疇,特別是在AI創造出的內容與原始素材之間的界線日益模糊的情況下,尤其困難。

同時,本次訴訟也可能成為未來許多類似案件的先例。如果《紐約時報》最終獲判勝訴,可能將迫使AI開發商在使用版權材料進行訓練時更加謹慎,並可能尋求與內容創作者或版權擁有者達成更明確的授權協議。這將對AI行業造成重大影響,尤其是在大型語言模型和其他生成式 AI 技術的發展面上,將可能減緩目前不斷向前衝刺的 AI 發展。

最後,這起訴訟也突顯了全球範圍內對 AI 技術和著作權法律相互適應的迫切需求。隨著 AI 技術的不斷進步,相關法律和規範也需要與時俱進,以確保創作內容的保護與 AI 創新之間達到平衡。這不僅涉及到技術和法律的問題,更是關於如何在尊重智慧產權的同時、也能促進科技發展和創新的大問題。

至於本場訴訟最終會如何?就讓我們繼續看下去吧。

 

這篇文對你有幫助嗎?歡迎分享轉發!

About Author

一個喜愛閱讀的法律人。

Comments are closed.