站長之家(ChinaZ.com) 10月20日消息: 包括前阿肯色州州長 Mike Huckabee 和暢銷的基督教作家 Lysa TerKeurst 在內(nèi)的一組作家已在紐約聯(lián)邦法院提起訴訟,指控 Meta、微軟和彭博在未經(jīng)許可的情況下使用他們的作品來訓(xùn)練人工智能系統(tǒng)。
這起擬議中的集體訴訟于周二提起,指稱這些公司使用了備受爭議的「Books3」數(shù)據(jù)集,作家們稱其中包含數(shù)千本盜版書,用于教導(dǎo)他們的大型語言模型如何回應(yīng)人類提示。
訴訟還指控人工智能研究組織 EleutherAI 侵犯版權(quán),據(jù)稱該組織提供了用于訓(xùn)練這些公司系統(tǒng)的數(shù)據(jù),其中包括 Books3。
彭博發(fā)言人周三表示,該公司沒有使用 Books3 來訓(xùn)練其大型語言模型 BloombergGPT 的商業(yè)版本,盡管它使用了該數(shù)據(jù)集來訓(xùn)練其研究模型。
微軟的發(fā)言人拒絕置評,而 Meta 的代表沒有立即回應(yīng)有關(guān)訴訟的請求。
作家的律師在周三的一份聲明中表示:「太多公司一直在通過一切手段推進人工智能系統(tǒng)和大型語言模型的發(fā)展,包括竊取我們作者的書籍。我們不反對創(chuàng)新,我們反對創(chuàng)新背后的竊取行為。」
近期,包括視覺藝術(shù)家和其他作家在內(nèi)的版權(quán)持有者還對大型科技公司未經(jīng)授權(quán)使用其內(nèi)容來訓(xùn)練生成式人工智能系統(tǒng)提起了訴訟。人工智能公司辯稱,他們對數(shù)據(jù)的使用受到美國版權(quán)法中的公平使用原則的保護。
許多作者的訴訟都集中在 Books3 上,據(jù)稱該數(shù)據(jù)集包含從非法互聯(lián)網(wǎng)「影子圖書館」中獲取的數(shù)千本書的文本。Huckabee、TerKeurst 以及作家 David Kinnaman、Tsh Oxenreider 和 John Blase 告訴法庭,他們的書是該數(shù)據(jù)集的一部分,被濫用來訓(xùn)練 Meta 的 Llama 2 大型語言模型,該模型是與微軟合作開發(fā)的,以及 BloombergGPT。
這些作者表示,這些公司從他們的書中「非法獲取了大量價值」。他們要求法庭給予他們未經(jīng)許可使用他們的作品的金錢賠償,并下令制止對他們作品的濫用。
(舉報)