11.11云上盛惠!海量產品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
盡皆知:過去的科幻文學家預言了潛艇、衛(wèi)星、人工智能等后世科技里程碑。然科幻文學家們的預言中,其實應驗的烏鴉嘴不比正面成就少,比如DDOS網(wǎng)絡攻擊、個人生物信息盜竊、和人工智能模型的退化。雖然商洽還在早期階段,但信源透露出的信息是AI巨頭企業(yè)們愿意為作為AI模型訓練數(shù)據(jù)的新聞內容向媒體巨頭們支付定期訂閱費用,媒體巨頭們開出的價位是年均500-2000萬美元
在大型語言模型越來越多地依賴于ChatGPT和其他工具來提高效率的情況下,我們可以預見到未來很大一部分網(wǎng)絡內容將由人工智能生成。這可能對大型語言模型的未來構成嚴重風險,因為目前它們依賴于從網(wǎng)絡上抓取的人類生成數(shù)據(jù)。研究論文推測,隨著互聯(lián)網(wǎng)上生成式人工智能數(shù)據(jù)的增加,人類創(chuàng)造的內容將變得越來越有價值,即使只是作為訓練大型語言模型時的無污染數(shù)據(jù)?
隨著越來越多的人使用AI來制作和發(fā)布內容,一個明顯的問題出現(xiàn)了:當AI生成的內容在互聯(lián)網(wǎng)上激增并且AI模型開始使用AI生成的內容進行訓練,會發(fā)生什么?來自英國和加拿大的一組研究人員已經研究了這個問題,并且最近在開放獲取期刊arXiv上發(fā)表了一篇相關論文。他們的發(fā)現(xiàn)令當前的生成式AI技術及其未來令人擔憂:“我們發(fā)現(xiàn)在訓練中使用模型生成的內容會導致生成的模型?