**劃重點:**
- ?? OpenAI啟動Data Partnerships計劃,與第三方機構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。
- ?? OpenAI尋求多領(lǐng)域、多語言、多格式的數(shù)據(jù),以提高AI模型的廣泛理解。
- ?? 盡管有商業(yè)動機,OpenAI的Data Partnerships計劃也引發(fā)了關(guān)于數(shù)據(jù)擁有者權(quán)益和透明度的討論。
站長之家(ChinaZ.com) 11月10日 消息:OpenAI最近宣布了Data Partnerships計劃,旨在與第三方機構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。這一舉措旨在解決現(xiàn)有AI模型訓(xùn)練數(shù)據(jù)集中存在的問題,其中包含有毒語言和偏見。
OpenAI的目標是培養(yǎng)更安全、更有益于全人類的AI。為了實現(xiàn)這一目標,他們計劃采集“大規(guī)?!睌?shù)據(jù)集,以反映人類社會,尤其是那些目前在網(wǎng)上難以獲得的數(shù)據(jù)。這些數(shù)據(jù)將涵蓋各種形式,包括圖像、音頻和視頻,但重點是尋找能夠表達人類意圖的數(shù)據(jù),例如長篇寫作或?qū)υ?,跨越不同語言、主題和格式。
OpenAI還承諾將與合作機構(gòu)合作,必要時使用光學(xué)字符識別和自動語音識別工具將培訓(xùn)數(shù)據(jù)數(shù)字化,并在必要時刪除敏感或個人信息。初期,他們計劃創(chuàng)建兩種類型的數(shù)據(jù)集:一個是公開的數(shù)據(jù)集,任何人都可以用于AI模型訓(xùn)練,另一個是用于訓(xùn)練專有AI模型的私有數(shù)據(jù)集,供希望保護數(shù)據(jù)隱私的機構(gòu)使用。
盡管OpenAI提出了宏偉的目標,但也有人對其商業(yè)動機提出質(zhì)疑。一些人認為,OpenAI的舉措旨在改善其模型的性能,但可能會損害其他機構(gòu)的利益,并未對數(shù)據(jù)擁有者作出合理的賠償。這引發(fā)了關(guān)于透明度和數(shù)據(jù)使用權(quán)益的討論。
OpenAI的Data Partnerships計劃旨在推動AI模型的發(fā)展,但其實施和影響還有待觀察。在克服數(shù)據(jù)集偏見等挑戰(zhàn)方面,OpenAI是否能做得更好,仍有待驗證。
(舉報)