斯坦福大學(xué)的一個(gè)AI團(tuán)隊(duì)在 5 月 29 日發(fā)布了一個(gè)名為L(zhǎng)lama3-V的多模態(tài)大模型,并宣稱只需 500 美元就能訓(xùn)練出一個(gè)性能與GPT4-V相媲美的模型。然而,該模型隨后被指控抄襲,與國(guó)內(nèi)由面壁智能和清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室聯(lián)合推出的大模型MiniCPM-Llama3-V 2. 5 存在極高的相似度。
面壁智能的CEO李大海和聯(lián)合創(chuàng)始人劉知遠(yuǎn)對(duì)此事件先后發(fā)表回應(yīng),認(rèn)為盡管這在某種程度上可以看作是他們成果得到了國(guó)際團(tuán)隊(duì)的認(rèn)可,但他們更希望建立一個(gè)開(kāi)放、合作、有信任的社區(qū)環(huán)境。目前,斯坦福的團(tuán)隊(duì)已經(jīng)公開(kāi)道歉,并刪除了相關(guān)庫(kù)和官宣推文。
Llama3-V模型在社交媒體上迅速走紅,并一度登上了HuggingFace趨勢(shì)榜首頁(yè)。但隨后,一名網(wǎng)友發(fā)現(xiàn)Llama3-V與MiniCPM-Llama3-V 2. 5 在結(jié)構(gòu)、代碼、配置文件上幾乎一模一樣,僅有變量名被替換。網(wǎng)友在面壁智能GitHub的項(xiàng)目下展示了一系列證據(jù)。
劉知遠(yuǎn)教授在知乎上回應(yīng)稱,MiniCPM-Llama3-V 2. 5 在研發(fā)時(shí)內(nèi)置了一個(gè)彩蛋,即對(duì)“清華簡(jiǎn)”的識(shí)別能力,而Llama3-V模型也展現(xiàn)出了一模一樣的能力。清華簡(jiǎn)是清華大學(xué)收藏的一批戰(zhàn)國(guó)竹簡(jiǎn),為戰(zhàn)國(guó)中晚期文物。劉知遠(yuǎn)透露,識(shí)別清華簡(jiǎn)是MiniCPM-Llama3-V 2. 5 的一項(xiàng)實(shí)驗(yàn)功能,訓(xùn)練圖像是最近從出土文物中掃描并標(biāo)注的,且尚未公開(kāi)發(fā)布。
遭到質(zhì)疑后,斯坦福團(tuán)隊(duì)成員刪除了官宣模型的推文,并將項(xiàng)目在Github和HuggingFace上的庫(kù)一并刪除。團(tuán)隊(duì)成員森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺(tái)上向面壁MiniCPM團(tuán)隊(duì)正式道歉,并表示會(huì)將Llama3-V模型撤下。
李大海在聲明中表達(dá)了對(duì)此事的深切遺憾,并強(qiáng)調(diào)應(yīng)該構(gòu)建一個(gè)開(kāi)放、協(xié)作且充滿信任的技術(shù)社區(qū)環(huán)境。他們希望團(tuán)隊(duì)的努力和優(yōu)秀工作能夠吸引更多人的關(guān)注和認(rèn)可,但并非以被模仿或抄襲的方式。
斯坦福人工智能實(shí)驗(yàn)室主任克里斯托弗·大衛(wèi)·曼寧(Christopher David Manning)也發(fā)文譴責(zé)這一抄襲行為。
面壁智能首席科學(xué)家劉知遠(yuǎn)表示,人工智能的飛速發(fā)展離不開(kāi)全球算法、數(shù)據(jù)與模型的開(kāi)源共享,讓人們始終可以站在SOTA的肩上持續(xù)前進(jìn)。開(kāi)源共享的基石是對(duì)開(kāi)源協(xié)議的遵守,對(duì)其他貢獻(xiàn)者的信任,對(duì)前人成果的尊重和致敬,Llama3-V團(tuán)隊(duì)無(wú)疑嚴(yán)重破壞了這一點(diǎn)。
面壁智能成立于 2022 年 8 月,由李大海擔(dān)任CEO,曾國(guó)洋為法定代表人,注冊(cè)資本約52. 46 萬(wàn)人民幣。公司已完成兩輪融資,由知乎、智譜AI等投資。李大海畢業(yè)于北京大學(xué)數(shù)學(xué)系,曾任Google中國(guó)創(chuàng)始員工之一,后在知乎擔(dān)任合伙人、CTO。劉知遠(yuǎn)是清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授,智源青年科學(xué)家,主要研究方向?yàn)樽匀徽Z(yǔ)言處理、知識(shí)圖譜和社會(huì)計(jì)算。
(舉報(bào))