美國斯坦福大學(xué)一個(gè)AI團(tuán)隊(duì)主導(dǎo)的開源大模型,被證實(shí)套殼抄襲了國內(nèi)清華系明星創(chuàng)業(yè)公司面壁智能的開源模型。目前,該團(tuán)隊(duì)已公開道歉,并將該項(xiàng)目在相關(guān)平臺(tái)上的庫一并刪除。
這一事件昨天在國內(nèi)外社交媒體上引發(fā)熱議,#斯坦福抄襲中國大模型#和#斯坦福團(tuán)隊(duì)道歉#,當(dāng)天下午分別沖上微博熱搜第2和第5位。
斯坦福大學(xué)AI團(tuán)隊(duì)
抄襲中國大模型
5月29日,一個(gè)來自斯坦福大學(xué)的AI團(tuán)隊(duì)在網(wǎng)上發(fā)表文章《Llama3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》,并開始廣而告之:成功訓(xùn)練出一個(gè)SOTA多模態(tài)模型Llama3-V,性能比GPT4-V、Gemini Ultra、Claude Opus更強(qiáng),但模型要小100倍,且訓(xùn)練成本僅需500美元(折合人民幣約3622元)。后三個(gè)大模型,都是全球范圍知名的多模態(tài)“巨無霸”。
由于團(tuán)隊(duì)成員擁有斯坦福大學(xué)(其中兩人是斯坦福大學(xué)本科生)、特斯拉、SpaceX、亞馬遜等亮眼背景,Llama3-V第一時(shí)間被推到了聚光燈下,登上開發(fā)者社區(qū)Hugging Face(抱抱臉)首頁,引發(fā)眾多開發(fā)者關(guān)注。
很快,有用戶在Hugging Face以及海外社交平臺(tái)X上提出質(zhì)疑:Llama3-V是否套殼MiniCPM-Llama3-V 2.5?后者為面壁智能5月20日推出的開源端側(cè)多模態(tài)模型。
輿論迅速發(fā)酵。經(jīng)過一些開發(fā)者的比較,兩者在模型結(jié)構(gòu)、代碼、配置文件等方面完全相同,只是進(jìn)行了一些重新格式化,并將部分變量重新命名。
面對質(zhì)疑,斯坦福大學(xué)團(tuán)隊(duì)一開始選擇“辯解”:只是使用了MiniCPM-Llama3-V 2.5的tokenizer(分詞器,自然語言處理NLP中的一個(gè)關(guān)鍵組件,負(fù)責(zé)將長篇文本內(nèi)容拆解成一個(gè)個(gè)獨(dú)立的單詞或子詞),并且宣稱在它發(fā)布前就已開始這項(xiàng)工作。
兩位斯坦福大學(xué)學(xué)生公開道歉
6月2日晚,面壁智能團(tuán)隊(duì)確認(rèn)抄襲事實(shí)。次日,面壁智能首席科學(xué)家劉知遠(yuǎn)在知乎上表示:“已經(jīng)比較確信Llama3-V是對我們MiniCPM-Llama3-V 2.5套殼!
他還表示:“人工智能的飛速發(fā)展離不開全球算法、數(shù)據(jù)與模型的開源共享。我們這次開源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協(xié)議的遵守,對其他貢獻(xiàn)者的信任,對前人成果的尊重和致敬!
CEO李大海也在朋友圈發(fā)文:“對這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境!
昨天,Llama3-V團(tuán)隊(duì)的其中兩位成員Aksh Garg(阿克什)和Siddharth Sharma(悉達(dá)多),也就是那兩位斯坦福大學(xué)本科生,已在社交平臺(tái)上向面壁智能團(tuán)隊(duì)道歉:“我們向作者道歉,并對自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉!
同時(shí),Aksh Garg解釋Siddharth Sharma和自己主要是負(fù)責(zé)推廣,編寫代碼的是Mustafa Aljadery(穆斯塔法),而他目前已經(jīng)聯(lián)系不上。
<愛上你,愛上新江南網(wǎng):hzgou.cn www.xjnnet.net,hzgou.cn歡迎您!>聲明:
本文僅代表作者個(gè)人觀點(diǎn),與新江南網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容,新江南網(wǎng)號系信息發(fā)布平臺(tái),新江南網(wǎng)僅提供信息存儲(chǔ)空間服務(wù)。如有侵權(quán)請出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
圖片精選
點(diǎn)擊排行