11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
北大等出品,首個多模態(tài)版o1開源模型來了——代號LLaVA-o1,基于Llama-3.2-Vision模型打造,超越傳統(tǒng)思維鏈提示,實現(xiàn)自主“慢思考”推理。在多模態(tài)推理基準測試中,LLaVA-o1超越其基礎(chǔ)模型8.9%,并在性能上超越了一眾開閉源模型。團隊宣布LLaVA-o1的代碼、預(yù)訓(xùn)練權(quán)重、數(shù)據(jù)集等即將全部開源。
根據(jù)SuperCLUE發(fā)布的中文大模型基準測評最新報告,阿里通義千問開源模型Qwen2-72B-Instruct以卓越的表現(xiàn)位居國內(nèi)通用能力第一,更在全球范圍內(nèi)成為最強開源模型。SuperCLUE報告詳細披露了對國內(nèi)外33個大模型的綜合測評結(jié)果,Qwen2-72B在一級總分上以77分的高分與Claude-3.5-Sonnet并列第二,僅次于OpenAI的GPT-4o。截至目前Qwen系列模型的下載量已突破2000萬次,其應(yīng)用場景覆蓋了工業(yè)、金融、醫(yī)療、汽車等多個垂直領(lǐng)域。
在2024年世界人工智能大會期間,李彥宏在一場圓桌訪談中對開源與閉源模型進行了討論,并直言不諱地稱開源其實是一種智商稅。面對開源閉源的問題,李彥宏堅持認為閉源模型會持續(xù)領(lǐng)先,他解釋說,閉源模型可以根據(jù)用戶需求提供多種變體,以平衡效果、推理速度和成本。大模型的加持能讓各行各業(yè)的公司受益,這種影響力對整個社會和人類來說更為重要。
發(fā)布僅2天,CodeLlama再次引爆AI編碼的變革。還記得Meta在CodeLlama論文中出現(xiàn)的能夠全面持平GPT-4的神秘版本UnnaturalCodeLlama嗎?大佬Sebastian在自己博客里做出解釋:是使用了1萬5千條非自然語言指令對CodeLlama-Python34B進行微調(diào)之后的版本。如果要讓70B的模型支持100ktoken的輸入長度,可能會使得模型對于計算量的要求變得過于夸張了。