中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<sup id="iflty"></sup>

<ol id="iflty"></ol>

<big id="iflty"></big>

<input id="iflty"></input>

微軟推出全新預(yù)訓(xùn)練模型phi-1.5 僅13億參數(shù)常識(shí)推理碾壓Llama2

2023-09-18 09:46 · 稿源：站長(zhǎng)之家

要點(diǎn):
1、微軟研究人員推出了一個(gè)僅有13億參數(shù)的LLM模型Phi-1.5。
2、Phi-1.5在常識(shí)推理任務(wù)上表現(xiàn)優(yōu)異，優(yōu)于多個(gè)參數(shù)量十倍以上的模型。
3、研究表明，模型參數(shù)規(guī)模不是決定性因素，高質(zhì)量數(shù)據(jù)更為重要。

站長(zhǎng)之家（ChinaZ.com）9月18日消息:微軟研究人員最近在一篇論文中提出了一個(gè)新的語(yǔ)言模型Phi-1.5，該模型的參數(shù)量?jī)H有13億。研究人員主要關(guān)注Phi-1.5在常識(shí)推理方面的表現(xiàn)，因?yàn)檫@是對(duì)語(yǔ)言模型能力的重要考驗(yàn)。

論文地址:https://arxiv.org/abs/2309.05463

項(xiàng)目地址:https://huggingface.co/microsoft/phi-1_5

結(jié)果表明，Phi-1.5在多個(gè)常識(shí)推理基準(zhǔn)測(cè)試數(shù)據(jù)集上都取得了與參數(shù)量是其10倍以上的模型相當(dāng)或更好的結(jié)果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等數(shù)據(jù)集上的表現(xiàn)，都與Llama2-7B、Falcon-7B和Vicuna-13B相當(dāng)甚至更好。

這說(shuō)明模型的參數(shù)規(guī)模不是決定性因素，采用高質(zhì)量合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練可能更為關(guān)鍵。研究中，Phi-1.5使用了微軟之前提出的Phi-1模型的訓(xùn)練數(shù)據(jù)，以及新增的“教科書(shū)級(jí)”合成數(shù)據(jù)進(jìn)行訓(xùn)練。

結(jié)果表明，Phi-1.5不僅展現(xiàn)出許多大模型所具有的語(yǔ)言理解和推理能力，在控制有害內(nèi)容生成方面也具有一定優(yōu)勢(shì)，這對(duì)研究大型語(yǔ)言模型的社會(huì)影響意義重大。本研究表明，相比單純追求模型規(guī)模，如何獲取高質(zhì)量訓(xùn)練數(shù)據(jù)可能更為重要，這為未來(lái)語(yǔ)言模型研究提供了新的思路。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開(kāi)源

被寄予厚望的美國(guó)Meta公司的最新開(kāi)源大模型Llama4發(fā)布不到2天時(shí)間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實(shí)際效果差、開(kāi)源條件多部署門檻高是偽開(kāi)源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文，打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開(kāi)放之間搖擺，恐將在AI競(jìng)賽中進(jìn)一步失去開(kāi)發(fā)者支持。

?Meta ?Llama ?4
苦等一年 Meta終于放大招正式發(fā)布開(kāi)源大模型Llama 4

美國(guó)科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開(kāi)源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu)，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過(guò)程中展現(xiàn)出更高效率，通過(guò)將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型，實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標(biāo)是建立世界領(lǐng)先的人工智能，將其開(kāi)源，并使其普遍可用，以便世界上每個(gè)人都能受益。

?Meta ?Llama ?4
實(shí)錘了，Llama 4重測(cè)排名掉至32名！遠(yuǎn)不及DeepSeek和Qwen

LMArena更新了Meta最新發(fā)布的開(kāi)源大模型Llama-4-Maverick的排名，從此前的第2名，直線掉到了第32名！這也實(shí)錘了此前開(kāi)發(fā)者對(duì)Meta為刷榜排名向LMArena提供了“特供版”的Llama4大模型的質(zhì)疑。開(kāi)源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名為32名，遠(yuǎn)低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max，甚至連英偉達(dá)基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

?Meta ?Llama ?4
Meta說(shuō)他們的 Llama 4 偏見(jiàn)少了！但，“虛假對(duì)等”才是真偏見(jiàn)

Meta公司稱，相比之前的版本，他們最新的人工智能模型Llama4的政治偏見(jiàn)更少了。其中一部分便是通過(guò)允許該模型回答更多帶有政治爭(zhēng)議性的問(wèn)題來(lái)實(shí)現(xiàn)這一點(diǎn)的。下次當(dāng)你使用Meta的AI產(chǎn)品時(shí)，它可能會(huì)為“通過(guò)服用馬用鎮(zhèn)靜劑來(lái)治療新冠病毒”這種觀點(diǎn)說(shuō)好話！

?meta ?ai產(chǎn)品 ?Llama4
薦反擊DeepSeek失?。?span id="vunmzre" class="col-red02">Llama 4效果不好，Meta承認(rèn)有問(wèn)題

今天凌晨1點(diǎn)半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長(zhǎng)文，對(duì)前天剛開(kāi)源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示，Llama4一開(kāi)發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個(gè)利好消息來(lái)拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
薦剛剛，Llama 4深夜開(kāi)源擊敗DeepSeek V3！2萬(wàn)億多模態(tài)巨獸搶回王座

Llama4重磅發(fā)布了!Meta官宣開(kāi)源首個(gè)原生多模態(tài)Llama4，首次采用的MoE架構(gòu)，支持12種語(yǔ)言，首批發(fā)布一共兩款:Llama4Scout:共有1090億參數(shù)，17B活躍參數(shù)，16個(gè)專家，1000萬(wàn)上下Llama4Maverick:共有4000億參數(shù)，17B活躍參數(shù)，128個(gè)專家，100萬(wàn)上下文另外，2萬(wàn)億參數(shù)Llama4Behemoth將在未來(lái)幾個(gè)月面世，288B活躍參數(shù)，16個(gè)專家。Llama4的橫空出世，成為迄今為止開(kāi)源最強(qiáng)，多模態(tài)能力最好的模型之一。L

?Llama4 ?多模態(tài)AI ?Meta開(kāi)源
薦Llama 4五大疑點(diǎn)曝光，逐層扒皮，全球AI進(jìn)步停滯，NYU教授稱Scaling徹底結(jié)束

令人失望的Llama4，只是前奏已。接下來(lái)我們恐將看到——全球局勢(shì)的改變，將徹底阻止AI進(jìn)步!最近，一位AICEO做出長(zhǎng)視頻，逐級(jí)對(duì)Llama4身上的六大疑點(diǎn)進(jìn)行了扒皮。GaryMarcus正在尋找對(duì)開(kāi)發(fā)更可靠替代方法有興趣的投資者。

?Llama4 ?AI進(jìn)步 ?全球局勢(shì)
能理解海豚聲音！谷歌開(kāi)發(fā)全新AI模型DolphinGemma

快科技4月15日消息，谷歌公布了一款名為DolphinGemma”的大型語(yǔ)言模型，旨在幫助科學(xué)家理解海豚的聲音，并生成類似海豚的聲音序列。研究人員預(yù)計(jì)在未來(lái)幾個(gè)月內(nèi)測(cè)試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry（CHAT）發(fā)聲系統(tǒng)，以探索是否能夠翻譯并模仿海豚的聲音，進(jìn)而實(shí)現(xiàn)與海豚的某種對(duì)話”。海豚是地球上最聰明且最善于溝通的動(dòng)物之一，其社交互動(dòng)極其復(fù)雜?

?谷歌 ?DolphinGemma ?海豚溝通
薦“元寶”殺入好友列表，想和13億微信用戶“交個(gè)朋友”

微信可以加“元寶”好友了，全民AI時(shí)代或?qū)⒂纱碎_(kāi)啟。“元寶”是騰訊元寶App入駐微信的AI助手，日前正式上線可用。這是繼今年2月微信宣布接入DeepSeek之后，騰訊在微信生態(tài)中落地應(yīng)用大模型的又一大動(dòng)作。特別的是，“元寶”是以添加微信好友的方式內(nèi)嵌到用戶微信聊天頁(yè)的，目前支持解析公眾號(hào)文章、解讀文檔（100M以內(nèi)）、分析圖片內(nèi)容等功能，背后基于的模型是騰訊

?騰訊 ?元寶APP ?AI助手
薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長(zhǎng)視頻直接可推理

現(xiàn)在的國(guó)產(chǎn)AI應(yīng)用，一口氣看好幾分鐘的視頻，都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段，AI就搖身一變成“名偵探”做剖析:它會(huì)對(duì)整個(gè)視頻的內(nèi)容先做一個(gè)總結(jié)，再按照秒級(jí)，對(duì)視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負(fù)責(zé)人張直政表示:除此之外，上海交通大學(xué)副教授閆維新對(duì)這個(gè)問(wèn)題的看法是:總言之，商湯作為國(guó)?

?國(guó)產(chǎn)AI ?視頻解析 ?智能剪輯

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM