中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > Mistral最新資訊  > 正文

    Nvidia 和 Mistral AI 的超精確小語(yǔ)言模型適用于筆記本電腦和 PC

    2024-08-24 13:57 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com) 8月24日消息:NvidiaMistral AI 發(fā)布了一款新型的小型語(yǔ)言模型,據(jù)稱該模型在小體積下依然具有「最先進(jìn)」的準(zhǔn)確性。該模型名為 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,參數(shù)量從 120 億縮減到了 80 億。

    英偉達(dá)

    據(jù) Nvidia 深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 在博客文章中介紹,這款 80 億參數(shù)的小型語(yǔ)言模型通過(guò)兩種不同的 AI 優(yōu)化方法實(shí)現(xiàn)了規(guī)??s減。開(kāi)發(fā)團(tuán)隊(duì)使用了結(jié)合剪枝和蒸餾的技術(shù)?!讣糁νㄟ^(guò)去除對(duì)準(zhǔn)確性貢獻(xiàn)最小的模型權(quán)重來(lái)縮小神經(jīng)網(wǎng)絡(luò)的規(guī)模。蒸餾過(guò)程中,團(tuán)隊(duì)在一個(gè)較小的數(shù)據(jù)集上重新訓(xùn)練了這個(gè)經(jīng)過(guò)剪枝的模型,從而大幅提高了因剪枝導(dǎo)致的準(zhǔn)確性下降?!?/p>

    這些優(yōu)化使得開(kāi)發(fā)人員能夠在「原始數(shù)據(jù)集的一小部分」上訓(xùn)練優(yōu)化后的語(yǔ)言模型,從而在計(jì)算成本上節(jié)省高達(dá) 40 倍。通常情況下,AI 模型需要在模型規(guī)模和準(zhǔn)確性之間進(jìn)行權(quán)衡,但通過(guò) Nvidia 和 Mistral AI 的新剪枝和蒸餾技術(shù),語(yǔ)言模型可以同時(shí)兼顧這兩者。

    配備了這些增強(qiáng)功能的 Mistral-NeMo-Minitron 8B 據(jù)稱在九項(xiàng)同類規(guī)模的語(yǔ)言驅(qū)動(dòng) AI 基準(zhǔn)測(cè)試中表現(xiàn)出色。所節(jié)省的計(jì)算資源足以讓筆記本電腦和工作站 PC 本地運(yùn)行 Minitron 8B,使其比云服務(wù)更快且更安全。

    Nvidia 圍繞消費(fèi)者級(jí)計(jì)算硬件設(shè)計(jì)了 Minitron 8B。該語(yǔ)言模型被封裝為 Nvidia NIM 微服務(wù),并針對(duì)低延遲進(jìn)行了優(yōu)化,以提高響應(yīng)速度。Nvidia 通過(guò)其定制模型服務(wù) AI Foundry,將 Minitron 8B 調(diào)整為能夠在低配置設(shè)備(如智能手機(jī))上運(yùn)行。盡管性能和準(zhǔn)確性可能略有下降,但 Nvidia 表示該模型仍然是高準(zhǔn)確性的語(yǔ)言模型,并且只需極少的訓(xùn)練數(shù)據(jù)和計(jì)算資源

    剪枝和蒸餾技術(shù)似乎是人工智能性能優(yōu)化的下一前沿。理論上,開(kāi)發(fā)者可以將這些優(yōu)化技術(shù)應(yīng)用于所有現(xiàn)有的語(yǔ)言模型,從而顯著提升整體性能,包括那些只能由 AI 加速服務(wù)器群組運(yùn)行的大型語(yǔ)言模型。

    舉報(bào)

    • 相關(guān)推薦
    • NVIDIA PhysX物理加速不死!內(nèi)核源代碼終于開(kāi)源

      PhysX物理加速技術(shù)已經(jīng)不再有NVIDIA官方的支持,但并不意味著這項(xiàng)優(yōu)秀技術(shù)會(huì)消失在歷史的長(zhǎng)河中,因?yàn)樗耆_(kāi)源了!其實(shí)早在2018年底,NVIDIA就公開(kāi)了PhysXSDK4.0開(kāi)發(fā)包,根據(jù)BSD-3許可協(xié)議公開(kāi)了源代碼,但不包括最核心的GPU模擬內(nèi)核。理論上完全可以將PhysX代碼從CUDA平臺(tái)上,移植到Vulcan、OpenCL,從支持AMD、Intel顯卡。

    • NVIDIA修復(fù)AMD Linux驅(qū)動(dòng)Bug!自家驅(qū)動(dòng)還在被吐槽

      最近,一位NVIDIA的Linux內(nèi)核工程師成功修復(fù)了一個(gè)影響AMD集成和獨(dú)立顯卡驅(qū)動(dòng)性能的問(wèn)題。問(wèn)題的根源在于Linux6.15內(nèi)核代碼中引入的一個(gè)變更,NVIDIA工程師BalbirSingh在為L(zhǎng)inux6.15內(nèi)核更新時(shí),對(duì)x86_64系統(tǒng)的內(nèi)核地址空間布局隨機(jī)化進(jìn)行了調(diào)整,以支持PCIBAR空間擴(kuò)展到10TB以上。受影響的顯卡型號(hào)包括RTX50系列和RTX40系列,甚至一些RTX30系列顯卡也受到了影響,在安裝該驅(qū)動(dòng)程序后,電腦可能會(huì)在安裝過(guò)程中或重啟時(shí)出現(xiàn)黑屏,少數(shù)用戶還報(bào)告了藍(lán)屏死機(jī)的問(wèn)題。

    • RTX 50/40系用戶崩潰!NVIDIA新驅(qū)動(dòng)易致Win10/11設(shè)備黑屏

      NVIDIA在上個(gè)月發(fā)布了572.83新版顯卡驅(qū)動(dòng)程序,不過(guò)根據(jù)最新消息,該驅(qū)動(dòng)程序容易導(dǎo)致Windows10和Windows11系統(tǒng)設(shè)備出現(xiàn)黑屏問(wèn)題。在更新日志中,官方稱其修復(fù)了RTX5080/5090在超頻時(shí)無(wú)法發(fā)揮最大性能的漏洞,并聲稱解決了部分黑屏問(wèn)題。對(duì)于已經(jīng)安裝該驅(qū)動(dòng)程序并遇到黑屏問(wèn)題的用戶,可以嘗試回退到舊版本驅(qū)動(dòng)程序,如566.36版本,或者嘗試關(guān)閉G-Sync、降低刷新率等方法來(lái)緩解問(wèn)題。

    • 深度系統(tǒng)deepin 23.1發(fā)布:NVIDIA顯卡、Intel/AMD處理器集體升級(jí)

      快科技4月16日消息,deepin深度操作系統(tǒng)團(tuán)隊(duì)發(fā)布了deepin 23.1版本,主要解決基礎(chǔ)組件更新后的安裝效率問(wèn)題,大幅提升新用戶安裝體驗(yàn),同時(shí)集成多項(xiàng)功能優(yōu)化與問(wèn)題修復(fù),進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本重點(diǎn)改進(jìn):硬件兼容性與內(nèi)核優(yōu)化:集成Linux 6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU處理器微碼更新,全面提升硬件支持與底層性能;核心功能增強(qiáng):DDE新增智能鏡像源管理、緊湊模式入口,全局搜索支持離線自然語(yǔ)言與AI處理能力;開(kāi)發(fā)工具與跨平臺(tái)支持:應(yīng)用商店適配Debian/Ubuntu/Arch等子系統(tǒng)環(huán)境,支持快速啟動(dòng);如意玲瓏

    • 首個(gè)支持NVIDIA DLSS的Switch 2游戲確認(rèn):《賽博朋克2077》

      文章主要討論了Digital Foundry發(fā)布的一份關(guān)于Nintendo Switch新版本的報(bào)告,特別提到了《賽博朋克2077》在Nintendo Switch 2版本上運(yùn)行時(shí)的性能表現(xiàn)。CD Projekt Red對(duì)此進(jìn)行了優(yōu)化,使得在高分辨率模式下游戲可以穩(wěn)定在30fps,而在720p模式下則能以40fps運(yùn)行。此外,文章指出,理論上在高分辨率模式下游戲可以達(dá)到1080p,而720p模式下則能以30fps運(yùn)行。文章還提到,VGC對(duì)用戶反饋的分析表明,《賽博朋克2077》在Switch 2版本上運(yùn)行時(shí)達(dá)到了30FPS的性能目標(biāo),但是由于性能限制,仍然存在一些問(wèn)題。

    • 任天堂Switch 2芯片首次曝光!搭載NVIDIA Tegra239支持DLSS

      任天堂Switch 2核心芯片Tegra 239參數(shù)曝光:采用8核Arm Cortex-A78C架構(gòu),集成1536個(gè)CUDA核心的GPU融合了Ada Lovelace和Ampere架構(gòu),支持128位LPDDR5內(nèi)存。原生支持DLSS技術(shù),可實(shí)現(xiàn)4K/60FPS輸出,性能較前代顯著提升。芯片主頻1.1-1.5GHz,功耗表現(xiàn)優(yōu)化。延續(xù)任天堂與NVIDIA合作傳統(tǒng),但官方尚未公布完整參數(shù)。此前Switch采用Tegra X1芯片,新款性能提升明顯,有望帶來(lái)更好的游戲體驗(yàn)。

    • 首款鴻蒙PC!曝華為筆記本新品售價(jià)過(guò)萬(wàn)

      快科技4月16日消息,在3月20日舉行的新品發(fā)布會(huì)上,余承東預(yù)告,鴻蒙電腦5月見(jiàn)。今天,博主定焦數(shù)碼爆料,華為5月登場(chǎng)的筆記本新品是MateBook X Pro系列,其中一款售價(jià)可能接近2萬(wàn),旗艦屬性拉滿。當(dāng)前華為商城在售的MateBook X Pro定價(jià)是10599元起,搭載英特爾酷睿Ultra 7處理器,配備16GB內(nèi)存和1TB存儲(chǔ),預(yù)裝Windows 11系統(tǒng)。與在售的MateBook X Pro相比,新款MateBook X Pro升級(jí)為鴻蒙系統(tǒng),是全球首款鴻蒙PC。去年HarmonyOS開(kāi)發(fā)者官網(wǎng)設(shè)計(jì)指南里出現(xiàn)了疑似鴻蒙PC的頁(yè)面布局,整體UI設(shè)計(jì)采用了與蘋(píng)果Mac類似的方案,狀態(tài)欄置頂、Dock欄

    • 時(shí)空壺接入大語(yǔ)言模型,跨語(yǔ)言溝通已成翻譯的藝術(shù)

      在當(dāng)今全球化浪潮中,跨語(yǔ)言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國(guó)談判,到文化交流中的思想碰撞,高效、精準(zhǔn)的語(yǔ)言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時(shí)空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動(dòng)全球交流合作邁向新的高度,真正實(shí)現(xiàn)跨越語(yǔ)言障礙,讓世界溝通無(wú)阻。

    • Trae國(guó)內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng),支持Token快速配置,并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景,顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

    • AI日?qǐng)?bào):Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開(kāi)源圖像編輯模型Step1X-Edit;?夸克AI超級(jí)框上線 “拍照問(wèn)夸克”

      本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開(kāi)源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語(yǔ)音識(shí)別等任務(wù);2)階躍星辰開(kāi)源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問(wèn)夸克"功能,實(shí)現(xiàn)視覺(jué)問(wèn)答;4)蘋(píng)果iOS18.5將在中國(guó)推送,帶來(lái)智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語(yǔ)言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國(guó)內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國(guó)宣布新車將接入DeepSeek技術(shù)。