中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > Jamba最新資訊  > 正文

    AI21發(fā)布世界首個Mamba的生產(chǎn)級模型Jamba 支持256K上下文長度

    2024-03-29 09:40 · 稿源:站長之家

    站長之家(ChinaZ.com) 3月29日 消息:AI21發(fā)布了世界首個Mamba的生產(chǎn)級模型:Jamba。這個模型采用了開創(chuàng)性的SSM-Transformer架構(gòu),具有52B參數(shù),其中12B在生成時處于活動狀態(tài)。Jamba結(jié)合了Joint Attention和Mamba技術(shù),支持256K上下文長度。單個A10080GB最多可容納140K上下文。與Mixtral8x7B相比,長上下文的吞吐量提高了3倍。

    image.png

    官網(wǎng):https://top.aibase.com/tool/jamba

    模型地址:https://huggingface.co/ai21labs/Jamba-v0.1

    Jamba代表了在模型設(shè)計上的一大創(chuàng)新。它結(jié)合了Mamba結(jié)構(gòu)化狀態(tài)空間(SSM)技術(shù)和傳統(tǒng)的Transformer架構(gòu)的元素,彌補(bǔ)了純SSM模型固有的局限。Mamba是一種結(jié)構(gòu)化狀態(tài)空間模型(Structured State Space Model, SSM),這是一種用于捕捉和處理數(shù)據(jù)隨時間變化的模型,特別適合處理序列數(shù)據(jù),如文本或時間序列數(shù)據(jù)。SSM模型的一個關(guān)鍵優(yōu)勢是其能夠高效地處理長序列數(shù)據(jù),但它在處理復(fù)雜模式和依賴時可能不如其他模型強(qiáng)大。

    而Transformer架構(gòu)是近年來人工智能領(lǐng)域最為成功的模型之一,特別是在自然語言處理(NLP)任務(wù)中。它能夠非常有效地處理和理解語言數(shù)據(jù),捕捉長距離的依賴關(guān)系,但處理長序列數(shù)據(jù)時會遇到計算效率和內(nèi)存消耗的問題。

    Jamba模型將Mamba的SSM技術(shù)和Transformer架構(gòu)的元素結(jié)合起來,旨在發(fā)揮兩者的優(yōu)勢,同時克服它們各自的局限。通過這種結(jié)合,Jamba不僅能夠高效處理長序列數(shù)據(jù)(這是Mamba的強(qiáng)項),還能保持對復(fù)雜語言模式和依賴關(guān)系的高度理解(這是Transformer的優(yōu)勢)。這意味著Jamba模型在處理需要理解大量文本和復(fù)雜依賴關(guān)系的任務(wù)時,既能保持高效率,又不會犧牲性能或精度。

    舉報

    • 相關(guān)推薦
    • 思看科技三維掃描儀NimbleTrack榮獲2025德國紅點設(shè)計大獎

      思看科技旗下NimbleTrack智能無線三維掃描儀榮獲2025年德國紅點設(shè)計大獎。該產(chǎn)品憑借創(chuàng)新工業(yè)美學(xué)設(shè)計、全無線理念和輕量化結(jié)構(gòu)(僅1.3kg)脫穎而出,實現(xiàn)0.025mm高精度掃描,支持每秒490萬次測量。其碳纖維一體成型框架和邊緣計算模塊提升了穩(wěn)定性與運(yùn)算效率,適用于汽車制造、航空航天等領(lǐng)域,推動行業(yè)數(shù)字化轉(zhuǎn)型。此次獲獎?wù)蔑@了思看科技在三維數(shù)字化領(lǐng)域的技術(shù)實力和設(shè)計創(chuàng)新能力。

    • 1000萬上下文!新開源多模態(tài)大模型,單個GPU就能運(yùn)行

      今年2月初,谷歌發(fā)布的Gemini2.0Pro支持200萬上下文,震驚了整個大模型領(lǐng)域。僅過了2個月,Meta最新開源的Llama4Scout就將上下文擴(kuò)展至1000萬,整整提升了5倍開啟千萬級時代。根據(jù)實驗數(shù)據(jù)顯示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等測試的數(shù)據(jù)比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

    • Create2025百度AI開發(fā)者大會舉行 文心4.5 Turbo、X1 Turbo發(fā)布

      百度在武漢舉辦Create2025+AI開發(fā)者大會,李彥宏強(qiáng)調(diào)AI應(yīng)用創(chuàng)造價值的關(guān)鍵。他指出當(dāng)前AI模型迭代加速,MCP成為行業(yè)標(biāo)準(zhǔn),但開發(fā)者擔(dān)憂應(yīng)用快速過時。李彥宏建議開發(fā)者選對場景和基礎(chǔ)模型,并學(xué)習(xí)調(diào)優(yōu)方法。百度發(fā)布文心大模型4.5 Turbo和X1 Turbo,價格大幅下降80%和50%,性能提升且成本更低,為開發(fā)者提供更實惠高效的工具選擇。

    • 剛剛,OpenAI發(fā)布GPT-4.1,性能暴漲、100萬上下文

      今天凌晨1點,OpenAI進(jìn)行了技術(shù)直播發(fā)布了最新模型——GPT-4.1。除了GPT-4.1之外,還有GPT4.1-Mini和GPT4.1-Nano兩款模型,在多模態(tài)處理、代碼能力、指令遵循、成本方面實現(xiàn)大幅度提升。特別是支持100萬token上下文,這對于金融分析、小說寫作、教育等領(lǐng)域幫助巨大。由于GPT-4.1的發(fā)布,OpenAI宣布將會淘汰剛發(fā)布不久的GPT-4.5,其能力可見一斑。目前,如果想體驗GPT-4.1而無法通過API身?

    • Create2025百度AI開發(fā)者大會上熱搜 4.5Turbo、X1Turbo發(fā)布

      百度在武漢舉辦2025AI開發(fā)者大會,正式發(fā)布文心大模型4.5Turbo和X1Turbo兩大版本。4.5Turbo在多模態(tài)處理能力上實現(xiàn)突破,支持文本、圖像、語音跨模態(tài)交互,調(diào)用成本較前代直降80%,僅為競品價格的40%。X1Turbo強(qiáng)化深度推理能力,價格較上代降50%,成本僅占競品的25%。兩款產(chǎn)品圍繞"多模態(tài)、強(qiáng)推理、低成本"三大特性展開,其中4.5Turbo提升邏輯推理與代碼生成效率,X1Turbo支持多步驟復(fù)雜推理和跨工具調(diào)用能力。百度此次定價策略極具競爭力,4.5Turbo成本降至行業(yè)主流水平的1/5,瞄準(zhǔn)中小企業(yè)及個人開發(fā)者;X1Turbo雖定位高端,但成本僅為競品1/4,主要面向科研機(jī)構(gòu)、金融分析等高要求領(lǐng)域。

    • AI日報:智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團(tuán)隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • 把影院帶回家,2025索尼BRAVIA新一代影院電視發(fā)布

      2025 年 4 月 15 日,索尼正式發(fā)布了BRAVIA新一代影院電視產(chǎn)品陣容,在現(xiàn)有高端產(chǎn)品線的基礎(chǔ)上,拓展了中端產(chǎn)品線,推出 2 款電視新品——新一代輕旗艦Mini LED索尼電視 5 系與高畫質(zhì)智能電視 3 系。至此,索尼電視全系列可以滿足用戶從基礎(chǔ)觀影到影院級視聽享受的多樣化需求,且電視尺寸實現(xiàn)了從 43吋、 50 吋、 55 吋、 65 吋、 75 吋、 85 吋到 98 吋大尺寸的全覆蓋,將影院級巨

    • 智能鎖行業(yè)首個AI大模型發(fā)布,TCL旗艦新品K7G Max首發(fā) 二十大使用場景行業(yè)領(lǐng)先

      TCL在2025年AWE展會上推出全球首款搭載AI大模型的智能鎖旗艦產(chǎn)品K7G Max。該產(chǎn)品整合伏羲AI大模型,具備生物識別、哨兵貓眼、親情服務(wù)和智能助手等功能,通過3D結(jié)構(gòu)光人臉識別和雙攝分布式貓眼技術(shù),實現(xiàn)2倍于行業(yè)平均的識別通過率。產(chǎn)品配備160°超廣角外攝像頭和120°內(nèi)攝像頭,支持24小時AI監(jiān)控和異常事件自動標(biāo)記。同時獲得BCTC活體檢測、C級鎖芯等多項安全認(rèn)證,安全性提升13.25倍。作為智能鎖行業(yè)領(lǐng)導(dǎo)者,TCL連續(xù)四年蟬聯(lián)銷量冠軍,其AI掌靜脈門鎖登陸亞馬遜新品榜TOP3,樹立了高端智能鎖行業(yè)標(biāo)桿。

    • 基于安卓16 Beta 2 澎湃OS開發(fā)者預(yù)覽版發(fā)布支持小米15、K70至尊版

      今日,小米澎湃OS官方宣布,基于安卓16Beta2的小米澎湃OS開發(fā)者預(yù)覽版現(xiàn)已發(fā)布。開發(fā)者們可使用小米15、REDMIK70至尊版嘗鮮適配。谷歌I/O大會將于今年5月20日-5月21日舉行,按計劃,谷歌將在大會上發(fā)布全新的安卓16操作系統(tǒng)。

    • 苦等一年 Meta終于放大招 正式發(fā)布開源大模型Llama 4

      美國科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開源AI模型Llama4,恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu),這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個專注于特定任務(wù)的專家”子模型,實現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示:他們的目標(biāo)是建立世界領(lǐng)先的人工智能,將其開源,并使其普遍可用,以便世界上每個人都能受益。

    熱文

    • 3 天
    • 7天