中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > Cerebras最新資訊  > 正文

    在全球芯片上訓(xùn)練!AI芯片初創(chuàng)公司Cerebras新推出七種開源語言模型

    2023-03-31 15:10 · 稿源:站長之家

    站長之家(ChinaZ.com)3月31日 消息:AI芯片初創(chuàng)公司Cerebras宣布進(jìn)軍大型語言模型領(lǐng)域,推出了七種新的開源語言模型。稱為Cerebras-GPT 的模型系列的大小范圍從1.11億個(gè)參數(shù)到130億個(gè)參數(shù)。

    image.png

    這家初創(chuàng)公司表示,這些模型使用 DeepMind 的Chinchilla公式進(jìn)行訓(xùn)練,旨在讓任何人都能以更低的成本使用它們,其消耗的能量實(shí)迄今為止公開可用的模型中最少的。

    Cerebras 決定構(gòu)建并提供這些開源模型它認(rèn)為訪問應(yīng)該更加開放。Cerebras ML 研究科學(xué)家 Nolan Dey 在博客文章中寫道:“最新的大型語言模型OpenAI 的GPT-4發(fā)布時(shí)沒有關(guān)于其模型架構(gòu)、訓(xùn)練數(shù)據(jù)、訓(xùn)練硬件或超參數(shù)的信息。該公司越來越多地使用封閉數(shù)據(jù)集構(gòu)建大型模型,并僅通過 API 訪問提供模型輸出。要讓 LLM 成為一種開放和可訪問的技術(shù),我們認(rèn)為重要的是能夠訪問最先進(jìn)的模型,這些模型對于研究和商業(yè)應(yīng)用都是開放的、可復(fù)制的和免版稅的?!?/p>

    image.png

    Cerebras模型的數(shù)據(jù)集尚未公開,目前可以通過HuggingFace訪問模型本身。

    在全球最大芯片上訓(xùn)練模型

    Cerebras 以其WSE-2芯片而聞名,它是世界上最大的芯片之一,類似于一個(gè)8x8英寸的平板,每個(gè)平板包含2.6萬億個(gè)晶體管和85萬個(gè)“人工智能優(yōu)化”內(nèi)核。

    image.png

    Cerebras 的CS-2系統(tǒng)包含大量 WSE-2AI 芯片。這家初創(chuàng)公司采用了其中的16個(gè)系統(tǒng)來為其 AI 超級計(jì)算機(jī) Andromeda 提供動力。Andromeda于去年11月發(fā)布,旨在大大減少訓(xùn)練大型語言模型所需的時(shí)間。

    這家初創(chuàng)公司甚至聲稱超級計(jì)算機(jī)可以處理具有巨大序列長度的大型語言模型,這是傳統(tǒng) GPU 根本無法做到的。在去年底接受AI Business采訪時(shí),Cerebras 首席執(zhí)行官 Andrew Feldman 表示 Andromeda 已經(jīng)幫助進(jìn)行了 COVID-19研究。

    這家初創(chuàng)公司已將注意力轉(zhuǎn)向大型語言模型,以此來展示其技術(shù)的能力。

    Cerebras-GPT 模型是在 Andromeda 上訓(xùn)練的,Cerebras 表示它能夠“快速完成訓(xùn)練,無需GPU集群上所需的傳統(tǒng)分布式系統(tǒng)工程和模型并行調(diào)優(yōu)?!?用于訓(xùn)練 Cerebras-GPT 模型的集群也已通過Cerebras AI Model Studio在云端提供。

    促進(jìn)大語言模型大眾化

    主要的人工智能實(shí)驗(yàn)室已經(jīng)做了很多開發(fā)語言模型的工作,但卻隱瞞了有關(guān)底層系統(tǒng)如何工作的信息。例如,OpenAI在本月早些時(shí)候發(fā)布GPT-4引起了憤怒,只是透露了很少的技術(shù)規(guī)格,卻沒有提及所使用的確切數(shù)據(jù)或尺寸細(xì)節(jié)。

    很多人,比如斯坦福大學(xué)的 AI 研究人員,認(rèn)為由于 OpenAI 等公司已經(jīng)關(guān)閉了他們的模型,這使得對這些技術(shù)的潛在影響進(jìn)行研究變得更加困難。

    Cerebras 設(shè)計(jì)了新模型以提供更廣泛的訪問,并表示希望這些模型將“作為有效培訓(xùn)的秘訣,并作為進(jìn)一步社區(qū)研究的參考。”

    站長之家注:

    Cerebras-GPT 官方博客網(wǎng)址:https://www.cerebras.net/blog/cerebras-gpt-a-family-of-open-compute-efficient-large-language-models/

    Cerebras-GPT模型HuggingFace網(wǎng)址:https://huggingface.co/cerebras

    舉報(bào)

    • 相關(guān)推薦
    • 和英偉達(dá)脫鉤 何小鵬:小鵬自研圖靈AI芯片提前上車

      快科技4月15日消息,小鵬汽車董事長何小鵬近日透露,小鵬汽車全棧自研的圖靈AI芯片即將提前到第二季度量產(chǎn)上車。隨著汽車行業(yè)的智駕廣泛應(yīng)用端到端技術(shù),催生AI大模型規(guī)模越來越大。小鵬汽車一方面開發(fā)參數(shù)量是主流VLA模型35倍的世界基座模型,另一方面即將量產(chǎn)1顆頂3顆英偉達(dá)Orin X的自研高算力芯片,兩大重磅技術(shù)打造最強(qiáng)AI大腦”。在去年11月份舉辦的小鵬AI科技日”

    • 馬斯克:將出現(xiàn)新方案實(shí)現(xiàn)自動駕駛 僅需攝像頭和AI芯片

      站長之家(ChinaZ.com) 4月15日 消息:當(dāng)?shù)貢r(shí)間4月14日,特斯拉首席執(zhí)行官埃隆·馬斯克在社交媒體透露,公司即將推出基于純AI技術(shù)的全自動駕駛(FSD)解決方案。該方案完全依賴攝像頭與特斯拉自主研發(fā)的AI芯片,并由其AI軟件驅(qū)動,與特斯拉長期堅(jiān)持的“純視覺自動駕駛”技術(shù)路線一致。特斯拉近期通過官方X賬號發(fā)布視頻,展示其德克薩斯工廠內(nèi)FSD無監(jiān)督技術(shù)的應(yīng)用場景。視頻?

    • 英偉達(dá)CEO黃仁勛造訪白宮:希望特朗普修改AI芯片出口規(guī)則

      快科技5月1日消息,據(jù)媒體報(bào)道,美國當(dāng)?shù)貢r(shí)間周三, 英偉達(dá)公司首席執(zhí)行官黃仁勛造訪白宮時(shí)表示,他希望特朗普政府修改從美國向全球出口人工智能(AI)技術(shù)的相關(guān)法規(guī),以便美國企業(yè)能更好地抓住未來的機(jī)遇。我們需要加速美國AI技術(shù)在全球的擴(kuò)散,”黃仁勛在與媒體的簡短會面中表示,政府的政策和鼓勵措施必須真正支持這一點(diǎn)。”與此同時(shí),黃仁勛還呼吁美國政府放寬人工智能圖形處理單元出口規(guī)定,但媒體報(bào)道特朗普政府計(jì)劃加強(qiáng)控制。眾所周知,英偉達(dá)目前主導(dǎo)著用于訓(xùn)練AI模型的尖端AI芯片市場,但其向中國客戶銷售最先進(jìn)產(chǎn)品的渠道已被?

    • 新一代AI芯片賦能三星OLED S90F系列,掌控客廳娛樂新主場

      三星推出全新OLED S90F系列電視,搭載新一代NQ4 AI Gen3芯片,通過AI技術(shù)重塑家庭娛樂體驗(yàn)。該系列提供83/77/65/42英寸多尺寸選擇,采用自發(fā)光OLED面板,支持4K AI影像增強(qiáng)、杜比全景聲和144Hz可變刷新率,實(shí)現(xiàn)沉浸式視聽效果。產(chǎn)品配備智能家居控制中心,可連接SmartThings平臺管理智能設(shè)備,并支持7年系統(tǒng)升級服務(wù)。游戲性能方面,支持FreeSync Premium技術(shù)、21:9和32:9超寬屏比例,打造專業(yè)電競體驗(yàn)。外觀采用纖薄設(shè)計(jì),獲潘通色彩認(rèn)證,兼顧科技美學(xué)與家居融合。

    • 時(shí)空壺接入大語言模型,跨語言溝通已成翻譯的藝術(shù)

      在當(dāng)今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判,到文化交流中的思想碰撞,高效、精準(zhǔn)的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時(shí)空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動全球交流合作邁向新的高度,真正實(shí)現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • 全球最大線上批發(fā)商城與線下商城戰(zhàn)略合作,阿里云賦能全球貿(mào)易AI時(shí)代新篇章

      作為“全球貿(mào)易中心”的義烏國際商貿(mào)城屢為天下先。今天,世界上最大的線上批發(fā)商城與世界上最大的線下商城正式簽約,此次合作由阿里巴巴先進(jìn)的AI云技術(shù)提供支撐,共同開啟全球貿(mào)易數(shù)字化新篇章。 4 月 15 日,義烏商城集團(tuán)宣布正式接入阿里通義大模型,結(jié)合阿里巴巴的云計(jì)算、大數(shù)據(jù)和電商等領(lǐng)域的優(yōu)勢,幫助 210 萬中小商家利用AI技術(shù)精準(zhǔn)經(jīng)營,快速出海。簽約儀?

    • 斥資36億!OpenAI考慮收購前蘋果設(shè)計(jì)師AI初創(chuàng)公司

      據(jù)報(bào)道,OpenAI近期正就收購AI硬件初創(chuàng)公司ioProducts展開深入談判,這筆潛在交易或?qū)⒅厮苋斯ぶ悄苡布袌龈窬?。OpenAI高層曾考慮以至少5億美元的價(jià)格收購這家由OpenAICEO薩姆阿爾特曼與前蘋果傳奇設(shè)計(jì)師喬納森艾維聯(lián)合創(chuàng)立的公司。這筆交易或?qū)㈤_啟AI巨頭與頂尖工業(yè)設(shè)計(jì)團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)合的新模式,為人工智能技術(shù)的終端落地開辟全新路徑。

    • 英偉達(dá)將首次在美制造 AI 超算、及 Blackwell 芯片

      站長之家(ChinaZ.com) 4月15日 消息:隨著 AI 行業(yè)的蓬勃發(fā)展,英偉達(dá)位于美國的人工智能芯片和超 級計(jì)算機(jī)工廠將創(chuàng)造數(shù)千個(gè)就業(yè)機(jī)會。科技巨頭英偉達(dá)(NVIDIA)宣布,其 AI 超 級計(jì)算機(jī)將完全在美國本土生產(chǎn)。在全球貿(mào)易戰(zhàn)的背景下,英偉達(dá)這一舉動是為了減少對海外市場的依賴,并促進(jìn)美國國內(nèi)的生產(chǎn)。英偉達(dá)確認(rèn),他們已開始在臺積電位于美國亞利桑那州鳳凰城的工廠生產(chǎn)?

    • 阿里千問3登頂全球最強(qiáng)開源模型 已在通義App上線

      阿里集團(tuán)推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國產(chǎn)模型性能新紀(jì)錄;Qwen3-32B則以部署成本低、運(yùn)行穩(wěn)定見長。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁版體驗(yàn)。升級后的通義App整合問答對話、圖像理解與生成等多項(xiàng)功能,持續(xù)強(qiáng)化代碼生成、數(shù)學(xué)解題等專業(yè)場景應(yīng)用能力,致力于打造實(shí)用性強(qiáng)的個(gè)人AI助手。

    • 提升大模型自動修Bug能力 豆包正式開源首個(gè)多語言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動豆包大模型團(tuán)隊(duì)宣布,正式開源首個(gè)多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評估和提升大模型自動修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言,是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語言開發(fā)場景,也更能反映當(dāng)前模型在自動化軟件工程”方向上的實(shí)際能力邊界。