中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > 字節(jié)跳動(dòng)最新資訊  > 正文

    提升大模型自動(dòng)修Bug能力 豆包正式開源首個(gè)多語言類SWE數(shù)據(jù)集

    2025-04-10 15:11 · 稿源: 快科技

    快科技4月10日消息,今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開源首個(gè)多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修 Bug”能力。

    在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。

    Multi-SWE-bench包含1632個(gè)實(shí)例,均來自GitHub issue,并經(jīng)過統(tǒng)一的測(cè)試標(biāo)準(zhǔn)和專業(yè)開發(fā)者的審核篩選,確保每個(gè)樣本具備清晰的問題描述、正確的修復(fù)補(bǔ)丁以及可復(fù)現(xiàn)的運(yùn)行測(cè)試環(huán)境。

    豆包大模型團(tuán)隊(duì)希望,Multi-SWE-bench能作為大模型在多種主流編程語言與真實(shí)代碼環(huán)境中的系統(tǒng)性評(píng)測(cè)基準(zhǔn),推動(dòng)自動(dòng)編程能力向更實(shí)用、更工程化的方向發(fā)展。

    團(tuán)隊(duì)表示,相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語言開發(fā)場景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

    舉報(bào)

    • 相關(guān)推薦
    • 大模型時(shí)代的新燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語音合成數(shù)據(jù)集

      本文探討了人工智能語音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動(dòng)下語音交互應(yīng)用場景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語音大模型訓(xùn)練需要TB至PB級(jí)數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充,能通過參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn),突破傳統(tǒng)數(shù)據(jù)在多樣性和場景覆蓋上的局限性。國內(nèi)外科技企業(yè)已開始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語音合成數(shù)據(jù)集,包含上萬小時(shí)數(shù)據(jù),覆蓋中英混合場景,支持情感合成、風(fēng)格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場景提供實(shí)時(shí)語音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。

    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國用戶打造更智能的用車體驗(yàn)。

    • 媲美OpenAI-o3,剛剛開源模型DeepCoder,訓(xùn)練方法、數(shù)據(jù)集大公開

      今天凌晨4點(diǎn),著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica,聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測(cè)試平臺(tái)LiveCodeBench的測(cè)試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • 英偉達(dá)開源15T數(shù)據(jù)集:32萬個(gè)機(jī)器人訓(xùn)練軌跡

      全球AI領(lǐng)導(dǎo)者英偉達(dá)開源了,用于實(shí)體機(jī)器人和自動(dòng)化駕駛的超大訓(xùn)練數(shù)據(jù)合集——NVIDIAPhysicalAIDataset。這個(gè)數(shù)據(jù)集一共15T,涵蓋了超過320,000個(gè)機(jī)器人訓(xùn)練軌跡,以及多達(dá)1,000個(gè)通用場景描述包括一個(gè)SimReady集合。英偉達(dá)表示,未來將繼續(xù)擴(kuò)展PhysicalAIDataset,將其建設(shè)成世界最大、統(tǒng)一的開源數(shù)據(jù)集,可用于AI模型、醫(yī)療、自動(dòng)化駕駛等不同領(lǐng)域,加速AI、實(shí)體機(jī)器人的訓(xùn)練效?

    • Qwen3深夜正式開源,小尺寸也能大力出奇跡。

      阿里發(fā)布通義千問Qwen3大模型系列,包含8個(gè)不同規(guī)模的模型,從0.6B到235B參數(shù)全覆蓋。亮點(diǎn)包括:1)全球頂尖模型能力;2)首個(gè)開源的混合推理模型;3)支持119種語言;4)部署成本僅為DeepSeek+R1的三分之一;5)支持MCP協(xié)議。其中235B旗艦?zāi)P托阅軐?duì)標(biāo)頂級(jí)閉源模型,30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開源,支持商用。實(shí)測(cè)顯示Qwen3在代碼和寫作方面優(yōu)于DeepSeek

    • 長安馬自達(dá)EZ-60全球首秀,接入豆包大模型

      4月23日,長安馬自達(dá)EZ-60在2025上海國際車展全球首發(fā)。作為品牌新能源戰(zhàn)略轉(zhuǎn)型產(chǎn)品,該車在美學(xué)設(shè)計(jì)、AI智能座艙、電感駕控及主被動(dòng)安全性能等方面實(shí)現(xiàn)突破。最大亮點(diǎn)是全面接入豆包大模型,用戶可通過語音指令實(shí)現(xiàn)復(fù)雜操作、互聯(lián)網(wǎng)信息問答及短視頻搜索等功能,打造"人-車-環(huán)境"跨模態(tài)交互體驗(yàn)。專屬AI助手支持超700項(xiàng)功能語音調(diào)用,實(shí)現(xiàn)"所說即所得"的智能交互。長安馬自達(dá)與火山引擎達(dá)成深度合作,將持續(xù)推進(jìn)大模型在智能座艙領(lǐng)域的創(chuàng)新應(yīng)用。

    • “奧迪助手”來了!全新AUDI車型接入豆包大模型

      2025年4月24日上海車展期間,上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時(shí)推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng),基于豆包大模型實(shí)現(xiàn)自然對(duì)話體驗(yàn)。該系統(tǒng)將搭載于兩款新車,并同步部署在車載端和手機(jī)APP端,支持跨設(shè)備對(duì)話記錄同步?;鹕揭鏋橄到y(tǒng)提供大模型技術(shù)支持,實(shí)現(xiàn)語音指令控制、車輛功能講解等智能服務(wù),并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示,該合作將助力品牌打造更智能、個(gè)性化的產(chǎn)品矩陣。

    • AI 大模型的困境:數(shù)據(jù)才是真正的“燃料”

      一旦掉入AI墳場,幻覺將永遠(yuǎn)存在,噩夢(mèng)才剛開始。最近有許多客戶在考慮上AI大模型一體機(jī)、AI私有化、AI大模型部署等項(xiàng)目,但小心進(jìn)入AI大模型的墳場,在光鮮亮麗的背后,AI大模型也面臨著諸多困境,其中最為核心的問題便是數(shù)據(jù)。只有擁有高質(zhì)量、多樣化、易于管理的數(shù)據(jù),AI大模型才能發(fā)揮出其真正的潛力,為企業(yè)帶來更大的價(jià)值。

    • 偉世通×火山引擎:發(fā)布基于豆包大模型的智能座艙解決方案

      2025年上海車展期間,火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺(tái),通過端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù),實(shí)現(xiàn)離線功能閉環(huán)運(yùn)行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài),支持個(gè)性化推薦和"千人千面"自適應(yīng)設(shè)計(jì),同時(shí)具備多模態(tài)交互能力,實(shí)現(xiàn)更自然的人機(jī)交互。雙方還將共同探索AI大模型在智能座艙場景的優(yōu)化適配,助力車企打造差異化智能座艙體驗(yàn)。

    • Switch2價(jià)格公布:日版約2400元 多語言版約3400元

      任天堂正式發(fā)布了其新一代游戲機(jī)Switch2,距離上一代產(chǎn)品發(fā)布已經(jīng)過去了八年。此次發(fā)布的Switch2在屏幕、手柄、性能等多個(gè)方面均帶來了重大提升,引起了廣泛關(guān)注。幾個(gè)版本在硬件上不會(huì)有區(qū)別,只是單獨(dú)推出了一個(gè)售價(jià)更低的日語版,變相給本國人提供優(yōu)惠。