11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買(mǎi)1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
本文探討了人工智能語(yǔ)音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動(dòng)下語(yǔ)音交互應(yīng)用場(chǎng)景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語(yǔ)音大模型訓(xùn)練需要TB至PB級(jí)數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充,能通過(guò)參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn),突破傳統(tǒng)數(shù)據(jù)在多樣性和場(chǎng)景覆蓋上的局限性。國(guó)內(nèi)外科技企業(yè)已開(kāi)始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集,包含上萬(wàn)小時(shí)數(shù)據(jù),覆蓋中英混合場(chǎng)景,支持情感合成、風(fēng)格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場(chǎng)景提供實(shí)時(shí)語(yǔ)音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。
今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言,是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。相比于以往聚焦Python的單語(yǔ)言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語(yǔ)言開(kāi)發(fā)場(chǎng)景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。
全球AI領(lǐng)導(dǎo)者英偉達(dá)開(kāi)源了,用于實(shí)體機(jī)器人和自動(dòng)化駕駛的超大訓(xùn)練數(shù)據(jù)合集——NVIDIAPhysicalAIDataset。這個(gè)數(shù)據(jù)集一共15T,涵蓋了超過(guò)320,000個(gè)機(jī)器人訓(xùn)練軌跡,以及多達(dá)1,000個(gè)通用場(chǎng)景描述包括一個(gè)SimReady集合。英偉達(dá)表示,未來(lái)將繼續(xù)擴(kuò)展PhysicalAIDataset,將其建設(shè)成世界最大、統(tǒng)一的開(kāi)源數(shù)據(jù)集,可用于AI模型、醫(yī)療、自動(dòng)化駕駛等不同領(lǐng)域,加速AI、實(shí)體機(jī)器人的訓(xùn)練效?
今天凌晨4點(diǎn),著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica,聯(lián)合開(kāi)源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測(cè)試平臺(tái)LiveCodeBench的測(cè)試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。
近日, 2025 年蘇州市“人工智能+”創(chuàng)新發(fā)展推進(jìn)大會(huì)暨人工智能賦能新型工業(yè)化深度行(蘇州站)圓滿落幕,會(huì)上發(fā)布一批蘇州人工智能大模型及創(chuàng)新要素。阿丘機(jī)器人科技(蘇州)有限公司(以下簡(jiǎn)稱“阿丘科技”)憑借自主研發(fā)的“PCB缺陷檢測(cè)視覺(jué)大模型”與“AQ工業(yè)基礎(chǔ)材料加工缺陷數(shù)據(jù)集”,分別入選“蘇州市級(jí)培育人工智能大模型”及“蘇州市首批行業(yè)高質(zhì)量數(shù)據(jù)集”兩大?
年末大禮包,稚暉君他又雙叒來(lái)開(kāi)源了!百萬(wàn)真機(jī)數(shù)據(jù)集開(kāi)源項(xiàng)目AgiBotWorld,也是全球首個(gè)基于全域真實(shí)場(chǎng)景、全能硬件平臺(tái)、全程質(zhì)量把控的大規(guī)模機(jī)器人數(shù)據(jù)集。該項(xiàng)目由稚暉君具身智能創(chuàng)業(yè)項(xiàng)目智元機(jī)器人,攜手上海AILab、國(guó)家地方共建人形機(jī)器人創(chuàng)新中心以及上海庫(kù)帕思聯(lián)合發(fā)布。百萬(wàn)真機(jī)全量數(shù)據(jù)將陸續(xù)開(kāi)源;千萬(wàn)仿真數(shù)據(jù)同步推送,支持更泛化和更通用的大模型訓(xùn)練;?
作為CDP的數(shù)據(jù)入口,數(shù)據(jù)集成能力一直是神策數(shù)據(jù)的優(yōu)勢(shì)和強(qiáng)項(xiàng)。經(jīng)過(guò)多年打磨,神策數(shù)據(jù)面向CDP復(fù)雜的數(shù)據(jù)接入場(chǎng)景,結(jié)合傳統(tǒng)的行為數(shù)據(jù)接入能力,打造了全新的可視化數(shù)據(jù)接入框架,具備強(qiáng)大的靈活性與擴(kuò)展性,并與外部數(shù)據(jù)源及內(nèi)部的數(shù)據(jù)建模域解耦。神策CDP通過(guò)整合來(lái)自多個(gè)來(lái)源的數(shù)據(jù),關(guān)聯(lián)全域ID,擴(kuò)展多實(shí)體的數(shù)據(jù)模型,幫助企業(yè)構(gòu)建客戶分群和標(biāo)簽,并結(jié)合豐富的數(shù)據(jù)加工技術(shù)和高效的數(shù)據(jù)輸出機(jī)制,為企業(yè)的業(yè)務(wù)分析、自動(dòng)化營(yíng)銷(xiāo)等全域客戶經(jīng)營(yíng)場(chǎng)景打下堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
蘋(píng)果最新殺入開(kāi)源大模型戰(zhàn)場(chǎng)比其他公司更開(kāi)放。推出7B模型,不僅效果與Llama38B相當(dāng)一次性開(kāi)源了全部訓(xùn)練過(guò)程和資源。就像他提供的這張圖,以GPT-4omini為代表的小模型整體比右側(cè)價(jià)格更低。
使用大模型合成的數(shù)據(jù),就能顯著提升3D生成能力?來(lái)自上海交大、香港中文大學(xué)等團(tuán)隊(duì)還真做到了。他們推出Bootstrap3D框架,結(jié)合微調(diào)的具備3D感知能力的多模態(tài)大模型。Bootstrap3D生成的數(shù)據(jù)集已經(jīng)全面開(kāi)源,任何研究人員和開(kāi)發(fā)者都可以免費(fèi)訪問(wèn)和使用。
高質(zhì)量圖像編輯的方法有很多,但都很難準(zhǔn)確表達(dá)出真實(shí)的物理世界。EdittheWorld試試。最終可以看到,團(tuán)隊(duì)的方法可以很好地實(shí)現(xiàn)world-instructedimageediting。