中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 字節(jié)跳動(dòng)最新資訊  > 正文

    豆包實(shí)時(shí)語(yǔ)音大模型正式上線!端到端語(yǔ)音對(duì)話 情商智商雙高

    2025-01-20 16:32 · 稿源: 快科技

    豆包實(shí)時(shí)語(yǔ)音大模型震撼上線,全方位提升語(yǔ)音交互體驗(yàn)!

    今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)隆重推出豆包實(shí)時(shí)語(yǔ)音大模型,現(xiàn)已在豆包App全量開放。升級(jí)至7.2.0版本即可親身體驗(yàn)這一語(yǔ)音交互領(lǐng)域的重大突破。

    豆包實(shí)時(shí)語(yǔ)音大模型集語(yǔ)音理解和生成于一體,打造端到端語(yǔ)音對(duì)話。與傳統(tǒng)的級(jí)聯(lián)模式相比,其在語(yǔ)音表現(xiàn)力、控制力、情緒承接方面展現(xiàn)出卓越性能,且具備低時(shí)延和隨時(shí)打斷對(duì)話等特性。

    該模型專為中文語(yǔ)境和場(chǎng)景設(shè)計(jì),采用語(yǔ)音和語(yǔ)義聯(lián)合建模,賦予其豐富的表現(xiàn)力,呈現(xiàn)出接近真人水準(zhǔn)的語(yǔ)音表達(dá)。通過學(xué)習(xí)角色語(yǔ)音和情感特點(diǎn),模型具備強(qiáng)大的講故事能力,可生動(dòng)切換不同角色/狀態(tài),配合不同情緒表達(dá),提升交互趣味性和沉浸感。

    聯(lián)合建模后,模型涌現(xiàn)出非凡的指令理解、聲音扮演和聲音控制能力。目前,模型部分方言和口音的識(shí)別源自Pretrain階段數(shù)據(jù)泛化,而非針對(duì)性訓(xùn)練。

    豆包實(shí)時(shí)語(yǔ)音大模型輸出的語(yǔ)音高度逼近真人,包括類人的副語(yǔ)言特征(如語(yǔ)氣詞、停頓思考等)。同時(shí),實(shí)時(shí)聯(lián)網(wǎng)功能賦予模型獲取最新信息的強(qiáng)大能力,對(duì)時(shí)效問題可精準(zhǔn)、及時(shí)地回應(yīng)。

    技術(shù)展示表明,該模型語(yǔ)音語(yǔ)氣自然度和情緒飽滿度逼近真人,對(duì)話風(fēng)格更加擬人,情感理解更加深刻,對(duì)用戶的情緒做到較好承接。不過,現(xiàn)階段模型僅支持中文,其他語(yǔ)種和方言的支持仍在探索中。

    舉報(bào)

    • 相關(guān)推薦
    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國(guó)產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國(guó)用戶打造更智能的用車體驗(yàn)。

    • 提升大模型自動(dòng)修Bug能力 豆包正式開源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言,是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。相比于以往聚焦Python的單語(yǔ)言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語(yǔ)言開發(fā)場(chǎng)景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

    • 長(zhǎng)安馬自達(dá)EZ-60全球首秀,接入豆包大模型

      4月23日,長(zhǎng)安馬自達(dá)EZ-60在2025上海國(guó)際車展全球首發(fā)。作為品牌新能源戰(zhàn)略轉(zhuǎn)型產(chǎn)品,該車在美學(xué)設(shè)計(jì)、AI智能座艙、電感駕控及主被動(dòng)安全性能等方面實(shí)現(xiàn)突破。最大亮點(diǎn)是全面接入豆包大模型,用戶可通過語(yǔ)音指令實(shí)現(xiàn)復(fù)雜操作、互聯(lián)網(wǎng)信息問答及短視頻搜索等功能,打造"人-車-環(huán)境"跨模態(tài)交互體驗(yàn)。專屬AI助手支持超700項(xiàng)功能語(yǔ)音調(diào)用,實(shí)現(xiàn)"所說(shuō)即所得"的智能交互。長(zhǎng)安馬自達(dá)與火山引擎達(dá)成深度合作,將持續(xù)推進(jìn)大模型在智能座艙領(lǐng)域的創(chuàng)新應(yīng)用。

    • “奧迪助手”來(lái)了!全新AUDI車型接入豆包大模型

      2025年4月24日上海車展期間,上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時(shí)推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng),基于豆包大模型實(shí)現(xiàn)自然對(duì)話體驗(yàn)。該系統(tǒng)將搭載于兩款新車,并同步部署在車載端和手機(jī)APP端,支持跨設(shè)備對(duì)話記錄同步。火山引擎為系統(tǒng)提供大模型技術(shù)支持,實(shí)現(xiàn)語(yǔ)音指令控制、車輛功能講解等智能服務(wù),并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示,該合作將助力品牌打造更智能、個(gè)性化的產(chǎn)品矩陣。

    • 偉世通×火山引擎:發(fā)布基于豆包大模型的智能座艙解決方案

      2025年上海車展期間,火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺(tái),通過端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù),實(shí)現(xiàn)離線功能閉環(huán)運(yùn)行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài),支持個(gè)性化推薦和"千人千面"自適應(yīng)設(shè)計(jì),同時(shí)具備多模態(tài)交互能力,實(shí)現(xiàn)更自然的人機(jī)交互。雙方還將共同探索AI大模型在智能座艙場(chǎng)景的優(yōu)化適配,助力車企打造差異化智能座艙體驗(yàn)。

    • 大模型時(shí)代的新燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集

      本文探討了人工智能語(yǔ)音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動(dòng)下語(yǔ)音交互應(yīng)用場(chǎng)景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語(yǔ)音大模型訓(xùn)練需要TB至PB級(jí)數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充,能通過參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn),突破傳統(tǒng)數(shù)據(jù)在多樣性和場(chǎng)景覆蓋上的局限性。國(guó)內(nèi)外科技企業(yè)已開始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集,包含上萬(wàn)小時(shí)數(shù)據(jù),覆蓋中英混合場(chǎng)景,支持情感合成、風(fēng)格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場(chǎng)景提供實(shí)時(shí)語(yǔ)音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。

    • 《王者榮耀》哪吒2語(yǔ)音包上線:你打我噻、收你們來(lái)了

      快科技4月17日消息,《王者榮耀》與世界第一動(dòng)畫電影《哪吒之魔童鬧?!敷@喜聯(lián)動(dòng)啦!此次聯(lián)動(dòng)可謂亮點(diǎn)滿滿,最引人注目的便是哪吒、敖丙等四位角色的聯(lián)動(dòng)皮膚,它們將于后續(xù)擇機(jī)正式上線。為慶祝此次深度合作,《王者榮耀》特別為大家精心準(zhǔn)備了限時(shí)語(yǔ)音包,這些語(yǔ)音均來(lái)自《哪吒之魔童鬧?!分械臒衢T臺(tái)詞,充滿力量與個(gè)性。具體語(yǔ)音內(nèi)容如下:-你打我噻-還吃!

    • 暗區(qū)突圍端游今日正式上線 | 與世界冠軍一起刺激槍戰(zhàn)!

      《暗區(qū)突圍:無(wú)限》正式上線!這款FPS射擊大作由魔方工作室打造,提供5張?zhí)厣貓D、5種游戲模式和1000+槍械配件自由搭配。

    • 亞馬遜推出AI語(yǔ)音模型Nova Sonic:價(jià)格比GPT-4o便宜80%

      亞馬遜正式推出新一代生成式AI語(yǔ)音模型NovaSonic,標(biāo)志著其在人工智能語(yǔ)音領(lǐng)域取得重大突破。這款創(chuàng)新模型能夠原生處理語(yǔ)音輸入并生成自然流暢的語(yǔ)音輸出,在速度、語(yǔ)音識(shí)別準(zhǔn)確率和對(duì)話質(zhì)量等核心性能指標(biāo)上,已達(dá)到與OpenAI、谷歌等科技巨頭的尖端語(yǔ)音模型相媲美的水平。該模型的推出是亞馬遜構(gòu)建人工通用智能戰(zhàn)略的重要一步,未來(lái)還將推出支持多模態(tài)理解的AI模型,涵蓋圖像、視頻及其他物理世界感知數(shù)據(jù)。

    • 阿丘科技李嘉悅:大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

      3月28日,由機(jī)器視覺產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺展在上海新國(guó)際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺及工業(yè)應(yīng)用研討會(huì)現(xiàn)場(chǎng),圍繞“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題,發(fā)表了精彩演講?!苯衲?,在這個(gè)快速變化的時(shí)代,我要補(bǔ)充一句:“AI工業(yè)視覺的格局正在加速變革,不會(huì)用大模型的將會(huì)被善用大模型的人淘汰。

    熱文

    • 3 天
    • 7天