中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

Cartesia發(fā)布低延遲語音生成模型Sonic 要復(fù)刻ChatGPT實時語音聊天？

2024-05-31 11:25 · 稿源：站長之家

站長之家(ChinaZ.com) 5月31日消息:Cartesia 發(fā)布了一個名為 Sonic 的低延遲語音生成模型，該模型以其快速的推理速度和超低的延遲引起了廣泛關(guān)注。Sonic 的延遲僅為135毫秒，能夠生成具有逼真情感和表達(dá)能力的語音。用戶只需提供10秒的錄音，Sonic 即可模仿說話者的韻律、語調(diào)和聲音特征，并且可以調(diào)節(jié)音調(diào)、速度、情感、發(fā)音和速度。

圖片截自歸藏

Sonic模型特點:

超低延遲:模型的延遲僅為135毫秒，這意味著它可以實時生成語音，非常適合聊天應(yīng)用。
情感表達(dá):Sonic能夠展現(xiàn)出人類的情感和表達(dá)能力，使對話更加自然和富有表現(xiàn)力。
快速模仿:僅需10秒的錄音，Sonic就能模仿說話者的韻律、語調(diào)和聲音特征。
可調(diào)節(jié)參數(shù):用戶可以調(diào)節(jié)音調(diào)、速度、情感、發(fā)音等參數(shù)，定制化語音輸出。

Cartesia 的目標(biāo)是打造能夠在任何設(shè)備上長期運行的實時智能系統(tǒng)。為此，他們引入了創(chuàng)新的“狀態(tài)空間模型”（SSM）架構(gòu)，用于構(gòu)建下一代基礎(chǔ)模型。SSM 模型能夠處理任意大小的語境，并且可以原生地實時處理各種形式的模態(tài)。Cartesia 的創(chuàng)始人 Albert 和 Karan 在過去四年中共同開發(fā)了 SSM，這是一種更高效的 AI 模型構(gòu)建方法，能夠像人類一樣流式傳輸信息。

在實時對話型 AI 的開發(fā)方面，Cartesia 已經(jīng)取得了初步進展。他們正在研發(fā)一個具有長期記憶、能夠?qū)崟r對話的 AI 計算平臺，該平臺可以解決復(fù)雜問題，為用戶帶來全新的體驗。低延遲是構(gòu)建實時智能的一大挑戰(zhàn)，模型需要在接收到輸入時立即做出響應(yīng)。通過新的 SSM 架構(gòu)，Cartesia 提高了高分辨率模態(tài)（如音頻和視頻）的生成效率和低延遲性能。實驗表明，與廣泛使用的 Transformer 模型相比，他們的模型在質(zhì)量、推理速度、吞吐量和延遲方面都有顯著改進。

使用 SSM 架構(gòu)，Cartesia 訓(xùn)練了 Sonic 語音模型，該模型能以135毫秒的延遲生成高質(zhì)量、逼真的語音。為了實現(xiàn)低延遲和高吞吐量，他們優(yōu)化了 SSM 推理系統(tǒng)，從而以更低的成本提供高質(zhì)量的模型。Sonic 已經(jīng)發(fā)布，并提供了一個 Web Playground 和低延遲 API。用戶可以在 Playground 中使用多樣化的語音庫進行應(yīng)用程序開發(fā)，包括客戶支持、娛樂和內(nèi)容創(chuàng)作，還支持即時克隆和語音設(shè)計（如調(diào)節(jié)速度和情感）。用戶也可以通過 API 訪問這些功能。

Cartesia 的下一個目標(biāo)是在未來一年內(nèi)實現(xiàn)原生多模態(tài)的實時智能，不僅局限于音頻領(lǐng)域。他們希望能夠?qū)崿F(xiàn)對任何形式的模態(tài)進行即時理解和生成，進一步推動實時智能的發(fā)展。

官網(wǎng)：https://top.aibase.com/tool/carteisa-sonic

試玩地址：https://play.cartesia.ai/

（舉報）

相關(guān)推薦

關(guān)鍵詞：

亞馬遜推出AI語音模型Nova Sonic：價格比GPT-4o便宜80%

亞馬遜正式推出新一代生成式AI語音模型NovaSonic，標(biāo)志著其在人工智能語音領(lǐng)域取得重大突破。這款創(chuàng)新模型能夠原生處理語音輸入并生成自然流暢的語音輸出，在速度、語音識別準(zhǔn)確率和對話質(zhì)量等核心性能指標(biāo)上，已達(dá)到與OpenAI、谷歌等科技巨頭的尖端語音模型相媲美的水平。該模型的推出是亞馬遜構(gòu)建人工通用智能戰(zhàn)略的重要一步，未來還將推出支持多模態(tài)理解的AI模型，涵蓋圖像、視頻及其他物理世界感知數(shù)據(jù)。

?亞馬遜 ?生成式AI ?Nova
“你可能患了血癌……” 醫(yī)生診斷錯誤，而 ChatGPT 是對的！

“當(dāng)身體出現(xiàn)異常時，積極查明原因是很重要的?！? 接受抗癌治療后的瑪琳這樣說道……

?AI醫(yī)療 ?ChatGPT ?AI模型
IQ 過百的 AI 模型名單發(fā)布：ChatGPT、Deepseek等上榜

人工智能IQ哪家強？o3 智商高達(dá) 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

?AI智商 ?ChatGPT ?Deepseek
薦ChatGPT終于發(fā)布長期記憶功能，開啟個人Agent時代

今天凌晨1點，OpenAI對ChatGPT功能進行了大更新，新增長期記憶功能，可以記住你過去所有的聊天記錄，會根據(jù)你的興趣、偏好提供更個性化的回答。這對于寫小說、金融分析、教育等領(lǐng)域幫助巨大。Team、Enterprise和Edu用戶將在幾周后獲得使用權(quán)限。

?ChatGPT ?長記憶功能 ?個性化回答
1至5元不等！有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”，一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎，近一周時間，通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨特風(fēng)格所付出的努力，如今卻遭遇這種無法受到著作權(quán)法保護的情況，無疑會極大地打擊創(chuàng)作者們的積極性。

?動畫風(fēng)格圖片 ?ChatGPT ?吉卜力風(fēng)格
累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

向 AI 傾訴情感在短期內(nèi)可能會帶來安慰，但過度依賴則存在風(fēng)險。通過即時的回應(yīng)可以獲得暫時的穩(wěn)定感，但從長遠(yuǎn)來看，這會讓人失去培養(yǎng)情緒調(diào)節(jié)能力和解決問題能力的機會……

?人工智能 ?AI技術(shù) ?AI聊天機器人
現(xiàn)在，ChatGPT會記下你說的每一句話！隨時可以“翻舊賬”

當(dāng)?shù)貢r間10日，ChatGPT的開發(fā)公司OpenAI宣布，將為ChatGPT引入新的“永久記憶”功能。OpenAI解釋稱，這是一種讓人工智能記住與用戶之前對話內(nèi)容的功能，基于此，ChatGPT能夠向用戶提供更加自然、且更具個性化的回答。他們還補充稱，英國和歐盟等部分地區(qū)，由于要進行合規(guī)審查，新功能的使用目前受到限制，未來會擇期提供。

?ChatGPT ?人工智能 ?記憶功能
ChatGPT記憶能力大幅提升：可調(diào)用所有對話

據(jù)報道，OpenAI首席執(zhí)行官SamAltman發(fā)文稱：我們大幅提升了ChatGPT的記憶能力它現(xiàn)在可以調(diào)用你之前所有的對話內(nèi)容了！”Altman介紹稱，此功能今日面向?qū)I(yè)版用戶推出，不久后也會向升級版用戶開放。ChatGPT付費用戶數(shù)量已成功突破2000萬大關(guān)，與去年底的1550萬相比，短短數(shù)月間增長了近30%。

?ChatGPT ?記憶功能 ?用戶體驗
ChatGPT新增“購物”功能……與谷歌展開全面商業(yè)戰(zhàn)

OpenAI 還計劃在未來將購物功能與付費訂閱服務(wù) “Plus” 和 “Pro” 用戶的“記憶功能”進行整合。該功能能夠結(jié)合過往的對話語境，實現(xiàn)更加個性化的產(chǎn)品推薦……

?openai ?ChatGPT ?ChatGPT購物
把我的寵物變成人！繼吉卜力后，ChatGPT 又掀起了一股SNS熱潮

除了吉卜力和迪士尼風(fēng)格之外，“寵物擬人化”最近在社交媒體上也非常流行。

?ChatGPT ?ai大模型 ?寵物擬人化

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM