中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > OpenVoice最新資訊  > 正文

    OpenVoice V2版本發(fā)布 能對聲音風(fēng)格進(jìn)行精細(xì)控制

    2024-04-26 09:41 · 稿源:站長之家

    站長之家(ChinaZ.com)4月26日 消息:MyShell TTS 開發(fā)的 OpenVoice 是一項(xiàng)創(chuàng)新的聲音克隆技術(shù),它能夠通過僅使用一小段參考發(fā)言者的音頻片段來復(fù)制其聲音,并生成多種語言的語音。

    QQ截圖20240426094050.png

    目前,MyShell TTS 已經(jīng)推出了全新的OpenVoice V2版本。這個版本能夠直接支持英語、西班牙語、法語、中文、日語以及韓語,并且顯著提高了音頻輸出的質(zhì)量。OpenVoice V2擁有復(fù)制任意聲音的能力,能以多種語言進(jìn)行語音輸出,并具備情感和口音的控制功能。它不但可以準(zhǔn)確模仿特定的聲音色彩,還允許對聲音的風(fēng)格,包括情感、口音、節(jié)奏、停頓及語調(diào)等進(jìn)行細(xì)致調(diào)整。

    主要功能:

    • 準(zhǔn)確的音色克隆: OpenVoice 能夠精確地克隆參考音色,并在多種語言和口音中生成語音。

    • 靈活的聲音風(fēng)格控制: 用戶可以對聲音的情緒、口音、節(jié)奏、停頓和語調(diào)進(jìn)行詳細(xì)調(diào)整,實(shí)現(xiàn)個性化的聲音輸出。

    • 零樣本跨語言聲音克隆: 即使某些語言未在訓(xùn)練集中出現(xiàn),OpenVoice 也能實(shí)現(xiàn)聲音復(fù)制。

    • 高效的計(jì)算性能: 相比于市場上現(xiàn)有的商業(yè)API,OpenVoice 在保持高性能的同時,計(jì)算成本大大降低。

    OpenVoice V2新特性:

    • 更好的音頻質(zhì)量: 采用新的訓(xùn)練策略提升音頻質(zhì)量。

    • 原生多語言支持: 原生支持英語、西班牙語、法語、中文、日語和韓語。

    • 集成 MeloTTS: V2版本引入了 MeloTTS 技術(shù),增強(qiáng)了聲音的自然度和表現(xiàn)力。

    • 免費(fèi)商業(yè)使用: 自2024年4月起,V1和V2版本均以 MIT 許可證發(fā)布,支持商業(yè)和研究用途的免費(fèi)使用。

    技術(shù)方法:

    聲音樣式和語言的解耦設(shè)計(jì): OpenVoice 的設(shè)計(jì)哲學(xué)是將聲音的不同特性進(jìn)行解耦,使得可以獨(dú)立控制各個參數(shù),提高操作的靈活性和推斷速度。

    基礎(chǔ)發(fā)音者 TTS 模型與音色轉(zhuǎn)換器: 包括允許對風(fēng)格參數(shù)進(jìn)行控制的基礎(chǔ)發(fā)音者 TTS 模型,以及采用編碼器-解碼器結(jié)構(gòu)的音色轉(zhuǎn)換器。

    訓(xùn)練策略和數(shù)據(jù)處理: 在訓(xùn)練過程中,使用了大量的多語種、多風(fēng)格的音頻樣本,并采用特定的損失函數(shù)確保在保留風(fēng)格的同時去除或轉(zhuǎn)換音色。

    官網(wǎng):https://research.myshell.ai/open-voice

    項(xiàng)目地址:https://top.aibase.com/tool/openvoice

    創(chuàng)建自己的語音機(jī)器人:https://myshell.ai/

    舉報(bào)

    • 相關(guān)推薦
    • 10倍精度升級!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級至v2.5版本,建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對動畫場景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計(jì)Star超1.2萬。

    • AI日報(bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動端超級智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • OPENVERSE獲重磅資本加持,元宇宙賽道再添生力軍

      我們正處于互聯(lián)網(wǎng)范式轉(zhuǎn)變的關(guān)鍵階段:從中心化的平臺驅(qū)動(Web 2),邁向去中心化的用戶主權(quán)網(wǎng)絡(luò)(Web3)。在Web3 體系下,數(shù)據(jù)與內(nèi)容的所有權(quán)回歸用戶本人,價值創(chuàng)造與價值流通基于協(xié)議自動執(zhí)行,平臺不再是控制者,而是服務(wù)型工具。這意味著,下一代互聯(lián)網(wǎng)不再依賴于少數(shù)平臺巨頭,而是建立在公開透明、用戶可驗(yàn)證、自治協(xié)作的價值網(wǎng)絡(luò)之上。OPENVERSE作為新一代 We

    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B新模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時支持超長上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • AI日報(bào):通義千問Qwen3重磅發(fā)布;抖音AI搜索能力開放;ChatGPT 搜索新增網(wǎng)購功能;Suno V4.5版本發(fā)布

      本期AI日報(bào)重點(diǎn)內(nèi)容: 1. 通義千問發(fā)布Qwen3大模型,在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出,支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口,為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能,通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本,提升音樂生成真實(shí)度 5. Simular AI登陸macOS,打造本地化智能助手 6. 暗月之面開源Kimi-VL模型,可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架,提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機(jī)械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

    • Check Point Quantum防火墻軟件R82版榮獲通用準(zhǔn)則EAL4+認(rèn)證

      Check Point公司宣布其Quantum防火墻軟件R82版本獲得通用準(zhǔn)則(Common Criteria)EAL4+級別認(rèn)證。該認(rèn)證由德國聯(lián)邦信息安全辦公室(BSI)頒發(fā),評估范圍涵蓋安全網(wǎng)關(guān)、安全管理及Maestro超大規(guī)模網(wǎng)絡(luò)編排器等組件。EAL4+是商業(yè)技術(shù)產(chǎn)品中廣泛認(rèn)可的高保障級別,證明該平臺符合嚴(yán)格國際標(biāo)準(zhǔn),能為關(guān)鍵基礎(chǔ)設(shè)施和政府機(jī)構(gòu)提供可信安全保障。此次認(rèn)證進(jìn)一步鞏固了Check Point作為全球網(wǎng)絡(luò)安全解決方案提供商的領(lǐng)先地位,其產(chǎn)品已在30多個國家部署。公司表示將持續(xù)為監(jiān)管行業(yè)客戶提供可驗(yàn)證的安全保障。

    • 深夜突襲,DeepSeek-Prover-V2加冕數(shù)學(xué)王者!671B數(shù)學(xué)推理逆天狂飆

      DeepSeek發(fā)布數(shù)學(xué)推理模型DeepSeek-Prover-V2,包含7B和671B兩個參數(shù)版本。該模型采用"遞歸+強(qiáng)化學(xué)習(xí)"訓(xùn)練方法,在MiniF2F測試集上達(dá)到88.9%通過率,解決了PutnamBench中的49道題目。關(guān)鍵技術(shù)包括:1) 使用DeepSeek-V3分解復(fù)雜定理生成子目標(biāo);2) GRPO算法從多個候選方案中自動學(xué)習(xí)最優(yōu)解;3) 通過思維鏈整合非形式化推理與形式化證明。模型在AIME競賽題和教科書題目上也表現(xiàn)優(yōu)異,7B小模型意外在部分問題上超越大模型。論文指出該方法為通向AGI提供了正確路徑,未來將擴(kuò)展至IMO級別數(shù)學(xué)難題。

    • 剛剛,OpenAI發(fā)布GPT-image-1模型,更強(qiáng)吉卜力版本來啦

      OpenAI發(fā)布全新圖像生成模型GPT-image-1,通過API向全球開發(fā)者開放。該模型支持精細(xì)控制圖像敏感度、生成效率、背景、輸出格式等參數(shù),并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應(yīng)用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級功能,圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著,開發(fā)者可通過API實(shí)現(xiàn)更多創(chuàng)意場景。新模型在?

    • AI日報(bào):昆侖萬維開源SkyReels-V2;訊飛星火X1全新升級;扣子空間Coze Space內(nèi)測

      本文介紹了多個前沿的人工智能產(chǎn)品和技術(shù)動態(tài),包括SkyReels-V2視頻生成模型、訊飛星火大模型升級、宇樹科技人形機(jī)器人比賽計(jì)劃、Coze Space AI協(xié)作平臺、Gemma3 QAT優(yōu)化模型、英特爾AI Playground工具、Reachy2人形機(jī)器人發(fā)布、ChatTS-14B語音研究項(xiàng)目、Figma推出AI設(shè)計(jì)工具以及MarkItDown MCP文檔轉(zhuǎn)換工具,展示了AI技術(shù)在多領(lǐng)域的廣泛應(yīng)用與創(chuàng)新發(fā)展?jié)摿Α?/p>

    • 徹底告別Windows!華為鴻蒙PC版本發(fā)布:自主可控、統(tǒng)一生態(tài)

      快科技5月1日消息,在3月份的華為Pura X發(fā)布會上,華為常務(wù)董事、終端BG董事長、智能汽車解決方案BU董事長余承東宣布,華為終端全面進(jìn)入鴻蒙時代,今年5月將推出鴻蒙電腦。隨著五一假期開啟,也揭開了5月的序幕,鴻蒙PC版也越來越近,預(yù)計(jì)最快會在假期結(jié)束后正式官宣發(fā)布會時間。其實(shí)鴻蒙PC版的推出也是被逼上梁山”,因?yàn)槲④泴θA為的Windows系統(tǒng)授權(quán)即將到期,華為將無法再繼續(xù)使用Windows。華為近期就已經(jīng)推出了Linux筆記本,出廠只有Linux系統(tǒng),配置不變,比Windows版本便宜300元。后續(xù)華為PC將全面轉(zhuǎn)向鴻蒙系統(tǒng),完全自主可控,老款?