站長之家(ChinaZ.com)9月20日 消息:近日,人工智能公司ElevenLabs推出了名為Projects的長篇音頻生成和編輯平臺。該平臺匯集了公司在長篇語音合成、音頻調(diào)教和并行音頻生成等領(lǐng)域的研究成果,使創(chuàng)作者、出版商和獨立作者能夠在幾分鐘內(nèi)為整個對話段落、新聞文章甚至有聲書生成配音,全部在一個工作流程中完成。
Projects與語音合成、VoiceLab和語音庫一起,作為一個獨立的工具為長篇音頻創(chuàng)作提供一站式解決方案。它還與專業(yè)語音克隆、語音庫和多語言模型無縫集成。用戶可以一鍵渲染整個項目,也可以選擇渲染并重新生成特定的音頻片段,同時保持上下文的連貫性。
體驗地址:https://elevenlabs.io/projects
該產(chǎn)品提供了端到端的工作流程,用戶可以直接從網(wǎng)頁鏈接、電子書、純文本或PDF文檔導(dǎo)入內(nèi)容,然后為不同的文本片段指定語音,并進(jìn)行細(xì)微的語音編輯,如調(diào)整語速、增強清晰度等。然后只需一鍵生成完整的語音版本。
Projects為用戶提供了直觀的界面和多種編輯功能。ElevenLabs表示,Projects匯集了他們在長篇音頻生成領(lǐng)域的最新研究成果,旨在讓長篇音頻生成盡可能簡單。該公司希望這個新平臺可以幫助用戶將故事栩栩如生地呈現(xiàn)出來。
Projects具有以下核心功能:
支持直接從鏈接、電子書、純文本和PDF文檔導(dǎo)入內(nèi)容
為不同文本片段指定不同語音/角色
支持28種語言,90多種語音
可調(diào)整語音參數(shù)如穩(wěn)定度、清晰度、增強等
可細(xì)節(jié)編輯特定語音片段
可手動調(diào)整段落之間的停頓時間
一鍵生成語音文件輸出
可以隨時保存編輯進(jìn)度
Projects使內(nèi)容創(chuàng)作者能夠以前所未有的效率將文字作品轉(zhuǎn)換成引人入勝的有聲內(nèi)容,為網(wǎng)站文章、有聲讀物、播客等創(chuàng)作帶來了革命性的進(jìn)步。該產(chǎn)品簡單高效的工作流程和強大的語音生成能力,令ElevenLabs在語音合成領(lǐng)域處于領(lǐng)先地位。
(舉報)