站長之家(ChinaZ.com)5月15日 消息:ElevenLabs近日發(fā)布了配音API,允許開發(fā)者在其產(chǎn)品中添加音頻或視頻翻譯功能。利用該API,開發(fā)者可以將任意音頻或視頻翻譯成29種語言,并且保留原始發(fā)言者聲音的獨特特征。為幫助開發(fā)者快速上手,ElevenLabs提供了Python教程和API參考,讓他們可以輕松將API整合到主要編程語言中。
此前,ElevenLabs還發(fā)布了一款名為ElevenLabs Music的文本生成歌曲產(chǎn)品。該產(chǎn)品在音樂的多個方面表現(xiàn)出色,包括節(jié)奏感、和聲、樂器搭配、情感表達、創(chuàng)意性以及風(fēng)格的多樣性,與領(lǐng)先產(chǎn)品Suno和Udio相媲美。其中,ElevenLabs Music在人聲獨唱部分表現(xiàn)出優(yōu)勢,其清晰度、擬人化和樂器融合度超過了競爭對手,得益于ElevenLabs在語音克隆領(lǐng)域的專業(yè)背景和海量語音數(shù)據(jù)積累。
ElevenLabs Music還展示了通過文本描述生成的多首音樂,如《傷透我的心》和《我的愛》,展示了其在不同音樂風(fēng)格上的創(chuàng)作能力。
除了配音API和ElevenLabs Music外,ElevenLabs的主要產(chǎn)品還包括語音克隆、文本轉(zhuǎn)語音和AI配音等解決方案。語音克隆服務(wù)允許用戶上傳樣本音頻,生成與原聲相似的音頻;文本轉(zhuǎn)語音支持29種語言、120種不同類型的語音輸出;而AI配音則提供了端到端的高保真音頻解決方案,針對電影和長音頻領(lǐng)域。
此外,ElevenLabs還提供了一個語音庫,允許用戶分享自己生成的音頻或聲音,并從中獲得報酬。未來,通過ElevenLabs Music生成的音樂也可以通過該平臺進行分享,為普通人實現(xiàn)成為“歌手”的夢想提供了新的途徑,同時也為專業(yè)音樂人提供了創(chuàng)作靈感。
文檔:https://elevenlabs.io/docs/api-reference/create-dub
示例:https://github.com/elevenlabs/elevenlabs-examples/tree/main/examples/dubbing/e2e-example
(舉報)