站長(zhǎng)之家(ChinaZ.com)1月18日 消息:GPT-SoVITS是一款強(qiáng)大的AI音色克隆軟件。通過輸入一個(gè)5秒的人聲樣本,用戶可以立即體驗(yàn)到文字轉(zhuǎn)語音的功能。同時(shí),只需1分鐘的訓(xùn)練數(shù)據(jù),就可以對(duì)模型進(jìn)行微調(diào),從而提高語音相似性和真實(shí)感。
項(xiàng)目地址:https://top.aibase.com/tool/gpt-sovits
此外,該產(chǎn)品還支持跨語言,目前已經(jīng)支持英語、日語和中文等多種語言的推理。產(chǎn)品還集成了聲音伴奏分離、自動(dòng)訓(xùn)練集分割、中文ASR以及文本標(biāo)注等工具,可以幫助初學(xué)者創(chuàng)建訓(xùn)練數(shù)據(jù)集和GPT/SoVITS模型。
同時(shí),該產(chǎn)品支持在Windows環(huán)境下運(yùn)行,并經(jīng)過了Python3.9、PyTorch2.0.1以及CUDA11的測(cè)試,同時(shí)也提供了快速安裝指南。
產(chǎn)品核心功能:
輸入5秒的聲音樣本即可進(jìn)行文字轉(zhuǎn)語音轉(zhuǎn)換;
僅需1分鐘的訓(xùn)練數(shù)據(jù)即可實(shí)現(xiàn)模型微調(diào);跨語言支持,包括英語、日語和中文;
集成聲音伴奏分離、自動(dòng)訓(xùn)練集分割、中文ASR和文本標(biāo)注等輔助工具;
支持在Windows環(huán)境下運(yùn)行,經(jīng)過了Python3.9、PyTorch2.0.1和CUDA11的測(cè)試。
(舉報(bào))