資源簡介
Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis(SV2TTS)”論文的實(shí)現(xiàn),這是一個(gè)三階深度學(xué)習(xí)框架,允許從幾秒鐘的音頻中創(chuàng)建一個(gè)數(shù)字化的語音,并使用它來調(diào)節(jié)訓(xùn)練的“文本轉(zhuǎn)語音”模型,以推廣到新的聲音。
代碼片段和文件信息
評論
共有 條評論