浅扩散模型-DDSP-SVC
置顶 | 发表于 | 更新于
基于 DDSP(可微分数字信号处理)的实时端到端歌声转换系统
(3.0 - 实验性)浅扩散模型 (DDSP + Diff-SVC 重构版)数据准备,配置编码器(hubert 或者 contentvec ) 与声码器 (nsf-hifigan) 的环节与训练纯 DDSP 模型相同。
因为扩散模型更难训练,我们提供了一些预训练模型:
https://huggingface.co/datasets/ms903/Diff-SVC-refactor-pre-trained-model/blob/main/hubertsoft_pitch_410k/model_0.pt (使用 ‘hubertsoft’ 编码器)
https://huggingface.co/datasets/ms903/Diff-SVC-refactor-pre-trained-model/blob/main/pitch_400k/model_0.pt (使用 ‘contentvec768l12’ 编码器)
将名为model_0.pt的预训练模型, 放到diffusion.yaml里面 “expdir: exp/*“ 参数指定的 ...