十、训练自己的TTS模型
开源项目:https://github.com/jerryuhoo/VTuberTalk
解决错误无数多个,修改多个脚本,苦熬几昼夜,终于杀青,功成垂败。特比注意,训练样本少于500条语句,效果灰常差,可以直接放弃。
1、安装
cpu版本:如果只是单纯使用,建议安装这个版本。
conda create -n paddlespeech python=3.8
conda activate paddlespeech
pip install -r requirements_cpu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
2、安装cpu版本的paddlepaddle
# cpu 版本的示例, 需要paddle 2.3.0以上版本
python3 -m pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
python3 -c "import paddle;paddle.utils.run_check()"
3、获取音频
从B站获取音频的方法: 可以用bilibili助手下载Vtuber的录播flv文件,再转成wav文件。
从YouTube获取音频的方法: 可以用TamperMonkey上的YouTube下载器下载mp4文件,再转成wav文件。
安装依赖库:
pip install pydub
python tools/video_to_wav.py --path
我这里使用格式工厂,可以任意格式转换,剪辑,最后直接输出data/
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
