天天热资讯！【AI歌声 / sovits】在 so-vits-svc 4.1 中训练与推理 4.0 版本模型的方法-南极运动网

天天热资讯！【AI歌声 / sovits】在 so-vits-svc 4.1 中训练与推理 4.0 版本模型的方法

来源：哔哩哔哩｜时间： 2023-07-03 18:22:55 ｜

so-vits 将默认的声音特征输入更换为了 ContentVec 第 12 层 Transformer 输出（简称 vec768l12），而版本默认使用的是 ContentVec 第 9 层 Transformer 输出（简称 vec256l9）。因此，版本的模型结构也与版本产生了区别。但 so-vits 版本仍然支持版本模型的推理与训练，只是需要更改一些参数。总结归纳如下：

(资料图片)

1. 在 config 文件中，如果需要适配 so-vits 的 vec256l9 模型，则将以下选项设为指定的值：

"filter_channels": 768,
"gin_channels": 256,
"ssl_dim": 256,
"speech_encoder":"vec256l9",

同时，也顺便给出 so-vits 的 vec768l12 模型的配置选项值：

"filter_channels": 768,
"gin_channels": 768,
"ssl_dim": 768,
"speech_encoder":"vec768l12",

需要注意的是，这两种模型的 filter_channels 均为 768；

2. 也存在直接生成对应的 config 文件的方法，在调用 preprocess_flist_ 时指定 --speech_encoder 命令行参数为 vec256l9 即可。但需要注意的是，需要将生成的 config 文件中的 filter_channels 项改为 768，否则模型结构还是与版本不兼容；

3. 在进行数据集预处理，即调用 preprocess_hubert_ 时，指定 F0 预测器（--f0_predictor 命令行参数）为 dio。因为 so-vits 在数据集预处理时使用的就是 dio 预测器（但在推理时使用的是 pm 预测器）。不同 F0 预测器具有不同的效果，可以自行测试一下。

关键词：

天天热资讯！【AI歌声 / sovits】在 so-vits-svc 4.1 中训练与推理 4.0 版本模型的方法

热文推荐

天天热资讯！【AI歌声 / sovits】在 so-vits-svc 4.1 中训练与推理 4.0 版本模型的方法

世界快讯:8月公布更多消息，《碧蓝幻想：Relink》开发进程结束

每日聚焦：上海交大医学院博士应聘中学卫生保健员？复旦附中回应

成交量下降这么多，楼市不可能反转的，醒醒吧看点

老九门番外之虎骨梅花评价_爱奇艺老九门番外之四屠黄葵为什么没了

橘红茶适合多痰咳嗽的患者-清喉利咽的凉茶推荐

红楼新编：大观园的微传奇（六十八）

天天关注：文化产业年营收超16.5万亿元

林宥嘉2023世界巡回演唱会武汉站门票已售罄今日热搜

直升机26分钟内紧急升空浙江建德成功解救三名失联驴友_当前时讯

环球观点：普陀这个“靠谱解纷中心”全力解决群租乱象

寒衣节_世界要闻

美国多地发生数起枪击事件受害者中有多名未成年人_环球速讯

邵阳市审计局深入开展巡视巡察“大起底”移交问题的监督检查工作

小森生活风之岛怎么进|天天快讯

天天热议:东海期货：供需格局或收紧下半年锡价仍有上行空间

AI概念重挫！ChatGPT流量见顶？背后三大原因，券商：TMT短调不足惧，第三波启动信号看这4点-每日看点

剑网三指尖江湖人参哪里有剑网三指尖江湖参剑-天天微速讯

醋酸的化学式的化合价_醋酸的化学式环球快看点

什么是脚本语言和编程语言_什么是脚本

资讯

行业

天天热资讯！【AI歌声 / sovits】在 so-vits-svc 4.1 中训练与推理 4.0 版本模型的方法

热点

我国在两种物理体系实现量子计算优越性

新主流网络视听崛起，开启主流价值社交传播之门

蔬菜价格波动电商平台加强直采保供保价

去境外搞电信诈骗赚快钱？结局可能是被打断手脚甚至抑郁

广东江门中院宣判一侵犯知识产权犯罪案

说好“一梯一户”却成了“两梯两户”，买方能否解除合同