分享我的解说配音工作流【附开源工具】【250310更新】

无视我233 · 发表于 2025-2-4 00:48:45

最新版本：v250310
v250310：
+ 添加了对 GPT-SoVITS V3 模型（20250228 整合包）的支持

v250215：
+ 修复了部分电脑环境下无法导入模块的问题；
+ 添加了对最新版整合包的支持
+ 感谢@八雲桐的辛苦测试和反馈！

下载地址见后面

这个帖子是什么？

事情得从我自己的解说视频制作说起。
如果看我 23 下半年以后的解说的观众应该知道，我在解说中引入了一套 AI 配音的工作流，并且这个工具栈被称为 RedGlow Engine（绯霞引擎），以此来致敬最早做语音字幕解说的 xfx。当时的整套计划包括了一套 AI 配音模型和一套能够在 Adobe Premiere 中快速进行配音制作的前端工具，我也都实现了，并且计划在不远的将来（笑死，结果咕到一年半过去了）开源整套工具。
当然那套 AI 模型完全是自己整的，但我自己数据集有限，做出来的效果也很不好；而正好网上有大佬开源了一套非常好用效果也很好的 GPT-SoVITS （GSV）配音工具，因此我自己的工作流中“AI 配音模型”的部分也理所应当改成了 GSV 模型。不过原来我写的前端工具我感觉还是挺好用的，用来做解说的效率也非常快，我也一直有想开源这套工具的想法；只是之前有一些图形界面没完全写完，不够好用。昨天想到可以拿 AI 来写这种界面，然后 AI 写的好像还不错，那既然万事俱备，也是时候来公开我的一整套工作流和自己用的工具了，希望可以帮到想要做类似 AI 配音的人。

简单来说，如果你正好和我一样用的是 Adobe Premiere 制作视频的话，那么你下载这个帖子提供的工具，再根据后面的步骤，就可以和我一样来很方便的给字幕配上 AI 配音——至于 Premiere 哪里下载嘛，大家可以私底下互相分享自己知道的资源，但毕竟破解软件上不了台面，在论坛里就不讨论了。

无视我233 · 发表于 2025-2-4 01:16:31

我该怎么安装这套工具？

注意：这里我分享的是用 Premiere 的工作流；如果你只是想要 AI 配音，然后手动导入其他剪辑软件，那么你只需要下载 GSV 整合包并且单独使用 GSV 这个工具就可以。
1. 安装 Premiere 的 Pymiere Link 插件：
https://zh.wsw233.com/files/view?f=rpe9v3
下载后双击运行即可。注意这个过程可能需要科学上网。
2. 下载 GSV 工具。你可以在这里下载整合包
https://www.yuque.com/baicaigong ... 1e/dkxgpiy9zb96hob4
推荐使用科学上网从 huggingface 源进行下载。
下载完成后，解压即可。
3. 下载 Redglow 前端：
https://zh.wsw233.com/files/view?f=ycgewy
下载完成后，将 redglow.zip 解压到 GSV 的根目录（像这样），
QQ图片20250204005531.png

然后进入 redglow 文件夹，双击 execute_before_run.bat（这一过程可能需要关闭科学上网）。
至此，安装过程就结束了。

我该怎么配置声库？
如果双击 go-redglow.bat 打开 redglow 前端，你会看到我提供了一个示例声库（即我的解说中各类龙套角色的声库），另外还有一个“编辑配置”的按钮，打开以后会进入一个声库配置窗口（顺带感谢 DeepSeek，这个窗口完全是它写的，人力写这个会非常麻烦），选中“男性1”以后你会看到这样的界面：

这里一个声库对应一个模型，并且支持配置多个情感（可以通过“添加情感”和“删除情感”按钮更改），如果再点击情感中的“叙述”，你会看到这个界面。

是的，GSV 非常好用的一点是，你可以直接使用 GSV 的默认模型（即“男性1”声库已经配置好的这个模型），然后仅通过一段参考音频和对应的文本就完成了一个声库的创建，你不需要有一块显卡来训练什么模型，完全是开箱即用。
当然 GSV 也提供了快速训练模型的方法，如果你有一块显卡和几分钟的音频素材的话，可以来训练得到一个更高质量、更还原的声库（例如，我的解说视频中我和库罗的声库都是训练得到的，但训练数据大约只有 5 分钟）。如果你对训练声库感兴趣，可以参考 GSV 官方的教程：https://www.yuque.com/baicaigong ... 1e/xyyqrfwiu3e2bgyk 和他们的官方仓库：https://github.com/RVC-Boss/GPT-SoVITS。
接下来的配置过程就完全是图形化操作的了，我想我应该不用过多介绍了，不过记得右下角有“保存配置”按钮，设置完一定要保存。

我该怎么真正使用这套工具？
1. 在打开 redglow 前端之前，请你先打开 Adobe Premiere 软件（这很重要）；
2. 打开你的项目，在时间轴上输入一段文本（这里的配图是早期版本，还没有图形化配置的功能）；
QQ图片20250204010927.png