事情得从我自己的解说视频制作说起。
如果看我 23 下半年以后的解说的观众应该知道,我在解说中引入了一套 AI 配音的工作流,并且这个工具栈被称为 RedGlow Engine(绯霞引擎),以此来致敬最早做语音字幕解说的 xfx。当时的整套计划包括了一套 AI 配音模型和一套能够在 Adobe Premiere 中快速进行配音制作的前端工具,我也都实现了,并且计划在不远的将来(笑死,结果咕到一年半过去了)开源整套工具。
当然那套 AI 模型完全是自己整的,但我自己数据集有限,做出来的效果也很不好;而正好网上有大佬开源了一套非常好用效果也很好的 GPT-SoVITS (GSV) 配音工具,因此我自己的工作流中“AI 配音模型”的部分也理所应当改成了 GSV 模型。不过原来我写的前端工具我感觉还是挺好用的,用来做解说的效率也非常快,我也一直有想开源这套工具的想法;只是之前有一些图形界面没完全写完,不够好用。昨天想到可以拿 AI 来写这种界面,然后 AI 写的好像还不错,那既然万事俱备,也是时候来公开我的一整套工作流和自己用的工具了,希望可以帮到想要做类似 AI 配音的人。
简单来说,如果你正好和我一样用的是 Adobe Premiere 制作视频的话,那么你下载这个帖子提供的工具,再根据后面的步骤,就可以和我一样来很方便的给字幕配上 AI 配音——至于 Premiere 哪里下载嘛,大家可以私底下互相分享自己知道的资源,但毕竟破解软件上不了台面,在论坛里就不讨论了。