CosyVoice开源地址 https://github.com/FunAudioLLM/CosyVoice
CosyVoice3官方自带的 webui.py 无法用于对接,因其中的audio组件流式,导致api调用时返回m3u8文件,而非wav音频,需打开 webui.py 文件,搜索代码
streaming=True修改为streaming=False,然后重新启动 webui.py
在视频翻译软件中使用
请按如下方法处理
- 部署好官方项目,确认可以启动webui.py,并在ui界面中成功完成一次配音操作,然后下载修改版
webui.py文件,并覆盖官方自带的,然后重新启动。 下载地址:https://github.com/jianchang512/stt/releases/download/0.0/cosyvoice3-webui-py.zip - 如果是windows系统,直接使用整合包
- 下载地址(百度网盘): https://pan.baidu.com/s/1Lp1GNGZGaO6WQG3NLli_RQ?pwd=1234
- 下载地址(huggingface): https://huggingface.co/mortimerme/repocollect/resolve/main/cosyvoice3-0529.7z?download=true
启动并在pyVideoTrans中使用
首先升级pyVideoTrans软件到最新
确保已部署CosyVoice项目,并启动了 webui.py, 可以在浏览器中打开
http://127.0.0.1:8000界面。打开视频翻译软件,左上角设置--CosyVoice:填写 webui.py 地址,默认是
http://127.0.0.1:8000填写参考音频和音频对应文字
填写完毕后,主界面中配音渠道选择 CosyVoice, 角色选择对应的即可。其中 clone 角色是复制原视频中的音色
注意事项
- 第一次使用会自动从 modelscope.cn 下载模型,用时较久,耐心等待
