CosyVoice_V2 阿里通义实验室 开源ai语音克隆模型
CosyVoice V2官方主页:CosyVoice2.0 里面有一些试听和模型的原理
Github:CosyVoice2.0 项目在github开源 想折腾的可以自己去部署
不想折腾的可以用b站大佬(与AI同行1996)的整合包
经过2个多月的使用 中文克隆中文能达到8-9成相似(输入的音频很重要)
中文克隆英文也是7-8成相似 但是语气有一些怪 或许 英文克隆英文会好一些
整合包简单使用方法
第一步:导入音频(时长大于3秒 采样率不低于16khz)或录制音频(需要有麦克风)
第二步:输入prompt文本 也就是你导入或录制音频里面说的内容
第三步:输入合成文本 也就是你要输出音频所说的内容
第四步:点击生成音频
注意事项
点击 生成音频 后进度条会跑 进度条就算到百分之百了 在试听和下载按钮没有出来之前都没算合成成功 建议等一下
还有就是在 生成音频音频途中不要 用浏览器(偶尔有bug)和关闭CosyVoice_V2的cmd窗口
想要输出的音频有停顿(说话更真实)可以用 ,号 。号 来做停顿 。不要使用回车键换行停顿(输出的音频有bug)
运行期间不要关闭 CosyVoice_V2的cmd窗口 关闭此窗口等于关闭CosyVoice_V2
————整合包下载————
夸克网盘: 夸克网盘分享 百度网盘:百度网盘 请输入提取码 提取码: qhqm
评论