在 github 开源了一个带 web 界面的中英文音色克隆工具 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jianchang512
V2EX    分享创造

在 github 开源了一个带 web 界面的中英文音色克隆工具

  •  
  •   jianchang512
    jianchang512 2023-11-20 12:42:37 +08:00 2843 次点击
    这是一个创建于 767 天前的主题,其中的信息可能已经有所发展或是发生改变。
    开源地址: https://github.com/jianchang512/clone-voice






    >
    > 这是一个声音克隆工具,可使用你的或者其他声音的音色,将一段文字合成为使用该声音说话的音频。
    >
    > 使用非常简单,没有 GPU 也可以使用,github 下载预编译版本,双击 app.exe 打开一个 web 界面,鼠标点点快速体验,笔记本电脑就可使用,。
    >
    > 支持 **中文**、**英文**、**日语**、**韩语** 4 种语言,可在线从麦克风录制声音。
    >
    > 为保证合成效果,建议录制时长 5 秒到 20 秒,发音清晰准确,不要存在背景噪声。
    >
    > 英文效果很棒,中文效果还凑合,下载体验下吧
    >



    项目基于 coqui-tts ,早就想使用这个来做音色克隆了,只是他们一直不支持中文,直达 9 月份才支持。

    使用 flask 搞了一个简单的本地 web 界面,可在线录制声音或上传已有的一段声音作为音色,然后输入一段文字,即可生成使用该声音的音频。

    目前支持中、英、日、韩 四种语言,英文效果最棒,中文勉强吧。

    已提供预编译版,window 上下载压缩包解压,双击 run.bat 即可使用。

    其实直接拉取 coqui-tts 也可以,本项目基本只是一个 coqui-tts 的简单包装,没多大技术含量,初衷是降低 ai 使用难度,让小白快速上手体验,不必配备 N 卡,即使笔记本也可使用。

    ## Youtube 演示

    12 条回复    2024-01-15 01:42:18 +08:00
    R4rvZ6agNVWr56V0
        1
    R4rvZ6agNVWr56V0  
       2023-11-20 13:14:39 +08:00
    有 docker 部署方式吗
    jianchang512
        2
    jianchang512  
    OP
       2023-11-20 13:19:39 +08:00
    @GeekGao 米有。
    seeyourface
        3
    seeyourface  
       2023-11-20 13:44:22 +08:00
    可以把声音翻译成另一种语言吗,音色不变
    jianchang512
        4
    jianchang512  
    OP
       2023-11-20 19:25:55 +08:00 via Android
    @seeyourface 下次更新会增加声音转声音的。但直接翻译的不支持

    这种目前貌似只有目标英语情况下效果还可以

    可以先识别为文字,翻译后再以原声音色生成新声音
    Hansah
        5
    Hansah  
       2023-11-21 13:48:26 +08:00
    百度云下载也太慢了...下载完我传个阿里云吧
    jianchang512
        6
    jianchang512  
    OP
       2023-11-21 16:44:38 +08:00
    @siknet 可以 github 下载啊,阿里云没咋用过,没限制吗
    Hansah
        7
    Hansah  
       2023-11-21 18:30:09 +08:00
    噢,看见 github 的下载了
    阿里云限速没百度云那么夸张,几百 k 到几兆都有
    Hansah
        8
    Hansah  
       2023-11-21 20:20:23 +08:00
    试了下,很厉害啊,就是分词有点问题
    jianchang512
        9
    jianchang512  
    OP
       2023-11-21 20:39:36 +08:00 via Android
    @siknet 其实就是调用了下 coqui-xttsv2

    他们直到九月份才支持中文,以前都无法用于中文,还有待完善
    1044523901
        10
    1044523901  
       2023-11-21 21:02:47 +08:00
    牛逼 加上 docker 部署就完美了,最近刚好有这个需求,赶快学习下~
    wqnmlgbzml
        11
    wqnmlgbzml  
       2023-12-19 11:37:49 +08:00
    这个很好呀!一直在找这样的开源项目。
    Llesue
        12
    Llesue  
       2024-01-15 01:42:18 +08:00
    玩了一下,英文中文分词都有问题……
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5298 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 06:52 PVG 14:52 LAX 22:52 JFK 01:52
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86