这种 AI 配音是如何调的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
WarlockMan
V2EX    问与答

这种 AI 配音是如何调的

  •  
  •   WarlockMan 2023-11-05 11:45:46 +08:00 1765 次点击
    这是一个创建于 707 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我在学前端的时候刷到一个讲解什么是纯函数的视频, 声音是 AI 生成的,但他用的这个音色非常特殊, 不是各大语音合成厂商提供好的预制角色, 火山引擎和微软 Azure 里的预制音色都没找到他这种音色, 这种音色是他自己调的吗,是用 Azure 定制性训练出来的么

    源视频:什么是纯函数 https://www.bilibili.com/video/BV1QM41197sz/

    4 条回复    2023-11-06 09:45:03 +08:00
    Solix
        1
    Solix  
       2023-11-05 11:54:25 +08:00 via iPhone
    腾讯云和阿里云的合成看看
    WarlockMan
        2
    WarlockMan  
    OP
       2023-11-05 12:12:12 +08:00
    @gaobh
    国内的几个大厂都看过了,预制角色里面没这种音色,像是自己用材料训练的定制音色。
    目前语音合成领域前沿大厂有微软,谷歌,字节跳动旗下的火山,
    目前就体验这几家能把声音做到自然,
    百度,阿里和腾讯的引擎有很重的机械音,能听出非常不自然,感觉在梯队上差了一级。

    现在的微软 Azure 语音合成在"自然"这个指标上应该是最高的,
    大概在七八年前好像,微软有个语音助手的项目叫 cortana ,
    从那个时候微软就在死磕拟真程度,
    那时候它的自然度就已经是这么高了。

    字节的火山引擎我猜测大概率是调用的微软接口,
    大厂就这么几家,也就是微软在一直烧钱死磕 AI 领域十多年,
    其他厂商想赶上短时间应该很难,
    所以我猜测大概率是用的微软 Azure 接口训练的定制音色,
    但我只是猜测,不敢肯定
    asrpub
        3
    asrpub  
       2023-11-05 12:19:10 +08:00 via Android
    就是普通的 TTS 吧,多找找其他的厂商,像魔音工坊也可以看看
    LLaMA2
        4
    LLaMA2  
       2023-11-06 09:45:03 +08:00   1
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2559 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 05:01 PVG 13:01 LAX 22:01 JFK 01:01
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86