自研推荐:微软云语音合成、抖音火山语音合成、阿里云语音合成小工具 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
baiyue
V2EX    分享创造

自研推荐:微软云语音合成、抖音火山语音合成、阿里云语音合成小工具

  •  1
     
  •   baiyue 2022-07-04 20:37:59 +08:00 3696 次点击
    这是一个创建于 1255 天前的主题,其中的信息可能已经有所发展或是发生改变。

    效果截图

    内容简介

    Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows 、Mac 、Linux 系统。

    此次介绍的这三个语音合成工具,中文语音丰富、自带呼吸声,效果逼真,欢迎使用。

    下载地址

    如果对人工智能感兴趣,可以帮忙在 github 给个 star :)

    https://github.com/Baiyuetribe/paper2gui

    14 条回复    2022-08-26 20:40:57 +08:00
    a570295535
        1
    a570295535  
       2022-07-04 20:47:09 +08:00 via Android
    点进去东西挺多啊,厉害呀!
    yanwen
        2
    yanwen  
       2022-07-04 21:47:34 +08:00
    一种接口一个 app 有点多 。如果可以的话,整合成一个 app 就更好了 (参考 Bob )
    baiyue
        3
    baiyue  
    OP
       2022-07-04 22:58:31 +08:00
    @yanwen 已在规划中,近期会优先上线 web 在线体验版,后续整合最优的小工具为一个
    baox2
        4
    baox2  
       2022-07-04 23:21:51 +08:00
    RVM-GUI 智能图片抠图工具
    速度很快,但抠像出来的图怎么都统一变成了 512*512 像素了阿?@baiyue
    linKnowEasy
        5
    linKnowEasy  
       2022-07-05 09:26:53 +08:00
    感谢, star 了, 希望有整合版后 @ 我一下
    baiyue
        6
    baiyue  
    OP
       2022-07-05 13:06:28 +08:00
    @baox2 rvm 受限于模型转换问题,输出只能固定尺寸,推荐使用另外两个抠图工具,比如 modnet 或 mobilenet ,支持图片或视频抠图。
    dfgxcvbcv
        7
    dfgxcvbcv  
       2022-07-05 14:36:26 +08:00
    现在调现成的接口都能算自研了吗?
    shuang
        8
    shuang  
       2022-07-05 23:54:45 +08:00
    省流:下载 app 后需要自己提供 key 才能用
    o00O00o
        9
    o00O00o  
       2022-07-06 09:12:46 +08:00
    请教一下,桌面端是使用的什么技术栈呢?
    baiyue
        10
    baiyue  
    OP
       2022-07-06 09:40:47 +08:00
    @o00O00o 项目里有介绍,该项目主要是基于 webview2 开发的图形界面,使用 wails 组合 vue 前端和 go 后端。所以界面是 VUE 写的,逻辑部分由 go 语言完成,AI 推理这块使用 c++里的 ncnn 推理框架,搭配 vulkan 实现任意显卡支持,同时也为基于 wasm 的网页应用和移动端 app 提供可能。
    icebear0
        11
    icebear0  
       2022-07-06 09:54:48 +08:00
    看到 OP 的这个,我第一时间想到的就是 bob (一个翻译软件),前几天也发布了正式版本,也在 V 站上抽奖过。
    所以如果 OP 做一个 bob 的插件(可以做成语音插件)的话,我相信肯定会有很多人使用,并且也能达到宣传自己这个项目的作用。
    bob 这款软件之前在 GitHub 上获得了 6.3K 的星,而且对应的群中,也有几千人在使用
    sjzjams
        12
    sjzjams  
       2022-07-06 10:07:31 +08:00
    @dfgxcvbcv 整合成一个工具 这不是更方便使用了吗,算的
    newledge
        13
    newledge  
       2022-08-19 11:10:43 +08:00
    最近就想搞搞语音合成。
    baiyue
        14
    baiyue  
    OP
       2022-08-26 20:40:57 +08:00
    @yanwen @sjzjams 感谢关注,项目已正式上线整合版,比现有开源的更全面更专业,持久维护。参见 https://github.com/Baiyuetribe/paper2gui
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1180 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 17:35 PVG 01:35 LAX 09:35 JFK 12:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86