


Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows 、Mac 、Linux 系统。
此次介绍的这三个语音合成工具,中文语音丰富、自带呼吸声,效果逼真,欢迎使用。
如果对人工智能感兴趣,可以帮忙在 github 给个 star :)
1 a570295535 2022-07-04 20:47:09 +08:00 via Android 点进去东西挺多啊,厉害呀! |
2 yanwen 2022-07-04 21:47:34 +08:00 一种接口一个 app 有点多 。如果可以的话,整合成一个 app 就更好了 (参考 Bob ) |
4 baox2 2022-07-04 23:21:51 +08:00 RVM-GUI 智能图片抠图工具 速度很快,但抠像出来的图怎么都统一变成了 512*512 像素了阿?@baiyue |
5 linKnowEasy 2022-07-05 09:26:53 +08:00 感谢, star 了, 希望有整合版后 @ 我一下 |
6 baiyue OP @baox2 rvm 受限于模型转换问题,输出只能固定尺寸,推荐使用另外两个抠图工具,比如 modnet 或 mobilenet ,支持图片或视频抠图。 |
7 dfgxcvbcv 2022-07-05 14:36:26 +08:00 现在调现成的接口都能算自研了吗? |
8 shuang 2022-07-05 23:54:45 +08:00 省流:下载 app 后需要自己提供 key 才能用 |
9 o00O00o 2022-07-06 09:12:46 +08:00 请教一下,桌面端是使用的什么技术栈呢? |
10 baiyue OP @o00O00o 项目里有介绍,该项目主要是基于 webview2 开发的图形界面,使用 wails 组合 vue 前端和 go 后端。所以界面是 VUE 写的,逻辑部分由 go 语言完成,AI 推理这块使用 c++里的 ncnn 推理框架,搭配 vulkan 实现任意显卡支持,同时也为基于 wasm 的网页应用和移动端 app 提供可能。 |
11 icebear0 2022-07-06 09:54:48 +08:00 看到 OP 的这个,我第一时间想到的就是 bob (一个翻译软件),前几天也发布了正式版本,也在 V 站上抽奖过。 所以如果 OP 做一个 bob 的插件(可以做成语音插件)的话,我相信肯定会有很多人使用,并且也能达到宣传自己这个项目的作用。 bob 这款软件之前在 GitHub 上获得了 6.3K 的星,而且对应的群中,也有几千人在使用 |
13 newledge 2022-08-19 11:10:43 +08:00 最近就想搞搞语音合成。 |
14 baiyue OP |