依托于 Soulx 开源模型的优秀性能,现在您可以与数字人进行实时视频通话
项目地址: https://github.com/dsd2077/CyberVerse
本项目仅用于学习研究,请勿用于违法犯罪。



项目地址: https://github.com/dsd2077/CyberVerse
本项目仅用于学习研究,请勿用于违法犯罪。

)
)
) 1 crime1024 Apr 21 想 怎么弄 |
&nbp; 2 yongdaimi Apr 21 强 |
4 diudiuu Apr 21 我就问下她能换衣服不 |
5 tf2 Apr 21 帮一个朋友问下,有爆衣特效吗? |
6 anonydmer Apr 21 好吧,需要 5090 ,打扰了 |
9 superliy Apr 21 让前女友陪聊天 |
10 tianjiyao Apr 21 我想问下。。。能不能裸体 菊部渲染。。 |
11 bzw875 Apr 21 4090 的用户才能给你 star ,你用户不够多啊 |
15 yao978318542 Apr 21 3060 12G 能运行才能给你 star [狗头] |
16 ybz PRO 付费视频啊,10 块钱 1 小时 |
17 dsd2077 OP PRO @yao978318542 #15 算力和质量成正比。后面会接 wav2lip 模型,体验上就不如实时生成好了,观感上偏向于 live2D 那种。 |
19 yukinotech Apr 22 从商业角度考虑,和精神小妹陪玩相比有性价比吗? |
20 dsd2077 OP PRO @yukinotech #19 没有叫过陪玩,但我我猜大概率 10 块钱一个小时是不会有精神小妹愿意的 哈哈哈 |
21 seedhk Apr 22 3060 能跑吗 慢点也能接受 |
22 IlIl Apr 22 可以试着做皮套人 估计渲染的压力会小点 |
24 dsd2077 OP PRO @IlIl #22 后面会考虑加上 wav2lip ,不过这套方案的上限非常高。 假如说以后模型进步到既能保持实时性,又能像视频生成模型一样强大。这就是实时游戏啊。 |
25 benen005g Apr 22 好吧,需要 5090 ,打扰了 |
26 xixiv5 Apr 23 可以吗? |
27 lllllllccccccc Apr 23 @xixiv5 不要问,问就是不可以 |
28 Znemo Apr 23 @lllllllccccccc 没回答就是可以 |
29 blur1119 Apr 23 这不是和豆包一样吗... |
30 dsd2077 OP PRO |
31 dsd2077 OP PRO @blur1119 #29 不完全一样,豆包的视频通话只能看到用户侧的视频,豆包是没有视频输出的。其次,豆包那个就是一个纯粹的 ChatBot 。我想做的是 Agent |
32 burp2019 Apr 23 顶,看路线图,后续还有好多东西要做 |
34 liujan611 Apr 24 跟首形科技联合一下,把机器人老婆联动到视频哈哈哈? |
35 dsd2077 OP PRO @liujan611 #34 这个想法有意思,不过如果有实体了,就不需要虚拟形象了。倒是可以做成全息投影那种产品,像一个智能音箱一样摆在家里,可以每天给 Ta 换皮肤,还可以看 Ta 唱跳 rap. 这从商业模式上也是讲得通的,谷子经济,人们愿意花成千上万去买一个手办。 |
36 zhang666 Apr 24 via iPhone 能提供情绪价值么 |
38 Fooooo0 Apr 24 问下 op 哪里租 5090 便宜? |
40 cz5424 Apr 24 4090 要求有点高了 |
42 iixy Apr 24 我对所有假的东西都没那方面的感觉,有人跟我一样吗? 就是,如果是整容过的女的,或者 ai 生成的色图视频,即便再逼真,我也不起来。 |
43 linxiaojialin Apr 25 可以拉远镜头的吗?展示全身、甚至远景镜头之类的 |
44 dsd2077 OP PRO @linxiaojialin #43 暂时不行,镜头基本是固定为输入的照片 |
45 davidlau Apr 25 请问 DOUBAO APP ID 和 Tken 是怎么获取的? 新版只有 API Key ,旧版只有 App ID |
46 dsd2077 OP PRO |
47 default996 Apr 25 |
48 dsd2077 OP PRO @default996 #47 现在算法优化了,以前可能真的需要专业显卡 H100/H200 这种 |
49 davidlau Apr 26 让 codex fix 了很多代码,在 Win WSL 平台 NVIDIA GTX 5090 16G 成功跑起来了。 相同环境的朋友可以参考: https://github.com/liuslevis/CyberVerse 顺便问下大家有实时对话返回杂音的吗?短语可以,长一点就是杂音(勉强听清部分内容) |
52 wnpllrzodiac Apr 26 via Android 能卸甲么? |
53 YICHUJIFA Apr 26 4090 显卡现在多少钱,好买么 ? |
55 davidlau Apr 26 @dsd2077 可以的 不过改动有点大 您可以选择性合入或者参考一下 详见 https://github.com/dsd2077/CyberVerse/pull/3 |
58 davidlau Apr 26 @dsd2077 想问下你 PC 有 GPU 吗?感觉这个 GPU 门槛低点容易火 哈哈哈 比如普通显卡也能用/二次元也能玩的 大家有需要的话,我可以帮忙看看模型量化/压缩怎么在入门消费级 GPU 上跑。请留言电脑配置。 |
59 onedge Apr 26 有趣的想法,可惜我是 mac 哈哈哈 |
60 davidlau Apr 26 看了下 SoulX-FlashHead-1.3B 选 Lite ,最低用 12GB 显存的 GPU 也可以跑,大家可以试试 |
61 gzlock Apr 27 可以反着来,用来数字人直播吗? 如果可以,那就只需要有一张 4090 或 5090 就可以拥有一个自己设计的数字人主播啦 话说适用于非人类吗?例如卡通猫之类的? 另外楼主如果发个视频预览一下效果就更好了,现在图片不直观 |
62 dsd2077 OP PRO @gzlock #61 1. 可以做直播的。做直播的话,对画质要求就更高了。自己玩的话确实 4090/5090 就行。 2. 适用于非人类。社区有很多开源的模型,到时候再接一批。 3. 项目里可以看到视频,我再贴一下吧 https://www.bilibili.com/video/BV196dQBGE3K/ https://www.bilibili.com/video/BV1pHdQBxEBm/ https://www.bilibili.com/video/BV1ivdQB1E3q/ |
64 evilcat Apr 27 RTX PRO 6000 啥时候降价啊 |
66 l353443703 16 days ago @iixy #42 化妆呢?也是假的吗? |
67 iixy 16 days ago @l353443703 我已练出火眼金睛,化妆也能看出真实颜值,大多数人化妆术没那么神 |
68 dsd2077 OP PRO 最近新增了下列功能: - 支持角色说话时打断说话 - 延时优化,给每一个环节加上 trace 点,看看哪个环节最耗时 - bug:用户会话保存有 bug 。 - 支持千问大模型系列 - 调通 standard 模式流程 - 支持 Qwen omni 模型 - 支持用户侧视频输入/屏幕共享 - 提示词调整,避免 LLM 的回复太冗长 - 提供头像剪切功能 - 给 qwen-omini 模型添加视频输出信号 - 国际化 V 友们如果有什么功能需求,也可以提出来,尽量满足 |