为什么 ai 生成的图片 手指总会有问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题复制粘贴 AI 生成的内容
dai269619118
V2EX    程序员

为什么 ai 生成的图片 手指总会有问题

  •  
  •   dai269619118 2024-09-06 10:26:23 +08:00 3613 次点击
    这是一个创建于 401 天前的主题,其中的信息可能已经有所发展或是发生改变。
    用 midjourney 生成图片的时候

    人物的手指的数量 4 5 6 个都会有

    出现问题的概率还挺大的

    为什么手指的数量上还处理不好?

    整体图片生成的都还挺好的,手指上总有瑕疵

    用的是 6.1 的模型

    有做着相关的大佬来说说吗 具体是怎么样的一个难点。
    13 条回复    2024-09-07 16:10:11 +08:00
    rekulas
        1
    rekulas  
       2024-09-06 10:38:52 +08:00
    这个网上不是很多分析了么,根本原因就是 ai 在缺乏对基础知识(投影、形体、物理、空间关系、力学等)的真正理解,而手虽然看起来简单,实际是一个比较复杂的结构,不同手势、角度带来的变化太大了,以目前 ai 的训练量还很难较为完美绘制

    mj 在手部上不算特别出色,现在有一些针对手部的增强模型,可以 mj 画了主图之后用增强模型修复手部,可以上 civitai 搜搜

    另外我觉得这也只是暂时的,大力出奇迹,ai 还在不断迭代,只要训练数据够多别说手千手观音都 so easy
    dai269619118
        2
    dai269619118  
    OP
       2024-09-06 10:46:24 +08:00
    @rekulas 兄弟我知道手势很难 我上面的问题是 手指生成数量的问题
    coderluan
        3
    coderluan  
       2024-09-06 10:55:55 +08:00
    试试最新的 Flux ,参数多了效果就好很多了,手这块比 midjourney 强很多。
    rekulas
        4
    rekulas  
       2024-09-06 11:01:00 +08:00
    一样的道理啊,因为手势的复杂性,喂给 ai 的图可能只有 3 根手指 可能 5 根,就像你训练 ai 看了 1 亿颗树,它肯定能画出让你满意的树,但绝对没法稳定画出树叶数量刚好==平均树叶数量的树
    你问的是原因,你若要问解决方案,没什么好的办法,只有尝试下新的模型,sd3 和手部增强版
    cmdOptionKana
        5
    cmdOptionKana  
       2024-09-06 11:12:06 +08:00
    flux 在这方面有明显改善,偶尔画错,但正确率已经很高,已经不能说 AI 画不好手了。
    kaneg
        6
    kaneg  
       2024-09-06 12:14:47 +08:00 via iPhone
    其实画过画的应该知道,画手是比较难的
    freshgoose
        7
    freshgoose  
       2024-09-06 12:20:44 +08:00
    flux 在这方面的改善还是很大的,这里有个免费版可以测试一下 https://fluxai.dev/zh/playground
    linch97
        8
    linch97  
       2024-09-06 13:49:08 +08:00
    AI 学的是统计规律,并没有逻辑。而且每个特征分辨率越低,越容易出错,你画几张手占主体的就会发现出错概率低了。加上手本来结构就很复杂,经常还有遮挡关系,都是目前 AI 绘图原理无法解决的。
    flankechen
        9
    flankechen  
       2024-09-06 14:38:30 +08:00
    1.人画画,手也是最难画的之一。
    2.现在的 ai 画画本质上都是扩散模型从纯噪声一步步去噪而已,物理,结构,投影一毛线关系没有,细致的结构,提示词对齐,一致性还有很多可以进步的。
    3.LS 说了,统计规律而已,目前数据细致程度和参数量没能到那个量级。不过一开始的时候,脚的数量有时候都会不对啊,现在的 fulx 好多了。
    pkoukk
        10
    pkoukk  
       2024-09-06 14:41:36 +08:00
    我猜,是大家给图片打标签喂给 AI 的时候,并没有标注这图上有几根手指吧...
    所以 AI 也并不清楚,这时候应该有几根
    sentinelK
        11
    sentinelK  
       2024-09-06 14:58:35 +08:00
    因为画图 AI 的实现逻辑,是从一个低分辨率图,利用统计学原理作为概率基础,逐步细化去噪的过程。

    因为是统计学原理,所以 AI 对于什么是“手”,以及“手”的物理概念一无所知。他只是知道绝大多数的画,在这个地方,会画成这样而已。

    手部在绘画中占用的资源(像素点)并不多,同时手部因为灵活,所以遮挡、姿势多样。相对脸部,躯干而言,属于信息量小,但变化大的部位。这也就导致其统计学“局部最优解”比较多,而且没有明显的全局最优。

    这就会导致手部的绘画容易出现错误。
    cocomanber
        12
    cocomanber  
       2024-09-07 15:25:07 +08:00
    这个手的数量的确是个问题哈哈哈,mj 都出现过鸡爪。。。离谱
    leegradyllljjjj
        13
    leegradyllljjjj  
       2024-09-07 16:10:11 +08:00
    真以为是外星智能啦,ai 后台跑的都是统计学模型,现阶段所有 ai 模型都是基于概率论的,现在的大模型是语言模型,加减乘除都能算错
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2700 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 12:07 PVG 20:07 LAX 05:07 JFK 08:07
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86