为什么 AI 生成人物的手指大多都容易出问题呢?
这一个月来,我一直在使用腾讯的 Ima.Copilot 生成图片。虽然生成的场景大多都很出色,但人物的手指总是出问题,这让我很头疼。每次遇到手指变形的情况,我都不得不重新生成,但如果重新生成,又会失去原本很喜欢的场景。有没有人知道如何在生成人物时避免手指变形呢?谢啦!
以下是三张手指出现问题的图片例子,看起来有些诡异。
因为手指太复杂。不是建模
有客户会看的这么仔细吗
你先想办法给手指各个形态起个名字,方便标注,就能解决这问题了。
请教一下你的 ima 怎么生成的图片...
个人猜测是因为多个手指的问题,鼻子旁边是嘴巴,是脸颊是眼睛眉毛,ai 比较好判断怎么画。但是手指边上有好几手指,形态也很多,ai 判断不出来画的是食指还是小拇指,不知道还要再画几个手指。并且形态太多了,五官就是五官,但是手指可以说每张图的形态都不太一样。
这个其实算莫拉维克悖论的范畴,有一个现象是人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力。所以好不好实现,你看他是否在所谓你一般认知里的高阶智慧能力就可以了,越简单的事情,AI 越不太容易做好
画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
画画的 AI 以为那玩意儿跟羽毛一样,多一点少一点没差别
就是信息颗粒度的问题
#4 画一张 xxxx
你让它 生成时注意手指数量为 5 个
ChatGPT 4o 的手好像稳多了,没那么容易出问题
1 、手指占整个画面的比例小。
2 、手指的几何形状复杂,很容易遮挡。
3 、手指非常灵活,手又是人类很重要的与其他物体互动的部位。
以上就导致了手部形态的统计学最优更难以找到。和盲人摸象一个道理。
换个模型,很多新模型已经处理的不错了
基于重绘功能,你可以只重绘手部,这样不会破坏其他地方
一方面手确实很复杂,不同的观测角度和姿势,千变万化。
另一方面,人类语言对“手”的描述却很贫乏又模糊,让 AI 建立起语言和“手”的各种姿势的对应关系不容易。
手的姿态很多,分类复杂,那么相似分类的数据就会变少。所以可能是因为训练不到位。
楼上说得很清楚了,以人像来说 一般正面侧面背面几个姿态就完事了,标注的也很清晰。但是手的形态千变万化任意摆放,标注的不清晰 很难对手进行拟合
这样提示:“在中国,有一对现代夫妻和他们的女儿,他们的家虽然简陋,但却充满了幸福的氛围。生成一张图片 1280*768px”
4o 画手没问题,找人工标的。
我第一眼以为是支付宝生日图
小厂招人难,烦人,这几年招人都没有断过。 不像那些名声在外的厂,给得起钱请得起大神。 目标招中级的前端,不知道以下几道题算不算超纲,目标是 1-3 年经验的前端: 一面主要…
我们知道计算机的计算数据需要从磁盘调度到内存,然后再调度到L2 Cache,再到L1 Cache,最后进CPU寄存器进行计算。 给老婆在电脑城买本本的时候向电脑推销人员问到这些…
之前发过一篇帖子: 你们不觉得产品经理这活,应该由程序员自己亲自干吗? 当时我主张程序员要做产品,现在我更主张了。 我看 V 站有许多程序员朋友担心 AI 太强大,担心自己作为…
合速度