搞出了一套批量生产 AI 插画的系统,用它接过单,不过客户给价太低没继续做下去。
把整个系统的搭建和使用过程写下来了,非常详细,核心是一套 Python 程序。
里面还详细介绍了 AI 图的各种问题怎么用 Photoshop 来修。
victor42.eth.limo/post/automate-ai-illustrations-production/
看到中途插画师退出,和最近新闻里战场士兵向机器狗投降一样,感觉是侮辱性太大了
个把月前看过了 作者能力是真强 太牛了!
执行力+1
如果甲方死扣细节,不管是人工画师还是 AI 画师都是一样的难满足
因为人是拥有很大的主观性(不确定性)的
赞!!!
看完了,技术没毛病,落地场景的选择有问题。甲方是要具象,符合现实逻辑的“AI 图”,显然他们不清楚 AI 的边界和局限性,但是作为甲方,提这种要求,也没毛病。关键是场景要选对,有这种毅力,自己做 C 端场景也不是不可以
厉害,佩服作者的动手能力
确实, 这种没有标准的东西不好收费阿, 用户一直提要求, 成本太高
我是来给你泼冷水的。
大家都知道屠龙刀有用,但有了屠龙刀,有谁会卖掉?而不是自己拥有统一武林呢?
你能接触到的 Ai 开源组件,本质上都是有残缺的,成不了屠龙刀的”废品“
你去研究参数,可实现和可商用是两码事。L3 自动驾驶技术 Audi 在几十年前就实现了,但到今天依然没有放在道路上。 与其研究这种有可行性,但没有可稳定交付的,不如不做。
厉害厉害!!
#8 “L3 自动驾驶技术 Audi 在几十年前就实现了...
这个事情有出处吗?
厉害厉害
我觉得主要问题是这种场景下,甲方并不是程序员或者项目经理,可以很清晰准确的表达他们的需求,也就是
- 需求很模糊
然后之前的 text2img 模型又有一个很大的缺陷就是他们是靠关键词生成图像(“念咒语”)而不是语义化的理解需求,也就是 - 自动化生成需要很精确的需求描述
最后就是现在模型依然有的局限,没办法很好的对图像内容进行准确的评估,所以 自动化评估很难实现
这几个点不解决就是文里面说的,只能完成 80%,后面就得靠人工,迭代也带靠人工,估计真正接近 95%的全自动流程得等到现在的语义化 text2img 和 vllm 的能力再提高才能实现了很有收获,我觉得 AI 绘图无论怎么发展,还是得手动介入,但是效率相比以往,已经提升非常多了
太强了
你的意思是 OpenAI 或者谷歌手里有能一句话就掀翻整个计算机世界的模型,但是他们心善,故意藏着,就把写代码都不利索的残缺品拿来给我们玩?
楼主分享得太好了、感谢无私精神
奥迪吹牛逼的 别说智驾 倒车的防撞系统都没做好
学到了,正打算生图
看完了,太牛掰了,太细了哥,你这能力做啥都行👍
啊对了,我还为这套系统写过一个手册,系统里所有的代码、模板都公开分享给大家。
我自己对于这种需要手动改图的事情没什么兴趣,我去研究别的了,不藏着掖着。
相信 v2 各位的动手能力都强的。可能 Photoshop 相关技巧比较陌生,手册里面我写得很详细,改图常用的一些 PS 工具和使用示例。
qvokpfxqsh.feishu.cn/wiki/KJMgwMn0wiXeiqkFvHHcHFxAn8B很不错, 不过你这套系统其实还差点,你如果用 Python 写一个 AI 设计 agent, 将很多流程和修图串起来可以完成更好的自动化
认识一朋友是做二次元周边的,最后也是要 AI 局部重绘精修,产出的图比 AI 直出的效果好得多,几乎分辨不出 AI 。
本来以为是水文,抱着质疑心态点开,内容确实出乎意料了:要代码有代码,要修图有修图。OP 的动手能力和专业素养都很强了,佩服
OP 这 PS 使用能力应该已经超过 V 站绝大多数的用户了,我自己修 AI 图是只会拿平板 / 数位板简单描一下然后 repaint 抽奖
很细节,很真实,点赞
整体看下来,我觉得你这套东西可以流水线生产老头乐,但接了保时捷代工的订单。
可老头乐市场需求也很大啊。
楼主的内容生产能力是真的强,包括写这篇博客。。。
后面的修图,太厉害了,完全是震撼到了
转 go 半年,初期痛不欲生,难以想象 go 的 web 开发生态如此简陋 写了半年感觉慢慢适应了,虽然很多东西都要手写(之前写 java 的)但感觉好像写啥都是一把梭,很快…
每个月最多可以白嫖 60 个小时,还有公网 ip 莫非 op 有什么使用场景 60 个小时不够用啊 对于在外面没带电脑的人来说,不错,可以直接手机上敲代码了 Beta …
前几天手机 Authenticator 突然弹了一个登录授权的确认弹窗出来,不是我操作的,我点了拒绝。 虽然知道我账号的安全措施足够,但还是上微软账号后台确认了一下,顺便看了一…