把整个系统的搭建和使用过程写下来了,非常详细,核心是一套 Python 程序。
里面还详细介绍了 AI 图的各种问题怎么用 Photoshop 来修。
victor42.eth.limo/post/automate-ai-illustrations-production/

看到中途插画师退出,和最近新闻里战场士兵向机器狗投降一样,感觉是侮辱性太大了

个把月前看过了 作者能力是真强 太牛了!

执行力+1
如果甲方死扣细节,不管是人工画师还是 AI 画师都是一样的难满足
因为人是拥有很大的主观性(不确定性)的

赞!!!

看完了,技术没毛病,落地场景的选择有问题。甲方是要具象,符合现实逻辑的“AI 图”,显然他们不清楚 AI 的边界和局限性,但是作为甲方,提这种要求,也没毛病。关键是场景要选对,有这种毅力,自己做 C 端场景也不是不可以

厉害,佩服作者的动手能力

确实, 这种没有标准的东西不好收费阿, 用户一直提要求, 成本太高

我是来给你泼冷水的。

大家都知道屠龙刀有用,但有了屠龙刀,有谁会卖掉?而不是自己拥有统一武林呢?

你能接触到的 Ai 开源组件,本质上都是有残缺的,成不了屠龙刀的”废品“

你去研究参数,可实现和可商用是两码事。L3 自动驾驶技术 Audi 在几十年前就实现了,但到今天依然没有放在道路上。 与其研究这种有可行性,但没有可稳定交付的,不如不做。

厉害厉害!!

#8 “L3 自动驾驶技术 Audi 在几十年前就实现了...
这个事情有出处吗?

厉害厉害

我觉得主要问题是这种场景下,甲方并不是程序员或者项目经理,可以很清晰准确的表达他们的需求,也就是

  1. 需求很模糊
    然后之前的 text2img 模型又有一个很大的缺陷就是他们是靠关键词生成图像(“念咒语”)而不是语义化的理解需求,也就是
  2. 自动化生成需要很精确的需求描述
    最后就是现在模型依然有的局限,没办法很好的对图像内容进行准确的评估,所以
  3. 自动化评估很难实现
    这几个点不解决就是文里面说的,只能完成 80%,后面就得靠人工,迭代也带靠人工,估计真正接近 95%的全自动流程得等到现在的语义化 text2img 和 vllm 的能力再提高才能实现了

    很有收获,我觉得 AI 绘图无论怎么发展,还是得手动介入,但是效率相比以往,已经提升非常多了

    太强了

    你的意思是 OpenAI 或者谷歌手里有能一句话就掀翻整个计算机世界的模型,但是他们心善,故意藏着,就把写代码都不利索的残缺品拿来给我们玩?

    楼主分享得太好了、感谢无私精神

    奥迪吹牛逼的 别说智驾 倒车的防撞系统都没做好

    学到了,正打算生图

    看完了,太牛掰了,太细了哥,你这能力做啥都行👍

    啊对了,我还为这套系统写过一个手册,系统里所有的代码、模板都公开分享给大家。
    我自己对于这种需要手动改图的事情没什么兴趣,我去研究别的了,不藏着掖着。
    相信 v2 各位的动手能力都强的。可能 Photoshop 相关技巧比较陌生,手册里面我写得很详细,改图常用的一些 PS 工具和使用示例。
    qvokpfxqsh.feishu.cn/wiki/KJMgwMn0wiXeiqkFvHHcHFxAn8B

    很不错, 不过你这套系统其实还差点,你如果用 Python 写一个 AI 设计 agent, 将很多流程和修图串起来可以完成更好的自动化

    认识一朋友是做二次元周边的,最后也是要 AI 局部重绘精修,产出的图比 AI 直出的效果好得多,几乎分辨不出 AI 。

    本来以为是水文,抱着质疑心态点开,内容确实出乎意料了:要代码有代码,要修图有修图。OP 的动手能力和专业素养都很强了,佩服

OP 这 PS 使用能力应该已经超过 V 站绝大多数的用户了,我自己修 AI 图是只会拿平板 / 数位板简单描一下然后 repaint 抽奖

很细节,很真实,点赞

整体看下来,我觉得你这套东西可以流水线生产老头乐,但接了保时捷代工的订单。
可老头乐市场需求也很大啊。

楼主的内容生产能力是真的强,包括写这篇博客。。。

后面的修图,太厉害了,完全是震撼到了