南瓜博士：让 AI 画了十万只猫后，我终于明白了人类的独特价值

🔗 原文链接： https://mp.weixin.qq.com/s/PwUkw4U9...

原创 ElfeXu 南瓜博士 2024-06-18 15:15 上海

从去年年初开始，关于 AI 的创造力，我大脑中就一直在左右互搏。前阵子，我用代码让 AI 画了十万只风格各异的猫，在这个过程中，我终于明白了人与 AI 应该有怎样的协作创造、人在其中的独到价值究竟在哪里。

十万分之四的猫猫

0.24% 的猫猫

今天这篇文章就是我左右互博观点的过程，希望能给你也带来些启发。

1 AI 有没有创造力？有！

我曾经斩钉截铁地说 AI 的创意就是比人强。《ChatGPT 的创意有多强》这篇文章就是证据：对于我想不出来的谜题，AI 总能用富有创造力的方法来给出回答。

其实这并不意外。创意是什么？是在你思考的范畴之外，远远的地方，找到一个点，然后想方设法让这个点和你思考范畴之内的事物产生关联，创意就来了。所谓 thinking out of the box，就是创意。要在大模型中远远的位置找一个点，这事儿对 AI 来说可真不难。

我至今一直特别频繁地利用 AI 的创造力：当自己卡壳的时候问问 AI，它总能帮我开脑洞。

2 但是，AI 没有审美和判断力

对于“AI 没有判断力”这个论断，你也许会不同意：“我让 AI 给学生的作文打分，AI 说得头头是道表现得很不错呀。”

我的建议是——不要凭感觉。设计一个实验来验证它。

我在写自动生成小说的 agent flow 时做过实验：A、B、C 三段文字，让 AI 根据一个明确的标准找出最好的。除非是“哪段文字更简短”这样的简单标准，只要标准稍一复杂稍多一点点感性，AI 就犯晕。当我以 ABC 的顺序提供文字时 AI 告诉我 A 最好，以 BCA 顺序提供时它说 B 最好，以 CAB 顺序提供时它又说 C 最好。

只有当我再加入两层裁判、用非常复杂的提示词和 flow 过程来教 AI，它才能勉强完成“哪个大纲有最深刻的转折”这样的分析。但那样做的成本，用到评判的排列组合里，就高到不可接受。

所以，我在人有人的用处这篇文章中写到： AI 脑暴，人类挑选；AI 划桨，人类掌舵。

3 没审美又何妨？用量大管饱的创造来弥补就好喽？

既然我和 AI 有着“船长 vs 水手”似的协作，就别在乎 AI 缺乏审美和判断力吧。用好它的长处，让它大量地创造。

但随着 AI 能力的上升，提示词越来越容易，让 AI 生成高质量内容也越来越容易。

以绘画为例。自从有了 --sref 风格参考参数，我就再不担心自己不懂艺术相关专业词汇。只需要找一张自己喜欢的风格图片，--sref 后面跟上图片链接，用再简单不过的提示词，也能得到漂亮同款。

甚至你都不需要找参考图，只需要一个风格种子的数字就好。比如 --sref 238978694 画出来的图案是这样的（从上到下提示词分别为 environment, plants, animals, a boy, a girl）：

这多简单呀。在 --sref 后面添加随机数生成图片，然后挑出喜欢的，把风格种子收藏起来，想画画时就能用得上。

从此，发明变成了发现。让我从一大堆画里挑一个，可比让我画出一副漂亮的画，或自己写出一串用于生成漂亮图画的艺术词汇，难度低太多了。

4 还是得叠加人的创造，才会有大不同

于是我写了个程序，让 AI 帮我自动生成风格各异的猫咪。

最初，我像老鼠掉进米缸里，看什么都觉得“哇！好看！真特别！”

没过两天，就开始见怪不怪了——噢，又是这样的。

紧接着，我开始头疼——那么多风格堆在一起，最初觉得精彩的，都因为后来的“量大管饱”而失去了独特性，看起来没那么美了。当我想找风格种子的时候我怅然若失：因为平庸的创造太多，“发现”再次变得费劲。

还是去麦橘和 waytoagi 的种子库社群更有收获。在那里大家不贪多，每天就深度探索一个种子，感受一种风格的独特魅力。

种子库 1 - 已投票

--sref 40977194

有潜力的风格种子，叠加上人的创造，才有了真正精彩的产出。

5 其实，AI 也能自举式创造

那有没有可能用一套提示词架个 agent flow，让 AI 自举式的开始创造呢？

还真有可能。我给 AI 设计了一套工作流，依次做以下几件事：

根据画风匹配作家
从几个干扰选项中确认作家、排除步骤一瞎匹配的那些
根据作家的作品描绘名场面
将名场面转译成绘画指令
将指令用对应画风画出来

例如下图左上角的猫猫，AI 能非常到位地识别匹配到作家奥斯卡·王尔德。从四幅图中挑出最配王尔德的它也能挑准，说明那是真匹配。（我做了好些这个实验，收到很多令人惊叹的结果，后面另写文章介绍。）

然后，它从《道林·格雷的画像》这部小说中提取出名场面，转译成 prompt，得到了如下的图画。

注意到左侧，年青俊美的道林格雷那空洞的眼神了吗？注意到右侧，手握匕首的道林，和都柏林 Merrion 广场里的王尔德雕塑是同样的姿势吗？

这些细节，真的让我鸡皮疙瘩都起来了。当给到的方法足够好，让 AI 能从人类知识的宝库里获取足够多信息，AI 也可以有精彩的自举式创造。

6 创造再多、质量再高，没有我的参与，对我就毫无意义

上面这套流程看起来是能顺畅地运行的，只要不计成本，就可以得到海量的风格、海量的图片，精心调教过的 workflow 还能让生成的图片有 70 分以上的审美和足够精彩的故事。

那还要强调人的价值吗？让 AI 做，人歇着就好不是吗？

我的回答是——当然要坚持人的价值。

手握匕首的道林那幅图之所以让我起鸡皮疙瘩，是因为它让我想起了王尔德的《自深深处》，让我想起了 Marrion 广场那座雕像。它有价值，是因为有我在当观众。

不管是 AI 也好，人类世界里芸芸众生的创作也好，有十万只猫咪又如何呢？只有我自己在某一刻起心动念、用喷涌而出的表达意愿创作出的那一只猫，或者在茫茫多他人的创作中吸引住我眼神、让我有联想、被击中的那一只猫，才是对我有意义的猫。

7 人与 AI 协作，保护好这个参差多样的美的世界

我终止了自动运行的脚本，把十万只猫咪封存起来。

AI 的创造像洪水一般，太过汹涌。大模型是人类智慧的加权平均。偷懒的人们用“一键出”的方式，让 AI 不断创造等于平均值的内容，而这些内容不知什么时候又会被用于 AI 的继续训练。我特别担心这样一来，AI 像做平滑降噪算法一样，对人类的文化进行“高斯模糊”。那些独特的风格会渐渐被平均掉，变成灰蒙蒙的一片。

我，是对我而言，最独特的存在。AI 是个平均值，但我能用我的创造和判断、为 AI 的创造注入灵魂，得到对我而言最有价值的作品。

麦橘和 waytoagi 风格库社群的人肉探索是有意义的；一个需要人不断参与其中挑挑拣拣的 agent flow 是有意义的。

每一个人，当他积极地使用 AI 时，他就把他的独特性、留在了他和 AI 共创的作品里。

而保留着每个个体独特性的世界，才是对人类有意义的世界。

耳边响起了《流浪地球》里刘培强的声音：“ 没有人类的文明毫无意义。”

其实，之前就写过同样观点的文章《真的能醉生梦死吗》。只不过，这一次，看到 AI 像洪水一样给了我十万只猫咪后，我对此的感受更深了。

最后打个广告：今晚，我会和几个朋友一起做场直播，作为 7 月成都 LIFE 教育创新大会的预热。 LIFE直播预告 | 教育创新你怎么看——黄豆包AI机器人PK教育专家

“人何以为人”是关注 AI 的教育届的朋友们，会频频探讨的话题。今晚我们一起聊 AI 的教育创新，应该会碰撞出不少火花。