“谁是人类”比赛的水面之下, 是人生哲学

💡

作者: Stuart,

一直以为, bot“拟人”这件事, 只是提示词工程, 只要按照吴恩达老师说的“先清晰精准表达, 然后通过反馈一次次的迭代”, 就足够了.

说实话, 我一开始也没期待会有什么惊喜. 我曾经一直偷偷观察着梦飞老师的机器人群的尝试, “爱情公寓”(一个以模仿爱情公寓中的人物来做一个聊天群)却是以失败草草收场. 失败原因是一些系统设定类的技术问题, 但是从拟人的结果上看, AI拟人只给出了一点小小的惊喜, 没有我意想中的惊艳, 类似下文中会提到的“蛋蛋”bot.

不过这次比赛的复盘中, 大家思维的碰撞💥却迸发出一些不一样的烟火. 在复盘中, 我就找到进一步提升拟人效果的可能性, 期望有更多的小伙伴基于这次的结论进一步让bot的拟人技术进化, 然后教我. (三思版) 嘿嘿.

💡

省流版结论: 以构建戏剧角色的手法构建拟人bot. (更精彩思路的在下面不省流版里)

以下为整个比赛的历程, 不省流但却提炼了整个bot拟人进化过程:

比赛bot们的迭代过程

💡

这里是我观察到的大部分参赛同学的迭代过程:

赋予角色 -> 赋予人生 -> 赋予说话风格 -> 进入优化瓶颈

赋予角色

一开始, 大家先入手的大多是江树的提示词模板知识, 知道了要赋予bot一些基本的人设, 诸如“你是蛋蛋, 一个外卖员”之类, 更进一步的是以QA对来对齐模型的回答风格.
- 但是这样效果其实很一般, 大多数人通过学习就差不多能做到这一步, 不出彩, 而且回答通常AI味很重 -- 这在我们调用通义千问max的时候特别明显 -- 它在努力地进行具体的回答.
- 感受下它浓浓的AI味回答:

赋予人生

然后是作为引导教学的阿飞：捏一个人生——AI-bot 拟人化提示词分享. 阿飞老师在尝试把他在“爱情公寓”中的经验总结传达给所有人, 并且他放置在公共区供大家“调戏”的bot蛋蛋确实做到了很多时候回答的很讨喜 -- 不过蛋蛋50%的回答还是很容易被区分出来不是个人类的.
- 到这里为止, 人设的设计已经进入了一个新阶段, 大家已经大概理解人设不仅仅是一个简单的角色说明, 要赋予它很多的人生经历.
基于学习, 同学们各显神通.
- 比如, 这是人脉哲的“小镇做题家”设计思路:

赋予说话风格

然后我们开始引导小伙伴们观察真人的回答方式, 和比赛中容易被大家选中认为是真人的回答:
- 比如有同学发现“真人在微信中的回答通常简短”, 于是就在提示词里限制输出字数.
- 再比如我们在第一第二轮比赛中, 发现“所有大模型回答同一类喜好性问题”, 于是同学们开始在提示词里应对性的设定了它特别的喜好.
- 还有, 有的同学发现人聊天有很明显的特征, 比如有的人习惯于用emoji, 有的人习惯于说“笑死”, 有的人不喜欢用标点符号, 于是对应的特征被设定进去.
- 更有甚者, 同学们还故意让bot打错别字, 模仿出输入法打字的错误, 或者用谐音梗模仿人的奇特的对话方式.

进入优化瓶颈

再后来, 由于比赛用的问题除了避开了大模型必然缺失的知识之外, 就是完全随机挑的, 今天问的是喜好, 明天问的是哲学问题, 后天问的是情感问题, 继续以上面“猜题打靶”的方式会导致一个结果:
- 于是有人陷入了以技术应试的思维:
  - 增加提示词中的内容增加到极限的8k, 16k, 32k (目前至少没看到往128k做的, 不过要是再来几轮比赛, 真说不定会有, 哈哈哈)
  - 有的人考虑用类似mem0的长记忆或者向量数据库来存
  - 甚至有人提出是不是整理语料拿来微调

总之, 最后这个问题, 路漫漫其修远兮, 看不到尽头.

还是肤浅了

但是这个问题, 在比赛结束后的分享复盘讨论会上, 我突然悟了, 发现原来“是我肤浅了”.

通用的提示词工程仅仅停留在“术”的层面, 如果我们一味只从其表面去追求更完善的“术”来弥补不足.“头痛医头, 脚痛医脚”的西式进化哲学, 会导致我们在陷入无穷无尽的增加上下文, 增加记忆. 我们完全可以尝试跃迁到“道”的层面去寻找新思路.

大家一起复盘和互相分享时, 猫叔点了一个点:

我们在做这个机器人的时候，理论上我们不需要做一个真正的人，不需要完整地去将它的整个生活呈现出来，所以更多的时候我们尝试着去做一些抽象的东西。

紧接着他扔给我们一个巨复杂的《角色构建方法论：解构角色的16个切面》的链接: https://www.gcores.com/articles/163859.

这是一个构建游戏/戏剧角色的方法论, 我瞬间一个激灵, 突然想到“或许, 我们缺的系统化拟人方法论, 正是戏剧和小说领域, 作家们探索了多年的塑造角色的方法论”.

想起多年前我在学习《批判性思维》时总结的一张关于语言表达图:

语言只是外在表现, 它是当下主观思想+客观环境刺激下的一个应激反应, 而主观思想的背后逻辑是三观, 三观又是人生经历的固化.

人也没有背诵所有问题该怎么回答, 而是结合问题和自己的思想作出的问题. 因此我们用庞大的语料库去制作一个拟人化的bot显然是也是误入歧途了.

有人会说, 三观是玄之又玄的哲学问题, 咱们人类自己都说不清楚, 怎么写进提示词? 这里也有两点思路:

第一, 从比赛中看, 大家喜欢的都不是在期望一个流水帐式人生, 被期望拟出的一定是一个出彩的人生, 而这样的人生往往都是非常戏剧性的, 由无数个巧合性事件塑造出的一个复杂的, 多侧面的, 立体的性格. ta应该高度个性化却又有广泛共性、代表性. -- 有没有发现, 这是不是就是一个小说或者一个戏剧的主角?
第二, 一个人的“棱角”九成被几个关键性的经历, 或者周而复始的重复性经历所打磨, 因此可以以关键性事件来建立其三观的底层逻辑, 而不需要完完整整、事无巨细的都列进它的经历.

总结改进思路

因此总结起来, 接下来的改进思路,

继续在人物语言风格化的层面打磨.
建立起一个人的三观特征.
不求全, 转而求精地设计人生经历, 塑造三观塑形的底层逻辑.

这次比赛的案例, 就不赘述了, 大家可以参考大聪明老师的《系统性「造人」：论 AI 拟人的实现》, 写的非常不错.

结语:

AI时代, 我们缺的, 终究不是提示词技术, 而是专业领域的知识技能, 也就是所谓的, “底蕴”.