跳转到内容

小七姐:提示词思考总结

📍

作者:小七姐

可以在这里关注她:小七姐的免费学习社群

新年假期结束了,和去年明显不同的是:今年对AI、对提示词感兴趣的大众用户在指数级增长。

本社群的很多朋友多少是了解一些提示词的,但很多朋友私聊和我说,如果需要对其他人介绍提示词的时候,感觉要说的很多又很碎,应当如何论述才能让他们明白呢?小七姐整合了一下自己之前关于提示词的总结,做了一篇比较系统的说明,希望能带给大家一些启发,也欢迎大家在需要的时候转发给需要它的人。

建了一个快闪共学小组,有缘看到的同学可以进飞书群一起学习(3 月 3 日下午 16:30 创建,3 天内有效)

创建了一个共学活动文档,用来留作业,发评论,讨论问题,收集群精华问答:Prompts 共学快闪活动

在最近的直播中也进行了分享,下面有 B 站视频详解

B 站详细介绍

以下为文字详解


一、什么是提示词?

提示词(Prompt)是给大语言模型(以下简称模型)的输入文本,用于指定模型应该执行什么样的任务并生成什么样的输出。

提示词发挥了“提示” 模型 应该做什么的作用。设计高质量的提示词需要根据目标任务和模型能力进行精心设计,良好的提示词可以让模型正确理解人类需求并给出符合预期的结果。

我们来看一些示例,以便更准确的理解提示词的实际使用:

直接提问型:

策略建议型:

翻译型

算数型

概念解释型:

二、为什么提示词需要学习?

首先了解大模型的特性,了解它能做到什么,不擅长做什么,完全无法做什么。

随后要求写好 brief 的能力,也就是清晰表述自己的需求和任务的能力。

两者兼具,才能用好这个工具。

三、对于个人、企业和组织,提示词有什么价值?

提示词是AI在组织内落地的一把钥匙

每当一个新工具落地到企业的生产力环境的时候,因为原有的工具习惯和路径依赖,生产者其实很容易对新工具产生怀疑和抵触。

但对于AI来说,提示词可以非常有效的迅速让大家意识到,这个工具真的是在帮我干活的:

提示词是提取和复用业务方法论的有效工具

以下是一个示例场景,不经过提示词大模型也可以做到准确的翻译。但经过简单提示,例如增加翻译的目的、场景和特定规范时,就可以生成更加符合需要,可以直接使用的内容:

上述好用的内容生成的前提是MQ老师(提示词作者)编写的职场英语助理提示词,这意味着,一个深谙跨语种沟通方法论的老师,可以把她的方法论封装成一个开袋即食的工具,让其他人直接使用(而不需要再去深入学习方法论本身)。

提示词是碾压式的组织学习利器

基于Johari沟通视窗模型,大模型+提示词在我们拓展认知的四个象限中,都有非常好的阐述式或启发式应用方法:

而在职场和个人成长中,有非常多的场景,例如:

下图(引用自熊猫Jay的《AI提示词与职场提效》专栏)

下图引用自夙愿的《AI提示词实战指南》

基于这样的学习,可以有效的优化传统的组织学习模式:

四、提示词研究的现状与挑战

新兴学科,缺乏体系化的学习框架

大模型提示词是一个新兴学科,传统教育尚未对此设计出新版教材,只有少部分爱好者和研究者个人编写的教材。整体来看,缺乏系统化、成体系的学习方法。

众说纷纭,缺乏参考标准

关于提示词的技巧、作用、方法和效果,处于个体经验和主观感受超过客观评价测试的阶段,也没有权威的、大众可用的测评机构来验证发布的这些有效语句,目前可参考的大多是从已发表论文中衍生出来的方法论和语句。

经验学科,缺乏稳定性测试

基于上述原因,当一个新的方法或结构化提示词被发布时,很难评价它是否在广泛的场景中具有稳定的表现,只能基于个人的不断使用来自行发觉其中的细节问题。

极客探索期,缺乏行业方法论

在AI探索初期,关于提示词的效果作用,大多是极客们在积极探索,很多优秀提示词仅出于兴趣和爱好,加之传播中的幸存者偏差问题,大多数广为流传的都是一些有噱头、有趣、整活的提示词,而真正用于业务的,具有行业方法论的提示词反而不那么“流行”,更多真正需要用提示词解决的业务场景需求也尚未得到广泛收集和关注。

五、提示词是如何优化生成内容的

前文提到过,其实你和大模型的任何一个对话都是提示词,而我们强调的提示词,是带有明确结构和方法,基于优化结果而向大模型提出的“提示”:

这可能是你和大模型的第一次对话:

这是一个封装过的提示词(GPTs)

可以看到同样是较为简短的输入,为什么生成的结果有显著差异呢?

这是因为“在魔术师的桌子下面”,有这样一个提示词在起作用:

六、学习提示词的本质是什么?

本质上只需要做两件事:

1.了解大模型的特性

2.了解自己的需求和表达

而最终如何把上述学习融入生产力:

七、提示词的知识体系是什么样的?

我自己把提示词学习分成五个维度,从高到低依次是:思维框架,方法论,语句,工具和场景。这是经过近一年的探索和教学总结的框架,我也把这套框架完全融入了我的提示词学习课程。

很多人学习的时候或者是被教授课程的时候,由于知识的诅咒和信息整合的问题,通常也是按照由高到低的顺序去了解和接触提示词的,但这样其实并不符合初学者的认知过程,大部分人会感到困难。

舒适的学习顺序应当是反过来的:

场景:

不管那些艰深的理论和学术的东西,直接切入提示词的场景去学,比如在什么场景下,可以如何使用提示词,用特定提示词以及不用它们的效果对比。

工具:

然后去使用一些现成的、方便的提示词工具,包括一些 Meta Prompt、一些 Al 角色定制等 ,也包括别人写好的成型的提示词,作为工具来体验和尝试,这都属于提示词工具的实践。

有效语句:

接下来要学的才是有效的提示语句,这包括大量的经典论文中明确提出的提示词语句。最典型的就是早期的 think it step by step

方法论:

第四个维度是学习有效的方法论,这里就要把这些有效语句及其背后的原理整合成了比较稳定可控的一整套的方法,可以去自动编写一些稳定的提示词。例如 think it step by step 背后的原理是 COT,但掌握了 COT 方法就不会只用一句 think it step by step

思维方式:

最后是思维方式,你可以完全按自己的思路编写 Prompt,经过前面四个层次,最终会理解到提示词本质上就是逻辑思维和表达能力,只不过交互的对象从人变成了大模型。

最终要面对的只有三类问题:

  1. 知识储备不足(包括大模型特性的知识和世界知识)
  2. 业务 know how 不扎实(能干自己活但是抽象不出方法论)
  3. 语言逻辑有缺陷(脑子里都知道,但表述不清楚)

建了一个学习小组快闪飞书群,有缘看到的同学可以进群一起学习