跳转到内容

皮皮Peter:跨学科揭秘「OpenAI提示词工程六条策略背后的理论基础」

原创 皮皮peter 皮皮Peter 2024-06-15 19:42 上海

概览:

本文探讨了OpenAI提示词工程 六条 策略的依据理论,包括 语言学、心理学、信息科学等多学科, 希望能帮助用户更多面的理解策略背后的理论 ,结合技巧和理论,更有效地与人工智能模型进行交互。

全文8000字,阅读约需 10 分钟

以下内容仅代表本人个人观点。

----------------------------------

前言

----------------------------------

关 于 OpenAI 提示词工程的六条策略,网络上的文章都是分享实践,本文希望从理论层面探讨这六条策略的理论 依据,给使用提示词的伙伴提供一些理论依据,以便更好的理解和学习使用提示词工程。

推荐同时查看熊猫Jay:万字解读ChatGPT提示词最佳实践(https://waytoagi.feishu.cn/wiki/FoJJwvwBNiEJYjkx1ygccO2CnVe)

----------------------------------

策略一:编写清晰的指令

----------------------------------

技巧1:在查询中包含详细信息以获得更相关的答案

理论依据:语言学 - 语用学;

语用学研究语言在具体语境中的使用,以及如何通过语境来理解和解释言语的意义。语用学强调了语境的重要性,包括物理环境、社会环境、心理环境和语言环境等,以及语言行为的适当性。

语用学强调语境、礼貌和合作原则、言语行为 等。

语境包括物理语境(地点、时间和场合)、社会语境(社会关系、角色和身份)、语言语境(前后文)等。

根据语用学对语言表达的要求,对提示词的要求:

  1. 清楚地表达目的和需要解决的问题。
  2. 提供相关的背景信息,帮助模型理解具体情境。
  3. 提供具体的细节,如时间、地点、相关人物或事件,以减少歧义。

也可尝试将语用学的原则应用于提示词中,效果可能会有所惊喜,比如研究表明礼貌可能有助于生成出更好、更正确的内容,在提示词中增加言语行为可以增加“人味儿”(详情查看南瓜博士:让 AI 的回复更有灵性(人味儿)的 Prompt 小技巧https://waytoagi.feishu.cn/wiki/ZtWYwXtVkiOJSGkwujPcdPQLnBb)

技巧2:要求模型使用角色

理论依据:心理学 - 角色理论;

角色理论是心理学中根据人们所处的社会角色去解释人的行为并揭示其中规律的理论。根据乔治·赫伯特·米德(George Herbert Mead)的观点,个体通过与他人的互动,学习并扮演不同的社会角色,这些角色定义了个体在特定社会环境中的行为和期望。

角色理论应用于多种情境中,包括工作场所、教育、家庭和社区,帮助解释和指导个体行为。它通过明确角色和期望,提供行为的框架和准则,从而减少冲突和不确定性。

角色理论通过明确角色和期望,提供了行为的框架和指导。 在提示词中指定模型的角色,模型会根据角色的特性提供更加专业和个性化的回复 ,比如:如果希望获得专业的法律咨询,可以要求模型扮演律师的角色;如果需要情感支持,可以要求模型扮演心理咨询师的角色。

技巧3:使用三引号、XML 标记、章节标题等分隔符可以帮助划分要区别对待的文本部分

理论依据:信息科学 - 文本结构化;

文本结构化是信息科学中研究如何将非结构化文本转换为结构化数据。这种转换使得文本更易于分析、存储和检索。 结构化文本可以更有效地支持信息抽取、内容管理、数据挖掘等任务。

在文本结构化理论中, 使用分隔符是区分不同文本部分的重要手段 。分隔符帮助定义文本的结构,比如:

  1. 标记语言:如XML和HTML,通过标签标记文本的不同部分,明确其属性和层次结构。
  2. 分隔符:如三引号、换行符和章节标题,用于在文本中明确分隔不同的段落、章节或内容块。

在提示词中使用这些分隔符,可以帮助模型更准确地识别和处理文本的不同部分。 比如:利用三引号来指定需要特别关注的代码块或文本段落;使用XML标记来指明特定数据的属性或类别;或者通过章节标题来指示文档的逻辑结构。

另外,结构化的文本还有助于模型进行更复杂的文本分析,如情感分析、主题建模和语义理解等。通过结构化文本,模型可以更精确地抽取关键信息,生成更加相关和有用的输出。

技巧4:指定完成任务所需的步骤

理论依据:认知心理学 - 分步学习理 论;

分步学习理论是认知心理学中的一种学习策略,认为复杂的任务可以通过分解成一系列更小、更易管理的步骤来学习。 该理论基于认知负荷理论,强调通过分步骤的方法来减少学习者在认知过程中的负担。

分步学习理论的观点是当学习者面对一个新任务或复杂问题时,将其分解为简单的子任务可以提高学习效率和成功率。这种方法有助于学习者逐步构建知识。

在提示词中指定完成任务所需的步骤,可以帮助模型更清晰地理解需求,并按照既定的顺序执行任务。 比如需要模型帮助解决一个数学问题,可以按照以下步骤进行:

  1. 明确问题:首先,清楚地描述问题是什么,包括所有相关的条件和已知信息。
  2. 分解任务:将问题分解成几个小步骤,例如确定需要使用的公式、列出已知变量等。
  3. 执行步骤:按照逻辑顺序执行每个步骤,例如先计算中间值,再逐步求解最终答案。
  4. 验证结果:在每个步骤完成后,检查结果是否合理,以确保正确性。
  5. 整合答案:将所有步骤的结果整合起来,形成最终的解答。

通过指定步骤,可以确保模型按照预期的方式工作。这种方法不仅适用于数学问题,也适用于编程、写作、研究等其他需要逻辑顺序和清晰步骤的任务。

技巧5:举例说明

理论依据:教育学 - 示例学习理论

示例学习理论是教育学中 强调通过具体例子来促进学习和理解的理论 。通过观察和分析具体实例,学习者可以更好地理解和掌握抽象概念和原理。

示例学习理论的核心观点:

  • 具体性 :具体例子比抽象描述更容易被学习者理解和记忆。
  • 情境性 :例子应该与学习者的实际经验或情境相关联,以增强学习效果。
  • 可迁移性 :通过例子学习的概念和技能应该能够被应用到新的情境中。

在提示词中使用示例说明,可以优化模型的理解和生成过程,提高输出的准确性和相关性。 比如提供格式示例,包括文章的整体布局、标题和副标题的使用,要求按格式生成:

例子:
# 环境保护的重要性
## 引言
## 主要观点
## 结论

技巧6:指定所需的输出长度

理论依据:人机交互 - 用户体验设计理论

用户体验设计理论是人机交互领域中关注如何创建高效、愉悦的用户体验的理论, 强调设计应该以用户为中心,考 虑用户的需求、偏好和使用情境,以提高用户满意度和产品的有效性。

用户体验设计理论核心原则:

  • 以用户为中心 :所有设计决策都应以用户需求和期望为核心,确保产品或服务能够真正满足用户的需求。
  • 易用性 :产品或服务应易于使用,用户能够轻松地完成所需任务,而不会遇到不必要的困难或障碍。
  • 功能性 :产品或服务必须具有实用性,能够有效地解决用户的问题。
  • 情感设计 :产品或服务应引发用户的积极情感体验,如愉悦感、满足感和信任感。

在与模型交互时,指定所需的输出长度后,模型可以生成更加符合用户期望的回复,比如:

  • 需要快速浏览信息,要求提供较短的摘要或要点。
  • 需要深入理解某个主题,要求模型提供详细的解释和分析。
  • 正在进行学术研究或撰写报告,要求提供长篇的、包含丰富数据和论据的内容。

通过指定输出长度,不仅提高了用户处理信息的效率和满意度,也提升了整体的交互体验。

运用用户体验设计理论,也可以探索更加人性化、高效的交互系统,比如增强情感设计。

----------------------------------

策略二:提供参考文本

----------------------------------

技巧1:使用参考文本回答问题

理论依据:知识管理 - 知识再利用理论

知识再利用理论是知识管理领域中 关注如何有效利用已有知识资源以提高效率和创新的理论 ,通过重用和整合现有知识,可以减少重复工作,加速学习和创新过程。

知识再利用理论的核心观点:

  1. 知识表示:知识需要以一种可以被机器或系统理解和处理的形式表示出来。
  2. 知识存储:有效的知识管理系统,确保知识可以被存储、检索和更新。
  3. 知识检索 :能够快速准确地从大量知识中检索出需要的信息。
  4. 知识整合 :将不同来源和类型的知识整合在一起,形成更全面的理解。
  5. 知识迁移 :将知识从一个领域或情境迁移到另一个,以解决新问题或创造新价值。
  6. 创新和创造性:利用现有知识创造新的解决方案或产品,推动创新。

在提示词中要求模型使用参考文本回答,可以确保模型回复的准确性和深度,提高互动的成功率。

技巧2:使用参考文本的引用来回答

理论依据:信息检索 - 引用分析理论

引用分析理论是信息检索领域中研究如何通过引用文献来评估信息价值和相关性的理论, 文献之间的引用关系可以揭示知识的发展脉络、研究的影响力以及信息的权威性

引用分析理论的核心观点:

  • 引用频率:文献被引用的频率可以作为衡量其重要性和影响力的一个指标。
  • 引用网络:文献之间的引用关系构成了一个网络,通过分析这个网络可以发现研究领域的核心文献和发展趋势。
  • 引用质量:引用的来源和质量也很重要,高权威性文献的引用可以增加被引用文献的可信度。

在提示词中要求模型使用参考文本的引用来回答问题,可以提高模型生成内容的准确性和权威性,增强内容的相关性和深度,提高用户的信息检索效率和效果。

----------------------------------

策略三:将复杂任务拆分为更简单的子任务

----------------------------------

技巧1:使用意图分类来标识与用户查询最相关的指令

理论依据:人工智能 - 意图识别理论

意图识别理论是人工智能领域中研究如何理解用户输入的意图并据此执行相应操作的理论, 通过分析用户的语言表达,可以识别出其背后的意图,并据此提供更加精准的服务或响应。

意图识别理论的核心观点:

  • 意图识别:通过自然语言处理技术,从用户的查询中识别出其目的或需求。
  • 上下文理解:考虑用户的语言、情境和历史交互,以更全面地理解意图。
  • 分类与匹配:将识别出的意图分类,并与预定义的指令或操作进行匹配,以执行相应的任务。

在提示词中使用意图分类,用户可以更直接地表达自己的需求,模型提供更加精准和个性化的服务。 具体步骤包括:

  1. 定义意图类别:根据应用场景,定义一系列可能的意图类别,如查询信息、请求操作、寻求建议等。
  2. 分析用户输入:分析输入文本,提取关键词和语义信息。
  3. 意图分类:根据分析结果,将输入归类到相应的意图类别中。
  4. 执行相应操作:一旦识别出用户的意图,模型即执行与该意图相关联的操作或提供相应的信息。

技巧2:对于需要很长对话的对话应用程序,请总结或过滤以前的对话

理论依据:信息处理 - 总结与过滤理论

总结与过滤理论是信息处理领域中关注如何有效管理和简化大量信息的理论, 通过总结和过滤信息,可以减少认知负荷,帮助用户更快地抓住关键内容,提高信息处理的效率。

总结与过滤理论的核心观点:

  • 信息简化:通过总结,将大量信息简化为关键点,帮助用户快速理解核心内容。
  • 信息筛选:过滤掉无关或冗余的信息,只保留对当前任务或决策最有价值的部分。
  • 上下文保持:在总结和过滤的过程中,保持信息的上下文,确保用户能够理解信息的来龙去脉。
  • 动态调整:根据用户的反馈和需求,动态调整总结和过滤的策略,以适应不同的情境。

在和模型交互时,对于需要长对话的应用程序,总结或过滤以前的对话可以帮助用户和模型保持对话的连贯性和效率。 具体步骤:

  1. 识别关键信息:在对话过程中,识别并标记出关键的对话内容和决策点。
  2. 定期总结:在对话的适当时机,提供对话的总结,帮助用户回顾和理解到目前为止的讨论。
  3. 过滤冗余信息:去除对话中重复或不相关的部分,确保对话的焦点始终集中在关键议题上。
  4. 提供上下文链接:在总结或过滤信息时,提供指向原始对话的链接或引用,以便用户需要时可以查看详细信息。
  5. 用户控制:允许用户根据自己的需要,选择查看详细对话、总结或特定部分的信息。

对于需要长对话的情况,通过总结和过滤以前的对话,模型可以提供更加清晰和高效的交互体验。体现了总结与过滤理论的理念,通过简化和筛选信息来提高信息处理的效率和质量。

技巧3:分段总结长文档,并以递归方式构建完整的摘要

理论依据:文本处理 - 分段总结理论

分段总结理论是文本处理领域中研究如何 将长篇文档分割成若干段落,并为每个段落提供总结的理论,通过递归地对每个段落进行总结,可以构建出一个全面且连贯的文档摘要。

分段总结理论的核心观点:

  • 文本分割:将长篇文档根据逻辑结构或主题分割成若干段落。
  • 段落总结:为每个段落提供一个简洁的总结,捕捉段落的核心思想或信息。
  • 递归构建:将各个段落的总结递归地整合,形成对整个文档的全面摘要。
  • 连贯性保持:在构建摘要的过程中,保持信息的连贯性,确保摘要能够流畅地反映文档的整体内容。

在提示词中使用分段总结和递归构建摘要,可以更有效地从长篇文档中提取关键信息,帮助用户快速把握文档的主要内容和结构。 该方法适用于学术研究、市场分析、政策评估等多种需要处理大量文本的场景。

----------------------------------

策略四:给模型时间“思考”

----------------------------------

技巧1:在匆忙得出结论之前,指示模型制定自己的解决方案

理论依据:认知科学 - 问题解决理论

问题解决理论是认知科学中 研究个体如何识别问题、探索解决方案并做出决策 的理论。该理论认为问题解决是一个动态的、多阶段的过程,涉及信息的收集、分析、评估和应用。

问题解决理论包括:

  • 问题识别:首先识别和定义问题,这是解决问题的起点。
  • 信息搜索:搜集与问题相关的信息,包括已知事实、可能的解决方案和潜在的障碍。
  • 方案生成:基于收集的信息,创造性地生成多种可能的解决方案。
  • 评估与选择:评估每个方案的可行性、效果和风险,选择最合适的方案。
  • 实施与反馈:实施选定的方案,并根据结果进行反馈和调整。

在提示词中要求模型在得出结论之前制定自己的解决方案,这样引导模型经历完整的问题解决过程,提高回复的质量。

技巧2:使用内心独白或一系列查询来隐藏模型的推理过程

理论依据:心理学 - 内心独白理论

内心独白理论是心理学中研究个体在思考过程中的自我对话现象的理论。 内心独白是个体进行自我指导、反思和问题解决的一种内在语言形式。

内心独白理论的核心观点:

  • 自我指导:内心独白作为自我指导的工具,帮助个体规划行动和解决问题。
  • 情感调节:通过内心独白,个体可以表达和调节自己的情感状态。
  • 认知加工:内心独白反映了个体对信息的认知加工过程,包括分析、综合和评估。
  • 问题解决:内心独白是问题解决过程中的一个组成部分,有助于个体探索和评估不同的解决方案。

在提示词中,使用内心独白或一系列查询来隐藏模型的推理过程,可以模拟人类的思考和自我对话过程,增强生成文本的逻辑性和连贯性,减少偏见和错误,使得模型在处理复杂问题时能够生成更可靠和有深度的回答。

技巧3:询问模型在之前的步骤中是否遗漏了任何内容

理论依据:认知心理学 - 元认知理论

元认知理论是认知心理学中研究个体对自己认知过程的认识和调控的理论。 元认知涉及对自己思维过程的监控、评估和调整,是提高学习和问题解决效率的关键。

元认知理论的核心观点:

  • 自我监控:个体能够监控自己的思考过程,包括注意、理解和记忆。
  • 自我评估:个体能够评估自己的认知活动,判断其有效性和准确性。
  • 自我调节:基于自我监控和评估的结果,个体能够调节自己的认知策略,以适应不同的任务和情境。
  • 元认知知识:个体对自己认知能力和任务要求的认识,有助于选择合适的认知策略。

询问模型是否遗漏了任何内容,利用了元认知的自我监控和反思机制,可以促进模型进行更深入的自我监控和评估,提高模型的准确性和可靠性,确保生成的内容更完整和准确。

----------------------------------

策略五:使用外部工具

----------------------------------

技巧1:使用基于嵌入的搜索实现高效的知识检索

理论依据:机器学习 - 嵌入表示模型

嵌入表示模型是机器学习领域中用于 将实体(如单词、短语、概念等)表示为实数向量的技术。这些向量捕捉了实体之间的语义和结构关系,使得相似的实体在向量空间中彼此接近。

嵌入表示模型的核心观点:

  • 语义相似性:嵌入向量能够反映实体之间的语义相似度,相似的实体具有接近的向量表示。
  • 结构关系:嵌入能够捕捉实体之间的结构关系,例如语法依赖或层次结构。
  • 降维:嵌入通常将高维数据映射到低维空间,同时尽可能保留原始数据的重要特征。
  • 计算效率:嵌入表示可以加速相似性搜索和知识检索任务,因为向量空间的计算比原始数据结构更高效。

在模型中使用基于嵌入的搜索来实现高效的知识检索,可以遵循以下步骤:

  1. 构建嵌入空间:首先,为知识库中的所有实体构建嵌入向量,形成一个嵌入空间。
  2. 索引嵌入向量:使用高效的数据结构(如KD树、球树等)对嵌入向量进行索引,以加速搜索过程。
  3. 相似性查询:当需要检索知识时,将查询实体转换为嵌入向量,并在嵌入空间中搜索与其最相似的实体。
  4. 结果评估与排序:根据相似度度量(如余弦相似度)对搜索结果进行评估和排序,返回最相关的实体。
  5. 迭代优化:根据检索结果的反馈,不断优化嵌入模型和搜索算法,以提高检索的准确性和效率。

嵌入表示模型通过将文本数据转换为低维向量,能够捕捉到文本的语义和上下文信息,实现高效、准确的语义搜索。这种方法不仅提高了检索的准确性和效率,还能够处理跨语言和跨模态的数据,适用于大规模和实时检索任务。

技巧2:使用代码执行来执行更准确的计算或调用外部 API

理论依据:计算机科学 - 程序执行与API调用理论

程序执行与API调用理论是计算机科学中研究如何通过编写和执行代码来完成特定任务,以及如何通过调用外部应用程序编程接口(API)来扩展程序功能的理论。该理论 强调代码的精确性和API的灵活性在实现复杂计算和集成不同系统方面的重要性。

程序执行与API调用理论的核心观点包括:

  • 精确性 :代码能够精确地按照编写者的意图执行计算和逻辑操作。
  • 自动化 :通过代码自动化执行重复性任务,提高效率和减少人为错误。
  • 模块化 :API调用允许程序利用外部系统或服务的功能,实现模块化设计。
  • 集成性 :API提供了不同系统和应用程序之间交互和集成的标准方式。
  • 可扩展性 :通过代码和API,可以轻松扩展程序的功能和处理能力。

通过使用代码执行和API调用,模型能够执行复杂的计算任务,访问和利用外部数据和服务,为用户提供更加丰富和准确的信息。该方法适用于需要精确计算、数据分析、系统集成等场景。

----------------------------------

策略六:系统地测试更改

----------------------------------

技巧1:参考黄金标准答案评估模型输出

理论依据:计算机科学 - 测试与评估理论

测试与评估理论是计算机科学中用于确保软件系统和人工智能模型按照预期工作的理论。 该理论强调通过系统性测试和评估来验证模型的性能,识别潜在的问题,并进行必要的改进。

测试与评估理论的核心观点包括:

  • 验证:通过与黄金标准答案的比较,验证模型输出的正确性。
  • 性能度量:定义和使用各种性能度量指标来评估模型的效率和效果。
  • 系统性测试:设计和执行一系列测试用例,以全面检查模型在不同条件下的表现。
  • 持续改进:基于测试和评估的结果,不断迭代和优化模型。
  • 用户反馈:将用户反馈纳入评估过程,以确保模型满足实际应用需求。

在模型开发和部署过程中,参考黄金标准答案评估模型输出遵循以下步骤:

  1. 定义评估标准:根据应用场景和需求,定义评估模型输出的标准和指标。
  2. 准备黄金标准答案:收集或创建一组准确的黄金标准答案,作为评估的基准。
  3. 执行测试:运行模型并使用相同的输入数据,收集模型的输出结果。
  4. 比较与分析:将模型输出与黄金标准答案进行比较,分析差异和一致性。
  5. 性能评估:根据预定义的性能度量指标,评估模型的整体性能。
  6. 问题诊断:识别模型输出中的偏差和错误,诊断可能的原因。
  7. 模型优化:根据评估结果,调整模型参数或算法,以提高准确性和性能。
  8. 用户测试:在实际用户环境中测试模型,收集用户反馈,并进一步评估模型的实用性和用户满意度。

通过参考黄金标准答案评估模型输出,可以确保模型提供高质量的结果,并在实际应用中满足用户的期望。该方法适用于各种需要精确输出验证的场景,如自然语言处理、图像识别、数据分析等。

----------------------------------

最后想说

----------------------------------

人工神经网络的根基奠定:心理学家沃伦·麦卡洛克向数理逻辑学家沃尔特·皮茨解释,他正在试图建立一个大脑模型,然后1943年两人在合作的《A logical calculus of the ideas immanent in nervous activity》论文中提出并给出了 人工神经网络 的概念及人工 神经元 的数学模型,从而开创了人工神经网络研究的时代。

你看,心理学家发起 神经网络的研究 ,神经网络是模拟人脑的,人脑的意识和潜意识又是心理学研究的,提示词的优化底层思路是不是也要回归心理学呢?

南瓜博士说“不想当心理学家的软件工程师不是好的 AI 训练师”,心理学或许可以帮你训练出更满意的AI。