跳转到内容

1.课程简介


欢迎来到这门针对开发者的 AIGPT 提示工程课程。我很高兴能够与 Isa Fulford 一起授课。她是 OpenAI 的技术团队成员,她开发了流行的 AIGPT 检索插件,同时也教授人们如何在产品中使用 LLM 或大型语言模型技术,也为 OpenAI 食谱做出贡献。我很高兴能和她一起授课。同时我也很高兴在这里与大家分享一些提示最佳实践

实际上,关于提示已经有了很多互联网上的材料,例如“30 个人人都必须知道的提示”。很多焦点都放在了 AIGPT 的 Web 版界面上,这使得很多人只用于完成特定的任务,而且经常是一次性的。但我认为,LLM 大型语言模型作为一名开发人员的强大之处在于使用 API 调用 LLM 快速构建软件应用程序。

实际上,AI Fund 在我的团队与 DeepLearning.AI 的姊妹公司合作,为很多创业公司应用这些技术到许多不同的应用领域,看到 LLM API 可以使开发人员非常快速地构建应用程序实属令人兴奋。因此,在这门课程中,我们将与您分享一些您可以做到什么的可能性,以及如何最佳实践地完成这些任务。有很多要涵盖的内容。

首先,你将学习一些软件开发最佳实践的提示。然后,我们将涵盖一些常见的用例,包括总结、推理、转换和扩展。接着,你将使用 LLM 构建一个聊天机器人。我们希望这会激发你的想象力,并能够创建出新的应用程序。在大型语言模型或 LLM 的开发中,大体上有两种类型的 LLM,我将其称为基础 LLM 和指令调整后的 LLM。

因此,基础 LLM 已经训练出来根据文本训练数据预测下一个单词。通常是在互联网和其他来源的大量数据上进行训练,以找出接下来最有可能的单词。例如,如果你提示“一次有一个独角兽”,它可能会继续完整这个句子,预测出接下来的几个单词是“和所有的独角兽朋友生活在一个神奇的森林里”。但如果你提示“法国的首都是什么”,那么 LLM 可能会给出正确的回答“巴黎”,或者可能会给出错误的回答。训练后的 LLM 可以接收新的提示作为输入,并输出预测结果。

基于互联网上的文章,基础 LLM 有可能会回答法国的最大城市是什么,法国的人口是多少等等。因为互联网上的文章很可能是关于法国的问答列表。相比之下,指令调整后的 LLM 更接受人们的指令。因此,如果你问它法国的首都是什么,它很可能会输出法国的首都是巴黎。指令调整后的 LLM 的研究和实践的动量更大。

因此,指令调整后的 LLM 通常是这样训练的:首先,你从大量文本数据中训练出一个基础 LLM,随后使用指令和良好尝试的输入和输出来对其进行微调和优化,然后通常使用称为“人类反馈强化学习”的技术进行进一步细化,以使系统更能够有帮助且能够遵循指令。因为指令调整后的 LLM 被训练成有用、诚实和无害的,所以它们输出有害文本(如毒性输出)的可能性比基础 LLM 更小。很多实际的应用场景已开始向指令调整后的 LLM 转移,而一些在互联网上查到的最佳实践则可能更适用于基础 LLM。

对于大多数今天的实际应用,我们建议大多数人应该专注于经过调整的指令语言模型。这些模型更易于使用,而且由于 OpenAI 和其他 LLM 公司的工作,它们变得更加安全和更加符合要求。因此,本课程将专注于经过调整的指令语言模型的最佳实践,这是我们建议大多数应用程序使用的模型。在继续之前,我只想感谢 OpenAI 和 DeepLearning.ai 团队为我们提供的材料做出的贡献。我非常感谢 OpenAI 的 Andrew Main、Joe Palermo、Boris Power、Ted Sanders 和 Lillian Weng。他们与我们一起进行了头脑风暴,对材料进行了审核,为这个短期课程的课程设置拼凑了课程计划。我也感谢深度学习方面 Geoff Ladwig、Eddy Shyu 和 Tommy Nelson 的工作。

因此,当您使用经过调整的指令语言模型时,请考虑给另一个人指示。比如说一个聪明但不了解任务细节的人。那么当 LLMs 不能工作时,有时是因为指令不够清晰。例如,如果您要说,请为我写一些关于艾伦·图灵的东西。除此之外,明确您希望文本集中讨论他的科学工作、个人生活、在历史中的角色或其他相关事项可能会有所帮助。

如果您指定文本要呈现的语气,它应该采用类似专业新闻记者所写的语气呢?还是更像一封简短的随笔,希望 LLMs 生成您所要求的内容?当然,如果你想象自己要求一个刚拿到大学毕业证的人为你执行这个任务,你甚至可以提前指定他们应该阅读哪几段文本以撰写关于艾伦·图灵的文本,这会进一步为他们成功执行您的此项任务做好准备。在下一个视频中,您将看到如何清晰明确、具体,这是提示 LLMs 的一个重要原则。您还将学习第二个提示原则:给 LLMs 时间思考。所以,让我们继续下一个视频。