本章节主要介绍了 Will Lee 开发的三个 bot,分别是信息检索 bot doctor no、AI 推理游戏卧底和知识助理 MVP。其中 doctor no 是一个极简版的 perplexity,可以通过谷歌搜索和大语言模型进行信息检索和总结;卧底是一个多议程模式的 bot,用于测试 AI 是否能骗过人类玩家;知识助理 MVP 则是一个产品 MVP,特色功能是可以实现 cos 与 notion 的连接,将网页上的信息存入 notion。
本章节主要介绍了 auto GPT 这个现象级的开源项目。Will Lee 认为 auto GPT 值得关注和欣赏,因为它具有实验精神,推动了 AI 可能性的边界。auto GPT 是一个实验性项目,旨在探索基于 GPT 4 的通用 agent 的能力边界。视频演示了 auto GPT 的交互方式,用户输入一个 GPT 的名字、目标数据,它会自动规划、自动调工,完成任务。Will Lee 还提出了在 auto GBD 项目中,workflow 在哪里的问题。
本章节主要讲述了不要过度迷信 AGI 中的“g”,并介绍了 Mana hugging face 和 auto GBG 团队的测试集。通过该测试集可以看出,人和大洋模型在表现上存在很大的差异。同时,还介绍了一个关于任务完成情况的对比测试,发现人类与其他方式相比存在较大差异,并且在选择和使用工具方面具有明显优势。最后,提出了几个值得思考的问题,如任务的多模态性等。
本章节主要介绍了从提示词工程到 flow 工程的相关研究。首先,Will Lee 提到了 Codem 团队的测试集,该测试集比 open i 的 human evaluate 测试集题目稍难一些,并且使用了尽可能多的流程来完成编程任务。其次,他介绍了该研究的结果,结果表明通过长流程去完成复杂的任务可以有很大的提升,而且这种提升不受模型本身能力的影响。最后,他还提到了 Devin 的测试集,该测试集直接模拟了实际程序员的工作场景。
本章节主要介绍了 workflow 的相关内容。Will Lee 提到了 Devin,并解释了最近丹阳开始关注 workflow 的原因,即吴恩达老师在 Twitter 上建议大家关注 workflow。Will Lee 认为 workflow 是符合时代的技术或概念,并分享了吴恩达老师在官网上的 workflow 设计模式。他还介绍了 reflection 和 TOOLS 两种可靠的设计模式,以及 planning 和 mount agent 两种不太稳定的设计模式,并强调具体实现方式会影响稳定性。最后,Will Lee 通过两个案例演示了 workflow 和 mountain agent flow 的具体形式。
01:04:22 Doc No 与 Open i GTS 对比,聚焦基于大人模型的 Agent 文案
本章节主要介绍了基于单 agent 的 bot——doc no。doc no 与 open i 的 GTS 相比,多了 Workflow or money agent flow。它可以根据用户输入的信息进行搜索并给出回答,其核心是 workflow,主要负责搜索和回答,并且可以调用各种插件辅助工作。
此外,doc no 中还有 code 节点,可以进行数据格式转换,方便后续单元模型处理。最后,doc no 会将格式化后的信息和用户语言偏好等参数传入大洋洋模型节点,生成回答。
本章节主要讨论了 m 大老师分享内容的答疑、工作流的使用场景、语言模型的进化是否会减少对工作流的依赖、当前模型的能力上限和在实际应用中的稳定性问题、在复杂场景下如何调用多个 bot 或工作流的问题、扣子的商业化问题以及 AI 技术在不同领域的应用。其中,重点探讨了工作流的使用场景、语言模型的进化是否会减少对工作流的依赖、当前模型的能力上限和在实际应用中的稳定性问题、在复杂场景下如何调用多个 bot 或工作流的问题以及扣子的商业化问题。