AI Agent Design Patterns: Single, Sequential & Parallel

一、为什么要有“设计模式”这回事？

做 AI 应用，大家最开始都会直接丢一段话给大模型，让它帮你干活。但当任务变复杂了，你就会发现这条路越走越难—— 模型有时候按你说的做，有时候又不按套路出牌。

这就像你雇了一个聪明但有点随性的员工：能力很强，但你没法保证他每次都按流程来。

设计模式解决的正是这个问题：怎么把 AI 智能体组织起来，让它既能干复杂的活，又能按你预期的方式运转。

Google 近期发布了一个叫做AI agent design patterns 的小教程视频系列，就是手把手教你搭这套“组织架构”。

最简单的方式，就是只用一个 AI 智能体搞定所有事。你给它配上工具（比如搜索功能），再写一段说明告诉它该怎么干，剩下的就交给它自己判断。

视频里举的例子是“帮我规划一次旧金山旅行”。这个智能体拿到任务后，会自己决定先搜什么、再搜什么，然后把信息整合成一份计划。代码非常简单，几行就搞定，上手门槛极低。

但问题来了：如果任务变复杂，比如“帮我找一家深夜还在营业的寿司店，同时告诉我最快怎么到”，这就要求智能体同时处理好几件相互关联的事。你只能把所有逻辑都塞进那段说明文字里，结果那段文字越写越长、越写越乱。

更麻烦的是，AI 本质上是“不确定”的——同样的指令，它今天可能严格执行，明天可能就绕弯子走了。你越依赖它自己判断，就越没办法控制它。

一句话总结：简单任务用它很爽，复杂任务靠它不住。

为了解决“管不住”的问题，我们可以把一个大任务拆成几个小任务，每个小任务交给一个专职智能体，然后规定好谁先干、谁后干，一棒接一棒地传下去。

还是旅行的例子，这次拆成两步：第一个智能体专门找餐厅，第二个智能体专门规划交通。系统会强制保证：餐厅找完了，交通规划才开始。这样你就不用担心顺序乱掉了。

那两个智能体之间怎么“交接”信息呢？视频里介绍了一个叫共享会话状态的机制，你可以把它理解成一块两个人都能看到的白板。第一个智能体把找到的餐厅信息写上去，第二个智能体来了直接读，然后继续干自己的活。简单、直接、有效。

这个模式的好处是执行过程非常可预测，出了问题也容易定位——反正就是一步一步来，哪步出错查哪步。坏处是太死板了，流程一旦定好就不能变。如果情况有变化、需要临时调整，这套流水线就傻眼了。

一句话总结：流程固定的任务，用它又稳又可靠；需要灵活应变的场景，它就力不从心了。

有时候几件事之间根本没有先后关系，完全可以同时做。这时候让它们排队一个一个来，就是纯粹的浪费时间。

视频里的例子：规划一次完整的出行，需要找博物馆、找演唱会、找餐厅。这三件事互不影响，完全可以三个智能体同时出发去搜索，谁先搜完谁先回来汇报，不用等别人。比起一件一件排队做，速度能快好几倍。

当然，三个人同时去找信息，最后还得有人把结果汇总成一份完整的计划。视频给出的方案是并行 + 顺序组合：先让三个智能体同时搜索（并行），搜完之后再交给第四个汇总智能体，把所有结果整理成一份旅行计划（顺序）。两种模式取长补短，配合使用。

这个模式的好处是速度快、效率高，特别适合可以拆开独立执行的任务。坏处是同时跑多个智能体，消耗的算力和费用也成倍增加，而且最后的汇总环节需要额外设计，整体复杂度比前两种都高。

一句话总结：任务能拆开、对速度有要求的场景，首选这个；但要做好多花钱、多花心思的准备。

这三种模式不是谁比谁好，而是各有各的用武之地。

很多实际项目里，这三种模式会混合使用——比如视频里展示的“并行搜索 + 顺序汇总”，就是把两种模式的优点结合在一起。真正的系统设计，往往就是在这几种基础模式上拼搭组合。

这一集打好了地基，下一集要盖更复杂的楼层。预告中提到了三个进阶模式：

这三种模式代表了从“按脚本执行”到“自主决策”的跨越，是构建真正复杂 AI 系统绕不开的核心能力。