一、为什么要有“设计模式”这回事?
做 AI 应用,大家最开始都会直接丢一段话给大模型,让它帮你干活。但当任务变复杂了,你就会发现这条路越走越难—— 模型有时候按你说的做,有时候又不按套路出牌。
这就像你雇了一个聪明但有点随性的员工:能力很强,但你没法保证他每次都按流程来。
设计模式解决的正是这个问题:怎么把 AI 智能体组织起来,让它既能干复杂的活,又能按你预期的方式运转。
Google 近期发布了一个叫做AI agent design patterns 的小教程视频系列,就是手把手教你搭这套“组织架构”。
二、单智能体:一个全能选手
最简单的方式,就是只用一个 AI 智能体搞定所有事。你给它配上工具(比如搜索功能),再写一段说明告诉它该怎么干,剩下的就交给它自己判断。
视频里举的例子是“帮我规划一次旧金山旅行”。这个智能体拿到任务后,会自己决定先搜什么、再搜什么,然后把信息整合成一份计划。代码非常简单,几行就搞定,上手门槛极低。
但问题来了:如果任务变复杂,比如“帮我找一家深夜还在营业的寿司店,同时告诉我最快怎么到”,这就要求智能体同时处理好几件相互关联的事。你只能把所有逻辑都塞进那段说明文字里,结果那段文字越写越长、越写越乱。
更麻烦的是,AI 本质上是“不确定”的——同样的指令,它今天可能严格执行,明天可能就绕弯子走了。你越依赖它自己判断,就越没办法控制它。
一句话总结:简单任务用它很爽,复杂任务靠它不住。

三、顺序智能体:流水线作业
为了解决“管不住”的问题,我们可以把一个大任务拆成几个小任务,每个小任务交给一个专职智能体,然后规定好谁先干、谁后干,一棒接一棒地传下去。
还是旅行的例子,这次拆成两步:第一个智能体专门找餐厅,第二个智能体专门规划交通。系统会强制保证:餐厅找完了,交通规划才开始。这样你就不用担心顺序乱掉了。
那两个智能体之间怎么“交接”信息呢?视频里介绍了一个叫共享会话状态的机制,你可以把它理解成一块两个人都能看到的白板。第一个智能体把找到的餐厅信息写上去,第二个智能体来了直接读,然后继续干自己的活。简单、直接、有效。
这个模式的好处是执行过程非常可预测,出了问题也容易定位——反正就是一步一步来,哪步出错查哪步。坏处是太死板了,流程一旦定好就不能变。如果情况有变化、需要临时调整,这套流水线就傻眼了。
一句话总结:流程固定的任务,用它又稳又可靠;需要灵活应变的场景,它就力不从心了。

四、并行智能体:多线程同时开工
有时候几件事之间根本没有先后关系,完全可以同时做。这时候让它们排队一个一个来,就是纯粹的浪费时间。
视频里的例子:规划一次完整的出行,需要找博物馆、找演唱会、找餐厅。这三件事互不影响,完全可以三个智能体同时出发去搜索,谁先搜完谁先回来汇报,不用等别人。比起一件一件排队做,速度能快好几倍。
当然,三个人同时去找信息,最后还得有人把结果汇总成一份完整的计划。视频给出的方案是并行 + 顺序组合:先让三个智能体同时搜索(并行),搜完之后再交给第四个汇总智能体,把所有结果整理成一份旅行计划(顺序)。两种模式取长补短,配合使用。
这个模式的好处是速度快、效率高,特别适合可以拆开独立执行的任务。坏处是同时跑多个智能体,消耗的算力和费用也成倍增加,而且最后的汇总环节需要额外设计,整体复杂度比前两种都高。
一句话总结:任务能拆开、对速度有要求的场景,首选这个;但要做好多花钱、多花心思的准备。

五、三种模式怎么选?
这三种模式不是谁比谁好,而是各有各的用武之地。
- 任务简单、快速验证想法,就用单智能体,省时省力。
- 任务步骤固定、前后有依赖、需要稳定可靠,就用顺序智能体,像流水线一样踏实。
- 任务可以拆成多个独立部分、对响应速度有要求,就用并行智能体,多线程提速。
很多实际项目里,这三种模式会混合使用——比如视频里展示的“并行搜索 + 顺序汇总”,就是把两种模式的优点结合在一起。真正的系统设计,往往就是在这几种基础模式上拼搭组合。

六、下一集会讲什么?
这一集打好了地基,下一集要盖更复杂的楼层。预告中提到了三个进阶模式:
- 循环与评审模式:让智能体能反复检查自己的输出,发现问题就重来,直到满意为止,适合对质量要求高的场景。
- 编排者模式:引入一个“总调度”智能体,根据实际情况动态决定派哪个智能体去干活,不再是固定流程,而是真正的灵活调度。
- 智能体作为工具:把一个完整的智能体打包成另一个智能体可以直接调用的工具,就像函数调用一样,实现更深层的模块化复用。
这三种模式代表了从“按脚本执行”到“自主决策”的跨越,是构建真正复杂 AI 系统绕不开的核心能力。