跳到主要内容

哪些模块值得先看,哪些别急着平均用力

我的先后顺序很明确

如果我不是为了“看完教程”,而是为了尽快建立能落地的 Agent 判断,我不会对 HelloAgents 里每个模块平均用力。

我会按这个顺序投入精力:

  1. 工具调用
  2. 上下文工程
  3. 记忆
  4. 评估
  5. 协议、多智能体、综合案例

这不是因为后面的内容不重要,而是因为前面的东西更直接决定“你做出来的到底像不像一个真正能工作的 Agent”。

第一优先级:工具调用

工具调用是我最先想啃的部分,因为它最直接决定 Agent 和“会聊天的模型”之间的边界。

如果一个学习者还说不清这些问题,我会默认他对 Agent 的理解还停留在表面:

  • 模型为什么不能只靠 prompt 做完所有事
  • 工具调用的输入输出怎么进入下一轮决策
  • 一个工具设计得太大、太杂时会带来什么问题

这部分学明白之后,你才会开始真正理解:Agent 不是“会思考”,而是“能把外部能力组织进闭环”。

第二优先级:上下文工程

很多人会先被记忆吸引,但我反而更愿意先补上下文工程。

原因很现实:大多数 Agent 不是先死在“记不住”,而是先死在“每一轮给模型喂了什么、没喂什么、顺序对不对”。

如果上下文组织不对,工具再多、记忆再长,模型也可能一直在错的问题上发力。

所以我会优先逼自己搞清:

  • 系统提示词、对话历史、工具结果分别占什么位置
  • 哪些信息应该每轮都给,哪些应该按需加载
  • 为什么上下文越长不一定越好

第三优先级:记忆

记忆值得学,但不值得比上下文更早学。

因为记忆不是“把更多内容塞进模型”,而是决定哪些历史经验要跨轮、跨任务留下来,以及以后怎么取出来。

如果前面两层没稳住,记忆通常只会把混乱放大:

  • 工具结果本来就没组织好,再加记忆只会更乱
  • 当前轮最重要的信息都没选清,长时记忆只会继续稀释焦点

我更愿意把记忆放在“你已经能做一个能跑的基本闭环之后”再深入。

第四优先级:评估

评估的重要性没有问题,但它不适合在一开始吃最多精力。

原因很简单:评估最有用的时候,是你已经有一个能重复执行、能比较前后差异的 Agent 雏形。

如果现在还在“这个系统到底怎么跑”的阶段,过早投入评估,往往只会得到一堆好看的指标词,而不会带来真正的改进动作。

我会把它放在前面三层之后,再问两个更实际的问题:

  • 我到底在评什么失败模式
  • 评估结果会驱动我改 prompt、改工具、改上下文,还是改记忆策略

最后再碰协议、多智能体和综合案例

这些内容不是不值钱,而是它们更依赖前面的基本盘。

如果工具、上下文、记忆这三件事还没建立清楚,多智能体和协议内容很容易只剩名词感。你会知道 MCP、A2A、协作这些词,但很难判断它们到底在解决哪一层问题。

如果现在只能挑两块

如果我时间很紧,只能从 HelloAgents 里先挑两块,我会选:

  • 工具调用
  • 上下文工程

因为这两块最直接决定一个 Agent 的最小工作质量。

记忆和评估当然也关键,但它们更像“把系统做稳、做长、做可比较”的能力;工具和上下文则更像“先让系统别一上来就偏掉”的能力。