哪些模块值得先看,哪些别急着平均用力
- 来源:https://datawhalechina.github.io/hello-agents/
- 参考仓库:https://github.com/datawhalechina/hello-agents
我的先后顺序很明确
如果我不是为了“看完教程”,而是为了尽快建立能落地的 Agent 判断 ,我不会对 HelloAgents 里每个模块平均用力。
我会按这个顺序投入精力:
- 工具调用
- 上下文工程
- 记忆
- 评估
- 协议、多智能体、综合案例
这不是因为后面的内容不重要,而是因为前面的东西更直接决定“你做出来的到底像不像一个真正能工作的 Agent”。
第一优先级:工具调用
工具调用是我最先想啃的部分,因为它最直接决定 Agent 和“会聊天的模型”之间的边界。
如果一个学习者还说不清这些问题,我会默认他对 Agent 的理解还停留在表面:
- 模型为什么不能只靠 prompt 做完所有事
- 工具调用的输入输出怎么进入下一轮决策
- 一个工具设计得太大、太杂时会带来什么问题
这部分学明白之后,你才会开始真正理解:Agent 不是“会思考”,而是“能把外部能力组织进闭环”。
第二优先级:上下文工程
很多人会先被记忆吸引,但我反而更愿意先补上下文工程。
原因很现实:大多数 Agent 不是先死在“记不住”,而是先死在“每一轮给模型喂了什么、没喂什么、顺序对不对”。
如果上下文组织不对,工具再多、记忆再长,模型也可能一直在错的问题上 发力。
所以我会优先逼自己搞清:
- 系统提示词、对话历史、工具结果分别占什么位置
- 哪些信息应该每轮都给,哪些应该按需加载
- 为什么上下文越长不一定越好
第三优先级:记忆
记忆值得学,但不值得比上下文更早学。
因为记忆不是“把更多内容塞进模型”,而是决定哪些历史经验要跨轮、跨任务留下来,以及以后怎么取出来。
如果前面两层没稳住,记忆通常只会把混乱放大:
- 工具结果本来就没组织好,再加记忆只会更乱
- 当前轮最重要的信息都没选清,长时记忆只会继续稀释焦点
我更愿意把记忆放在“你已经能做一个能跑的基本闭环之后”再深入。
第四优先级:评估
评估的重要性没有问题,但它不适合在一开始吃最多精力。
原因很简单:评估最有用的时候,是你已经有一个能重复执行、能比较前后差异的 Agent 雏形。
如果现在还在“这个系统到底怎么跑”的阶段,过早投入评估,往往只会得到一堆好看的指标词,而不会带来真正的改进动作。
我会把它放在前面三层之后,再问两个更实际的问题:
- 我到底在评什么失败模式
- 评估结果会驱动我改 prompt、改工具、改上下文,还是改记 忆策略
最后再碰协议、多智能体和综合案例
这些内容不是不值钱,而是它们更依赖前面的基本盘。
如果工具、上下文、记忆这三件事还没建立清楚,多智能体和协议内容很容易只剩名词感。你会知道 MCP、A2A、协作这些词,但很难判断它们到底在解决哪一层问题。
如果现在只能挑两块
如果我时间很紧,只能从 HelloAgents 里先挑两块,我会选:
- 工具调用
- 上下文工程
因为这两块最直接决定一个 Agent 的最小工作质量。
记忆和评估当然也关键,但它们更像“把系统做稳、做长、做可比较”的能力;工具和上下文则更像“先让系统别一上来就偏掉”的能力。