Skip to content

Agent 基础速查

快速查阅 Agent 等级、推理模式选择和记忆架构决策。


一、Agent 等级速查(L0-L5)

等级名称核心特征典型场景
L0传统软件确定性逻辑,输入 A 必然输出 Bif-else、规则引擎
L1Prompt + Tool单次调用 + 工具调用,无自主循环翻译、总结、简单问答
L2ReAct Agent思考 → 行动 → 观察,自主循环信息检索、简单任务执行
L3Planning Agent任务分解、依赖管理、多步骤执行研究报告、复杂数据分析
L4Reflection Agent自我评估、反馈循环、迭代改进代码审查、高质量内容生成
L5Multi-Agent多 Agent 协作、分工、编排战略分析、端到端项目

判断该用哪一级


二、推理模式速查

什么时候用 ReAct vs Planning vs Reflection?

维度ReActPlanningReflection
核心机制思考→行动→观察 循环任务分解→排序→执行生成→评估→反馈→改进
适合任务探索性、步骤不确定的任务复杂、多步骤、依赖关系明确的任务需要高质量输出、有明确评估标准的任务
优势灵活、可纠正、可追溯结构清晰、可并行、可追踪提高下限、减少明显错误
劣势可能陷入死循环分解粒度难把握成本翻倍、不保证改进
典型场景信息检索、故障排查研究报告、数据处理流水线代码生成、文档撰写

ReAct 详解

要素说明
循环结构Reason(思考)→ Act(行动)→ Observe(观察)→ 循环
解决的问题信息过时(可以去查)、无法验证(做完再检查)、无法追溯(每步有记录)
关键约束需要预算上限、终止条件、验收机制(否则可能死循环)
生产底线ReAct 不是正确保证,预算 + 终止 + 验收才是真正的底线

Planning 详解

要素说明
三个核心问题① 如何分解?② 如何执行(并行/串行)?③ 何时停止?
最容易忽视第三个问题——不知道什么时候该停,导致无限循环
分解原则能画出流程图 → 用工作流;画不出来 → 考虑多 Agent
执行策略有依赖 → 串行;无依赖 → 并行;混合 → DAG

Reflection 详解

要素说明
核心组件质量评估 → 反馈生成 → 带反馈重生成
适用场景高价值输出、可客观评估的任务、迭代改进
本质锦上添花,不是核心依赖——不能让烂回答变好
成本约 2 倍调用成本(生成 + 评估 + 可能的重生成)

三、记忆架构选择速查

记忆类型对比

类型时间跨度存储方式适用场景选择标准
工作记忆秒-分钟级上下文窗口正在处理的任务所有 Agent 必需
会话记忆分钟-小时级Redis 缓存单次对话历史需要多轮交互的场景
长期记忆天-月级PostgreSQL用户偏好、成功模式需要跨会话个性化
语义记忆永久向量数据库相关历史问答、知识库需要语义相似度检索

记忆架构选择决策

三层存储架构

存储职责典型数据
PostgreSQLACID 事务数据执行历史、审计日志、用户偏好
Redis热数据缓存(毫秒级)活跃会话、Token 预算、速率限制
Qdrant向量相似度搜索语义记忆、压缩摘要、文档分块

另一种选择:本地文件存储

方案优势劣势适合谁
本地文件(CLAUDE.md 等)零部署、Git 友好、隐私语义检索弱、多设备同步难单机开发者工具
服务器端存储多租户、语义检索强需要部署、数据在云端企业级多租户应用

四、Agent 四大核心组件速查

Agent = 大脑 + 手脚 + 记忆 + 主见
       (LLM)  (Tools) (Memory) (Autonomy)
组件职责没有会怎样
大脑 (LLM)思考,决定下一步没有智能,只是死板脚本
手脚 (Tools)执行,搜索/读写/调用 API只能聊天,不能做事
记忆 (Memory)记住之前发生了什么每次从零开始,效率极低
主见 (Autonomy)自己做决定只是 Chatbot,不是 Agent

生产环境的第五层:护栏(Guardrails)

护栏类型说明
预算Token 消耗上限
权限操作范围限制
审批关键操作需要人工确认
审计全过程可追溯
沙箱隔离执行环境

五、Agent 与传统软件对比

维度传统软件Agent
确定性确定性:给定输入 A,必然产出 B概率性:给定输入 A,可能产出 B 或 C
灵活性低——按固定逻辑执行高——能自主调整策略
可预测性低(每次运行路径可能不同)
调试方式调试代码调试环境——"环境里缺了什么导致 Agent 犯错?"
错误来源代码 bug环境缺失(工具、上下文、约束)

六、Chain-of-Thought 速查

CoT 类型做法适用场景
Zero-shot CoTPrompt 中加"Let's think step by step"简单推理任务
Few-shot CoT提供推理示例需要特定推理模式
Tree-of-Thoughts多条推理路径并行探索复杂决策、需要多视角

七、常见问题速查

问题原因解法
Agent 死循环没有终止条件设置最大轮次 + Token 预算上限
Agent 偏离目标目标漂移用文件记录计划,定期读回检查
Agent 调用错误工具工具设计不匹配模型能力Seeing Like an Agent,简化工具接口
输出质量不稳定LLM 概率性引入 Reflection 模式
长对话质量下降上下文腐烂上下文工程(卸载/缩减/隔离)

基于 CC BY-SA 4.0 协议发布