定义
Agentic Systems(智能体系统)是指能够通过传感器感知环境,并自主地通过执行器采取行动以达成特定目标的 AI 系统。其核心闭环为:感知 → 思考 → 行动 → 观察 → 循环。
四个基本要素
- 环境(Environment):智能体所处的外部世界(如网页、API、文件系统)
- 感知(Sensors):API 返回的数据流、文件内容、用户输入等
- 行动(Action):通过执行器对环境施加影响(工具调用、代码执行)
- 自主性(Autonomy):基于感知和内部状态独立决策,而非被动响应
智能体的分类演进
按内部决策架构(经典分类)
| 类型 | 核心机制 | 经典案例 |
|---|---|---|
| 简单反射智能体 | 条件-动作规则 | 自动恒温器 |
| 基于模型的反射智能体 | 内部世界模型 + 状态追踪 | 自动驾驶汽车 |
| 基于目标的智能体 | 主动规划达成未来状态 | GPS 导航 |
| 基于效用的智能体 | 最大化期望效用 | 多目标权衡系统 |
| 学习型智能体 | 从互动中自主学习 | AlphaGo Zero |
按时间与反应性
- 反应式:即时响应,速度快但短视(如高频交易机器人)
- 规划式:行动前深思熟虑,有远见但耗时(如下棋)
- 混合式:结合两者优势,底层快速反应 + 高层审慎规划
Workflow vs Agent
| 维度 | Workflow | Agent |
|---|---|---|
| 本质 | 预设流程 | 自主决策 |
| 优势 | 可预测、可靠 | 灵活、适应性强 |
| 局限 | 僵硬、无法应对异常 | 有幻觉风险 |
| 适合场景 | 规则明确、高合规要求 | 复杂多变、需要判断 |
最佳实践:Workflow 作为骨架保证确定流程,Agent 在关键决策节点提供灵活判断。
现代 LLM 驱动架构
核心组件
感知模块 → 规划模块(LLM) ↔ 记忆模块
↑ ↓
└──────── 工具模块 ← 执行模块
- 感知模块:接收环境输入,将原始数据转为 LLM 可读的自然语言观察
- 规划模块(LLM 中枢):任务分解、推理决策、工具选择
- 记忆模块:工作记忆 + 情景记忆 + 语义记忆(详见 Agent_Memory)
- 工具模块:外部 API、搜索、代码执行等
- 执行模块:解析 LLM 输出并调用工具
Thought-Action-Observation 协议
规范 LLM 与环境信息交换的格式:
- Thought:内部决策快照,分析情境、自我反思
- Action:具体操作,以函数调用形式表示
- Observation:行动结果的封装反馈
与传统智能体的本质区别
| 维度 | 传统智能体 | LLM 驱动智能体 |
|---|---|---|
| 核心引擎 | 显式编程与规则库 | 预训练神经网络 |
| 行为模式 | 确定且有边界 | 灵活、通用 |
| 知识来源 | 工程师设计 | 隐式世界模型与涌现能力 |
| 指令处理 | 需结构化输入 | 自然语言指令 |
智能体发展史(三大思潮)
符号主义(Newell, Simon, Minsky):智能源于对符号的逻辑操作。催生专家系统、SHRDLU。根本局限:知识获取瓶颈、框架问题、系统脆弱性。
联结主义(Hinton):知识以连接权重分布式存储在神经网络中。深度学习的成功赋予智能体强大的感知和模式识别能力。
行为主义/强化学习:通过互动和试错学习最优策略。从 TD-Gammon 到 AlphaGo。
现代融合:LLM 本身是联结主义产物,却成为执行符号推理的核心”大脑”,形成神经-符号结合的现代智能体架构。
协作模式
- 单智能体自主循环:AgentGPT 模式,通过”思考-规划-执行-反思”闭环自我迭代
- 多智能体协作:角色扮演式(CAMEL)、组织化工作流(MetaGPT/CrewAI)、灵活对话(AutoGen/AgentScope)
- 群体智能仿真:MiroFish 通过数千个独立 Agent 的社会演化推演未来,是 Agent 系统在预测仿真领域的独特应用
- 高级控制流:LangGraph 状态图建模
核心能力
- 自主规划:分解复杂目标为可执行子任务
- 工具使用:调用外部 API、搜索、代码执行等
- 状态管理:在多次交互中维护上下文和进度
- 自我评估:监控执行过程并在必要时调整策略
三大经典范式
详见 Agent_Paradigms,包括 ReAct(边想边做)、Plan-and-Solve(先想后做)、Reflection(做完反思)。
关键局限
- 幻觉问题、无限循环风险、评估难题
- 对 LLM 自身能力的高度依赖
- 提示词脆弱性
关联连接
- Agent_Paradigms — 三种经典 Agent 范式
- Agent_Memory — 四层记忆架构
- Agent_Communication_Protocols — MCP/A2A/ANP 协议
- Agentic_RL — 智能体强化学习
- ReAct — 推理与行动范式
- Context_Engineering — 上下文工程
- RAG — 检索增强生成
- 摘要-hello-agents — Datawhale 智能体教程来源
- Datawhale — Datawhale 社区
- MiroFish — 群体智能预测仿真引擎(多智能体预测应用)