定义

Agentic Systems(智能体系统)是指能够通过传感器感知环境,并自主地通过执行器采取行动以达成特定目标的 AI 系统。其核心闭环为:感知 → 思考 → 行动 → 观察 → 循环

四个基本要素

  • 环境(Environment):智能体所处的外部世界(如网页、API、文件系统)
  • 感知(Sensors):API 返回的数据流、文件内容、用户输入等
  • 行动(Action):通过执行器对环境施加影响(工具调用、代码执行)
  • 自主性(Autonomy):基于感知和内部状态独立决策,而非被动响应

智能体的分类演进

按内部决策架构(经典分类)

类型核心机制经典案例
简单反射智能体条件-动作规则自动恒温器
基于模型的反射智能体内部世界模型 + 状态追踪自动驾驶汽车
基于目标的智能体主动规划达成未来状态GPS 导航
基于效用的智能体最大化期望效用多目标权衡系统
学习型智能体从互动中自主学习AlphaGo Zero

按时间与反应性

  • 反应式:即时响应,速度快但短视(如高频交易机器人)
  • 规划式:行动前深思熟虑,有远见但耗时(如下棋)
  • 混合式:结合两者优势,底层快速反应 + 高层审慎规划

Workflow vs Agent

维度WorkflowAgent
本质预设流程自主决策
优势可预测、可靠灵活、适应性强
局限僵硬、无法应对异常有幻觉风险
适合场景规则明确、高合规要求复杂多变、需要判断

最佳实践:Workflow 作为骨架保证确定流程,Agent 在关键决策节点提供灵活判断。

现代 LLM 驱动架构

核心组件

感知模块 → 规划模块(LLM) ↔ 记忆模块
    ↑                        ↓
    └──────── 工具模块 ← 执行模块
  • 感知模块:接收环境输入,将原始数据转为 LLM 可读的自然语言观察
  • 规划模块(LLM 中枢):任务分解、推理决策、工具选择
  • 记忆模块:工作记忆 + 情景记忆 + 语义记忆(详见 Agent_Memory
  • 工具模块:外部 API、搜索、代码执行等
  • 执行模块:解析 LLM 输出并调用工具

Thought-Action-Observation 协议

规范 LLM 与环境信息交换的格式:

  • Thought:内部决策快照,分析情境、自我反思
  • Action:具体操作,以函数调用形式表示
  • Observation:行动结果的封装反馈

与传统智能体的本质区别

维度传统智能体LLM 驱动智能体
核心引擎显式编程与规则库预训练神经网络
行为模式确定且有边界灵活、通用
知识来源工程师设计隐式世界模型与涌现能力
指令处理需结构化输入自然语言指令

智能体发展史(三大思潮)

符号主义(Newell, Simon, Minsky):智能源于对符号的逻辑操作。催生专家系统、SHRDLU。根本局限:知识获取瓶颈、框架问题、系统脆弱性。

联结主义(Hinton):知识以连接权重分布式存储在神经网络中。深度学习的成功赋予智能体强大的感知和模式识别能力。

行为主义/强化学习:通过互动和试错学习最优策略。从 TD-Gammon 到 AlphaGo。

现代融合:LLM 本身是联结主义产物,却成为执行符号推理的核心”大脑”,形成神经-符号结合的现代智能体架构。

协作模式

  • 单智能体自主循环:AgentGPT 模式,通过”思考-规划-执行-反思”闭环自我迭代
  • 多智能体协作:角色扮演式(CAMEL)、组织化工作流(MetaGPT/CrewAI)、灵活对话(AutoGen/AgentScope)
  • 群体智能仿真MiroFish 通过数千个独立 Agent 的社会演化推演未来,是 Agent 系统在预测仿真领域的独特应用
  • 高级控制流:LangGraph 状态图建模

核心能力

  • 自主规划:分解复杂目标为可执行子任务
  • 工具使用:调用外部 API、搜索、代码执行等
  • 状态管理:在多次交互中维护上下文和进度
  • 自我评估:监控执行过程并在必要时调整策略

三大经典范式

详见 Agent_Paradigms,包括 ReAct(边想边做)、Plan-and-Solve(先想后做)、Reflection(做完反思)。

关键局限

  • 幻觉问题、无限循环风险、评估难题
  • 对 LLM 自身能力的高度依赖
  • 提示词脆弱性

关联连接