核心信息
GenericAgent 是一个自我进化的智能体系统:从 3.3K 行种子代码开始,自主生长技能树,实现完整的系统控制能力,Token 消耗仅为同类产品的 1/6。
- Stars:11.6k
- Forks:1.3k
- 许可证:MIT
- 技术栈:Python 85.1%, 少量 JS/CSS/Rust
- 最新版本:v0.1.0 (2026-05-15, 桌面 App)
- 技术报告:arXiv 2604.17091
核心理念
“Don’t preload skills — evolve them.”
系统不预置技能,每次解决任务时自动将执行路径固化为可复用的 Skill,形成专属技能树。作者声称整个仓库从 git init 到每条 commit 均由 GenericAgent 自主完成。
三层核心架构
1. 五层记忆系统(L0–L4)
| 层级 | 名称 | 功能 |
|---|---|---|
| L0 | Meta Rules | 基础行为规则和系统约束 |
| L1 | Insight Index | 极简索引,快速路由与召回 |
| L2 | Global Facts | 长期运行的稳定知识 |
| L3 | Task Skills/SOPs | 可复用的任务流程 |
| L4 | Session Archive | 已完成会话归档,用于长程召回 |
2. 自主执行循环
核心代码仅 ~100 行 (agent_loop.py):感知环境 → 任务推理 → 执行工具 → 写入记忆 → 循环。
3. 最小工具集
9 个原子工具 + 2 个记忆管理工具:
| 工具 | 功能 |
|---|---|
code_run | 执行任意代码 |
file_read | 读取文件 |
file_write | 写入文件 |
file_patch | 修改文件 |
web_scan | 感知网页内容 |
web_execute_js | 控制浏览器 |
ask_user | 人机协作确认 |
update_working_checkpoint | 记忆管理 |
start_long_term_update | 跨会话持久化 |
通过 code_run 可动态安装包、写脚本、调 API,将临时能力固化为永久工具。
自我进化机制
[新任务] → [自主探索](安装依赖、写脚本、调试验证)
→ [固化为 Skill] → [写入记忆] → [下次直接调用]
示例:用户说”读微信消息”→ 第一次装依赖、反向 DB、写脚本、保存 Skill → 之后一行调用。
Token 效率优势
上下文窗口不到 30K(对比其他 Agent 的 200K–1M),实现”6x less token consumption”。分层记忆确保关键信息在场,减少噪音和幻觉。
多前端支持
桌面 App、TUI (Textual)、Streamlit UI、Telegram、微信、QQ、飞书/Lark、企业微信、钉钉
评测维度
基于 Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.4、MiniMax M2.7,在五个维度进行系统评测:
- 任务完成度与 Token 效率
- 工具使用效率
- 记忆系统有效性
- 自我进化能力
- 网页浏览能力
关联连接
- GenericAgent — GenericAgent 项目实体
- Agentic_Systems — 智能体系统
- Agent_Memory — 记忆系统(GenericAgent 的五层记忆是重要参考实现)
- Agent_Paradigms — Reflection 范式与 GenericAgent 的自我进化机制相通
- 摘要-hello-agents — Datawhale 也为 GenericAgent 制作了教程 hello-generic-agent