核心信息

GenericAgent 是一个自我进化的智能体系统:从 3.3K 行种子代码开始,自主生长技能树,实现完整的系统控制能力,Token 消耗仅为同类产品的 1/6。

  • Stars:11.6k
  • Forks:1.3k
  • 许可证:MIT
  • 技术栈:Python 85.1%, 少量 JS/CSS/Rust
  • 最新版本:v0.1.0 (2026-05-15, 桌面 App)
  • 技术报告:arXiv 2604.17091

核心理念

“Don’t preload skills — evolve them.”

系统不预置技能,每次解决任务时自动将执行路径固化为可复用的 Skill,形成专属技能树。作者声称整个仓库从 git init 到每条 commit 均由 GenericAgent 自主完成。

三层核心架构

1. 五层记忆系统(L0–L4)

层级名称功能
L0Meta Rules基础行为规则和系统约束
L1Insight Index极简索引,快速路由与召回
L2Global Facts长期运行的稳定知识
L3Task Skills/SOPs可复用的任务流程
L4Session Archive已完成会话归档,用于长程召回

2. 自主执行循环

核心代码仅 ~100 行 (agent_loop.py):感知环境 → 任务推理 → 执行工具 → 写入记忆 → 循环。

3. 最小工具集

9 个原子工具 + 2 个记忆管理工具

工具功能
code_run执行任意代码
file_read读取文件
file_write写入文件
file_patch修改文件
web_scan感知网页内容
web_execute_js控制浏览器
ask_user人机协作确认
update_working_checkpoint记忆管理
start_long_term_update跨会话持久化

通过 code_run 可动态安装包、写脚本、调 API,将临时能力固化为永久工具。

自我进化机制

[新任务] → [自主探索](安装依赖、写脚本、调试验证)
→ [固化为 Skill] → [写入记忆] → [下次直接调用]

示例:用户说”读微信消息”→ 第一次装依赖、反向 DB、写脚本、保存 Skill → 之后一行调用。

Token 效率优势

上下文窗口不到 30K(对比其他 Agent 的 200K–1M),实现”6x less token consumption”。分层记忆确保关键信息在场,减少噪音和幻觉。

多前端支持

桌面 App、TUI (Textual)、Streamlit UI、Telegram、微信、QQ、飞书/Lark、企业微信、钉钉

评测维度

基于 Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.4、MiniMax M2.7,在五个维度进行系统评测:

  1. 任务完成度与 Token 效率
  2. 工具使用效率
  3. 记忆系统有效性
  4. 自我进化能力
  5. 网页浏览能力

关联连接