M ulti-A gent R ecursive E ngineering F ramework
全球唯一以"Agent 治理"为核心产品定位的框架。在治理深度上碾压所有竞品(10/10 vs 0-3),将 Agent 治理作为独立的价值主张而非安全 feature。
MAREF 是 Agent 世界的操作系统内核 — 管理 Agent 集群的生命周期、安全边界、状态健康和进化方向。
10 态 Gray Code 治理状态机— 数学可证明收敛性 (6bit, 汉明距离=1)** TLA+ 形式化验证**— 5 定理证明 (Lyapunov收敛 + Sperner完备性)** CircuitBreaker**— 3连败自动锁 + HALT 吸收态 + 30s 冷却四级安全决策树— Rule→Mode→SafetyGate→User, 97% 自动化率** LoRA/本体双重漂移检测**— KL/JS/Hellinger 三重散度 + 人工仲裁
桌面 Agent 操控— 截图→解析→键鼠→验证 完整闭环 (macOS/Linux/Windows)多 Agent 任务编排— TaskDAG 分解 + 5维 Agent 分发 + Saga 补偿事务** SubAgent 上下文隔离**— Git Worktree 式, 96% Token 节省移动→桌面任务桥接— mDNS 发现 + 幂等任务队列 + SSE 推送浏览器安全操控— Playwright + 安全域名白名单 + 认证会话管理
递归自演进引擎— C1(观测)→C2(优化)→C3(收敛) 三循环红蓝对抗— 200 轮 5 阶段, 攻击强度 2.47→18.98 (7.7×)混沌工程— 5 类 LLM 故障注入 (延迟/错误/截断/幻觉/超时)记忆三温框架— Hot/Warm/Cold 三层记忆架构** Trust Engine v2**— 5 因子加权 + Goodhart 抗策略操纵检测
A2A/MCP 双协议— A2A v0.3 + MCP 6 种传输跨框架适配器— AutoGen/CrewAI/LangGraph/Dify/Coze 生产级** OpenTelemetry**— Prometheus + Grafana + OTLP 全链路可观测** Serverless 运行时**— Lambda / Cloud Run 适配** TypeScript SDK**—@maref/sdk
npm 包
pip install maref
maref desktop demo
python scripts/check_desktop_env.py
maref status
maref serve --port 8000 --gui
python
from maref_lite.governance import GovernanceOverlay
from maref_lite.state_machine import GovernanceState
overlay = GovernanceOverlay()
overlay._state_machine.transition(GovernanceState.OBSERVE)
overlay._state_machine.transition(GovernanceState.ANALYZE)
print(overlay.get_status())
MAREF: Agent 治理操作系统
┌─────────────────────────────────────────────────────────┐
│ 应用层 ─── LangGraph / CrewAI / AutoGen / Anthropic │
│ (编排/操控/开发框架) │
│ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ │
│ 治理层 ─── MAREF (本框架) │
│ · 状态机 · 熔断器 · 四级决策树 │
│ · 身份/信任 · 漂移检测 · 形式化验证 │
│ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ │
│ 通信层 ─── A2A / MCP (Google/Anthropic 标准) │
└─────────────────────────────────────────────────────────┘
| 维度 | MAREF | Anthropic | OpenAI | LangGraph | CrewAI | AutoGen | |---|---|---|---|---|---|---| | 治理/安全 | 10 | 4 | 3 | 2 | 1 | 1 | | 形式化验证 | 10 | 0 | 0 | 0 | 0 | 0 | | 漂移检测 | 9 | 0 | 0 | 0 | 0 | 0 | | 桌面操控 | 8 | 9 | 7 | 0 | 0 | 0 | | 编排 | 7 | 8 | 8 | 9 | 8 | 8 | | 身份/信任 | 7 | 0 | 0 | 0 | 0 | 0 | | 社区/生态 | 3 | 8 | 9 | 8 | 9 | 8 |
| 类型 | 数量 | 状态 |
|---|---|---|
| 全量 | 4,300+ | ✅ |
| 覆盖率 | 82% | ✅ |
pytest tests/ -v --cov
pytest tests/desktop/ -v # 桌面操控测试
pytest tests/chaos/ -v # 混沌工程
- v0.1.0-v0.20.0: 工程基础设施 + 形式化验证 + Sidecar + 漂移 + 混沌 + A2A + Identity + 编排 + Desktop Agent → GA
- Phase Ω (R101-R150): 50 轮自主递归演进全量补强 → v0.21.0 Final
- v0.30.0-GA: 人机协同层 + 记忆层 + 技能市场层 + 国密 SM2/SM3/SM4-GCM + 技术白皮书
- v1.0: 递归进化全栈 + Agent 信用评级 + 四象治理模型
- v2.0: 元 Agent 闭包 + 碳硅共生 + 八卦治理
详见 task_plan_v0.21.0-rc_omega_50_rounds.md
Apache License 2.0 — LICENSE