
在人工智能的演进史中,我们正处于一个从"对话机器人"向"自主代理(Agents)"跨越的关键节点。然而,构建一个能够长时间运行、处理复杂任务且具备鲁棒性的 Agent,其难度远超想象。
近日,Anthropic 发布了一篇深度技术博客,详细介绍了其 Managed Agents(托管代理)服务的底层架构设计哲学。这篇文章的核心论点在于:为了应对模型能力的快速迭代,必须通过虚拟化和解耦,将 Agent 的"大脑"(模型与逻辑控制)与"双手"(执行环境与工具)彻底分离。
本文将带你深入拆解 Anthropic 的这一架构思考,探讨它如何解决长程任务中的稳定性、安全性和可扩展性难题。
1. 消失的"假设":为什么传统 Agent 架构会过时?
在构建 Agent 时,开发者通常会编写一个"Harness"(装具/控制环路)。这个环路负责调用模型、解析工具调用、并处理异常。
Anthropic 团队发现了一个有趣的现象:Harness 往往隐含了开发者对模型能力的"偏见"和"假设"。
例如,在 Claude 3.5 Sonnet 早期,模型存在"上下文焦虑"(Context Anxiety)——当接近上下文上限时,它会急于结束任务。为了解决这个问题,开发者在 Harness 中硬编码了"上下文重置"逻辑。然而,当 Claude 3.5 Opus 发布后,这种焦虑消失了,原本的优化逻辑反而成了拖累性能的"僵尸代码"。
结论很明确:模型在进化,而硬编码的控制逻辑会迅速腐烂。 Managed Agents 的设计目标就是创建一个"面向未来的系统",它不假设模型能做什么或不能做什么,而是提供一套像操作系统一样的稳定接口。
2. 核心哲学:虚拟化与解耦
Managed Agents 借鉴了计算机操作系统(OS)的成功经验。OS 通过虚拟化硬件(进程、文件、内存),让 70 年代的程序逻辑在今天的 SSD 上依然运行良好。
Anthropic 将 Agent 拆解为三个独立的虚拟化组件:
- Session(会话):一个只增不减的事件日志,记录了发生过的一切。
- Harness(大脑/装具):循环调用 Claude 并分发工具调用的逻辑层。
- Sandbox(双手/沙箱):执行代码、编辑文件的安全环境。
从"宠物"到"耕畜"的转变
在早期设计中,这三个组件被打包在一个容器里。这导致了一个经典的运维难题:容器变成了"宠物"。
- 如果容器崩了,Session 丢了,任务就死掉了。
- 如果容器卡死,工程师必须像护理宠物一样手动登录进去调试。
而在 Managed Agents 架构中,所有组件都是"耕畜"(Cattle)。
- 大脑挂了? 重新启动一个 Harness,从 Session 日志中恢复状态,无缝接力。
- 双手坏了? 直接销毁旧沙箱,按标准配方(Recipe)秒级初始化一个新沙箱。
3. 攻克安全堡垒:凭证隔离
安全是企业级 Agent 的生命线。传统的耦合架构中,Claude 生成的代码运行在包含 API 密钥的环境里。一旦发生"提示词注入"(Prompt Injection),攻击者就能轻易窃取凭据。
Managed Agents 引入了两种高级安全模式:
- 资源绑定:例如在克隆 Git 仓库时,Token 仅在初始化阶段使用,随后被销毁。沙箱内的 Git 操作通过本地配置完成,Agent 无法触及原始 Token。
- MCP 代理与保险库:对于自定义工具,通过 Model Context Protocol (MCP)。OAuth Token 存储在外部的安全保险库中。当 Claude 调用工具时,请求经过一个中间代理(Proxy),由代理去库里取回凭证并完成调用。
这种设计确保了:即使 Claude "叛变"了,它也看不见、摸不到那些核心凭证。
4. 重新定义"上下文":Session 不是 Context Window
长程任务(Long-horizon tasks)面临的最大挑战是:Claude 的记忆是有限的。
传统的做法是"压缩(Compaction)“或"修剪(Trimming)”。但这些都是不可逆的操作。如果你在第 10 步删掉了一个看起来没用的信息,可能第 100 步时模型会因为缺少它而崩溃。
Managed Agents 提出了一个创新的方案:将 Session 作为外部存储对象。
- Session 日志:持久化存储所有原始事件。
- 灵活检索:Harness 可以通过
getEvents()接口,根据需要"切片"读取历史。 - 动态重构:在将历史塞进 Claude 的上下文窗口前,Harness 可以根据当前模型的最优策略进行实时转换。
这就像是给模型配了一个无限容量的"外接硬盘",由 Harness 决定每一时刻该把哪些数据读入"内存"。

5. 性能奇迹:TTFT 降低 90%
架构的解耦不仅带来了稳定性,更带来了性能的飞跃。
在旧架构中,启动一个 Agent 必须先拉起一个厚重的容器,克隆代码库,配置环境。这导致首字延迟(TTFT)极高。
通过解耦:
- 大脑先行:Harness 是无状态的,可以瞬间启动。Claude 可以立即开始思考和规划。
- 按需动手:只有当 Claude 真正决定执行
execute()工具调用时,后台才去异步拉起沙箱。
实验数据显示,这种架构让 P50 TTFT 降低了约 60%,而 P95(长尾延迟)更是暴降 90% 以上。
6. 结论:通往"多脑多手"的未来
Managed Agents 的架构愿景不只是为了运行一个 Claude。它支持:
- 多脑协作:一个任务可以启动多个 Stateless Harness。
- 异构执行:一只手在 Linux 容器里写代码,另一只手在模拟器里测试 App。
Anthropic 正在构建的不是一个简单的 Agent 产品,而是一套 Agent 操作系统规范。它让开发者可以专注于业务逻辑,而将底层的持久化、安全隔离和执行环境交给这一套经过工业级验证的"元装具(Meta-harness)"。
随着 Claude 的智能不断提升,Managed Agents 的这种"接口稳定、实现自由"的设计,将成为 AI 规模化落地的核心基石。
参考资料:
- Anthropic Engineering: Scaling Managed Agents: Decoupling the brain from the hands
- Model Context Protocol (MCP) Documentation
注:本文为基于 Anthropic 技术博客的深度解读,旨在帮助开发者理解其架构背后的工程思考。