解耦"大脑"与"双手"：Anthropic Managed Agents 如何定义下一代 AI 代理架构

2026-04-15

2026-04-16

AI Agent, Anthropic, Claude, 架构设计, MCP

Anthropic Managed Agents：解耦大脑与双手

在人工智能的演进史中，我们正处于一个从"对话机器人"向"自主代理（Agents）"跨越的关键节点。然而，构建一个能够长时间运行、处理复杂任务且具备鲁棒性的 Agent，其难度远超想象。

近日，Anthropic 发布了一篇深度技术博客，详细介绍了其 Managed Agents（托管代理）服务的底层架构设计哲学。这篇文章的核心论点在于：为了应对模型能力的快速迭代，必须通过虚拟化和解耦，将 Agent 的"大脑"（模型与逻辑控制）与"双手"（执行环境与工具）彻底分离。

本文将带你深入拆解 Anthropic 的这一架构思考，探讨它如何解决长程任务中的稳定性、安全性和可扩展性难题。

1. 消失的"假设"：为什么传统 Agent 架构会过时？

在构建 Agent 时，开发者通常会编写一个"Harness"（装具/控制环路）。这个环路负责调用模型、解析工具调用、并处理异常。

Anthropic 团队发现了一个有趣的现象：Harness 往往隐含了开发者对模型能力的"偏见"和"假设"。

例如，在 Claude 3.5 Sonnet 早期，模型存在"上下文焦虑"（Context Anxiety）——当接近上下文上限时，它会急于结束任务。为了解决这个问题，开发者在 Harness 中硬编码了"上下文重置"逻辑。然而，当 Claude 3.5 Opus 发布后，这种焦虑消失了，原本的优化逻辑反而成了拖累性能的"僵尸代码"。

结论很明确：模型在进化，而硬编码的控制逻辑会迅速腐烂。 Managed Agents 的设计目标就是创建一个"面向未来的系统"，它不假设模型能做什么或不能做什么，而是提供一套像操作系统一样的稳定接口。

2. 核心哲学：虚拟化与解耦

Managed Agents 借鉴了计算机操作系统（OS）的成功经验。OS 通过虚拟化硬件（进程、文件、内存），让 70 年代的程序逻辑在今天的 SSD 上依然运行良好。

Anthropic 将 Agent 拆解为三个独立的虚拟化组件：

Session（会话）：一个只增不减的事件日志，记录了发生过的一切。
Harness（大脑/装具）：循环调用 Claude 并分发工具调用的逻辑层。
Sandbox（双手/沙箱）：执行代码、编辑文件的安全环境。

从"宠物"到"耕畜"的转变

在早期设计中，这三个组件被打包在一个容器里。这导致了一个经典的运维难题：容器变成了"宠物"。

如果容器崩了，Session 丢了，任务就死掉了。
如果容器卡死，工程师必须像护理宠物一样手动登录进去调试。

而在 Managed Agents 架构中，所有组件都是"耕畜"（Cattle）。

大脑挂了？ 重新启动一个 Harness，从 Session 日志中恢复状态，无缝接力。
双手坏了？ 直接销毁旧沙箱，按标准配方（Recipe）秒级初始化一个新沙箱。

3. 攻克安全堡垒：凭证隔离

安全是企业级 Agent 的生命线。传统的耦合架构中，Claude 生成的代码运行在包含 API 密钥的环境里。一旦发生"提示词注入"（Prompt Injection），攻击者就能轻易窃取凭据。

Managed Agents 引入了两种高级安全模式：

资源绑定：例如在克隆 Git 仓库时，Token 仅在初始化阶段使用，随后被销毁。沙箱内的 Git 操作通过本地配置完成，Agent 无法触及原始 Token。
MCP 代理与保险库：对于自定义工具，通过 Model Context Protocol (MCP)。OAuth Token 存储在外部的安全保险库中。当 Claude 调用工具时，请求经过一个中间代理（Proxy），由代理去库里取回凭证并完成调用。

这种设计确保了：即使 Claude "叛变"了，它也看不见、摸不到那些核心凭证。

4. 重新定义"上下文"：Session 不是 Context Window

长程任务（Long-horizon tasks）面临的最大挑战是：Claude 的记忆是有限的。

传统的做法是"压缩（Compaction）“或"修剪（Trimming）”。但这些都是不可逆的操作。如果你在第 10 步删掉了一个看起来没用的信息，可能第 100 步时模型会因为缺少它而崩溃。

Managed Agents 提出了一个创新的方案：将 Session 作为外部存储对象。

Session 日志：持久化存储所有原始事件。
灵活检索：Harness 可以通过 getEvents() 接口，根据需要"切片"读取历史。
动态重构：在将历史塞进 Claude 的上下文窗口前，Harness 可以根据当前模型的最优策略进行实时转换。

这就像是给模型配了一个无限容量的"外接硬盘"，由 Harness 决定每一时刻该把哪些数据读入"内存"。

Managed Agents 性能提升：TTFT 大幅降低

5. 性能奇迹：TTFT 降低 90%

架构的解耦不仅带来了稳定性，更带来了性能的飞跃。

在旧架构中，启动一个 Agent 必须先拉起一个厚重的容器，克隆代码库，配置环境。这导致首字延迟（TTFT）极高。

通过解耦：

大脑先行：Harness 是无状态的，可以瞬间启动。Claude 可以立即开始思考和规划。
按需动手：只有当 Claude 真正决定执行 execute() 工具调用时，后台才去异步拉起沙箱。

实验数据显示，这种架构让 P50 TTFT 降低了约 60%，而 P95（长尾延迟）更是暴降 90% 以上。

6. 结论：通往"多脑多手"的未来

Managed Agents 的架构愿景不只是为了运行一个 Claude。它支持：

多脑协作：一个任务可以启动多个 Stateless Harness。
异构执行：一只手在 Linux 容器里写代码，另一只手在模拟器里测试 App。

Anthropic 正在构建的不是一个简单的 Agent 产品，而是一套 Agent 操作系统规范。它让开发者可以专注于业务逻辑，而将底层的持久化、安全隔离和执行环境交给这一套经过工业级验证的"元装具（Meta-harness）"。

随着 Claude 的智能不断提升，Managed Agents 的这种"接口稳定、实现自由"的设计，将成为 AI 规模化落地的核心基石。

参考资料：

Anthropic Engineering: Scaling Managed Agents: Decoupling the brain from the hands
Model Context Protocol (MCP) Documentation

注：本文为基于 Anthropic 技术博客的深度解读，旨在帮助开发者理解其架构背后的工程思考。

AI技术