Claude Managed Agents 深度解析：Anthropic 的 AI Agent 架构设计哲学

2026/04/118 分钟

分类：技术分享

标签：#人工智能#技术#AI

2026 年 4 月 8 日，Anthropic 正式发布了 Claude Managed Agents——一个托管式的 AI Agent 服务。与市面上大多数 Agent 框架不同，Anthropic 不是简单地在 Claude 之上包装一层工具调用循环，而是从底层重新思考了 Agent 的架构。

结果是一套优雅的三层解耦设计：Session、Harness、Sandbox。

这篇文章将深入拆解这套架构的设计哲学。

Agent 的本质公式

先从一个简单的等式开始理解：

一个 Agent 由三个核心组件构成：

Claude（大脑）：负责推理和决策

Harness（双手）：驱动循环，调用 Claude API 并将工具调用路由到执行环境

Sandbox（工作台）：Claude 在其中编写代码、编辑文件、运行命令的隔离环境

打个比方，这三者就像人的大脑、双手和工作台各司其职。

Session ≠ Context Window

这是一个容易混淆但至关重要的概念。

Session 是一个持久的、只追加（append-only）的事件日志。每一次 Claude 的 API 调用、每一次工具执行结果、每一条用户消息，都被完整地记录在 Session 中。Session 是 Agent 的全部历史，理论上可以无限增长。

Context Window 则是从 Session 中选取当前相关内容喂给 Claude 的窗口，有大小限制，而 Session 没有。

💡

可以把 Session 想象成一本完整的日记本，而 Context Window 是你正在翻看的那几页。

这种分离带来了巨大的灵活性。当 Context Window 即将达到容量上限时，系统不需要丢弃旧数据——它可以进行 上下文压缩（Context Compaction），将早期的详细对话总结成更紧凑的形式，为新内容腾出空间。Session 中仍然保留着完整的原始记录。

三层解耦架构详解

Session：不可变的事件流

Session 的核心接口只有两个：emitEvent() 和 getEvents()。

emitEvent()：将新事件追加到日志末尾

getEvents()：从日志中读取事件（可指定范围）

因为 Session 是只追加的，所以它天然支持重放。如果 Harness 崩溃了，新的 Harness 实例可以从 Session 中恢复所有状态，继续工作。这使得 Agent 具备了天然的容错能力。

Harness：驱动循环

Harness 是 Agent 的控制中心，它执行一个循环：

从 Session 中提取上下文

调用 Claude API

将 Claude 的响应写入 Session

如果响应包含工具调用，将其路由到 Sandbox 执行

将执行结果写回 Session

回到步骤 1

Harness 是无状态的——所有状态都存储在 Session 中。这意味着 Harness 可以随时被替换、重启、迁移，而不会丢失任何进度。

这种设计遵循了 Pets vs Cattle 的基础设施哲学：

Session 是 Pet：精心培育、持久保存、不可丢失

Harness 和 Sandbox 是 Cattle：可以随时创建、销毁、替换

Sandbox：隔离的执行环境

Sandbox 是 Claude 实际执行代码的地方。每个 Sandbox 都是完全隔离的，有自己的文件系统、进程空间和网络环境。

Sandbox 的关键特性：

完全隔离：一个 Agent 的 Sandbox 无法访问另一个 Agent 的数据

可重建：如果 Sandbox 出了问题，可以基于 Session 中的记录重建

可扩展：可以动态创建和销毁 Sandbox 实例

安全边界：凭证永远不进入 Sandbox

这是整个架构中最精妙的安全设计。

在传统的 Agent 系统中，API 密钥和凭证通常需要直接传递给 Sandbox。这意味着如果 Sandbox 被攻破，攻击者就能获取这些凭证。

Anthropic 的解决方案是 vault + proxy 架构：

🔒

所有第三方凭证存储在独立的 vault（密钥库）中，Harness 和 Sandbox 都无法直接访问。当 Claude 需要调用外部工具时，通过 MCP proxy 从 vault 中按需获取凭证，代理执行请求。整个过程中凭证不会暴露给 Sandbox 中的代码。

这种设计的优势在于：

最小权限原则：Sandbox 中的代码无法直接访问任何凭证

审计追踪：所有外部调用都经过 proxy，可以被记录和审计

凭证轮换：可以在 vault 层面统一管理凭证更新，无需修改 Sandbox 中的代码

Many Brains, Many Hands：多 Agent 协作

三层解耦架构自然地支持多种多 Agent 协作模式：

Many Brains, One Hand

多个 Claude 实例共享同一个 Sandbox。适用于需要多角度分析同一份代码的场景——比如一个负责安全审查，一个负责性能优化。

One Brain, Many Hands

一个 Claude 实例控制多个 Sandbox。适用于需要同时在不同环境中执行任务的场景——比如同时在 Python 和 Node.js 环境中测试代码。

Many Brains, Many Hands

多个 Claude 实例各自控制自己的 Sandbox，通过共享的 Session 进行协调。这是最灵活的模式，适用于复杂的多步骤任务。

这些模式之所以能够自然地组合，正是因为 Session、Harness 和 Sandbox 是解耦的。开发者可以针对代码审查、并行测试等不同场景自由组合。

上下文工程：让大脑保持专注

在长任务的执行过程中，Context Window 的管理是一个核心挑战。Anthropic 引入了多种 上下文工程 技术来解决这个问题：

上下文压缩（Compaction）：当 Context Window 即将达到容量上限时，将早期对话压缩成总结，为新内容腾出空间。Session 中的原始数据仍然完整保留。

记忆工具（Memory Tool）：让 Claude 可以主动选择将重要信息写入持久存储，在后续的对话中可以主动检索。这类似于人类记笔记的习惯。

上下文裁剪（Context Trimming）：在发送给 Claude 之前，智能地裁剪不相关的上下文，只保留当前任务需要的部分。

这三者协同工作，确保 Claude 在任何时刻都能获得最相关的上下文，而不被无关信息淹没。

性能优化：TTFT 降低 60-90%

Managed Agents 在性能方面做了大量优化，尤其是 首 Token 延迟（TTFT, Time-to-First-Token）：

P50 TTFT 降低约 60%

P95 TTFT 降低超过 90%

这些优化的关键在于 将 brain 从 container 中解耦：在解耦之前，每次推理都需要等待 Sandbox 的 container 完全启动。解耦之后，不需要立即使用 Sandbox 的 Session 不再等待 container 启动——编排层（orchestration layer）从 Session 日志中拉取待处理事件后，推理可以立即开始。

客户案例

Managed Agents 已在多家企业中落地：

Notion：将 Agent 集成到产品中，为用户提供 AI 写作和编辑助手

Rakuten（乐天）：用于内部开发工具链的自动化，加速工程师的日常编码流程

Asana：在项目管理流程中引入 AI Agent，帮助团队自动化工作流

Vibecode：将 Managed Agents 作为核心能力集成到 AI 编程工具中

Sentry：利用 Agent 自动分析和分类错误报告，减少工程师的手动排查时间

使用门槛与定价

Managed Agents 目前可通过 Claude Platform 使用，计费方式简洁：

$0.08/session-hour（每会话小时 8 美分），加上标准的 Claude API Token 使用费

Session-hour 指的是一个 Session 存活的总时长。长时间运行的 Session 成本更高，因此开发者有动力优化 Session 的生命周期管理。

架构设计的启示

Claude Managed Agents 的架构设计给 AI Agent 领域带来了几个重要启示：

🎯

解耦是关键：将状态（Session）、控制（Harness）、执行（Sandbox）分离，让每个组件可以独立演进和扩展。

不可变日志是基石：Session 的只追加特性为容错、重放、审计提供了天然支持。

安全从架构开始：不是在 Sandbox 中做安全加固，而是从架构层面确保敏感凭证永远不进入执行环境。

上下文工程是核心竞争力：Agent 的能力不仅取决于模型本身，还取决于如何管理好 Context Window。

解耦的理念并不新鲜——微服务、容器化都遵循类似的哲学。但 Anthropic 将其应用到 AI Agent 领域，用 Session 的不可变日志替代传统的有状态对话管理，用 vault + proxy 替代明文凭证传递，用 brain/container 解耦替代一体化部署。这些选择值得每一个构建 AI Agent 系统的团队借鉴。

分享到：