Claude Managed Agents 深度解析:Anthropic 的 AI Agent 架构设计哲学

Claude Managed Agents 深度解析:Anthropic 的 AI Agent 架构设计哲学

2026/04/118 分钟
分类:技术分享
标签:#人工智能#技术#AI
Claude Managed Agents
Claude Managed Agents
2026 年 4 月 8 日,Anthropic 正式发布了 Claude Managed Agents——一个托管式的 AI Agent 服务。与市面上大多数 Agent 框架不同,Anthropic 不是简单地在 Claude 之上包装一层工具调用循环,而是从底层重新思考了 Agent 的架构。
结果是一套优雅的三层解耦设计:Session、Harness、Sandbox
这篇文章将深入拆解这套架构的设计哲学。

Agent 的本质公式

先从一个简单的等式开始理解:
Agent Formula
Agent Formula
一个 Agent 由三个核心组件构成:
  1. Claude(大脑):负责推理和决策
  1. Harness(双手):驱动循环,调用 Claude API 并将工具调用路由到执行环境
  1. Sandbox(工作台):Claude 在其中编写代码、编辑文件、运行命令的隔离环境
打个比方,这三者就像人的大脑、双手和工作台各司其职。

Session ≠ Context Window

这是一个容易混淆但至关重要的概念。
Session 是一个持久的、只追加(append-only)的事件日志。每一次 Claude 的 API 调用、每一次工具执行结果、每一条用户消息,都被完整地记录在 Session 中。Session 是 Agent 的全部历史,理论上可以无限增长。
Context Window 则是从 Session 中选取当前相关内容喂给 Claude 的窗口,有大小限制,而 Session 没有。
💡
可以把 Session 想象成一本完整的日记本,而 Context Window 是你正在翻看的那几页。
这种分离带来了巨大的灵活性。当 Context Window 即将达到容量上限时,系统不需要丢弃旧数据——它可以进行 上下文压缩(Context Compaction),将早期的详细对话总结成更紧凑的形式,为新内容腾出空间。Session 中仍然保留着完整的原始记录。

三层解耦架构详解

Architecture Diagram
Architecture Diagram

Session:不可变的事件流

Session 的核心接口只有两个:emitEvent()getEvents()
  • emitEvent():将新事件追加到日志末尾
  • getEvents():从日志中读取事件(可指定范围)
因为 Session 是只追加的,所以它天然支持重放。如果 Harness 崩溃了,新的 Harness 实例可以从 Session 中恢复所有状态,继续工作。这使得 Agent 具备了天然的容错能力。

Harness:驱动循环

Session and Harness
Session and Harness
Harness 是 Agent 的控制中心,它执行一个循环:
  1. 从 Session 中提取上下文
  1. 调用 Claude API
  1. 将 Claude 的响应写入 Session
  1. 如果响应包含工具调用,将其路由到 Sandbox 执行
  1. 将执行结果写回 Session
  1. 回到步骤 1
Harness 是无状态的——所有状态都存储在 Session 中。这意味着 Harness 可以随时被替换、重启、迁移,而不会丢失任何进度。
这种设计遵循了 Pets vs Cattle 的基础设施哲学:
  • Session 是 Pet:精心培育、持久保存、不可丢失
  • Harness 和 Sandbox 是 Cattle:可以随时创建、销毁、替换

Sandbox:隔离的执行环境

Sandbox 是 Claude 实际执行代码的地方。每个 Sandbox 都是完全隔离的,有自己的文件系统、进程空间和网络环境。
Sandbox 的关键特性:
  • 完全隔离:一个 Agent 的 Sandbox 无法访问另一个 Agent 的数据
  • 可重建:如果 Sandbox 出了问题,可以基于 Session 中的记录重建
  • 可扩展:可以动态创建和销毁 Sandbox 实例

安全边界:凭证永远不进入 Sandbox

这是整个架构中最精妙的安全设计。
在传统的 Agent 系统中,API 密钥和凭证通常需要直接传递给 Sandbox。这意味着如果 Sandbox 被攻破,攻击者就能获取这些凭证。
Anthropic 的解决方案是 vault + proxy 架构
🔒
所有第三方凭证存储在独立的 vault(密钥库)中,Harness 和 Sandbox 都无法直接访问。当 Claude 需要调用外部工具时,通过 MCP proxy 从 vault 中按需获取凭证,代理执行请求。整个过程中凭证不会暴露给 Sandbox 中的代码。
这种设计的优势在于:
  1. 最小权限原则:Sandbox 中的代码无法直接访问任何凭证
  1. 审计追踪:所有外部调用都经过 proxy,可以被记录和审计
  1. 凭证轮换:可以在 vault 层面统一管理凭证更新,无需修改 Sandbox 中的代码

Many Brains, Many Hands:多 Agent 协作

Many Brains Many Hands
Many Brains Many Hands
三层解耦架构自然地支持多种多 Agent 协作模式:

Many Brains, One Hand

多个 Claude 实例共享同一个 Sandbox。适用于需要多角度分析同一份代码的场景——比如一个负责安全审查,一个负责性能优化。

One Brain, Many Hands

一个 Claude 实例控制多个 Sandbox。适用于需要同时在不同环境中执行任务的场景——比如同时在 Python 和 Node.js 环境中测试代码。

Many Brains, Many Hands

多个 Claude 实例各自控制自己的 Sandbox,通过共享的 Session 进行协调。这是最灵活的模式,适用于复杂的多步骤任务。
这些模式之所以能够自然地组合,正是因为 Session、Harness 和 Sandbox 是解耦的。开发者可以针对代码审查、并行测试等不同场景自由组合。

上下文工程:让大脑保持专注

在长任务的执行过程中,Context Window 的管理是一个核心挑战。Anthropic 引入了多种 上下文工程 技术来解决这个问题:
  1. 上下文压缩(Compaction):当 Context Window 即将达到容量上限时,将早期对话压缩成总结,为新内容腾出空间。Session 中的原始数据仍然完整保留。
  1. 记忆工具(Memory Tool):让 Claude 可以主动选择将重要信息写入持久存储,在后续的对话中可以主动检索。这类似于人类记笔记的习惯。
  1. 上下文裁剪(Context Trimming):在发送给 Claude 之前,智能地裁剪不相关的上下文,只保留当前任务需要的部分。
这三者协同工作,确保 Claude 在任何时刻都能获得最相关的上下文,而不被无关信息淹没。

性能优化:TTFT 降低 60-90%

Managed Agents 在性能方面做了大量优化,尤其是 首 Token 延迟(TTFT, Time-to-First-Token)
  • P50 TTFT 降低约 60%
  • P95 TTFT 降低超过 90%
这些优化的关键在于 将 brain 从 container 中解耦:在解耦之前,每次推理都需要等待 Sandbox 的 container 完全启动。解耦之后,不需要立即使用 Sandbox 的 Session 不再等待 container 启动——编排层(orchestration layer)从 Session 日志中拉取待处理事件后,推理可以立即开始。

客户案例

Managed Agents 已在多家企业中落地:
  • Notion:将 Agent 集成到产品中,为用户提供 AI 写作和编辑助手
  • Rakuten(乐天):用于内部开发工具链的自动化,加速工程师的日常编码流程
  • Asana:在项目管理流程中引入 AI Agent,帮助团队自动化工作流
  • Vibecode:将 Managed Agents 作为核心能力集成到 AI 编程工具中
  • Sentry:利用 Agent 自动分析和分类错误报告,减少工程师的手动排查时间

使用门槛与定价

Managed Agents 目前可通过 Claude Platform 使用,计费方式简洁:
  • $0.08/session-hour(每会话小时 8 美分),加上标准的 Claude API Token 使用费
Session-hour 指的是一个 Session 存活的总时长。长时间运行的 Session 成本更高,因此开发者有动力优化 Session 的生命周期管理。

架构设计的启示

Claude Managed Agents 的架构设计给 AI Agent 领域带来了几个重要启示:
🎯
解耦的理念并不新鲜——微服务、容器化都遵循类似的哲学。但 Anthropic 将其应用到 AI Agent 领域,用 Session 的不可变日志替代传统的有状态对话管理,用 vault + proxy 替代明文凭证传递,用 brain/container 解耦替代一体化部署。这些选择值得每一个构建 AI Agent 系统的团队借鉴。

分享到:

相关文章

返回首页