Anthropic 如何设计 Managed Agents：用「脑手分离」架构解锁长时 agent 可靠性

Wed, 06 May 2026 22:00:00 +0800

在构建 AI Agent 时，你是否遇到过这些问题：容器崩溃导致 Session 丢失、无法连接客户私有网络、长时间任务后期模型行为失控？

Anthropic 最近发布的工程博客系统性地介绍了他们如何解决这些问题。核心方案只有一个：把「大脑」（Claude + harness）和「手」（Sandbox + Tools）彻底解耦。

本文将深入解析这个架构的设计思路、实现细节，以及它如何让 Agent 系统从「宠物」变成「牛群」。

为什么需要「脑手分离」？

在介绍具体架构之前，我们需要理解问题的来龙去脉。

传统架构：一切耦合在一个容器里

早期的 Managed Agents 采用紧耦合设计，Session、Harness 和 Sandbox 三者共享同一个执行环境。这种设计的优点是：文件编辑是直接 syscall，没有跨服务边界的性能损耗。

但随之而来的问题是——你养了一只「宠物」。

这里的「宠物 vs 牛群」是基础设施领域的经典比喻：

宠物（Pet）：有名字、需要精心维护、不能丢失

牛群（Cattle）：无差别对待、可替换、丢失后直接启动新的

当容器成为那只宠物，任何故障都意味着 Session 丢失。更糟糕的是，你的调试窗口只有一个——WebSocket 事件流，但它无法告诉你问题出在 Harness 本身、网络丢包，还是容器本身离线。

第二个问题：Harness 假设了一切都在本地

当客户要求连接到自己私有的 VPC（Virtual Private Cloud）时，紧耦合设计遇到了硬墙：Harness 假设所有资源都在它旁边。要么客户把自己的网络和 Anthropic 的网络 peering，要么让客户在自己的环境里跑 Harness——这已经超出了服务本身的设计边界。

核心架构：三个抽象解耦一切

Anthropic 的解决方案是把 Agent 的三个核心组件虚拟化成通用接口：

graph TB
    subgraph "Session（持久化上下文）"
        S[Session Log<br/>append-only event stream]
    end
    
    subgraph "Harness（Agent 循环）"
        H[Harness<br/>Claude 调用 + 路由]
    end
    
    subgraph "Sandbox（执行环境）"
        SB[Sandbox<br/>代码执行 / 文件编辑]
    end
    
    subgraph "外部工具"
        MCP[MCP Server]
        VA[Vault<br/>OAuth 等凭证]
    end
    
    H -->|execute(name, input) → string| SB
    H -->|emitEvent / getEvents| S
    H -.->|MCP 代理| MCP
    MCP -.->|凭证获取| VA
    
    S -->|wake(sessionId)| H
    SB -.->|execute 返回| H

1. Session：Agent 的外部记忆