Claude Code 多智能体编排深度解析：从 Subagent 到 Agent Teams 的演进之路

核心观点

Anthropic 在 2026 年 5 月密集发布了 Claude Code 的多项重大更新，从 Subagent 到 Agent Teams 再到 /workflows，清晰地勾勒出一个技术演进路线：用代码取代 LLM 编排器，解决多智能体系统的根本性瓶颈。

传统多智能体模式面临的核心问题是**“Token 税”**——每个子智能体的输出都会重新进入主编排器的上下文窗口，导致随着并行任务增加，主会话上下文被迅速污染，效率急剧下降。

Anthropic 的解决方案是分层的：

Subagent：基础并行单元，独立上下文，结果回传
Agent Teams：多智能体协作，支持直接通信
/workflows：代码级编排，子智能体输出直接流转，主上下文零污染

这一演进代表着 AI 编程工具从对话式交互向工程化工作流的关键转变。

深度分析：多智能体架构的三层演进

第一层：Subagent —— 并行化的基础单元

Subagent 是 Claude Code 最早引入的多智能体机制。其核心设计理念是上下文隔离：

关键特性：

每个 Subagent 拥有独立的上下文窗口
主会话保持干净，只接收蒸馏后的结果
支持并行执行，适合任务分解

典型应用场景：

任务：分析大型代码库
├── Subagent 1: 分析 src/api/ 目录
├── Subagent 2: 分析 src/services/ 目录
├── Subagent 3: 分析 src/models/ 目录
└── Subagent 4: 分析 src/utils/ 目录

这种模式在代码库探索、多文件重构等场景中表现出色。根据社区实践，7 个并行 Subagent 是常见配置：组件 Agent、样式 Agent、测试 Agent、类型 Agent、Hooks Agent、集成 Agent、清理 Agent。

但问题依然存在： 当 Subagent 数量增加到 10 个以上时，主会话需要汇总所有结果，上下文窗口压力依然巨大。

第二层：Agent Teams —— 协作式多智能体

Agent Teams 是 Anthropic 在 Claude Code 2.1.32+ 中引入的实验性功能，核心改进是智能体间直接通信。

与 Subagent 的关键区别：

特性	Subagent	Agent Teams
上下文	独立，结果回传主会话	完全独立
通信	仅向主 Agent 汇报	团队成员可直接通信
协调	主 Agent 管理	共享任务列表，自协调
最佳场景	独立任务	需要讨论协作的复杂工作
Token 成本	较低	较高（每个成员是独立实例）

Agent Teams 引入了共享任务列表和角色分工概念。一个 Team Lead 协调多个 Teammate，每个成员可以从共享任务列表中认领工作，并直接与其他成员交流。

实际案例： 设计 CLI 工具时，可以创建三个 Teammate：

UX 专家：从用户体验角度探索
架构师：从技术实现角度分析
质疑者：从批判性角度挑战方案

这种协作模式能产生更高质量的方案，但代价是更高的 Token 消耗和协调开销。

第三层：/workflows —— 代码级编排

/workflows 是 Anthropic 在 Claude Code 2.1.147 中发布的重大功能，代表着从 LLM 编排向代码编排的范式转移。

核心创新：用 workflow.js 取代 LLM 编排器

传统模式的问题在于：LLM 编排器需要保存每个子智能体的中间结果，规划下一步。当派生 10 个子智能体时，每个结果都重新进入主上下文——这就是"Token 税"。

/workflows 的解决方案是：子智能体输出直接从一阶段流向下一阶段，永不触碰主上下文窗口。

workflow.js 的能力：

结构化阶段输出：定义可预测的数据模式
并行扇出 + 流式管道：数据在阶段间直接流转
条件、循环和预算控制：使用真实 JavaScript
失败自动重试：内置错误恢复机制
实时进度查看：通过 /workflows 命令监控
后台运行：工作流在后台执行，主会话保持空闲

技术原理：

1
2
3
4
5
6
7
8


// workflow.js 概念示例
{
  phases: [
    { name: "explore", parallel: true, agents: 4 },
    { name: "analyze", dependsOn: "explore" },
    { name: "synthesize", dependsOn: "analyze" }
  ]
}

这种模式将编排逻辑从 LLM 的"黑盒"推理转移到明确的代码定义，既提高了可预测性，又彻底解决了上下文污染问题。

对比分析：三种模式的选择策略

场景	推荐模式	理由
代码库探索、文件分析	Subagent	独立任务，结果汇总即可
方案设计、架构讨论	Agent Teams	需要多角色协作和辩论
复杂流水线、CI/CD	/workflows	需要确定性编排和状态管理
大规模重构	Subagent + /workflows	先用 Subagent 分析，再用 workflows 执行
多版本实验	Agent Teams	并行探索不同方案

实践建议：多智能体编排最佳实践

1. 显式委托原则

Claude 默认保守使用子智能体。要获得最佳效果，显式描述应该委托什么：

低效："帮我实现这个功能"
高效："使用并行任务实现用户画像功能：
- 任务1（前端）：创建 ProfileCard、ProfileEdit、AvatarUpload 组件
- 任务2（API）：创建 profile API 路由
- 任务3（数据库）：添加 Prisma schema 和迁移
- 任务4（测试）：编写单元测试和集成测试"

2. 依赖管理策略

有些任务必须按顺序执行。结构化编排：

Phase 1（并行）：
- 任务 A：创建数据库模型
- 任务 B：配置 Stripe SDK

Phase 2（依赖 Phase 1，并行）：
- 任务 C：实现支付处理服务
- 任务 D：创建支付 API 端点

Phase 3（依赖 Phase 2）：
- 任务 E：编写集成测试

3. 上下文窗口经济学

Subagent 的真正价值在于上下文隔离：

大型代码库：将探索工作分散到多个 Agent
研究密集型任务：将研究产物隔离在子会话中
避免主会话被中间产物污染

社区生态：围绕多智能体的工具链

Agent Profiler

DevonPeroutky 开源的 agent-profiler 是 Claude Code 的性能分析工具：

Trajectory View：查看工具调用如何影响上下文窗口
Flow View：可视化 Subagent/Skill 的派生和上下文传递
Summary View：识别哪些步骤可以提取为 Skill 或缓存

该工具完全本地运行，无需上传数据到云端。

Ruflo

社区开发的 Ruflo 是面向 Claude 的智能体编排平台，支持：

多智能体集群部署
自学习群体智能
RAG 集成
原生 Claude Code/Codex 集成

一句话总结

Anthropic 正在用 Subagent → Agent Teams → /workflows 的三层架构，将 Claude Code 从"智能对话助手"升级为"工程化 AI 工作流平台"——代码编排取代 LLM 编排，是多智能体系统从玩具走向生产的关键一跃。