Please enable Javascript to view the contents

Claude Code 多智能体编排深度解析:从 Subagent 到 Agent Teams 的演进之路

Anthropic 正在重新定义 AI 编程助手的工作方式,从单一对话到多智能体协作的技术跃迁

 ·  ☕ 5 分钟  ·  🪶 VictorHong · 👀... 阅读

Claude Code 多智能体编排

核心观点

Anthropic 在 2026 年 5 月密集发布了 Claude Code 的多项重大更新,从 Subagent 到 Agent Teams 再到 /workflows,清晰地勾勒出一个技术演进路线:用代码取代 LLM 编排器,解决多智能体系统的根本性瓶颈

传统多智能体模式面临的核心问题是**“Token 税”**——每个子智能体的输出都会重新进入主编排器的上下文窗口,导致随着并行任务增加,主会话上下文被迅速污染,效率急剧下降。

Anthropic 的解决方案是分层的:

  • Subagent:基础并行单元,独立上下文,结果回传
  • Agent Teams:多智能体协作,支持直接通信
  • /workflows:代码级编排,子智能体输出直接流转,主上下文零污染

这一演进代表着 AI 编程工具从对话式交互工程化工作流的关键转变。


深度分析:多智能体架构的三层演进

第一层:Subagent —— 并行化的基础单元

Subagent 架构

Subagent 是 Claude Code 最早引入的多智能体机制。其核心设计理念是上下文隔离

关键特性:

  • 每个 Subagent 拥有独立的上下文窗口
  • 主会话保持干净,只接收蒸馏后的结果
  • 支持并行执行,适合任务分解

典型应用场景:

任务:分析大型代码库
├── Subagent 1: 分析 src/api/ 目录
├── Subagent 2: 分析 src/services/ 目录
├── Subagent 3: 分析 src/models/ 目录
└── Subagent 4: 分析 src/utils/ 目录

这种模式在代码库探索、多文件重构等场景中表现出色。根据社区实践,7 个并行 Subagent 是常见配置:组件 Agent、样式 Agent、测试 Agent、类型 Agent、Hooks Agent、集成 Agent、清理 Agent。

但问题依然存在: 当 Subagent 数量增加到 10 个以上时,主会话需要汇总所有结果,上下文窗口压力依然巨大。


第二层:Agent Teams —— 协作式多智能体

Agent Teams 架构

Agent Teams 是 Anthropic 在 Claude Code 2.1.32+ 中引入的实验性功能,核心改进是智能体间直接通信

与 Subagent 的关键区别:

特性 Subagent Agent Teams
上下文 独立,结果回传主会话 完全独立
通信 仅向主 Agent 汇报 团队成员可直接通信
协调 主 Agent 管理 共享任务列表,自协调
最佳场景 独立任务 需要讨论协作的复杂工作
Token 成本 较低 较高(每个成员是独立实例)

Agent Teams 引入了共享任务列表角色分工概念。一个 Team Lead 协调多个 Teammate,每个成员可以从共享任务列表中认领工作,并直接与其他成员交流。

实际案例: 设计 CLI 工具时,可以创建三个 Teammate:

  • UX 专家:从用户体验角度探索
  • 架构师:从技术实现角度分析
  • 质疑者:从批判性角度挑战方案

这种协作模式能产生更高质量的方案,但代价是更高的 Token 消耗和协调开销。


第三层:/workflows —— 代码级编排

/workflows 是 Anthropic 在 Claude Code 2.1.147 中发布的重大功能,代表着从 LLM 编排向代码编排的范式转移

核心创新:用 workflow.js 取代 LLM 编排器

传统模式的问题在于:LLM 编排器需要保存每个子智能体的中间结果,规划下一步。当派生 10 个子智能体时,每个结果都重新进入主上下文——这就是"Token 税"。

/workflows 的解决方案是:子智能体输出直接从一阶段流向下一阶段,永不触碰主上下文窗口

workflow.js 的能力:

  • 结构化阶段输出:定义可预测的数据模式
  • 并行扇出 + 流式管道:数据在阶段间直接流转
  • 条件、循环和预算控制:使用真实 JavaScript
  • 失败自动重试:内置错误恢复机制
  • 实时进度查看:通过 /workflows 命令监控
  • 后台运行:工作流在后台执行,主会话保持空闲

技术原理:

1
2
3
4
5
6
7
8
// workflow.js 概念示例
{
  phases: [
    { name: "explore", parallel: true, agents: 4 },
    { name: "analyze", dependsOn: "explore" },
    { name: "synthesize", dependsOn: "analyze" }
  ]
}

这种模式将编排逻辑从 LLM 的"黑盒"推理转移到明确的代码定义,既提高了可预测性,又彻底解决了上下文污染问题。


对比分析:三种模式的选择策略

场景 推荐模式 理由
代码库探索、文件分析 Subagent 独立任务,结果汇总即可
方案设计、架构讨论 Agent Teams 需要多角色协作和辩论
复杂流水线、CI/CD /workflows 需要确定性编排和状态管理
大规模重构 Subagent + /workflows 先用 Subagent 分析,再用 workflows 执行
多版本实验 Agent Teams 并行探索不同方案

实践建议:多智能体编排最佳实践

1. 显式委托原则

Claude 默认保守使用子智能体。要获得最佳效果,显式描述应该委托什么:

低效:"帮我实现这个功能"
高效:"使用并行任务实现用户画像功能:
- 任务1(前端):创建 ProfileCard、ProfileEdit、AvatarUpload 组件
- 任务2(API):创建 profile API 路由
- 任务3(数据库):添加 Prisma schema 和迁移
- 任务4(测试):编写单元测试和集成测试"

2. 依赖管理策略

有些任务必须按顺序执行。结构化编排:

Phase 1(并行):
- 任务 A:创建数据库模型
- 任务 B:配置 Stripe SDK

Phase 2(依赖 Phase 1,并行):
- 任务 C:实现支付处理服务
- 任务 D:创建支付 API 端点

Phase 3(依赖 Phase 2):
- 任务 E:编写集成测试

3. 上下文窗口经济学

Subagent 的真正价值在于上下文隔离

  • 大型代码库:将探索工作分散到多个 Agent
  • 研究密集型任务:将研究产物隔离在子会话中
  • 避免主会话被中间产物污染

社区生态:围绕多智能体的工具链

Agent Profiler

DevonPeroutky 开源的 agent-profiler 是 Claude Code 的性能分析工具:

  • Trajectory View:查看工具调用如何影响上下文窗口
  • Flow View:可视化 Subagent/Skill 的派生和上下文传递
  • Summary View:识别哪些步骤可以提取为 Skill 或缓存

该工具完全本地运行,无需上传数据到云端。

Ruflo

社区开发的 Ruflo 是面向 Claude 的智能体编排平台,支持:

  • 多智能体集群部署
  • 自学习群体智能
  • RAG 集成
  • 原生 Claude Code/Codex 集成

一句话总结

Anthropic 正在用 Subagent → Agent Teams → /workflows 的三层架构,将 Claude Code 从"智能对话助手"升级为"工程化 AI 工作流平台"——代码编排取代 LLM 编排,是多智能体系统从玩具走向生产的关键一跃


参考链接

  1. Claude Code Agent Teams 官方文档
  2. Claude Code Subagent 官方文档
  3. Anthropic 官方 Claude Code 产品页
  4. Agent Profiler GitHub 仓库
  5. Turion.ai: Claude Code Multi-Agent 完整指南
  6. MindStudio: Code with Claude 2026 新功能解析
  7. Reddit r/ClaudeCode: /workflows 功能讨论
  8. Reddit r/ClaudeCode: Agent Profiler 开源发布
  9. Reddit r/vibecoding: 多智能体安全与可维护性指南
  10. WinBuzzer: Anthropic 展示 Claude Code 高级模式

VictorHong
作者
VictorHong
🔩工具控,⌨️ 后端程序员,🧪AI 探索者