
核心观点
Anthropic 在 2026 年 5 月密集发布了 Claude Code 的多项重大更新,从 Subagent 到 Agent Teams 再到 /workflows,清晰地勾勒出一个技术演进路线:用代码取代 LLM 编排器,解决多智能体系统的根本性瓶颈。
传统多智能体模式面临的核心问题是**“Token 税”**——每个子智能体的输出都会重新进入主编排器的上下文窗口,导致随着并行任务增加,主会话上下文被迅速污染,效率急剧下降。
Anthropic 的解决方案是分层的:
- Subagent:基础并行单元,独立上下文,结果回传
- Agent Teams:多智能体协作,支持直接通信
- /workflows:代码级编排,子智能体输出直接流转,主上下文零污染
这一演进代表着 AI 编程工具从对话式交互向工程化工作流的关键转变。
深度分析:多智能体架构的三层演进
第一层:Subagent —— 并行化的基础单元

Subagent 是 Claude Code 最早引入的多智能体机制。其核心设计理念是上下文隔离:
关键特性:
- 每个 Subagent 拥有独立的上下文窗口
- 主会话保持干净,只接收蒸馏后的结果
- 支持并行执行,适合任务分解
典型应用场景:
任务:分析大型代码库
├── Subagent 1: 分析 src/api/ 目录
├── Subagent 2: 分析 src/services/ 目录
├── Subagent 3: 分析 src/models/ 目录
└── Subagent 4: 分析 src/utils/ 目录
这种模式在代码库探索、多文件重构等场景中表现出色。根据社区实践,7 个并行 Subagent 是常见配置:组件 Agent、样式 Agent、测试 Agent、类型 Agent、Hooks Agent、集成 Agent、清理 Agent。
但问题依然存在: 当 Subagent 数量增加到 10 个以上时,主会话需要汇总所有结果,上下文窗口压力依然巨大。
第二层:Agent Teams —— 协作式多智能体

Agent Teams 是 Anthropic 在 Claude Code 2.1.32+ 中引入的实验性功能,核心改进是智能体间直接通信。
与 Subagent 的关键区别:
| 特性 | Subagent | Agent Teams |
|---|---|---|
| 上下文 | 独立,结果回传主会话 | 完全独立 |
| 通信 | 仅向主 Agent 汇报 | 团队成员可直接通信 |
| 协调 | 主 Agent 管理 | 共享任务列表,自协调 |
| 最佳场景 | 独立任务 | 需要讨论协作的复杂工作 |
| Token 成本 | 较低 | 较高(每个成员是独立实例) |
Agent Teams 引入了共享任务列表和角色分工概念。一个 Team Lead 协调多个 Teammate,每个成员可以从共享任务列表中认领工作,并直接与其他成员交流。
实际案例: 设计 CLI 工具时,可以创建三个 Teammate:
- UX 专家:从用户体验角度探索
- 架构师:从技术实现角度分析
- 质疑者:从批判性角度挑战方案
这种协作模式能产生更高质量的方案,但代价是更高的 Token 消耗和协调开销。
第三层:/workflows —— 代码级编排
/workflows 是 Anthropic 在 Claude Code 2.1.147 中发布的重大功能,代表着从 LLM 编排向代码编排的范式转移。
核心创新:用 workflow.js 取代 LLM 编排器
传统模式的问题在于:LLM 编排器需要保存每个子智能体的中间结果,规划下一步。当派生 10 个子智能体时,每个结果都重新进入主上下文——这就是"Token 税"。
/workflows 的解决方案是:子智能体输出直接从一阶段流向下一阶段,永不触碰主上下文窗口。
workflow.js 的能力:
- 结构化阶段输出:定义可预测的数据模式
- 并行扇出 + 流式管道:数据在阶段间直接流转
- 条件、循环和预算控制:使用真实 JavaScript
- 失败自动重试:内置错误恢复机制
- 实时进度查看:通过
/workflows命令监控 - 后台运行:工作流在后台执行,主会话保持空闲
技术原理:
|
|
这种模式将编排逻辑从 LLM 的"黑盒"推理转移到明确的代码定义,既提高了可预测性,又彻底解决了上下文污染问题。
对比分析:三种模式的选择策略
| 场景 | 推荐模式 | 理由 |
|---|---|---|
| 代码库探索、文件分析 | Subagent | 独立任务,结果汇总即可 |
| 方案设计、架构讨论 | Agent Teams | 需要多角色协作和辩论 |
| 复杂流水线、CI/CD | /workflows | 需要确定性编排和状态管理 |
| 大规模重构 | Subagent + /workflows | 先用 Subagent 分析,再用 workflows 执行 |
| 多版本实验 | Agent Teams | 并行探索不同方案 |
实践建议:多智能体编排最佳实践
1. 显式委托原则
Claude 默认保守使用子智能体。要获得最佳效果,显式描述应该委托什么:
低效:"帮我实现这个功能"
高效:"使用并行任务实现用户画像功能:
- 任务1(前端):创建 ProfileCard、ProfileEdit、AvatarUpload 组件
- 任务2(API):创建 profile API 路由
- 任务3(数据库):添加 Prisma schema 和迁移
- 任务4(测试):编写单元测试和集成测试"
2. 依赖管理策略
有些任务必须按顺序执行。结构化编排:
Phase 1(并行):
- 任务 A:创建数据库模型
- 任务 B:配置 Stripe SDK
Phase 2(依赖 Phase 1,并行):
- 任务 C:实现支付处理服务
- 任务 D:创建支付 API 端点
Phase 3(依赖 Phase 2):
- 任务 E:编写集成测试
3. 上下文窗口经济学
Subagent 的真正价值在于上下文隔离:
- 大型代码库:将探索工作分散到多个 Agent
- 研究密集型任务:将研究产物隔离在子会话中
- 避免主会话被中间产物污染
社区生态:围绕多智能体的工具链
Agent Profiler
DevonPeroutky 开源的 agent-profiler 是 Claude Code 的性能分析工具:
- Trajectory View:查看工具调用如何影响上下文窗口
- Flow View:可视化 Subagent/Skill 的派生和上下文传递
- Summary View:识别哪些步骤可以提取为 Skill 或缓存
该工具完全本地运行,无需上传数据到云端。
Ruflo
社区开发的 Ruflo 是面向 Claude 的智能体编排平台,支持:
- 多智能体集群部署
- 自学习群体智能
- RAG 集成
- 原生 Claude Code/Codex 集成
一句话总结
Anthropic 正在用 Subagent → Agent Teams → /workflows 的三层架构,将 Claude Code 从"智能对话助手"升级为"工程化 AI 工作流平台"——代码编排取代 LLM 编排,是多智能体系统从玩具走向生产的关键一跃。
参考链接
- Claude Code Agent Teams 官方文档
- Claude Code Subagent 官方文档
- Anthropic 官方 Claude Code 产品页
- Agent Profiler GitHub 仓库
- Turion.ai: Claude Code Multi-Agent 完整指南
- MindStudio: Code with Claude 2026 新功能解析
- Reddit r/ClaudeCode: /workflows 功能讨论
- Reddit r/ClaudeCode: Agent Profiler 开源发布
- Reddit r/vibecoding: 多智能体安全与可维护性指南
- WinBuzzer: Anthropic 展示 Claude Code 高级模式