从零构建多代理系统：我学到的那些课

cover

开篇：一个 Hackday 项目如何改变了我对 AI 的认知

2025 年 5 月的 Shopify Hackday，我尝试做一个 Ruby Gem MCP server，给 Claude Code 提供 AST 导航能力。第一次尝试失败了——Claude 不认识 Prism（Ruby 解析器），文档里也没有例子。

我试了一个”老派”方法：自己先读完 Prism 代码库，然后用 Claude Code 在代码库里学习，再把答案复制粘贴过来。

然后我问了自己一个问题：如果我能把这个过程自动化呢？

我把一个 Claude Code（放在 Prism 代码库里）和主 Claude Code（正在构建 library）通过 MCP 连接起来。结果：两个 agent 一次性完成了任何一个单独 agent 都做不到的事情。

一个关键认知诞生了：两个 agent 协作，胜过任何一个单独 agent。

这个经验最终催生了 Claude Swarm（GitHub 1.4k+ stars）和它的继任者 SwarmSDK。

Shopify 的 AI 采用曲线：从怀疑到全员”氛围编程”

Shopify 的 AI 采用路径很有意思：

2024 年之前：与 OpenAI 签约，内部有聊天工具可用，但大量工程师因为早期 GPT-3.5 的糟糕体验而持怀疑态度。

2024 年：工具向所有人开放——LibreChat、VSCode Copilot、Cursor 等。但渗透率依然不高。

2025 年 2 月转折点：CEO Tobi 发了全员邮件，大意是”在我们雇人之前，先要能证明 AI 做不了这个工作”。这封邮件直接推动了全员 AI 采用。

结果：约 6000 名员工的 Shopify，现在连非工程师都在”氛围编程”（vibe coding）原型产品了。

从”All-in-One”提示词到多代理微服务架构

Shopify 团队观察到一个核心模式：

❌ 旧做法：一个 LLM + 巨大提示词

问题：无关 token 太多
     LLM 会迷路
     效果差

✅ 新做法：多个窄专型 agent

每个 agent 都是某个领域的专家
结果：效果显著提升

SwarmSDK 就是在这一认知下诞生的，核心特性包括：

多模型支持：Claude、Gemini、o3 等
YAML / Ruby DSL 定义 agent：声明式，易维护
工作流支持 + 树形结构：复杂任务分解
事件钩子：可观测性
内置成本追踪：谁在花钱，花了多少
插件系统：包括 memory 插件

那些让人头疼的问题

1. 碎片化危机

每个团队都在构建自己的 agent 系统，用不同的框架（LangChain 等），大量重复造轮子。

2. 规模化难题

Shopify 的 AI 团队变成了”AI 特警队”——所有人都有问题来求助。解决方案不是扩大 AI 团队，而是构建赋能工具，让每个团队的 AI 爱好者自己具备构建能力。

3. 非开发者上手难度

YAML 文件、CLI 命令对这些用户来说太复杂了。开发者自己也不想写 YAML 编程。多模型实现的代码当时是”一大坨 hack”，日志记录更是噩梦。

Agent 微服务架构：一个解决碎片化的思路

当前状态（碎片化）：

各团队自己造 agent
      ↓
微服务地狱：
- 网络重试
- 可观测性挑战
- 链路追踪
- 大家只是想通信而已

统一编排策略：

所有人用同一种方式定义 agent
不需要 MCP/A2A 互相通话
导入定义，单进程运行
Ruby + Fibers：对 I/O 密集的 LLM 工作完美契合（网络请求）

三个核心教训

教训一：”最好的解决方案始于我自己的痛点”

先解决自己的问题。你的真实需求是最强的产品牵引力。

教训二：”把 agent 当成窄专型工具/专家，而不是通才”

给 agent 写人物介绍/简介 = 浪费 token
除非你想控制 AI 的输出，否则不需要这些
用的 token 越少，效果越好

教训三：”不要建 AI 特警队，要建赋能工具”

赋能每个团队的 AI 爱好者——他们最了解自己的领域。

2026 = 有用 Agent 元年？

MCP 上下文膨胀：房间里的大象

当前 MCP 的问题：

加工具 = 加 token 到上下文
参数描述往往与当前任务无关
比如用 Gmail MCP 读邮件 = 浪费 token 在”发邮件”功能上

愿景：每个 token 都精准投放到当前任务。

真实数据：从 22 小时到 7 分钟

Shopify 的实际收益：

场景	之前	之后	提升
主题合规审查	22 小时	7-20 分钟	巨大
候选人评估	多小时	不到 1 小时	显著
Q2 发版调研	巨大提示词	15 个专精 agent	高精度
供应商评估	手动 PDF 审查	多 agent 验证	可扩展

所有场景都需要人工复核——不是全自动。

写在最后

Shopify 的多代理系统演进路径，映射了整个行业对 AI 认知的转变：

从怀疑到接受：需要 CEO 级别的推动力
从通才到专才：窄专型 agent 效果远超大一统提示词
从工具到架构：碎片化问题的解法不是更多特警队，而是赋能
从概念到工程：2026 年的关键词是”有用”——而不是”酷”

当你的 agent 开始协作，当你的 token 消耗开始下降，当你团队的 AI 爱好者开始自己构建——你就知道走对路了。

参考来源：What I Learned Building Multi-Agent Systems From Scratch - Paulo Arruda, Staff Engineer at Shopify

文档信息

本文作者：王翊仰
本文链接：https://www.wangyiyang.cc/2026/05/14/multi-agent-system-lessons/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）