Table of Contents
為什麼我們都在假裝單一 Agent 夠用
過去這一年,整個 AI 業界幾乎都把力氣花在訓練更強的單一模型——模型大一點、上下文長一點、輸出就更好一點。這套邏輯在 Lab 裡看起來有效,但在真實應用場景裡開始碰壁。
我在實際使用 OpenClaw 的過程中觀察到一件事:當我試著讓一個 agent 同時處理郵件、回覆股票問題、發布部落格文章時,輸出的品質會飄移。有時候它會忘記之前交代過的偏好,有時候在郵件和文章之間不小心混用了語氣,有時候乾脆就是 hallucination — 自信地給你一個錯誤的數字。
這不是模型的錯。這是架構的問題。
當一個 agent 被塞進太多職責時,它的「能力邊界」會變得模糊。你要它做的越多,它能做好每一件事的能力反而越弱。Context window 再大,也解決不了這個問題。
所以,開始有人往另一條路走:不要一個全能的超級 agent,而是讓多個專業 agent 組成團隊,各自只專注一件事。
三種主流 Agent 協作模式
目前這個領域主要看到三種架構思路,各有特色。
1. OpenAI Swarm:輕量路由的極致
Swarm 是 OpenAI 在 2024 年中開源的實驗框架。它的核心理念是:每個 agent 就是一個 Python function,agent 和人之間的「交棒」(handoff)就是一個 return 語句。
Swarm 的設計哲學是極度輕量:沒有 orchestration 層,沒有昂貴的中央協調者,就是一堆獨立的 function 和一個事件迴圈。拿來做客服分類、內容流水線、研究路由這些場景時,意外地有效。
但 Swarm 有明顯的天花板:沒有長期記憶,沒有狀態持久化,錯誤處理全靠自己寫。拿它做生產級系統,你需要自己加一大堆 guardrail。
2. OpenClaw Agent Team:workspace 即邊界
OpenClaw 的做法是另一條路。它沒有使用 handoff 作為核心抽象,而是以 workspace 為邊界 建構 agent 團隊。
每個 agent 有自己獨立的目錄結構、HEARTBEAT.md、和長期記憶。Agent 之間透過 skill、訊息路由、和 cron job 來協調,而不是事件驅動的 handoff。這種架構更適合需要長期運作的任務——比如每天定時監控股票、發送郵件報告、管理部落格文章的生命週期。
我現在的部落格寫作流程就是跑在這個架構上:每一篇文章的生成,會經過企劃、寫作、SEO 優化、視覺設計、發布五個不同的 agent 接力完成。每個 agent 只管自己那段,失敗了可以從那一段重來,不需要從頭。
3. AutoGen:對話作為核心抽象
微軟的 AutoGen 走得最遠,它把對話作為 agent 之間的協調機制。每個 agent 可以是 LLM、是人、或者是外部工具,全部一視同仁地丢進同一個對話循環裡。
AutoGen 的優點是彈性極高:你在同一個 workflow 裡可以穿插真人審核、人力批准、專家諮詢。但代價是設定複雜,而且 agent 對話有可能會陷入雙方來回不休的無限循環,需要很好的終止條件設計。
為什麼我最後選了 OpenClaw Agent Team
用了一段時間之後,歸納出三個理由:
第一,隔離度更好。 每個 agent 有自己的 workspace、自己的記憶。一個 agent 犯錯不會污染另一個的上下文。這在 Swarm 裡很難做到,因為 handoff 本質上是共享狀態的。
第二,長期記憶是內建的。 HEARTBEAT.md、daily memory、MEMORY.md 這套體系讓 agent 的記憶可以在 sessions 之間延續,不需要每次都從零開始 prompt。
第三,符合真實工作流程。 真實世界的文章發布不是一條直線,而是一個迴圈:企劃→寫作→SEO→視覺→發布→根據反饋修改。每個環節有不同的節奏,OpenClaw 的 cron + heartbeat 機制更適合這種非同步協作。
那 Swarm 就不值得用嗎?
不是。Swarm 的強項在於輕量路由。
如果你的場景是:
- 一個客服系統需要根據問題類型瞬間分發到不同部門
- 一個內容工廠需要根據關鍵字決定用哪個模板生成
- 一個研究代理需要根據初步分析結果選擇下一步的工具
這些場景 Swarm 非常適合。它的 handoff 機制簡單到可以在幾十分鐘內搭一個原型出來。
但如果你的 agent 需要記住上次對話的內容、跨天持續運作、和真實世界的事件(時間、郵件、股票漲跌)保持同步,那你遲早需要 Agent Team 這套架構。
結語
AI Agent 的下一個台階,不是更強的單一模型,而是更好的協作協議。Swarm 告訴我們 handoff 可以多簡單,Agent Team 告訴我們專業分工加上長期記憶的價值,AutoGen 告訴我們對話式協作的彈性。
現在真正的問題不是「這個模型能做到嗎」,而是「一堆模型要怎麼分工合作,才能做到單一模型做不到的事」。
這才是未來三到五年最值得關注的方向。