什麼時候該用 multi agent 系統？

當你的工作需要 7x24 無人值守持續運轉，或是有明確的流水線流程（固定輸入、固定步驟、固定的 pass/fail）時，multi agent 系統的管理成本才值得。一個人或小團隊操作，一個 agent 搭配好的 Harness 就夠了。

multi agent 系統有哪些隱藏成本？

三個：管理成本（每個 agent 的指令都要寫到具體操作層級，而且持續維護）、交接成本（agent 之間的每一步交接都可能出錯，少寫一步流程就卡住）、context 重建成本（每次叫醒一個 agent 都要從零載入所有指令和歷史紀錄）。

Paperclip 是什麼？

Paperclip 是一個開源的 AI agent 編排平台（GitHub 23,000+ stars），用真實公司的管理方法論（OKR、組織架構、簽核流程、預算控制）來管理 AI 團隊。願景是打造零人公司（zero-human company）。

我建了一間 AI Agent 公司，第一天就想解散它

6 個 AI agent、OKR、簽核流程、預算控制。全到位。

第一天結束，我在想怎麼解散它。

零人公司的誘惑

Paperclip 是一個開源的 AI agent 編排平台，上線幾週就拿到 23,000+ stars。

它的願景很大膽：zero-human companies——零人公司。

不是讓 AI 回答問題，是讓 AI 自己開公司。用真實企業的管理方法論來管 AI 團隊：

組織架構：CEO → PM → Developer → Reviewer，有彙報線
OKR：公司目標 → 專案目標 → 每個任務綁目標
簽核流程：策略決定、文章發布，走正式簽核
預算控制：每個 agent 月預算上限，超支自動暫停
Heartbeat（定時喚醒）：agent 不是一直跑的，按排程短暫醒來，做完再休眠

PM 出身的人看到 OKR、組織架構、簽核流程、預算控制這些關鍵字，很難不心動。

我用 Claude Code 搭配 Harness（CLAUDE.md + Skills），一個 agent 做 agentic coding 已經很強了。但 Paperclip 打的是更上一層：讓 AI 自己跑，我只管 approve。

研究員找題目、作者寫稿、編輯審稿、工程師處理技術——四個角色，各司其職，自動接力。

我決定認真建一間。

第一天

半天時間，6 個 AI agent——有管策略的、有做研究的、有寫東西的、有審稿的、有處理技術的。OKR、簽核、預算、定時喚醒、操作紀錄，全部到位。不是 demo，是認真要拿來用的。

開了第一個工單，指派給 CEO。

接下來四個小時，我修了四次指令，手動推進了無數次流程，在 Inbox 裡按了 approve，看 agent 跑了又卡、卡了又修。

東西最後是做出來了。沒問題。

但我坐在那裡想：我到底在做什麼？

我在管理。不是在產出。

multi agent 有哪些隱藏成本？

管理成本

一個 agent 負責追進度。它寫了一份漂亮的進度報告，但沒有實際把工作交出去。因為指令寫了「推進到下一站」，卻沒告訴它具體怎麼操作。

6 個 agent，每個的指令都改了 3-4 次。業務一變，6 份指令的維護成本是 1 份的 6 倍。

交接成本

真實公司裡，做完了，走到同事座位前說「好了你看一下」。人有常識，不需要 protocol。

AI 沒有常識。每一個「走到座位前」都要寫成明確的指令——改狀態、改負責人、用正確格式通知對方。少寫一步，流程就卡住。

Context 重建成本

每次叫醒一個 agent，它要從零載入所有指令、歷史紀錄、前情提要，然後才開始想。

6 個 agent 各跑 3 次 = 18 次重建。一個 Claude Code session 只載入一次。18 次 vs 1 次，不是百分比的差距。

流程的目的是什麼？

做了 10 年 PM，我太熟悉流程了。

一張簽核單上 5 個人，不同單位。順利的話一週，不順利簽兩週以上。沒有人跟催，更久。

有了流程，每件事都有「該走的路」。但該走的路往往是最沒有彈性、最慢的路。

PM 的日常：30% 的時間做事，70% 的時間推流程——催簽核、開會對齊、寫進度報告、等相關人回覆。

流程存在的目的，是讓多人協作時降低出錯。10 個人的團隊沒有流程會亂，100 個人沒有流程會崩潰。

但如果一件事本來一個對話就能做完呢？

拆成流程的瞬間，就多了交接、簽核、等待。2 個節點是 1 次交接，6 個節點是 15 次可能的交互。複雜度不是線性成長，是指數級的。

我從真實公司帶著這套經驗出來，覺得自己很懂管理。然後認認真真地，把一句話能解決的事，拆成了一套管理系統。

然後花四個小時在管理這套系統。

一個 agent 能做到什麼？

同一天稍早，我用 Claude Code 準備了一場工作坊。修改模板、更新網頁、寫流程文件、壓縮上傳、部署網站。

一個 session。40 分鐘。全部搞定。

同一個對話裡，它是研究員、是寫手、是工程師——需要什麼角色就切換，所有 context 都在。不需要開工單、不需要等排程、不需要跑簽核、不需要特殊格式才能叫醒同事。

我說「改這個」，它改了。我說「不對」，它馬上改。

換成 Paperclip？我要在工單上寫一條留言，用正確的格式 @mention 那個 agent，它醒來後重新載入所有 context，讀完歷史紀錄，理解我要改什麼，然後才開始動。

一句話的修改，變成一條完整的工單流程。

回頭看那 6 個 agent 的管理系統——

	6 個 Agent + 管理系統	1 個 Session
從想法到初稿	15+ 步、4 小時	1 步、30 分鐘
中間的等待	每步等排程叫醒	0
簽核流程	2 次正式簽核	看了直接說改哪裡
出錯修正	改指令 → 重跑 → 等結果	「不對，改成這樣」

Paperclip 把一句話能解決的事，變成了一套簽核流程。

什麼時候才需要？

不是 Paperclip 不好。它的底層設計很紮實——兩個 agent 不會搶同一個任務、預算超支自動暫停、所有操作都有紀錄不能竄改。這些機制在對的場景會救命。

問題是場景。

你的情況	建議	原因
一個人或小團隊	一個 agent + 好的 Harness	說改就改，比任何流程都快
無人值守、7x24 持續運轉	持久化多 agent 系統	沒有人在線，系統自己跑

工作性質也會影響。如果你的任務有明確的規格和 pass/fail——跑測試、跑部署、跑數據流程——流程和自動化的價值就高。但如果每一步都需要人判斷、方向隨時會變，硬套流程只會把彈性鎖死。

跟真實公司一樣——3 個人的團隊不需要 OKR、不需要簽核流程、不需要週會。硬要導入只會拖慢速度。Anthropic 在 Building Effective Agents 中也強調：

Success in the LLM space isn’t about building the most sophisticated system. It’s about building the right system for your needs.

（在 LLM 領域，成功不是建最複雜的系統，而是建最適合你需求的系統。）

那一天白費了嗎？

沒有。

跑過一次才知道，我的工作裡哪些環節真的需要流程，哪些只是在給自己製造工作。

公司架構保留著。6 個 agent 的指令寫好了。一個指令就能啟動。

等有一天真的需要無人值守，或是工作變成有明確流程的流水線——有固定的輸入、固定的步驟、固定的 pass/fail——那天再啟動它。但那天不是今天。

回到 Claude Code + Harness。一個 session。一個 agent。說什麼做什麼。不對馬上改。

做了 10 年 PM，學到最重要的一課：流程是為了規模。沒有規模，流程就是枷鎖。

用 AI 組團隊也一樣。

想自己建一套高效運轉的 AI 系統？5/16（六） 我和 Vista 在台北開一場 6 小時實作工作坊，帶你從零建好 Claude Code + Obsidian 的個人 AI 指揮中心——不需要會寫程式。看工作坊詳情 →

喜歡這類內容？我每週寫一封信，聊怎麼把 AI 用在真實生活和工作裡，和一路上想通的道理。訂閱直接寄給你。

我建了一間 AI Agent 公司，第一天就想解散它

零人公司的誘惑

第一天

multi agent 有哪些隱藏成本？

管理成本

交接成本

Context 重建成本

流程的目的是什麼？

一個 agent 能做到什麼？

什麼時候才需要？

那一天白費了嗎？

常見問題

相關文章

Harness：決定 AI Agent 成敗的不是模型，是這個東西

Agentic Coding：從 Vibe Coding 到 AI 自主寫程式的進化

Claude Code 教學：5 分鐘完成安裝與第一個任務