09:把 AI 當成真正的團隊成員:我的 Multi-Agent 管理哲學

Multi-Agent Mar 20, 2026

這是 Nerigate Build Log 系列的第九篇。上一篇談的是任務路由決策框架——點這裡回顧


如果我問你「怎麼管理 AI Agent 系統」,你可能會想到的是:提示詞工程、API 限制、token 預算⋯⋯

這些都重要,但不是最重要的。

最重要的,其實是職責設計

我在建立雙 Agent 系統的過程中,慢慢發現:管理 AI Agent 和管理人類團隊成員,用的是同一套原則。


每個 Agent 需要一份「員工手冊」

在我的系統裡,每個 Agent 都有一個 AGENTS.md 文件。

這份文件定義角色定位、做什麼不做什麼、工作規則、協作方式。

聽起來像員工手冊,對吧?因為它就是。

沒有這份文件,每次對話 Agent 都從零開始判斷「我應該怎麼回應這個問題」。有了它,Agent 在每次啟動時都有一個一致的行為基準。

這解決了一個很大的問題:AI Agent 沒有記憶,但可以有行為一致性。


職責分離:兩隻貓,兩個角色

我的系統裡有兩個 Agent:

DarkMeow(主控端):負責分析、判斷、規劃、協作管理。用的是 Claude Sonnet 作為預設模型,需要高品質分析推理則切換至 Opus;DarkMeow 不直接執行搜尋或外部 API 呼叫,這些工作派給 MeowClaw。

MeowClaw(偵察/執行端):負責搜尋、蒐集、執行程式任務。用的是 Codex,適合工具呼叫和程式碼;MeowClaw 不做策略決策,它執行指令。

這個分工不是隨機決定的,而是根據每個模型的優勢設計的:

  • Claude 善於推論和語言理解 → DarkMeow 做判斷
  • Codex 善於工具呼叫和程式碼 → MeowClaw 做執行

就像人類團隊裡,你不會讓同一個人既做策略規劃又做開發衝刺。


何時應該「招募」新 Agent?

在跟同仁或者朋友說明龍蝦時,經常會被問到一個問題:「什麼時候應該增加新的 Agent?」

我的判斷標準很簡單——當一個現有 Agent 的職責開始模糊的時候。

舉個例子:如果 DarkMeow 既要做分析、又要做搜尋、又要做程式碼調試,每次呼叫的 system prompt 就需要同時考慮三種不同模式的行為期待。這會導致回應品質下降,也難以調試。

解決方法是:把其中一個職責獨立成新的 Agent,給它自己的定義文件和模型選擇。

這和組織設計是一樣的邏輯:一個部門職責太多,就拆部門。


Agent 之間的協作:結構化交接

最容易出問題的環節,往往是 Agent 之間的交接。

DarkMeow 把任務派給 MeowClaw 的時候,如果只是說「去研究一下 Proxmox」,MeowClaw 可能回來給一份完全不符合需求的報告。

我現在的交接格式是這樣的:

🏷️ 問題分類:研究
🎯 任務目標:比較 Proxmox 和 ESXi 在小型 homelab 場景的差異
📋 已知資訊:目前用 Synology NAS,評估是否轉移
⚠️ 需要的輸出:比較表格 + 遷移成本估算
🔗 參考來源:請搜尋近 6 個月的資料

這樣 MeowClaw 收到的是結構化指令,而不是模糊的目標。

結構化交接還有另一個好處:如果任務失敗,我能快速定位問題在哪個環節。


三個反直覺的教訓

教訓一:越自主不一定越好。

AI Agent 可以設計得非常自主——讓它自己決定使用哪些工具、派發幾個子任務、用什麼模型。

但完全自主的 Agent 很難預測,出問題也很難 debug。我現在的原則是:能明確的地方就明確,把自主性留給真正開放性的任務

教訓二:限制是一種設計,不是缺陷。

我在 AGENTS.md 裡明確寫了「不應該做什麼」——不修改哪些系統設定、不執行哪類高風險操作、不越過某些資料邊界。

這些限制讓系統更可預測,也讓我更安心授權 Agent 去做事。

教訓三:失敗要設計進去,不是事後補救。

每個 Agent 任務都有可能失敗。問題不是能不能失敗,而是失敗的時候系統怎麼反應。

我現在的設計是:連續失敗 3 次 → 換策略,不是繼續重試同一件事。這個斷路器機制省了很多時間,也避免了「Agent 無限循環執行同一個失敗任務」的悲劇。


管 AI 和管人,本質上一樣

核心問題完全相同:

  • 職責清不清楚? → AGENTS.md / 職位說明書
  • 協作流程順不順? → 結構化交接 / 會議紀錄
  • 出問題怎麼辦? → 斷路器 / 升級機制

對象換了,原則沒變。

唯一的差別是:AI Agent 不會累,不會抱怨,也不會不好意思說「我不懂」。你給它清楚的定義,它就照著做。

這讓我想到一個問題:管理人的時候,我是不是也把這些基礎做好了?


這是 Nerigate Build Log 系列的第九篇。
← 上一篇:08:什麼任務該派 AI Agent?決策框架
下一篇:10:我睡著的那晚,AI 做了什麼?→

Tags