09：把 AI 當成真正的團隊成員：我的 Multi-Agent 管理哲學

Multi-Agent Mar 20, 2026

這是 Nerigate Build Log 系列的第九篇。上一篇談的是任務路由決策框架——點這裡回顧。

如果我問你「怎麼管理 AI Agent 系統」，你可能會想到的是：提示詞工程、API 限制、token 預算⋯⋯

這些都重要，但不是最重要的。

最重要的，其實是職責設計。

我在建立雙 Agent 系統的過程中，慢慢發現：管理 AI Agent 和管理人類團隊成員，用的是同一套原則。

每個 Agent 需要一份「員工手冊」

在我的系統裡，每個 Agent 都有一個 AGENTS.md 文件。

這份文件定義角色定位、做什麼不做什麼、工作規則、協作方式。

聽起來像員工手冊，對吧？因為它就是。

沒有這份文件，每次對話 Agent 都從零開始判斷「我應該怎麼回應這個問題」。有了它，Agent 在每次啟動時都有一個一致的行為基準。

這解決了一個很大的問題：AI Agent 沒有記憶，但可以有行為一致性。

職責分離：兩隻貓，兩個角色

我的系統裡有兩個 Agent：

DarkMeow（主控端）：負責分析、判斷、規劃、協作管理。用的是 Claude Sonnet 作為預設模型，需要高品質分析推理則切換至 Opus；DarkMeow 不直接執行搜尋或外部 API 呼叫，這些工作派給 MeowClaw。

MeowClaw（偵察/執行端）：負責搜尋、蒐集、執行程式任務。用的是 Codex，適合工具呼叫和程式碼；MeowClaw 不做策略決策，它執行指令。

這個分工不是隨機決定的，而是根據每個模型的優勢設計的：

Claude 善於推論和語言理解 → DarkMeow 做判斷
Codex 善於工具呼叫和程式碼 → MeowClaw 做執行

就像人類團隊裡，你不會讓同一個人既做策略規劃又做開發衝刺。

何時應該「招募」新 Agent？

在跟同仁或者朋友說明龍蝦時，經常會被問到一個問題：「什麼時候應該增加新的 Agent？」

我的判斷標準很簡單——當一個現有 Agent 的職責開始模糊的時候。

舉個例子：如果 DarkMeow 既要做分析、又要做搜尋、又要做程式碼調試，每次呼叫的 system prompt 就需要同時考慮三種不同模式的行為期待。這會導致回應品質下降，也難以調試。

解決方法是：把其中一個職責獨立成新的 Agent，給它自己的定義文件和模型選擇。

這和組織設計是一樣的邏輯：一個部門職責太多，就拆部門。

Agent 之間的協作：結構化交接

最容易出問題的環節，往往是 Agent 之間的交接。

DarkMeow 把任務派給 MeowClaw 的時候，如果只是說「去研究一下 Proxmox」，MeowClaw 可能回來給一份完全不符合需求的報告。

我現在的交接格式是這樣的：

🏷️ 問題分類：研究
🎯 任務目標：比較 Proxmox 和 ESXi 在小型 homelab 場景的差異
📋 已知資訊：目前用 Synology NAS，評估是否轉移
⚠️ 需要的輸出：比較表格 + 遷移成本估算
🔗 參考來源：請搜尋近 6 個月的資料

這樣 MeowClaw 收到的是結構化指令，而不是模糊的目標。

結構化交接還有另一個好處：如果任務失敗，我能快速定位問題在哪個環節。

三個反直覺的教訓

教訓一：越自主不一定越好。

AI Agent 可以設計得非常自主——讓它自己決定使用哪些工具、派發幾個子任務、用什麼模型。

但完全自主的 Agent 很難預測，出問題也很難 debug。我現在的原則是：能明確的地方就明確，把自主性留給真正開放性的任務。

教訓二：限制是一種設計，不是缺陷。

我在 AGENTS.md 裡明確寫了「不應該做什麼」——不修改哪些系統設定、不執行哪類高風險操作、不越過某些資料邊界。

這些限制讓系統更可預測，也讓我更安心授權 Agent 去做事。

教訓三：失敗要設計進去，不是事後補救。

每個 Agent 任務都有可能失敗。問題不是能不能失敗，而是失敗的時候系統怎麼反應。

我現在的設計是：連續失敗 3 次 → 換策略，不是繼續重試同一件事。這個斷路器機制省了很多時間，也避免了「Agent 無限循環執行同一個失敗任務」的悲劇。

管 AI 和管人，本質上一樣

核心問題完全相同：

職責清不清楚？ → AGENTS.md / 職位說明書
協作流程順不順？ → 結構化交接 / 會議紀錄
出問題怎麼辦？ → 斷路器 / 升級機制

對象換了，原則沒變。

唯一的差別是：AI Agent 不會累，不會抱怨，也不會不好意思說「我不懂」。你給它清楚的定義，它就照著做。

這讓我想到一個問題：管理人的時候，我是不是也把這些基礎做好了？

這是 Nerigate Build Log 系列的第九篇。
← 上一篇：08：什麼任務該派 AI Agent？決策框架
下一篇：10：我睡著的那晚，AI 做了什麼？→

Recommended for you

OpenClaw

10：我睡著的那晚，AI 做了什麼？OpenClaw 離線自主運作實錄

a month ago • 5 min read

AI Agent

08：什麼任務該派 AI Agent？從 DarkMeow 架構學到的決策框架

a month ago • 4 min read

Ollama

07：本地 LLM 不等於免費：Crow-9B 實測，以及 Qwen 讓我等到睡著的故事

a month ago • 5 min read

10：我睡著的那晚，AI 做了什麼？OpenClaw 離線自主運作實錄