Door Hinge Knowledge Hub by Watersonusa

AI Agent Team Architecture: OGSM Framework + 3-Layer Skills + Multi-Model Routing

By Waterson Corporation • Published 2026-04-11 • Audience: AI Practitioners & Developers

如何用 OGSM + 三層架構 + 多 AI 分工設計高效 Agent 團隊

What is the best architecture for AI agent teams? 結合 OGSM 目標框架、三層知識架構(CLAUDE.md / Memory / Skills)、以及按任務類型分派 AI model 的 routing 機制,就是我們實戰驗證過的答案。這套 ai agent team architecture 已經用在 19 個 agent 同時協作的 AIA 課程產出,以及 9-agent 的 Blog Writer Fleet。

大多數人用 AI 的方式像在跟實習生對話——每次都從頭教。如果你有 19 個 AI 實習生同時工作呢?沒有架構,你會花更多時間管理混亂,而不是產出成果。這篇文章分享我們從零開始設計 AI agent 團隊的完整方法論,從目標設定到多 model 分工,每一層都有實戰案例佐證。

第一層:三層架構讓設定變簡單

想像你經營一間公司,每個新進員工報到時需要什麼?

架構層 比喻 載入時機 用途
CLAUDE.md 員工手冊 每次對話自動載入 開發原則、Git 設定、角色定義
Memory 個人筆記本 每次對話自動載入 回饋記錄、偏好設定、專案狀態
Skills 專業工具包 需要時才載入 可重複使用的流程、參考文件、腳本

這就是 claude code skill architecture 的核心。員工手冊(CLAUDE.md)寫的是每個人都要遵守的規則——開發流程、溝通風格、意圖偵測表。筆記本(Memory)記的是從過去錯誤學到的教訓,像是「先理解再動手」、「美式大字 16-20px」。工具包(Skills)則是特定任務才打開的專業模組,例如 /aia-rewrite 課程重寫流程、/publish-article 文章發佈流程。

關鍵設計原則: CLAUDE.md 每次都會消耗 context tokens,所以要精簡。大量參考資料放在 Skills 的 references/ 資料夾,需要時才載入,達到零 context 成本。

判斷資訊該放哪一層的快速測試:

  1. 每次對話都需要? → CLAUDE.md
  2. 從過去錯誤學到的? → Memory
  3. 其他專案也能用? → Skill

想了解完整的三層架構設計細節,請參考我們的 Claude Code Memory & Skill Architecture 系列文章

第二層:OGSM 讓 Agent 有目標地合作

三層架構解決了「知識怎麼存」的問題。但 19 個 agent 要怎麼對齊方向?這就是 OGSM framework ai agent planning 的價值所在。

OGSM 代表 Objective(最終目的)、Goals(階段目標)、Strategies(策略路徑)、Measures(驗證指標)。跟 OKR 不同,OGSM 是故事驅動、以受眾為中心的框架。

每一層怎麼對應到 Agent 定義

OGSM 層 Agent 定義中的角色 常見錯誤
O 整個團隊的最終目的。必須有情感、指定受眾、聚焦成果 太抽象(「成為最好的」)
G 每個 agent 獨特貢獻的一句話目標 寫成任務清單
S 這個 agent 選擇的策略路徑,包含 Skill 和 Model 調用 用泛用方法
M 驗證 S 的資源是否真的被使用 只數交付物數量

黃金法則

每個 G 都應該讓讀者感受到目標受眾的存在。

Direction Seed:派遣 Agent 的 9 欄位 briefing

當你用 Agent tool 派遣子 agent 時,它們跑在隔離的 context 中——看不到你的 CLAUDE.md、Memory、或當前對話。所以每次派遣都必須帶完整的 Direction Seed。

9 個欄位包括:課程/專案 ID、目標受眾 persona、完整 Objective、該 agent 的 G/S/M、Skill + Model 調用清單、硬限制、語氣要求、交付格式、以及至少 3 條 Anti-patterns

Anti-patterns 為什麼重要?因為子 agent 會「善意但錯誤地」解讀 briefing。列出「不要做 X,改做 Y」的清單,就是在回答:「如果這個 agent 理解錯了,最可能怎麼錯?」

Pilot Dispatch 模式

每個 Wave 先派 1 個 agent(pilot),等結果,對照 O 做 sanity check,然後才平行派其他人。為什麼?大多數 briefing 問題是系統性的——來自設計者的假設,不是 agent 的問題。Pilot 出錯,修 briefing 只要 1 次。4 個 agent 同時出錯,要修 4 次。

完整的 OGSM agent 規格可以參考我們的 v5.2 機器人定義頁v5.2-copilot 版本

第三層:多 Model 各司其職

How to route tasks between Claude, Gemini, and Codex? 答案是按任務類型 routing,不是把一個 model 綁定給一個 agent。

這是我們跟 LangGraph、CrewAI 等框架最大的差異。他們的做法是 per-agent binding:Investigator 用 GPT-4,Writer 用 Claude。問題是 Investigator 用 GPT-4 做所有事——研究、寫筆記、格式化——即使另一個 model 更適合。

我們的 multi-model routing claude gemini codex 做法是 per-task-type routing:

任務類型 主要 Model 為什麼
research Gemini 2.5 Pro Google Search grounding,搜尋品質最好
verify Gemini 2.5 Flash 網路查證快又便宜
code / html-build Codex 結構化輸出最強
writing / judgment Claude 創意寫作、情感弧線、中文品質
seo Gemini 2.5 Flash Google 搜尋洞察

同一個 Investigator agent,研究用 Gemini,寫筆記用 Claude,格式化用 Codex。任務決定 model,不是 agent 身份決定 model。

成本效益: 把研究任務路由到 Gemini,在研究密集的專案中省下 40-60% 成本,而且搜尋品質因為 Google grounding 反而更好——品質和成本雙贏。

Script-First 原則

能用腳本做的事,不要派 AI。AI 是拿來做判斷和創意的,不是跑機械化任務。

錯誤做法 正確做法
派 Codex 生成 HTML md_to_blog.py
派 Gemini 檢查 404 check_links.py
派 AI 驗證 schema validate_schema.py

我們的 scripts/ 資料夾裡有 setup_team.sh(scaffold 新團隊)、generate_permissions.py(產生權限白名單)等工具。規則很簡單:先檢查 scripts/ 有沒有現成工具,只有需要判斷力或創意時才路由給 AI model。

實戰案例

HSW-007 AIA 課程:19-Agent Fleet

我們的 HSW-007 Healthcare Door Hardware 課程 用 19 個 agent、分 3 個 Wave 產出:

用 Background execution 平行跑,整個流程 15-20 分鐘完成,sequential 跑要 60-90 分鐘。

Blog Writer Fleet:9-Agent Fleet

Blog Writer Fleet 用 9 個 agent 寫出 3 篇文章。從 v5.1 升級到 v5.2 的改善數字:

這些改善來自 OGSM 的 M(Measure)層——我們驗證的是「S 的資源有沒有被真正使用」,而不只是「交付物有沒有產出」。

與 LangGraph / CrewAI 的比較

面向 LangGraph / CrewAI 我們的架構
Model 綁定 Per-agent binding(一個 agent 綁一個 model) Per-task-type routing(任務決定 model)
目標對齊 各 agent 獨立定義 OGSM 統一 Objective,每個 G 連回 O
知識管理 自定義 三層架構(CLAUDE.md / Memory / Skills)
成本 所有任務用同一個 model 研究用 Gemini、code 用 Codex,省 40-60%
派遣安全 無標準化 Direction Seed 9 欄位 + Pilot Dispatch

核心差異:我們的架構讓每個 agent 的每個子任務都用最適合的 model,而不是整個 agent 綁死一個 model。這在 agent 數量超過 10 個時,成本和品質差異會非常顯著。

FAQ

Q: What is the best architecture for AI agent teams?

A: 結合 OGSM 目標框架(確保 agent 對齊方向)、三層知識架構(管理持久化知識)、以及 per-task-type multi-model routing(每個任務用最適合的 AI),是我們實戰驗證最有效的架構。

Q: How to route tasks between Claude, Gemini, and Codex?

A: 按任務類型 routing:research 和 verify 給 Gemini(Google grounding)、code 和 html-build 給 Codex、writing 和 judgment 留給 Claude。不要把 model 綁定在 agent 上。

Q: OGSM 跟 OKR 有什麼不同?

A: OKR 是任務清單 + 檢查點。OGSM 是故事驅動、以受眾為中心的框架。每個 G 都要讓讀者感受到目標受眾的存在,不只是交付數量。

Q: claude code skill architecture tutorial 要怎麼開始?

A: 從三層架構開始:CLAUDE.md 放每次對話都需要的規則、Memory 放學習到的回饋和偏好、Skills 放可重複使用的流程和參考文件。詳細教學見 系列文章

Q: 需要多少個 agent 才值得用這套架構?

A: 3 個以上就值得。核心價值不在 agent 數量,在於目標對齊(OGSM)和知識管理(三層架構)。即使只有 3 個 agent,沒有 Direction Seed 的派遣也會產出不一致的結果。

Q: Background execution 能省多少時間?

A: 在 12-agent 的課程重寫中,平行執行約 15-20 分鐘,sequential 跑要 60-90 分鐘。省 3-4 倍時間。

Q: Script-first 原則適用於所有任務嗎?

A: 適用於所有確定性任務。如果輸入相同、輸出也應該相同,就用腳本。只有需要判斷力、創意、或上下文推理的任務才路由給 AI model。

Q: 這套架構能用在非 Claude Code 的環境嗎?

A: OGSM 框架和 per-task-type routing 的概念是通用的。三層架構是 Claude Code 的特定實作,但同樣的分層邏輯(always-loaded / auto-loaded / on-demand)可以應用到任何 agent 框架。

下一步