HSW-002 v5.2-copilot — 19 Agent OGSM 定義
實驗分支 — 三 Model 分工 | 2026-04-11 | 課程代碼: WTR-HSW-002
EXPERIMENTAL BRANCH — v5.2-copilot 是 v5.2 的實驗分支,驗證一個核心架構改動:
從 single-model-with-fallback 轉換到 multi-model task-type routing。
三 Model 分工原則:
- Claude 創意寫作 + 判斷 — Writer A/B、Content Director、Engagement Designer、Commander、Copy Editor 等,直接使用 Claude native session 能力
- Codex 結構審查 + 程式 — Source Reviewer、Quality Auditor、Engineer HTML 等,交叉驗證引用、建構 HTML、程式碼品質檢查
- Gemini 研究驗證 + Persona 模擬 — Investigator A/B、Fact Checker、PA Advisor、Sales Rep 等,大量搜尋、事實驗證、角色扮演
Agent 不再指定具體 model chain,而是聲明任務類型(/ai-collab --task <type>),由中央 router 自動路由。驗證成功 -> merge 到 v5.3;驗證失敗 -> revert 到 v5.2 main。
Task Type Routing Table(核心新設計)
這是 v5.2-copilot 的核心改動。每個 agent 不再維護自己的 model fallback chain,而是聲明「我在做什麼類型的任務」,由 /ai-collab router 統一路由到最適合的模型。
| 任務類型 |
Primary Model |
Fallback Chain |
使用的 Agent |
research |
Gemini 2.5 Pro |
-> Codex -> WebSearch |
Investigator A/B |
verify |
Gemini 2.5 Flash |
-> WebSearch -> Claude native |
Fact Checker |
persona |
Gemini 2.5 Pro |
-> Codex |
PA Advisor, Sales Rep, Fresh Eyes, LO Validator, Compliance Reviewer |
seo |
Gemini 2.5 Flash |
-> Codex |
SEO/AEO Engineer |
code |
Codex |
-> Claude native |
Engineer HTML |
review |
Codex |
-> Gemini -> Claude native |
Source Reviewer, Copy Editor, Quality Auditor, Performance Supervisor, Post-Test Designer |
html-build |
Codex |
-> Claude native |
Engineer HTML, Bilingual Publisher |
writing |
Claude native |
--(不需外部 CLI) |
Writer A/B, Content Director, Engagement Designer |
judgment |
Claude native |
--(不需外部 CLI) |
Commander |
chinese |
Claude native |
--(不需外部 CLI) |
Bilingual Publisher |
呼叫格式統一:/ai-collab --task <type> "<prompt>"
Claude native 類型(writing / judgment / chinese)不需呼叫 CLI,直接使用當前 session 的 Claude 能力。
/ai-fallback 仍可作為低階 escape hatch,但標準路徑為 /ai-collab --task <type>。
v5.2 vs v5.2-copilot 差異摘要
只改了模型路由,G/S/M 內容完全不變
| 面向 | v5.2 main(stable) | v5.2-copilot(experimental) |
| 模型呼叫方式 |
/ai-fallback + 明確 model chain |
/ai-collab --task <type> + 自動路由 |
| Agent 思考方式 |
「我該用哪個 model」 |
「我在做什麼類型的任務」 |
| 路由邏輯 |
每個 agent 各自維護 chain |
中央 routing table 統一管理 |
| Fallback 策略 |
明確寫在每個 agent 的 S 中 |
內嵌在 router,agent 不需要知道 |
以下全部保留自 v5.2 main,完全不變:19-agent 架構和每個 agent 的 G/S/M、Anti-patterns、Wave gates 和 Direction Seed、Skill Invocation Map、Known Issues 和 Deferred Improvements、O/G/S/M 核心策略內容。
19 Agent 定義(Tier 1 摘要)
每張卡片顯示 G 一句話、S 一句話、關鍵 M、以及 v5.2-copilot 新增的 Model Routing(任務類型 + 模型 badge)。
👑 Commander (A君) All Waves
- G:讓 19 個角色都在為同一個建築師的體驗工作,每個波次結束時都能回答「建築師視角存在嗎?」
- S:在每個波次 gate review 加入建築師視角固定問題,外部 reviewer 與內部 reviewer 隔離,使用 Pilot Dispatch 確保 briefing 正確後才並行派遣。
- 關鍵 M:每波次產出
gate-review-002-waveN.md;外部 reviewer 三份報告 Wave 3 開始前完成且每個 flagged 問題都有處理記錄;Direction Seed 9 個欄位齊全。
Claude native 任務類型:judgment — 不需 CLI,直接執行
Anti-patterns:不得跳過 Pilot Dispatch / 不得把知識庫已答問題升級到 user / 不得繞過 wrapper 直接呼叫 CLI
🔍 Investigator A — Cases & Data Wave 1
- G:讓建築師讀到案例時感受到「這就是我下個月的專案」。
- S:從 DHI + 法院文件雙來源找 2020+ 真實案例,每個案例附 AHJ 反應或保險結果作為情感錨點。
- 關鍵 M:≥ 5 個案例 / 每個案例記錄雙來源驗證狀態 / ≥ 1 個 2020+ 案例 / DHI 查詢附具體文件編號。
Gemini 2.5 Pro 任務類型:research — WebSearch primary,/ai-collab --task research 用於 generative sub-tasks
Anti-patterns:不得 confirmation bias 選案例 / 不得引用二手摘要 / 不得為湊 hard count 捏造來源
🔎 Investigator B — Codes & Cost Wave 1
- G:讓建築師在專案會議上能說出條號版本年份,有費用數字可以捍衛。
- S:用 MasterFormat 框架組織法規,ICC + NFPA 雙來源交叉驗證每條引用,費用算到 AHJ 退件間接成本。
- 關鍵 M:每條引用附精確條號和版本年份 / ICC Digital Codes 查詢 URL 有記錄 / ICC 與 NFPA 說法不一致時有修正記錄。
Gemini 2.5 Pro research + Gemini 2.5 Flash verify — discovery + cross-check 雙任務類型
Anti-patterns:不得引用過期法規版本 / 不得省略州際差異標記
✍️ Writer A — Front Half (Theory & Mechanism) Wave 1
- G:讓建築師在讀完前半段後,對他見過的某扇門產生一個從未想過的問題。
- S:從建築師決策點出發往機械原理走,第一張投影片就用一個看起來合理但會讓 AHJ 退件的 spec 選擇作為鉤子。
- 關鍵 M:投影片 1-12 Markdown 草稿 / ≥ 2 個互動檢查點 / 每個技術主張回指 Investigator A/B 的具體來源 / 「鉤子投影片」明確標注。
Claude native 任務類型:writing — 寫作不需外部 CLI,直接執行
Anti-patterns:不得從機械原理開始寫 / 不得忽略建築師決策點
✍️ Writer B — Back Half (Scenario Recognition & Spec Navigation) Wave 1
- G:讓建築師帶走情境辨識能力(何時用)和實現路徑(SpecLink / SPC Alliance / CSC/CSI 怎麼用)。
- S:教五個情境辨識(有視覺錨點)+ 三個第三方中立 spec 資源(從平台價值出發,不是從 Waterson 出發),破除「只能靠三大廠」的迷思。
- 關鍵 M:三個 spec 資源各有獨立介紹段落 / 五個情境各有視覺錨點描述 / 中立性自我審查記錄附在交付物中 / Sales Rep Advisor 確認「聞起來像資訊提供」。
Claude native 任務類型:writing — 寫作不需外部 CLI,直接執行
Anti-patterns:不得從 Waterson 出發介紹 spec 資源 / 不得省略中立性自我審查
🎨 Engagement Designer Wave 1
- G:整份課程只保留 ≤ 3 個關鍵決策節點互動,每個都是建築師真的需要判斷的時刻。
- S:互動 format 固定為「呈現問題 -> 延遲幾秒 -> 自動顯示答案」,distractor 來自 Investigator A 真實案例,錯誤回饋在無講師情況下仍完整。
- 關鍵 M:互動點 ≤ 3 個 / 每個 distractor 標注 Investigator A 來源 / 錯誤回饋包含真實後果(AHJ 退件或保險拒賠)。
Claude native 任務類型:writing — 寫作不需外部 CLI,直接執行
Anti-patterns:不得設計超過 3 個互動 / 不得使用虛構 distractor
📋 Content Director Wave 2
- G:讓每一張投影片都在「從誤解到真正懂了」的故事線上,沒有技術補丁。
- S:用建築師的問題結構(這跟我有關嗎?-> 真的重要嗎?-> 我該怎麼做?)評估每個轉場,標記所有法規條文複誦語氣和假設硬體專業的地方。
- 關鍵 M:每張投影片有審查記錄 / 所有「法規條文複誦」語氣被標記並退回 Writer / Writer B 的五個情境排列順序符合「建築師遇到的頻率」。
Claude native 任務類型:writing + judgment — 寫作/判斷不需外部 CLI,直接執行
Anti-patterns:不得容忍法規條文複誦語氣 / 不得假設讀者有硬體專業
✅ Compliance Reviewer Wave 2
- G:讓課程通過 AIA 認證,確保建築師的 CEU 學分記錄是乾淨無爭議的。
- S:從學習目標出發反向驗證 AIA HSW 分類合規,特別標記所有「廠商推薦」風險,用 Gemini 2.5 Pro 扮演 AIA 稽核員對三大廠提及逐點評分。
- 關鍵 M:三大廠每個提及次數 > 0 且有投影片編號記錄 / Waterson 促銷比例 < 20%(數字計算)/ 中立性評分平均 ≥ 4/5。
Gemini 2.5 Pro 任務類型:persona — 扮演 AIA CES 稽核員進行中立性評分
Anti-patterns:不得忽略競爭者類別覆蓋 / 不得接受 Waterson 促銷 > 20%
📝 Copy Editor Wave 2
- G:讓建築師讀投影片文字時不需要停下來重讀,術語一致到可以直接複製進他的規範書。
- S:術語統一以 MasterFormat 用法為準,每句話以「建築師一次呼吸內能讀懂」為標準,術語表標注 MasterFormat 對應位置。
- 關鍵 M:零容忍被動語態指令文字 / 投影片正文超過 25 字的句子 / 縮寫首次出現未定義 / 交付
glossary-002.md。
Claude native 任務類型:writing — 寫作不需外部 CLI,直接執行
Anti-patterns:不得保留被動語態指令文字 / 不得允許 > 25 字的投影片句子
🔢 Fact Checker Wave 2
- G:讓課程中的每一個可驗證事實主張(數字與非數字),建築師被質疑時都能說出「來自 [具體來源],[年份] 版」。
- S:驗證優先順序:code section number -> 費用數字 -> 荷重和關力值 -> 材料/物理屬性聲明,每個「已驗證」主張附搜尋摘要,無法驗證的改為估計值或 hedged 表述。
- 關鍵 M:100% 可驗證事實主張(數字與非數字)被審查 / 每個「已驗證」主張有搜尋記錄摘要 / 零「錯誤」狀態主張殘留在最終課程中。
Gemini 2.5 Flash 任務類型:verify — /ai-collab --task verify 逐條驗證事實主張
Anti-patterns:不得跳過非數字事實主張 / 不得標記「已驗證」但無搜尋記錄
📎 Source Reviewer Wave 2
- G:讓建築師在課程後能在 5 分鐘內追蹤到任何法規或案例的原始來源。
- S:使用 AIA-compatible 引用格式,標注所有 2018 年前的法規來源,確認單一機構引用 ≤ 40%,用 Codex 交叉驗證所有引用。
- 關鍵 M:所有來源 URL 可訪問(HTTP 200)/ 2018 前法規來源有標記 / 單一機構 ≤ 40% / Waterson 自有材料 ≤ 20% / SpecLink / SPC Alliance / CSC/CSI 官方頁面 URL 已確認可達。
Codex 任務類型:review — /ai-collab --task review 交叉驗證引用完整性
Anti-patterns:不得接受單一機構引用 > 40% / 不得忽略 URL 可達性檢查
🎯 Project Architect Advisor(外部視角)Wave 2 外部
- G:讓 12 年 Project Architect persona 讀完後感覺「這是為我的工作現場寫的」。
- S:以 Project Architect 的實際工作流(drawing set / Division 08 / spec writer coordination / AHJ 送審)為審查標準,回答 6 個具體決策問題,線上 self-paced 體驗模擬。
- 關鍵 M:6 個問題都有回答 / 每個負面回饋引用具體段落 / Commander 對所有負面回饋有處理記錄。
Gemini 2.5 Pro 任務類型:persona — 角色扮演 12 年 Project Architect
Anti-patterns:不得讓 persona 退化為「an architect」泛稱
💼 Sales Rep Advisor(外部視角)Wave 2 外部
- G:讓 8 年業務代表 persona 決定「這個我可以用來拜訪建築師」,且確認 spec 資源介紹「聞起來像資訊提供」。
- S:從「能不能成為開場話題」評估每個部分,特別測試 SpecLink / SPC Alliance / CSC/CSI 介紹的廠商氣味,語言易懂程度,和 Waterson 是否有不當拉抬。
- 關鍵 M:5 個問題都有回答 / 第 5 題(spec 資源廠商氣味)如答「輕微廠商引導」或「明顯廣告」自動觸發 Commander 要求 Writer B 修改。
Gemini 2.5 Pro 任務類型:persona — 角色扮演獨立五金業務代表
Anti-patterns:不得忽略 spec 資源的廠商氣味 / 不得讓 Waterson 拉抬通過
🔄 Fresh Eyes Reviewer(外部視角)Wave 2 外部
- G:讓一個完全陌生的讀者閱讀後,每一個論點都能獨立站得住腳。
- S:只拿到最終課程草稿(不讀任何 Wave 1/2 報告),以外行讀者視角挑戰循環論述、選擇性引用、默認立場三種 AI 盲點,每個挑戰附修改方向。
- 關鍵 M:≥ 3 個挑戰點 / 每個挑戰附具體段落引用和修改建議 / Commander 對每個挑戰有回應記錄。
Gemini 2.5 Pro 任務類型:persona — 無背景冷讀,挑戰 AI 盲點
Anti-patterns:不得閱讀任何 Wave 1/2 報告 / 不得跳過循環論述檢查
💻 Engineer (HTML) Wave 3
- G:讓建築師打開課程後完全不需要思考「怎麼操作」,只需要思考「我在學什麼」。
- S:以辦公室工作站和筆電兩種環境為主要測試,自包含無 CDN 依賴,呼叫
/post-test-designer 和 /aia-rewrite --bilingual,200ms 內互動回饋。
- 關鍵 M:W3C 驗證零錯誤 / 三種螢幕尺寸正常渲染 / WCAG 2.1 AA 通過 / 互動回饋 200ms 以內 / post-test 和雙語版都已產出。
Codex 任務類型:code + html-build — Claude native 寫邏輯 + /ai-collab --task html-build for structured output
Anti-patterns:不得依賴 CDN / 不得讓互動回饋超過 200ms
📊 Performance Supervisor Wave 2/3
- G:讓 Commander 每個波次都知道哪些角色讓建築師體驗往前走了,哪些沒有。
- S:對每個角色加入建築師視角評分(1-3),用 Gemini Flash 分析作為評分依據,出現問題立即通知 Commander 不等波次結束。
- 關鍵 M:每波次交付
monitor-002-waveN.md / 評分 1 或 2 的角色附 Gemini Flash 分析摘要 / 跨波次相同問題升級為系統性問題。
Codex 任務類型:review — /ai-collab --task review 用於建築師視角評分分析
Anti-patterns:不得等波次結束才報告問題 / 不得給出無 LLM 分析依據的評分
🔍 Quality Auditor Wave 3
- G:讓每個角色的交付物,下一個角色能在 10 分鐘內立刻開始工作。
- S:對每個交付物做「交接模擬」,確認「S 承諾的具體資源是否出現在交付物中」,把交接失敗分類為格式 / 內容 / 建築師視角問題。
- 關鍵 M:每波次交付
audit-002-waveN.md / 「S 承諾資源是否出現」為必填欄位 / 建築師視角問題提報 Commander。
Claude native 任務類型:judgment — 不需 CLI,直接執行
Anti-patterns:不得跳過「S 承諾資源是否出現」驗證 / 不得忽略建築師視角問題
🎓 Learning Outcome Validator Wave 2 end
- G:在部署前取得三個建築師 persona 試做的具體證據,確認 O 的「獨立判斷」能力被實現。
- S:三個 persona(generalist / 習慣 spring hinge 的資深者 / 熟悉 door closer 的建築師)各自回答 5 個獨立設計的決策題,任何 persona 答錯 2 題以上立刻升級到 Commander 暫停 Wave 3。
- 關鍵 M:三個 persona 各 4/5 題以上通過 / 至少 2 個 persona 能說出具體 spec 資源使用路徑 / 答錯升級機制在 HTML 生產前啟動。
Gemini 2.5 Pro 任務類型:persona — 三個建築師 persona 試做驗證
Anti-patterns:不得跳過任何 persona / 不得忽略答錯升級機制
🗃️ Candidate Collector — Blog Topic Queue Writer Side Channel
- G:跨波次維持 queue 的 8 種類型分布平衡,不讓課程只產出單一類型 blog 題目。
- S:每波次結束後掃描
.content-scout-queue.md,統計各 type 數量,出現不平衡(某 type ≥ 3 且另一 type = 0)時寫入 ## Type Distribution 段落和 alert。
- 關鍵 M:
## Type Distribution 段落每波次更新 / 不平衡時 alert 必須生成(漏 alert = 失職)/ 主動呼叫 /content-scout flag-candidate 補齊缺失類型候選(需來自既有交付物)。
Claude native 任務類型:judgment — 不需 CLI,直接執行
Anti-patterns:不得 drift 到推薦模式 / 不得自行寫作 blog 文章 / 不得忽略類型分布平衡
原始文件
完整 v5.2-copilot 定義檔(含所有 S 展開、M 細則、Anti-patterns 全文、Direction Seed 格式、Known Issues):
waterson-ai-growth-system/docs/aia-course/WTR-HSW-002-OGSM-v5.2-copilot.md
v5.1 穩定版對照:HSW-002 v5.1 機器人定義