真實案例：OGSM v5 — AI Factory 迭代時代（19 個 Agent，16/19 驗證）| HSW-002

建築師教育課程 HSW-002 的 OGSM v5 工作計畫 • 2026-04-11 • v5 核心：v4 是 4 輪人類迭代的終點，v5 是 Agent Optimization Factory 驅動迭代的起點。Batch 1–4 驗證 16/19 agents。

這是 v5（AI Factory 時代）。v4 是 4 輪人類主導討論與迭代的成果（Round 1/2/3）。v5 是第一個由 Agent Optimization Factory 驅動的版本——改動完全來自 AI mini-agent 工廠的學習，不是人類的直覺判斷。尋找 v4？查看 v4 歷史版本（人類迭代時代終點）

v4 → v5：從人類迭代到 AI Factory

v4 = 人類迭代時代的終點。v5 = AI Factory 迭代時代的起點。

v4 是 chihao 帶領 4 輪人類討論＋判斷產生的版本。v5 是第一個由 Agent Optimization Factory 驅動的版本。Factory 派出 mini-agent 工廠，每個 agent 跑 3 個 cycle（每 cycle：Spec Verifier → Iterator → Dispatch Harness → BDD 驗收），從真實 production input 中找到規格缺陷，提出 smallest-possible-diff，並驗收 BDD pass rate 不退步。

v5 的改動完全來自工廠學習。人類不需要判斷「哪裡不好」——factory 自己找到了問題並修復。

v4 — 人類迭代時代

4 輪人類主導討論（Round 1/2/3）
改動由 chihao 的直覺判斷驅動
19 agents 規格定義完整
但 10 個 raw 模型呼叫未包 fallback
Direction Seed 只有 9 欄位（無 knowledge query）
無 scale-up 真實執行驗證

v5 — AI Factory 迭代時代

Agent Optimization Factory 驅動
改動來自 mini-agent 3-cycle 學習
10 個 raw 呼叫全部包入 /ai-fallback
Direction Seed 第 5 欄加入 3 條 knowledge query commands
Batch 1–4 驗證 16/19 agents 通過
6 個新 gotcha、5 個新 pattern 納入知識庫

v5 的三組改動

10 個 agent（Investigator A/B、Fact Checker、Compliance Reviewer、Source Reviewer、3 個外部 reviewer、Performance Supervisor、Learning Outcome Validator）的 Model commands 原本直呼 echo "Y" | gemini -m ... -p ... 或 codex exec。v5 全部改用 bash ~/.claude/skills/ai-fallback/scripts/call_with_fallback.sh "prompt" "chain" 包裝，加入 per-model timeout（120s/150s）。原因：factory pre-flight 發現 check_ai_fallback_usage.py FAIL 10 個 agent。

這是 Principle 7 延伸：subprocess agents 看不到 parent memory，所以查詢命令必須 embed 到 briefing。這是經驗傳承機制——未來 Iteration Team 自動繼承上一輪學到的所有 pattern + gotcha。

3. Smoke test 發現的 2 個 pre-scale blocker（記錄在 Known Issues，v5 尚未修）

Scale-up 進度：Batch 1–4（16/19 agents 驗證）

Smoke test 驗證 factory pattern 後，工廠在 2026-04-11 執行 Batch 1–4 的真實 agent scale-up。每個 agent 用 real production input 執行完整 BDD 驗收。

PAPER = paper exercise，BDD 設計通過但未跑真實 LLM production input。GO = 真實 production input + BDD 驗收通過。CAUTION GO = 通過但有已知邊界情況需監控。

總目標 O（Objective）

v5 的 O 與 v4 相同。O 是整個 19 人團隊唯一的北極星，factory 改動從不觸碰 O——factory 改的是達到 O 的路徑（S/M/anti-patterns），不是 O 本身。

Batch	Agent	BDD	狀態	關鍵發現
Batch 1	Investigator A	12/12	CAUTION GO	NEW-02 vacuous success on Codex; WebSearch saved 5 queries
Batch 1	Investigator B	11/12	CAUTION GO	G-011 paywall workaround via AHJ adoption channels
Batch 1	Writer A	13/13	GO	Substrate gap protocol triggered on 2 slides; BDD pre-pinning (P-014) applied
Batch 1	Writer B	12/13	GO	Toolbox framing improved architect independence score
Batch 2	Content Director	12/12 + 2 WEAK	GO	3/3 planted issues caught; WEAK on framing suggestions
Batch 2	Compliance Reviewer	16/16	GO	G-012 Pro timeout 150s verified; flash-lite fallback clean
Batch 2	Copy Editor	12/13	GO	Preserved peer voice; surgical typo fix; CE-13 vacuous-PASS guard
Batch 2	Fact Checker	11/12	GO	8 real lookups verified; 1 false negative on ambiguous date claim
Batch 2	Source Reviewer	10/10	GO	G-013 discovered: raw model misclassified 2 planted violations; P-017 reviewer-override applied
Batch 3	Project Architect Advisor	13/13	GO	Pro→flash-lite fallback clean; BDD pre-pinning (P-014) applied
Batch 3	Sales Rep Advisor	18/18	GO	Measurable cross-layer value vs Compliance; vendor-smell test clean
Batch 3	Fresh Eyes Reviewer	12/12	GO	Discovered G-014 + G-015; P-018 3-axis override caught 3 additional gaps Flash-Lite missed
Batch 4	Commander	11/11	PAPER	All gate-review questions answered; Direction Seed 9-field check clean
Batch 4	Performance Supervisor	9/9	PAPER	Direction Seed audit trail design verified
Batch 4	Quality Auditor	9/9	PAPER	S-to-M coverage check design verified
Batch 4	Learning Outcome Validator	8/9	GO	Pro hang handled by timeout; fallback to flash-lite successful
Batch 4	Engineer HTML	10/10	GO	post-test-designer skill invocation clean; no hallucinated slides
Batch 4	Engagement Designer	9/10	GO	Self-caught fabrication on interaction count; corrected before gate review
Batch 4	Candidate Collector	10/10	GO	Cleanest of 4 coordination agents; 0 schema violations

O — Objective (v5，與 v4 相同)

讓建築師喜歡這份簡報並真正理解產品在做什麼。課程結束時，學員應該能獨立判斷任何門五金規格的合規性和適用性，不需要查資料。

首宗目標 persona：Project Architect（不是 design architect，也不是 principal）。所有審查視角、內容假設、互動設計都以 Project Architect 的 day-to-day 工作流為基準——drawing set 審查、Division 08 寫作、spec writer coordination、AHJ 送審、RFI/submittal review。

情感目標

建築師想把這門課存起來、推薦給同事——不只是為了湊學時而完成它。

實用目標

建築師能引用條號、解釋機械差異、在專案壓力下抓出錯誤 spec——不靠 Google。

團隊結構總覽（19 個角色）

v5 保留 v4 的 19-agent 架構不變。factory 改動只在規格內部（S/M/anti-patterns 和 model commands）——角色數量和 wave 結構不動。

Wave 1 — 研究與草稿

Investigator A
Investigator B
Writer A
Writer B
Engagement Designer

v5 改動：Investigator A/B model commands 包入 /ai-fallback；加入 paywall workaround protocol（G-011）

Wave 2 — 內部審查

Content Director
Compliance Reviewer
Copy Editor
Fact Checker
Source Reviewer

v5 改動：Source Reviewer 加入 P-017 reviewer-override 後處理層；Compliance Reviewer Pro-timeout 處理確認

Wave 2 — 外部審查（與內部隔離）

Project Architect Advisor
Sales Rep Advisor
Fresh Eyes Reviewer

v5 改動：Fresh Eyes Reviewer 加入 P-018 3-axis override；外部 reviewer model commands 包入 /ai-fallback（Flash-Lite timeout 180s for long prompts）

Wave 3 — 整合與部署

Engineer HTML
Commander (A君)

v5 改動：Commander Direction Seed 第 5 欄加 3 條 knowledge query commands

Measurement — 持續監控

Performance Supervisor
Quality Auditor
Learning Outcome Validator

v5 改動：Performance Supervisor Direction Seed audit 加入 knowledge query field 驗證；LO Validator model timeout 處理

Side Channel

Candidate Collector

Wave 1→3 collect-only；v5 paper exercise PASS（0 schema violations）

Gotchas 知識庫（v5 新增：G-011 ~ G-015 + NEW-02）

mini-agent factory run（Batch 1–4）中，工廠從真實執行中發現以下新的坑，全部寫入知識庫並更新 Direction Seed。未來每個 agent 啟動時都可以透過 get_gotchas_for_context.sh 查詢。

Patterns 知識庫（v5 新增：P-014 ~ P-018）

Batch 1–4 的 factory run 中發現 5 個新 pattern，全部寫入知識庫。未來透過 get_patterns_for_failure.sh 查詢。

v4 vs v5 對照表

v4 和 v5 代表兩種不同的迭代哲學。兩個版本都是「正確的」——在各自的時代背景下。v4 是人類判斷能達到的極限；v5 是 AI factory 能做到的第一步。

Known Issues（v5 記錄，尚未修）

以下問題在 v5 規格中記錄，但尚未在 v5 中修復。v6 目標是由 factory 平行優化後解決這些問題。

v5 的意義：Factory 能做什麼，不能做什麼

維度	v4（人類迭代時代）	v5（AI Factory 時代）
改動來源	chihao 的直覺判斷 + 討論	mini-agent factory 3-cycle 學習
改動驗證	人類 sanity check	BDD 自動化驗收（pass rate 不退步）
模型呼叫處理	10 個 raw 呼叫，無 fallback	10 個全部包入 /ai-fallback，含 timeout
知識傳承	靠人記憶，隱式	get_patterns/get_gotchas/get_skills 查詢，顯式 embed 到 briefing
Scale-up 驗證	0 真實 production 驗證	16/19 agents 真實 production input 驗證
已知坑	G-001 ~ G-010（factory run 前發現）	G-001 ~ G-015 + NEW-02（factory run 中發現）
已知 pattern	P-001 ~ P-013	P-001 ~ P-018（P-014 ~ P-018 新增）
什麼時候用 v4	讀歷史文件、了解人類迭代哲學、對照 factory 前後差異
什麼時候用 v5	執行真實課程製作、dispatch agent fleet、factory 持續優化基礎

Factory 可以做到

從真實 production input 中找到規格缺陷（不靠人的直覺）
提出 smallest-possible-diff（不過度修改）
BDD 自動驗收（pass rate 可量化）
知識庫自動更新（gotchas/patterns 可查）
16/19 agents 並行驗證（速度比人類快 10x）

Factory 還不能做到（v5 限制）

自主決定 O 的變更（O 還是人類判斷）
處理 Codex trust check（需要人類環境設置）
在 quota 耗盡時自主取得付費帳號
Commissioner 層的 cross-agent 衝突仲裁
生產環境的 wall-clock budget 管理

Direction Seed v5 改動：第 5 欄擴充

Direction Seed 是 Commander 派遣每個 subagent 的 briefing 模板。v4 有 9 個欄位。v5 的第 5 欄（Knowledge & Context）強制加入 3 條 knowledge query commands：

為什麼？subprocess agents 看不到 parent memory 或 ~/.claude/skills/ogsm-framework/references/。這 3 條命令讓每個新派的 subprocess agent 在開始工作前，自動繼承工廠累積的所有 pattern + gotcha + skill 知識——不依賴 agent 記憶，不依賴人類傳達。

Performance Supervisor 的驗證規則（v5 新增）：每個波次抽檢 ≥ 1 次 Commander 的 dispatch briefing，確認第 5 欄內含 3 條 knowledge query commands。任一條件不滿足，該 subagent 的交付物不納入 gate review，必須重新派遣。

系統級 Anti-patterns（v4 保留 + v5 補充）

下一步

想了解這個架構如何建立起來？

回到主文章，看 Memory、Skills 和 OGSM 如何組成一個完整的 AI 團隊管理系統。也可以看 v4 歷史版本，對照人類迭代和 factory 迭代的差異。

← 回到主文章看 v4（人類迭代時代）看 HSW-002 課程本身

這份 OGSM 的原始 Markdown 檔案

這份展示頁面的所有內容來自真實的工作計畫文件 WTR-HSW-002-OGSM-v5.md，儲存在 Waterson AI Growth System 的私有 repo 中。v4 版本保留在 WTR-HSW-002-OGSM-v4.md（人類迭代時代終點），更早的歷史版本（v1/v2/v3）也保留在同一 repo 中供比較。

factory-run-artifacts/ 包含完整的 gotchas-and-lessons.md 和 patterns-library.md，可以透過 get_gotchas_for_context.sh 和 get_patterns_for_failure.sh 查詢。

OGSM v5 — AI Factory 迭代時代（19 個 Agent，16/19 驗證）

v4 → v5：從人類迭代到 AI Factory

v4 — 人類迭代時代

v5 — AI Factory 迭代時代

v5 的三組改動

Scale-up 進度：Batch 1–4（16/19 agents 驗證）

總目標 O（Objective）

團隊結構總覽（19 個角色）

Wave 1 — 研究與草稿

Wave 2 — 內部審查

Wave 2 — 外部審查（與內部隔離）

Wave 3 — 整合與部署

Measurement — 持續監控

Side Channel

Gotchas 知識庫（v5 新增：G-011 ~ G-015 + NEW-02）

ICC/NFPA paywall — 無法取得 verbatim 原文

/ai-fallback wrapper 錯誤分類 Codex trust check 為成功

Gemini 2.5 Pro 同樣會 hang（G-001 的延伸）

Raw model 不會自主套用 spec anti-patterns

/ai-fallback wrapper 錯誤分類 Pro quota 為 hang

Flash-Lite 90s wrapper timeout 對長 prompt 太緊

Patterns 知識庫（v5 新增：P-014 ~ P-018）

Pre-dispatch BDD flag format pinning

WebSearch escape hatch for research archetype

Paywall AHJ workaround for code research

Reviewer-override post-processing layer

Fresh Eyes Reviewer 3-axis override（P-017 延伸）

v4 vs v5 對照表

Known Issues（v5 記錄，尚未修）

v5 的意義：Factory 能做什麼，不能做什麼

Factory 可以做到

Factory 還不能做到（v5 限制）

Direction Seed v5 改動：第 5 欄擴充

系統級 Anti-patterns（v4 保留 + v5 補充）

Raw LLM call without fallback（v5 新增）

Knowledge query omission（v5 新增）

Raw model trust without override（v5 新增）

Subprocess Agent Isolation 忽視（v4 保留）

Brief Layering 失衡（v4 保留）

Vacuous success BDD scenarios（v5 補充）

下一步

想了解這個架構如何建立起來？

這份 OGSM 的原始 Markdown 檔案