Waterson USA / Door Hinge Knowledge Hub
版本: v1 · v2 · v3 · v4(歷史版本) · v5(目前)

OGSM v5 — AI Factory 迭代時代(19 個 Agent,16/19 驗證)

建築師教育課程 HSW-002 的 OGSM v5 工作計畫 • 2026-04-11 • v5 核心:v4 是 4 輪人類迭代的終點,v5 是 Agent Optimization Factory 驅動迭代的起點。Batch 1–4 驗證 16/19 agents。

這是 v5(AI Factory 時代)。v4 是 4 輪人類主導討論與迭代的成果(Round 1/2/3)。v5 是第一個由 Agent Optimization Factory 驅動的版本——改動完全來自 AI mini-agent 工廠的學習,不是人類的直覺判斷。尋找 v4?查看 v4 歷史版本(人類迭代時代終點)

v4 → v5:從人類迭代到 AI Factory

v4 = 人類迭代時代的終點。v5 = AI Factory 迭代時代的起點。

v4 是 chihao 帶領 4 輪人類討論+判斷產生的版本。v5 是第一個由 Agent Optimization Factory 驅動的版本。Factory 派出 mini-agent 工廠,每個 agent 跑 3 個 cycle(每 cycle:Spec Verifier → Iterator → Dispatch Harness → BDD 驗收),從真實 production input 中找到規格缺陷,提出 smallest-possible-diff,並驗收 BDD pass rate 不退步。

v5 的改動完全來自工廠學習。人類不需要判斷「哪裡不好」——factory 自己找到了問題並修復。

v4 — 人類迭代時代

v5 — AI Factory 迭代時代

v5 的三組改動

1. 10 個 raw LLM 呼叫 → /ai-fallback wrap

10 個 agent(Investigator A/B、Fact Checker、Compliance Reviewer、Source Reviewer、3 個外部 reviewer、Performance Supervisor、Learning Outcome Validator)的 Model commands 原本直呼 echo "Y" | gemini -m ... -p ...codex exec。v5 全部改用 bash ~/.claude/skills/ai-fallback/scripts/call_with_fallback.sh "prompt" "chain" 包裝,加入 per-model timeout(120s/150s)。原因:factory pre-flight 發現 check_ai_fallback_usage.py FAIL 10 個 agent。

2. Direction Seed 第 5 欄位擴充 — mandatory knowledge query commands

新增 3 條 knowledge query commands 作為 Direction Seed 必要元素:

這是 Principle 7 延伸:subprocess agents 看不到 parent memory,所以查詢命令必須 embed 到 briefing。這是經驗傳承機制——未來 Iteration Team 自動繼承上一輪學到的所有 pattern + gotcha。

3. Smoke test 發現的 2 個 pre-scale blocker(記錄在 Known Issues,v5 尚未修)

Scale-up 進度:Batch 1–4(16/19 agents 驗證)

Smoke test 驗證 factory pattern 後,工廠在 2026-04-11 執行 Batch 1–4 的真實 agent scale-up。每個 agent 用 real production input 執行完整 BDD 驗收。

整體狀態:16/19 agents 驗證通過(GO / CAUTION GO)。3 個 Batch 4 agents(Commander、Performance Supervisor、Quality Auditor)為 paper exercise,BDD 設計通過但未跑真實 LLM production input。

Batch Agent BDD 狀態 關鍵發現
Batch 1 Investigator A 12/12 CAUTION GO NEW-02 vacuous success on Codex; WebSearch saved 5 queries
Batch 1 Investigator B 11/12 CAUTION GO G-011 paywall workaround via AHJ adoption channels
Batch 1 Writer A 13/13 GO Substrate gap protocol triggered on 2 slides; BDD pre-pinning (P-014) applied
Batch 1 Writer B 12/13 GO Toolbox framing improved architect independence score
Batch 2 Content Director 12/12 + 2 WEAK GO 3/3 planted issues caught; WEAK on framing suggestions
Batch 2 Compliance Reviewer 16/16 GO G-012 Pro timeout 150s verified; flash-lite fallback clean
Batch 2 Copy Editor 12/13 GO Preserved peer voice; surgical typo fix; CE-13 vacuous-PASS guard
Batch 2 Fact Checker 11/12 GO 8 real lookups verified; 1 false negative on ambiguous date claim
Batch 2 Source Reviewer 10/10 GO G-013 discovered: raw model misclassified 2 planted violations; P-017 reviewer-override applied
Batch 3 Project Architect Advisor 13/13 GO Pro→flash-lite fallback clean; BDD pre-pinning (P-014) applied
Batch 3 Sales Rep Advisor 18/18 GO Measurable cross-layer value vs Compliance; vendor-smell test clean
Batch 3 Fresh Eyes Reviewer 12/12 GO Discovered G-014 + G-015; P-018 3-axis override caught 3 additional gaps Flash-Lite missed
Batch 4 Commander 11/11 PAPER All gate-review questions answered; Direction Seed 9-field check clean
Batch 4 Performance Supervisor 9/9 PAPER Direction Seed audit trail design verified
Batch 4 Quality Auditor 9/9 PAPER S-to-M coverage check design verified
Batch 4 Learning Outcome Validator 8/9 GO Pro hang handled by timeout; fallback to flash-lite successful
Batch 4 Engineer HTML 10/10 GO post-test-designer skill invocation clean; no hallucinated slides
Batch 4 Engagement Designer 9/10 GO Self-caught fabrication on interaction count; corrected before gate review
Batch 4 Candidate Collector 10/10 GO Cleanest of 4 coordination agents; 0 schema violations

PAPER = paper exercise,BDD 設計通過但未跑真實 LLM production input。GO = 真實 production input + BDD 驗收通過。CAUTION GO = 通過但有已知邊界情況需監控。

總目標 O(Objective)

v5 的 O 與 v4 相同。O 是整個 19 人團隊唯一的北極星,factory 改動從不觸碰 O——factory 改的是達到 O 的路徑(S/M/anti-patterns),不是 O 本身。

O — Objective (v5,與 v4 相同)

讓建築師喜歡這份簡報並真正理解產品在做什麼。課程結束時,學員應該能獨立判斷任何門五金規格的合規性和適用性,不需要查資料。

首宗目標 persona:Project Architect(不是 design architect,也不是 principal)。所有審查視角、內容假設、互動設計都以 Project Architect 的 day-to-day 工作流為基準——drawing set 審查、Division 08 寫作、spec writer coordination、AHJ 送審、RFI/submittal review。

情感目標

建築師想把這門課存起來、推薦給同事——不只是為了湊學時而完成它。

實用目標

建築師能引用條號、解釋機械差異、在專案壓力下抓出錯誤 spec——不靠 Google。

團隊結構總覽(19 個角色)

v5 保留 v4 的 19-agent 架構不變。factory 改動只在規格內部(S/M/anti-patterns 和 model commands)——角色數量和 wave 結構不動。

Wave 1 — 研究與草稿

v5 改動:Investigator A/B model commands 包入 /ai-fallback;加入 paywall workaround protocol(G-011)

Wave 2 — 內部審查

v5 改動:Source Reviewer 加入 P-017 reviewer-override 後處理層;Compliance Reviewer Pro-timeout 處理確認

Wave 2 — 外部審查(與內部隔離)

v5 改動:Fresh Eyes Reviewer 加入 P-018 3-axis override;外部 reviewer model commands 包入 /ai-fallback(Flash-Lite timeout 180s for long prompts)

Wave 3 — 整合與部署

v5 改動:Commander Direction Seed 第 5 欄加 3 條 knowledge query commands

Measurement — 持續監控

v5 改動:Performance Supervisor Direction Seed audit 加入 knowledge query field 驗證;LO Validator model timeout 處理

Side Channel

Wave 1→3 collect-only;v5 paper exercise PASS(0 schema violations)

Gotchas 知識庫(v5 新增:G-011 ~ G-015 + NEW-02)

mini-agent factory run(Batch 1–4)中,工廠從真實執行中發現以下新的坑,全部寫入知識庫並更新 Direction Seed。未來每個 agent 啟動時都可以透過 get_gotchas_for_context.sh 查詢。

Patterns 知識庫(v5 新增:P-014 ~ P-018)

Batch 1–4 的 factory run 中發現 5 個新 pattern,全部寫入知識庫。未來透過 get_patterns_for_failure.sh 查詢。

v4 vs v5 對照表

v4 和 v5 代表兩種不同的迭代哲學。兩個版本都是「正確的」——在各自的時代背景下。v4 是人類判斷能達到的極限;v5 是 AI factory 能做到的第一步。

維度 v4(人類迭代時代) v5(AI Factory 時代)
改動來源 chihao 的直覺判斷 + 討論 mini-agent factory 3-cycle 學習
改動驗證 人類 sanity check BDD 自動化驗收(pass rate 不退步)
模型呼叫處理 10 個 raw 呼叫,無 fallback 10 個全部包入 /ai-fallback,含 timeout
知識傳承 靠人記憶,隱式 get_patterns/get_gotchas/get_skills 查詢,顯式 embed 到 briefing
Scale-up 驗證 0 真實 production 驗證 16/19 agents 真實 production input 驗證
已知坑 G-001 ~ G-010(factory run 前發現) G-001 ~ G-015 + NEW-02(factory run 中發現)
已知 pattern P-001 ~ P-013 P-001 ~ P-018(P-014 ~ P-018 新增)
什麼時候用 v4 讀歷史文件、了解人類迭代哲學、對照 factory 前後差異
什麼時候用 v5 執行真實課程製作、dispatch agent fleet、factory 持續優化基礎

Known Issues(v5 記錄,尚未修)

以下問題在 v5 規格中記錄,但尚未在 v5 中修復。v6 目標是由 factory 平行優化後解決這些問題。

v5 的位置:v5 是「CAUTION GO」版本——GO for pattern(factory 方法論已驗證),CAUTION for 2 blockers(INT-001 incomplete + Codex trust check)。v6 目標是 scale-up 到 12–19 agents 並行優化後產生的版本。

v5 的意義:Factory 能做什麼,不能做什麼

Factory 可以做到

Factory 還不能做到(v5 限制)

Direction Seed v5 改動:第 5 欄擴充

Direction Seed 是 Commander 派遣每個 subagent 的 briefing 模板。v4 有 9 個欄位。v5 的第 5 欄(Knowledge & Context)強制加入 3 條 knowledge query commands:

v5 第 5 欄必要新增(knowledge query before action):
bash ~/.claude/skills/ogsm-framework/scripts/get_patterns_for_failure.sh <failure-type> — 在 Cycle 1 FAIL 後查詢
bash ~/.claude/skills/ogsm-framework/scripts/get_gotchas_for_context.sh <context> — 在 bootstrap 和每次 FAIL 查詢
bash ~/.claude/skills/ogsm-framework/scripts/get_skills_for_role.sh <role-name> — 在 bootstrap 和 BDD 設計前查詢

為什麼?subprocess agents 看不到 parent memory 或 ~/.claude/skills/ogsm-framework/references/。這 3 條命令讓每個新派的 subprocess agent 在開始工作前,自動繼承工廠累積的所有 pattern + gotcha + skill 知識——不依賴 agent 記憶,不依賴人類傳達。

Performance Supervisor 的驗證規則(v5 新增):每個波次抽檢 ≥ 1 次 Commander 的 dispatch briefing,確認第 5 欄內含 3 條 knowledge query commands。任一條件不滿足,該 subagent 的交付物不納入 gate review,必須重新派遣。

系統級 Anti-patterns(v4 保留 + v5 補充)

下一步

想了解這個架構如何建立起來?

回到主文章,看 Memory、Skills 和 OGSM 如何組成一個完整的 AI 團隊管理系統。也可以看 v4 歷史版本,對照人類迭代和 factory 迭代的差異。

← 回到主文章 看 v4(人類迭代時代) 看 HSW-002 課程本身

這份 OGSM 的原始 Markdown 檔案

這份展示頁面的所有內容來自真實的工作計畫文件 WTR-HSW-002-OGSM-v5.md,儲存在 Waterson AI Growth System 的私有 repo 中。v4 版本保留在 WTR-HSW-002-OGSM-v4.md(人類迭代時代終點),更早的歷史版本(v1/v2/v3)也保留在同一 repo 中供比較。

factory-run-artifacts/ 包含完整的 gotchas-and-lessons.md 和 patterns-library.md,可以透過 get_gotchas_for_context.shget_patterns_for_failure.sh 查詢。