Waterson USA / Door Hinge Knowledge Hub
這是 v4 歷史版本(人類迭代時代終點)。v5 引入 AI Factory Era — 19 個 agent 全面由 Agent Optimization Factory 驅動迭代,Batch 1–4 驗證 16/19 agents。 → 回到最新版(v5)
版本: v1 · v2 · v3 · v4(目前)

真實案例:19 個 AI Agent 的 OGSM v4 實作(round 2)

建築師教育課程 HSW-002 的完整 OGSM v4 工作計畫 • 2026-04-10 • v4 核心:23 → 19 agents。Round 2 新增:Candidate Collector 範圍重寫、Model Invocation Map、Direction Seed 第 9 欄位(Anti-patterns)、Brief Layering Tier 1/Tier 2。

這是什麼?

這個頁面展示 HSW-002(Spring Hinge vs Self-Closing Hinge)AIA 課程的 OGSM v4 工作計畫。這不是示範用的假案例——這是我們在製作這門課程時,真正使用的工作計畫。v4 的核心故事是一次方法論自我修正:我們以為需要 5 個新 agent,回頭檢視後發現其中 4 個其實是穿著 agent 外衣的 skill。

v4 Changelog(2026-04-10)— Skill vs Agent 邊界重分類

v3.1 嘗試用 5 個新 agent 覆蓋課程生命週期的五個缺口。v4 回頭檢視後發現:只有一個真的需要新 agent——其他四個是可重複流程(skill)或現有 agent 的 M 擴充。

v3.1「新 agent」v4 重新分類原因
🔭 Content Scout 保留為 agent,改名 Candidate Collector,範圍縮限 需要跨波次持續讀交付物並寫入 queue——這是需要「角色」而不只是「流程」的唯一理由。但原本的「寫 blog」範疇移除,只做「蒐集 + 寫入 queue」
📖 Post-Test Designer 降級為 /post-test-designer skill 題目設計是可重複的流程,不是需要跨時間記憶的角色。Wave 3 Engineer 在 S 中直接呼叫
🏭 Competitor Coverage Auditor 併入 Compliance Reviewer 的 M 擴充(4 條新增驗收) 類別覆蓋本來就屬於 AIA 合規審查,不需要另立角色
🌏 Chinese Translator 降級為 /aia-rewrite --bilingual skill flag 雙語產出是 skill 能力,不是長期角色。Phase 2 實作
📈 SEO/AEO Engineer 延後,替換為「流程倒轉原則」 AI 先寫 → 人類補缺,不在課程製作期增設角色。Deferred to later phase
結果:23 → 19 agents。新增原則:Skill Invocation Map + Principle 7(Embedded Skill Invocation Required)。

v3 和 v2 有什麼不同?(沿用)

v2 把建築師放進每一句 G,並加入 3 個外部 Reviewer。v3 的核心改動是:Writer B 從「教 spec 語言」轉向「情境辨識 + 獨立 spec 資源導航」,並將所有角色的 M 從任務清單改成對準 S 的資源承諾驗證。

面向v2(舊版)v3/v4(這個版本)
Writer B 的定位 教建築師讀 spec 語言、做決策 教建築師情境辨識 + 知道獨立 spec 資源路徑
Writer B 的 G 建築師有一個決策工具 建築師帶走情境辨識能力 + 實現路徑
Writer B 的 S 決策樹、場景練習 五個情境 + SpecLink / SPC Alliance / CSC/CSI(中立角度)
M 的設計原則 任務清單(交付 X 個、記錄 Y 個) 對準 S 的資源使用(S 承諾的資源是否真的被使用和驗證)
Sales Rep Advisor 評估課程是否適合拜訪建築師 加入 spec 資源「廠商氣味」測試(第 5 個問題)
互動設計師 每 10 分鐘一個互動 整份課程 ≤ 3 個互動點 + 線上 self-paced format(問題 → 延遲 → 自動顯示答案)
Architect Advisor 泛指建築師外部視角 Project Architect Advisor(對齊首宗 persona:Project Architect)
v4 重分類(2026-04-10) v3.1:23 agents(含 5 個新增) 19 agents:Content Scout → Candidate Collector(collect-only);Post-Test Designer → skill;Competitor Coverage Auditor → Compliance Reviewer M 擴充;Chinese Translator → skill flag;SEO/AEO → deferred
v4 新增原則 Skill Invocation Map(哪些 agent 在哪個 wave 呼叫哪個 skill)+ Principle 7(Embedded Skill Invocation Required)

如果你還沒讀過主文章,建議先回去看架構說明:

→ 回到主文章:如何組建有效率的 AI Agent 團隊

先說清楚:OGSM 不是 OKR

很多人第一次看到 OGSM,會把它當成 OKR 的另一種格式。這是最常見的誤解,也是大多數 OGSM 最後寫成廢紙的根本原因。

OKR 的世界觀

OGSM 的世界觀

最常見的 OGSM 失誤:偽裝成 OKR 的 OGSM。長這樣:O 是「提升課程品質」,G 是「發布 5 個互動題目」,S 是「每週開會」。這份 OGSM 技術上合格,但沒有人問過「建築師的判斷能力提升了嗎?」——O 的靈魂消失了。

OGSM 的靈魂在 S 和 G 如何串回 O。S 要回答「我為什麼選這條路,而不是其他路」,G 要回答「那個人讀到這裡時,發生了什麼事」。如果你的 G 只是任務清單,你寫的是偽裝的 OKR。

總目標 O(Objective)— v4

整個 19 人團隊只有一個 O。v4 的 O 與 v3 相同——v4 的改動在 agent 數量的精簡、新增 Skill Invocation Map 和 Principle 7,O 本身不變。O 是整個團隊唯一的北極星,不輕易改動。

O — Objective (v4)

讓建築師喜歡這份簡報並真正理解產品在做什麼。課程結束時,學員應該能獨立判斷任何門五金規格的合規性和適用性,不需要查資料。

首宗目標 persona:Project Architect(不是 design architect,也不是 principal)。所有審查視角、內容假設、互動設計都以 Project Architect 的 day-to-day 工作流為基準——drawing set 審查、Division 08 寫作、spec writer coordination、AHJ 送審、RFI/submittal review。

情感目標

建築師想把這門課存起來、推薦給同事——不只是為了湊學時而完成它。

實用目標

建築師能引用條號、解釋機械差異、在專案壓力下抓出錯誤 spec——不靠 Google。

關鍵:兩個目標缺一個,O 就沒有達成。只有實用沒有情感,建築師學完就忘;只有情感沒有實用,建築師喜歡但用不上。這個 O 的設計直接驅動了為什麼需要外部 Reviewer 層——內部 agent 無法驗證「建築師喜歡嗎」這件事。

團隊結構總覽(19 個角色)

v2 在原本 4 層架構(Wave 1 / Wave 2 / Wave 3 / Measurement Layer)之外,新增了一個 External Reviewer Layer,包含 3 個在 Wave 2 並行運作的外部視角角色。v3.1 曾嘗試新增 5 個 agent,v4 重分類後:Candidate Collector 保留為 agent(Side Channel,collect-only),其他四項降級為 skill(`/post-test-designer`、`/aia-rewrite --bilingual`)、M 擴充(Compliance Reviewer 的競爭品牌覆蓋檢查)或 deferred(SEO/AEO)。

Wave 1 — 研究與初稿

生產原始素材:案例、法規、成本數據、課程初稿、互動設計

Wave 2 — 內部品質審查

確保內容正確、合規、清晰,每個都有明確的通過標準。v4 改動:類別覆蓋審查(原 v3.1 的「Competitor Coverage Auditor」agent)已合併入合規審查員的 M 擴充(4 條新增驗收)——不再是獨立 agent。

External Reviewer Layer — Wave 2 並行,獨立運作(v2 新增)

3 個外部視角與內部 reviewer 隔離——不看彼此的報告,確保第一印象的獨立性。Commander 優先處理外部 reviewer 的問題。

Wave 3 — 整合部署

生產可部署的 HTML,通過 W3C 驗證、無障礙審查、效能測試。v4 改動:HTML 工程師在 S 中呼叫 /post-test-designer skill(生成 10 題 CEU post-test)和 /aia-rewrite --bilingual skill flag(Phase 2)——不再是獨立 agent。SEO/AEO 需求 deferred。

Side Channel — 內容管線(#19 Candidate Collector)

A君 在 Wave 1 結束時派遣,Wave 1→3 全程運作,Wave 3 前交付,不擋任何 gatev4 範圍縮限:只做一件事——跨讀交付物 + 把值得寫的題目 + 完整研究資料寫入 .content-scout-queue.md不寫 blog 文章、不做 SEO 驗證、不排序優先級。使用 /content-scout flag-candidate skill 寫入 queue。Phase 3 Blog Writer Fleet 接手後續寫作。

Round 2 範圍重寫:Candidate Collector 的職責從 v4 初版的「蒐集 + 類型平衡判斷」進一步精煉——蒐集本身(flag-candidate 命令)是 skill 的工作,Candidate Collector agent 負責的是 skill 無法做到的部分:跨波次的類型平衡觀察、候選之間的關聯性偵測、以及把這些情境判斷寫入 collector_notes 欄位。我們發現原本的定義讓 agent 同時做機械驗證和情境判斷,這兩件事一個屬於 skill、一個屬於 agent。第二輪重構把它們分開。

Measurement Layer — 持續監控

三層監控:建築師視角評分、S 格式合規、直接測量 O

每個角色的 G、S 和 M(v4)

以下展示所有 19 個角色各自的 G(整合目標)、S(為建築師選的路徑)和 M(對準 S 資源承諾的驗收標準)。v4 改動:19 個 agent(移除 4 個降級為 skill/M 的角色,新增 Candidate Collector);各 agent 的 S 中加入 /content-scout flag-candidate 的 embedded skill invocation 指令(Principle 7)。

Wave 1 — 研究與初稿
👑

指揮官(Commander / A君)

Wave 1 + 全程

G — 串回 O 的整合目標

建築師在課程結束時拿到的,是一份值得推薦給同事的作品——不是因為它合規,而是因為它真的有用。Commander 的任務是讓 19 個角色都在為同一個建築師的體驗工作,而不是各自完成自己的任務清單。每一個波次結束時,都要能回答:「如果建築師現在讀到這裡,他會繼續讀嗎?他會學到他下次 spec 需要的東西嗎?」

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:Commander 若只協調任務完成,得到的是合格課程;只有同時協調建築師視角的貫穿,才能得到建築師想保存和推薦的課程。
🔍

調查員 A — 案例與數據

Wave 1

G — 串回 O 的整合目標

建築師讀到這些案例時,不是在讀別人的失敗故事——而是在想「這就是我下個月要交審的那棟案子的狀況」。每一個案例都要讓建築師感受到:這不是理論,這是我的執業風險。當他能把案例說給業主或 AHJ 聽,O 的「不依賴習慣或表象」才能成立。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v4)

對齊 O:建築師只有在感受到「這和我有關」的時候才會改變 spec 習慣——案例研究是讓他們從旁觀者變成當事人的唯一方式。
🔎

調查員 B — 法規與成本

Wave 1

G — 串回 O 的整合目標

建築師在專案會議上引用這份課程的法規資訊時,可以毫不猶豫說出條號和版本年份,不怕被承包商或 AHJ 糾正。費用比較表讓他在業主問「為什麼要換比較貴的五金」時,有數字可以說——不是感覺,是 20 年的維護成本差異。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v4)

對齊 O:建築師能「獨立判斷合規性」的前提,是他有可以直接引用的條號和可以捍衛的費用數字——這兩樣東西都在調查員 B 的交付物裡,缺一不可。
✍️

寫手 A — 前半段(理論與機制)

Wave 1

G — 串回 O 的整合目標

建築師讀完前半段,腦子裡出現的不是技術規格表——而是一個他見過的門,和他以前從來沒有想過的問題:「那扇門用的是哪一種 hinge?為什麼?」如果他在前 30 分鐘之後還沒有產生這個問題,後半段的應用練習就沒有意義了。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:前半段如果只是技術說明,建築師讀完只有知識,沒有動機改變 spec 習慣。只有當機械原理和真實執業風險被接在一起,後半段的決策練習才有土壤。
✍️

寫手 B — 後半段(情境辨識 & Spec 資源導航)

Wave 1

G — 串回 O 的整合目標(v3 完全重寫)

建築師讀完後半段,帶走的是兩個東西:情境辨識能力(「我看到這五個情境之一,我知道 Waterson 可能適合」)和實現路徑(「我不需要靠三大廠的 spec writer,我知道去哪裡找獨立的 spec writing 資源」)。

他不是在背產品規格,他是在理解:spec writing 不是三大廠的專利。當他下次遇到重門、ADA 需求、防火兼顧美觀、長期維護考量、或改建受限等情境,腦子裡會響起 Waterson 這個選項——而且他知道下一步怎麼走。

S — 為建築師選的路徑(v3 完全重寫)

M — 對準 S 的資源驗收標準(v4)

對齊 O:O 中「獨立判斷任何門五金規格的適用性」,在建築師這個職業的脈絡裡,真正的障礙不是技術知識,而是「我不知道怎麼把這個選擇落實到我的專案文件裡」。寫手 B 解決的是這個障礙——情境辨識讓建築師知道「何時用」,資源導航讓他知道「如何用」。
🎨

互動設計師(Engagement Designer)

Wave 1

G — 串回 O 的整合目標(v3 完全重寫)

線上 self-paced 學習的建築師不會被機械式的互動打斷——整份課程只保留 3 個關鍵決策節點的互動,每一個都是他需要停下來思考的時刻,而不是維持注意力的節奏工具。互動的答案會在幾秒後自動顯示,他不需要等講師,也不需要回到課程。

S — 為建築師選的路徑(v3 完全重寫)

M — 對準 S 的資源驗收標準(v3 全新)

對齊 O:線上 self-paced 課程的挑戰是「沒有講師」——學習者只能靠內容本身和自己的節奏。過多互動在實體講座是維持注意力的工具,但在線上課程會變成打斷。Engagement Designer 的工作不是「設計互動節奏」,而是「識別 3 個建築師真的需要停下來思考的決策節點」,並確保每個節點的錯誤回饋在沒有講師的情況下仍然完整。這是 O「能獨立判斷」在線上學習脈絡中的實際落地方式。
Wave 2 — 內部品質審查
📋

內容總監

Wave 2

G — 串回 O 的整合目標

建築師讀完整份課程,感受到的是一個完整的故事:從「我以為我懂這個選擇」到「我現在真的懂了,而且我知道下次怎麼 spec」。每一張投影片都在這個故事線上,沒有一張是掉出來的技術補丁。建築師不需要在讀課程的同時追蹤「為什麼突然講到這個」。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:一門技術上正確但敘事破碎的課程,建築師讀完只有困惑,沒有信心。內容總監保護的是 O 的情感目標——「喜歡這份簡報」——它是所有技術性 reviewer 無法替代的把關。

合規審查員

Wave 2

G — 串回 O 的整合目標

建築師在修完課程後,能夠在自己的公司 CEU 記錄中看到這個信用學時——而且這份記錄在他去考 LEED AP 或參加 AIA national conference 的時候,是乾淨的、無爭議的。合規不是目的,合規是確保課程能夠抵達建築師的唯一通道。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:一門未通過 AIA 認證的課程永遠到不了建築師手裡。Compliance 是 O 得以發生的先決條件,不是附加功能。
📝

文字編輯

Wave 2

G — 串回 O 的整合目標

建築師讀投影片文字時,不需要停下來重讀——因為每一句話都剛好在他能夠一次讀懂的長度和密度。術語一致讓他不需要追蹤「spring hinge」和「self-closing hinge」是不是在說同一件事,讓他把認知資源用在理解概念,而不是解析文字。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:語言的清晰是理解的前提。建築師無法靠一份需要多次重讀才能理解的課程,發展出在壓力下能使用的判斷能力。
🔢

事實查核員

Wave 2

G — 串回 O 的整合目標

建築師在 spec review 會議上引用這門課的數字時,如果被承包商或 AHJ 質疑,他要能說「這個數字來自 [具體來源],[年份] 版」——不是說「我記得課程裡有提到」。一個無法被追蹤的數字,在建築師的執業世界裡等同於沒有數字。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:建築師在執業中做的是法律和安全決策。一個錯誤的條號或費用數字,在現實中的後果是退件、索賠或火安全失敗——直接違背 O 中「正確決策」的承諾。
📎

資料來源審查員

Wave 2

G — 串回 O 的整合目標

建築師在課程結束後,如果想追蹤某個法規或案例的原始來源,他能在 5 分鐘內找到——因為引用格式清楚,連結可用,出版物有完整識別資訊。他可以把這份參考清單直接用在自己的規範書備注裡,不需要重新整理。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:來源可信度決定建築師是否相信他在課程裡學到的東西——只有建立在可查核、多樣化、時效正確的來源上,課程才能達到 O 中「做出正確決策」所需的信任基礎。
🏭

類別覆蓋稽核員(Competitor Coverage Auditor)

Wave 2 · v3.1 新增

G — 串回 O 的整合目標

AIA 稽核員打開課程,30 秒內看到三大廠(Allegion / ASSA ABLOY / dormakaba)被中立提及——立刻判斷這是類別覆蓋 CEU,不是廠商廣告。合規審查員檢查形式合規(格式、LU 時數),類別覆蓋稽核員檢查實質合規(品牌中立性、類別覆蓋、促銷比例)。HSW-003 退件歷史證明兩者必須由不同角色把關。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3.1)

對齊 O:Compliance Reviewer 檢查的是「課程是否符合 AIA CES 格式」,類別覆蓋稽核員檢查的是「課程是否符合 AIA 對教育 vs 廣告的實質判斷」。HSW-003 退件證明這兩件事必須由不同角色做——HSW-003 通過了合規審查員,卻被 AIA 以「過度廠商導向」退件。O 要求「抵達建築師」,先要抵達 AIA 審查。
External Reviewer Layer — v2 新增

以下 3 個角色在 Wave 2 並行運作,但與內部 reviewer 完全隔離。他們不看彼此的報告,不知道課程的生產過程。Commander 對他們的負面回饋有最高優先處理權。

🎯

Project Architect Advisor(外部 Project Architect 視角)

External Gemini 2.5 Pro
角色設定:Gemini 2.5 Pro 扮演一位有 12 年資歷、目前在中型事務所執業的 Project Architect persona。不是 Waterson 員工,不知道這門課是 Waterson 做的。只知道他是一位正在找門五金 CEU 的 Project Architect,今天選擇打開了這門課。

G — 串回 O 的整合目標(v3 重寫)

這份課程的首宗目標 persona 是 Project Architect——不是 design architect,不是 principal。Project Architect 的 day-to-day 是:看 drawing set / 寫 project manual 的 Division 08 / 和 spec writer 協調 Division 08 71 00 Door Hardware / 和 AHJ 協調送審 / 處理 RFI 和 submittal review。Project Architect Advisor 讀完這份課程後,感覺這份內容是「為我的工作現場寫的」——他能立刻想到下次 spec coordination meeting 怎麼用到,不是抽象的教科書。

S — 為建築師選的路徑(v3 重寫)

M — 對準 S 的資源驗收標準(v3 重寫)

對齊 O:O 的情感目標「讓 Project Architect 喜歡這份課程」只有一個 Project Architect 視角才能真正驗證。設計師 / principal / spec writer 的視角都會漏掉 Project Architect 的真實決策脈絡。Project Architect Advisor 的工作不是「一般建築師」的抽象視角,而是「在下次 spec coordination meeting 中會不會用到這份內容」的具體判斷。
💼

Sales Rep Advisor(外部業務視角)

External Claude Sonnet
角色設定:Claude Sonnet 扮演一位非 Waterson 的門五金廠商業務代表 persona,有 8 年拜訪建築事務所的經驗。他今天要帶這份課程去拜訪一個建築師,作為開場話題和技術支持材料。

G — 串回 O 的整合目標

這位業務代表決定要不要把這門課作為下次拜訪建築師的工具——他會不會說「這個我可以用,建築師看了會有興趣」?業務代表的視角測試的是:這份課程在真實的市場情境中,能不能成為建築師和廠商之間有意義的對話基礎。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:課程的終極使用場景之一是業務代表把它帶給建築師——Sales Rep Advisor 的視角確保這個使用場景是可行的,讓 O 不只在 AIA 學習管理系統裡成立,也在真實的市場接觸點上成立。他對「廠商氣味」的直覺驗證,是 Writer B 資源介紹能否真正建立信任的最後一關。
🔄

Fresh Eyes Reviewer(獨立模型視角)

External Gemini 2.5 Pro(獨立)
角色設定:使用 Gemini 2.5 Pro 獨立閱讀最終課程草稿,不參考任何 Wave 1 或 Wave 2 的報告。這個角色的唯一工作是挑戰看起來「理所當然」的論點——因為 Claude 在整個製作過程中一直參與,有盲點的風險。

G — 串回 O 的整合目標

這份課程在被一個完全陌生的讀者閱讀之後,沒有出現「這個說法明明有另一面,為什麼課程只說一面?」的問題。每一個論點都能在獨立閱讀的情況下站得住腳,不依賴讀者已經知道 Waterson 或已經認同課程的前提。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:O 要求建築師能做出「正確決策」——一份有盲點或選擇性論述的課程,可能讓建築師在特定情境下做出錯誤決策。Fresh Eyes Reviewer 是防止這種風險的最後一道獨立檢驗。
v4 重分類說明: 以下的「中文翻譯」、「SEO/AEO 工程師」卡片是 v3.1 的歷史記錄,保留以顯示 v3 → v4 的演化過程。v4 已將這兩個角色降級為 skill(/aia-rewrite --bilingual)和 deferred 原則——不再是獨立 agent。v3.1 時的「Post-Test Designer」也已降級為 /post-test-designer skill(由上方 HTML 工程師的 S 呼叫)。
Wave 3 — 整合部署
💻

HTML 工程師

Wave 3

G — 串回 O 的整合目標

建築師打開課程的那一刻,感受到的是一個工作得如此流暢的介面,他完全不需要想「怎麼操作這個」——他只需要想「我在學什麼」。每一個互動都在他按下按鈕的那一秒給出回饋,沒有等待,沒有猜測,沒有技術問題打斷他的學習節奏。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v4)

對齊 O:課程的技術執行是 O 的傳遞機制。一個有破損互動或不流暢體驗的 HTML 檔,讓所有內容工作都付諸流水——Engineer 的工作是確保 O 能夠被建築師實際接收到。
🌏

中文翻譯 / i18n 在地化(Chinese Translator)

Wave 3 · v3.1 新增

G — 串回 O 的整合目標

台灣 Project Architect 讀完中文版後,感覺這是為他的工作現場寫的——不是機器翻譯。五個情境、三個資源、Division 08 討論,都有台灣對應版本。他在台灣的送審流程、設計監造、工務聯繫情境中,能立刻想到下次會議怎麼用到這份內容,就像美國 Project Architect 讀英文版的感受一樣。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3.1)

對齊 O:O 寫的是「建築師」,但沒有指定哪一個市場的建築師。中文翻譯確保 O 在兩個市場平行落地——台灣 Project Architect 讀完後,同樣能獨立判斷、同樣會推薦給同事。若只有英文版,O 有地理天花板。
📈

SEO/AEO 工程師(SEO/AEO Engineer)

Wave 3 · v3.1 新增

G — 串回 O 的整合目標

Project Architect 搜尋「spring hinge vs self-closing hinge」或問 ChatGPT/Perplexity「哪種 hinge 適合防火門」時,這門課出現在 Google 第一頁或 AI 引擎第一個引用。課程不是躺在 /aia/ 等人發現的靜態 HTML,是搜尋旅程的目的地。O 假設建築師已經打開課程,SEO/AEO 負責他找到課程。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3.1)

對齊 O:O 的情感目標和實用目標都假設一個前提:建築師已經打開課程。但這個前提不是自動成立的——課程躺在 /aia/ 裡等待被發現,和課程出現在搜尋結果第一頁,是兩個完全不同的世界。SEO/AEO 工程師讓 O 的發現路徑被設計,而不是被期待。
Side Channel — Content Scout(v3.1 歷史版本 → v4 改名 Candidate Collector)
v4 改動: Content Scout 在 v4 改名為 Candidate Collector,範圍縮限為「只蒐集不寫作」。移除 SEO 驗證、內容排序、以及 blog 文章撰寫職能;只保留「跨讀交付物 + 寫入 .content-scout-queue.md」的單一職責。v4 的 Candidate Collector 卡片請見上方「Measurement Layer」之後的 Side Channel 區塊。
🔭

Content Scout — Blog 候選擷取器 v3.1 歷史版本

Side Channel · v3.1 新增

G — 串回 O 的整合目標

每一次課程製作產出的不只是一門課,還是一條內容管線的起點。建築師讀完課程的那一刻,content-plan.md 裡已經有 2–3 個從這門課挖掘出來的部落格題目在排隊,隨時可以轉換成 blog 文章,進一步放大 Project Architect 遇到 Waterson 的觸點。課程不是一次性消耗品,是內容生態系的種子。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3.1)

對齊 O:O 假設建築師「已經打開課程」,但課程影響力的放大機制不在課程本身。Content Scout 把課程變成內容生態系的種子——每一篇從課程挖出的 blog 文章都是另一個建築師遇到 Waterson 的觸點。沒有 Content Scout,課程是一次性消耗品。
Measurement Layer — 持續監控
📊

績效督導

Measurement Layer

G — 串回 O 的整合目標

每一個波次結束時,Commander 知道的不只是「哪些任務完成了」——而是「哪些角色的交付物讓建築師的學習體驗往前走了,哪些沒有」。建築師視角的退步在 Wave 1 就被發現,而不是在 Wave 3 才被 Project Architect Advisor 打臉。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:O 的情感目標(建築師喜歡這份課程)很容易在製作過程中被「任務完成」的指標遮蔽。績效督導的建築師視角評分讓這個目標在每個波次都是可見的。
🔍

品質稽核員

Measurement Layer

G — 串回 O 的整合目標

每一個角色的交付物都能讓下一個角色立刻開始工作——不需要花時間重新格式化、追問來源、或猜測某個欄位的意思。流暢的交接讓整個生產過程的節奏保持,而節奏保持讓建築師視角的修改有足夠的時間被執行。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:生產鏈的流暢性保護的是時間,而時間保護的是修改建築師視角問題的機會。一個在 Wave 2 才被發現的 Wave 1 格式問題,會壓縮掉本來可以用來改善建築師體驗的時間。
🎓

學習成果驗證員

Measurement Layer

G — 串回 O 的整合目標(最關鍵)

在課程被部署之前,我們有具體的證據說明:一個沒有硬體專業的建築師,讀完這門課之後,能夠在真實的 spec review 情境中做出正確決策。這個證據是 Gemini Pro 用建築師 persona 模擬的推理過程——不是我們自己說「這應該夠了」。

S — 為建築師選的路徑

M — 對準 S 的資源驗收標準(v3)

對齊 O:O 中「獨立判斷合規性和適用性」不是在課程發布時實現的——它是在建築師讀完課程之後實現的。學習成果驗證員是唯一直接測量 O 的角色。沒有它的確認,部署只是希望,不是證據。

Skill Invocation Map(v4 新增)

為什麼需要這張表:透過 Agent tool 派遣的 subprocess agent,執行時看不到 parent Claude 的 memory 或 CLAUDE.md。所以任何「agent 應該呼叫 skill」的指令,必須直接寫在該 agent 的 S 段落裡(Principle 7)。這張表是集中的單一事實來源,讓 Commander 在派遣時可以直接複製貼上對應的 skill 命令到 briefing 中。

Agent Wave Skill 呼叫時機
🔍 調查員 A Wave 1 /content-scout flag-candidate 發現案例足以支撐獨立 blog 文章時
🔎 調查員 B Wave 1 /content-scout flag-candidate 發現法規主題足以支撐獨立 blog 文章時
✍️ 寫手 A Wave 1 /content-scout flag-candidate 撰寫時發現某個技術概念值得獨立展開
✍️ 寫手 B Wave 1 /content-scout flag-candidate 撰寫時發現某個情境值得獨立展開
🎯 Project Architect Advisor Wave 2 /content-scout flag-candidate 讀完課程後發現建築師會想看但課程未深入的主題
🗃️ Candidate Collector Wave 1→3 /content-scout flag-candidate 跨讀所有交付物時主動加入候選(見 Candidate Collector 的 S 段落)
💻 HTML 工程師 Wave 3 /post-test-designer 把課程內容轉成 HTML 前先生成 10 題 post-test
💻 HTML 工程師 Wave 3 /aia-rewrite --bilingual 生成英文版 + 中文版(Phase 2 預留)

注意:/post-test-designer/aia-rewrite --bilingual 是 Phase 2 要建立的 skill,v4 架構預留這些呼叫點,skill 本身在 Phase 2 才會實作。

Model Invocation Map(round 2 新增)

除了 Skill Invocation Map,v4 round 2 新增了 Model Invocation Map——集中記錄哪個 agent 用哪個模型、原因是什麼。多模型分工的資訊原本散落在各 agent 的 persona note 裡,集中化後 Commander 在派遣時有單一事實來源可以參考。

Agent Model 用途
🔍 調查員 A(Investigator A) Gemini Flash 案例搜尋(Google Search grounding)
✅ 合規審查員(Compliance Reviewer) Gemini 2.5 Pro AIA 稽核員 persona 模擬
🔄 Fresh Eyes Reviewer Gemini 2.5 Pro(獨立) 外部視角挑戰,避免 Claude 自我驗證
📎 資料來源審查員(Source Reviewer) Codex 引用交叉驗證

多模型分工的原則是:Claude 做核心決策,Gemini 做搜尋 / 驗證 / persona simulation,Codex 做引用和 code review。

Principle 7 — Embedded Skill Invocation Required(v4 新增)

Subprocess agent 看不到 parent 的記憶。如果你只在外部文件說「呼叫這個 skill」,subprocess 根本不知道。

OGSM v1–v3 假設 agent 可以「自己知道」該呼叫哪些 skill——基於 CLAUDE.md、memory、或對話脈絡。這個假設在 subprocess agent(透過 Agent tool 派遣的子 agent)上失敗,因為 subprocess 的 context 是隔離的。

原則:agent 需要呼叫的任何 skill,必須在 S 段落中包含完整的命令格式 + 呼叫時機 + 範例。或者在 S 段落中明確引用 Skill Invocation Map(本頁上方的表格)。

驗收方式:Commander 在派遣每個 subprocess agent 時,把對應 agent 的 S 段落 + Skill Invocation Map 作為任務 briefing 的一部分傳入。Performance Supervisor 在每個波次檢查:subprocess agent 有沒有真的呼叫該呼叫的 skill?沒有的話是 briefing 失誤還是 agent 拒絕執行?

為什麼是 Principle 7:OGSM 原則 1–6 是關於「目標對齊」和「audience workflow」,Principle 7 是關於「agent 執行層」的可複製性——這是 multi-agent 系統特有的問題,傳統 OGSM 不需要處理。

Direction Seed(方向種子)— Commander Dispatch Template(v4 新增)

概念來自 watersonusa.ai 的文章《如何組建有效率的 AI Agent 團隊》——「第零步:設定方向種子」。12 個 agent 同時工作,最怕每個人跑不同方向;所以 Commander 派遣 subagent 前必須先傳遞一段統一的任務描述,確保所有 agent 瞄準同一個目標。

Direction Seed 和 Principle 7 是同一件事的兩面

兩者合併為 Commander Dispatch Template——每次透過 Agent tool 派遣任何 subagent 時,briefing 必須包含以下 9 個欄位。缺一不可。

Dispatch Template 必要 9 個欄位(round 2 更新)

  1. Course ID + Role Name(例:HSW-002 / Investigator A
  2. Target Audience Persona(不是抽象「建築師」,是完整 persona:12 年資歷的 Project Architect,負責 drawing set + Division 08 + spec writer coordination,典型 day-to-day 工作流程簡述)
  3. O(Objective)的完整引用——不要縮寫,讓 subagent 看到情感目標和實用目標全文
  4. This Agent's G/S/M——從本 OGSM 文件複製貼上該 agent 的完整 G/S/M 段落
  5. Embedded Skill Invocations——從 Skill Invocation Map 複製本角色該呼叫的所有 skill 命令,含完整參數格式(Principle 7 的要求)
  6. Hard Constraints(例:促銷比例 < 20%、citation 必須兩個來源、不得虛構案例)
  7. Tone + Voice Requirements(例:architect-peer,不是 marketing;直接、不迂迴;不預設讀者是初學者)
  8. Deliverable Format + File Path(例:WTR-HSW-002/investigator-a.md,包含段落結構標準)
  9. Anti-patterns to Avoid(這個 agent 不該做的事,反面清單)——至少 3 條。來自每個 agent 的 OGSM 定義中預先寫好的標準清單。為什麼重要:人類 briefing 最容易漏掉「顯而易見的反面」,強迫列反面清單才會逼 parent 思考「我假設 subagent 會知道但它其實不知道」的盲點。

省略任何欄位的代價:省略第 2 欄(persona)→ agent 寫出 generic 內容,失去 O 的情感目標。省略第 3 欄(O 全文)→ agent 知道自己的 G 但不知道 G 為什麼存在。省略第 5 欄(embedded skills)→ Principle 7 失效,skill 呼叫變成碰運氣。省略第 6 欄(constraints)→ 交付物 downstream 才發現違反硬門檻,浪費下一個 agent 的時間。省略第 7 欄(tone)→ 不同 agent 語氣不一致,Copy Editor 要全部重寫。省略第 9 欄(anti-patterns)→ agent 做了你以為「顯而易見不應該做」的事,因為你從來沒有說出來。

Pilot Dispatch(先派一個試水溫)

在並行派遣多個 subagent 之前,Commander 先派一個 pilot subagent 執行完整任務,驗證 briefing 的每個欄位是否清楚、有沒有遺漏、subagent 的輸出格式是否符合預期。Pilot 的目的不是省步驟,而是用最小成本確認「我的 briefing 讓 agent 理解了我想要的東西」——一個 pilot 失敗,比十個 agent 同時跑錯方向再全部重來的成本低得多。

三層保障設計

  1. 文件層:每個 agent 的 S 段落包含該呼叫的 skill 命令(Principle 7)
  2. Map 層:Skill Invocation Map 作為單一事實來源,避免 S 段落之間重複維護
  3. 派遣層:Commander 在 Dispatch Template 的第 5 欄,從 Skill Invocation Map 複製貼上該角色該呼叫的 skill 命令到 briefing 中

這個三層設計確保 skill 呼叫資訊在 (1) agent 定義、(2) 中央 Map、(3) 實際派遣 briefing 三個地方都存在——任何一層遺漏,其他兩層都能補救。

Brief Layering — Tier 1 / Tier 2(round 2 新增)

v4 round 2 把分層記憶體的哲學(在主文章和 v2 中詳細說明)套用到 agent briefing 層。每個 agent 的 G/S/M 定義分兩層:

Tier 1 — Direction Seed 必帶

  • 精簡版 G/S/M(核心一句話)
  • Target persona 摘要
  • O 的情感 + 實用目標
  • 最關鍵的 hard constraints(2–3 條)
  • Embedded skill invocations
  • Anti-patterns(3 條)

目標長度:約 800 字以內。每次派遣都帶。

Tier 2 — 按需載入

  • 完整的 M 驗收清單(所有條目)
  • Agent 的詳細 S 說明(所有子項目)
  • Gate 條件全文
  • 歷史版本 diff(v2→v3→v4 改動)
  • 所有 Wave 的 alignment note

目標長度:完整 OGSM 文件。按需傳入,不是每次都帶。

這個分層對應 CLAUDE.md 和 Skills 的設計哲學:常用的規則放在每次都載入的地方(Tier 1),詳細的參考資料按需讀取(Tier 2)。對 agent briefing 來說,Tier 1 確保 subagent 對齊方向,Tier 2 在 subagent 需要查細節時才引入——不是每次都把完整 OGSM 文件塞進 briefing。

實際效果:v4 round 2 把 Direction Seed 的 briefing 長度從 2000+ 字壓縮到 800 字左右。這不是因為資訊減少,而是因為把「核心對齊資訊」和「執行細節參考」拆開。Subagent 第一步只需要核心對齊資訊,執行過程中才去查細節——這才是符合實際工作流的設計。

把 CLAUDE.md / Skills 的分層思路套用到 agent 定義層——「常用的保持精簡,細節按需讀取」不只適用於人類工作記憶,也適用於 agent briefing。

Brief Layering 是 v4 round 2 最小但影響最深遠的設計改動:它讓 Commander 在派遣時有明確的決策框架——「這次任務需要 Tier 2 的細節嗎?還是 Tier 1 就夠了?」這個問題本身就會強迫 Commander 思考「這個 agent 現在需要知道什麼,不需要知道什麼。」

對齊性驗證矩陣(v4)

角色 O 情感目標(喜歡) O 實用目標(能判斷) G 失敗的風險
👑 指揮官 直接影響 直接影響 整體失敗
🔍 調查員 A 建立情感連結 提供決策依據 建築師感受不到課程和自己有關
🔎 調查員 B 核心 建築師無法在壓力下引用
✍️ 寫手 A 建立好奇心 建立理解基礎 後半段決策練習失去土壤
✍️ 寫手 B 新:情境辨識 + 實現路徑 建築師知道 Waterson 但不知道怎麼落實
🎨 互動設計師 提升參與感 建立決策本能 被動閱讀,無能力轉移
📋 內容總監 直接影響 間接影響 建築師迷失在技術細節中
✅ 合規審查員 必要條件 必要條件 課程永遠到不了建築師
📝 文字編輯 降低摩擦 降低認知負擔 重讀造成學習中斷
🔢 事實查核員 直接影響 建築師在現場被糾正,信任崩潰
📎 資料來源審查 擴展工具包 建築師無法追蹤和引用
💻 HTML 工程師 直接影響 傳遞機制 技術障礙打斷學習
🎯 Project Architect Advisor 唯一直接測量 間接測量 O 情感目標未被驗證
💼 Sales Rep Advisor 真實場景驗證 語言易懂性 課程在現實市場中無法流通
🔄 Fresh Eyes Reviewer 確保論點站得住腳 建築師在特殊情境下做出錯誤決策
📊 績效督導 早期預警 早期預警 O 偏移在最後才被發現
🔍 品質稽核員 保護修改時間 保護修改時間 技術問題壓縮建築師體驗改善空間
🎓 學習成果驗證 唯一直接測量 部署是希望,不是證據
🔭 Content Scout (v3.1) 放大器(擴大觸及) 課程是一次性消耗品,影響力有天花板
📖 Post-Test 設計師 (v3.1) 最後學習機會 + 學分關卡 建築師拿不到學分,O 的「抵達建築師」失敗
🏭 類別覆蓋稽核員 (v3.1) AIA 實質合規 HSW-003 退件重演,課程到不了 AIA 學員
🌏 中文翻譯 (v3.1) 在地情感連結 台灣 Project Architect 獨立判斷 O 有地理天花板,只在美國市場落地
📈 SEO/AEO 工程師 (v3.1) 發現層 課程躺在 /aia/ 等人發現,O 有發現天花板

Wave Gate 條件(v4)

每個 Gate 是進入下一個 Wave 的通過條件。v3 在 Gate 0、1、2、3 都加入了 spec 資源相關的驗收條件。

關鍵設計洞見(v4 更新)

知道「何時用」不夠——建築師還需要知道「如何用」。實現路徑本身是一個學習成果。

v2 的最大貢獻是讓建築師知道「何時 spec Waterson」(五個情境)。但 v2 漏掉了一個問題:建築師知道 Waterson 適合這個情境之後,下一步是什麼?他怎麼把這個決策變成一份實際的 spec 文件?

v3 的 Writer B 改動回答的是這個問題:「不是要建築師自己學會 spec 語言,而是告訴他有哪些獨立的 spec 資源路徑。」 這個轉向讓 OGSM 的設計更貼近建築師的實際工作流——他們是決策者,不是 spec 撰寫者。

同時,v3 的 M 改動讓這件事可被驗證:Learning Outcome Validator 現在需要確認建築師能說出至少 2 個具體的資源使用路徑。可被驗證的學習成果,才是真正的交付物。

OGSM 不只看課程品質,還要看發現 → 留下影響的完整生命週期。

v3 把課程內部品質做到極致——Project Architect 讀到課程那一刻會覺得這是為他寫的。但 v3 漏掉了一個問題:他怎麼找到這門課程?讀完後,課程怎麼變成持續的影響力?非英語市場怎麼落地?

v3.1 的五個新 agent 回答的是「課程如何從一次性學習事件變成持續的影響力系統」——發現層(SEO/AEO Engineer)讓建築師在搜尋旅程找到課程;在地化層(Chinese Translator)讓台灣 Project Architect 讀到同樣品質的課程;驗證層(Post-Test Designer)讓 CEU 學分能被帶走;實質合規層(Competitor Coverage Auditor)讓課程通過 AIA 實質審查;放大層(Content Scout)讓每次課程都產出 blog 內容擴大觸及面。

OGSM 的設計原則是「每個 agent 都要串回 O」。v3.1 讓這個原則延伸到課程生命週期的每一個環節——不只課程內部,還包括課程的發現、傳播、留存。

Agent = 持續角色(名詞),有跨時間的 G。Skill = 可重複流程(動詞),可被多個 agent 的 S 呼叫。把可重複流程強塞進 agent 外衣,你會得到角色數量膨脹、context 協調開銷、和被埋沒的可複用性。

v3.1 把五個生命週期缺口都當成「需要新角色」處理——把 23 個 agent 塞進同一個 OGSM。v4 的核心洞察是:只有 Candidate Collector 真的需要新 agent——因為它需要一個持續存在的角色,跨讀所有波次的交付物並寫入 queue。其他四個都是可重複流程(skill)或現有角色的 M 擴充。

把 Post-Test Designer 強塞成 agent,意味著每個波次都要協調它的 context;把 Chinese Translator 強塞成 agent,意味著雙語能力被鎖定在一個專案裡無法被其他課程重用。把它們降級為 skill,這兩個問題都消失了。

v4 的測試:在設計任何新「agent」之前,先問:「這個角色需要跨時間記住什麼?如果不需要,它可能是 skill 而不是 agent。」

六個 OGSM 反模式(Anti-patterns)

這些是我們在 v1 和 v2 時犯過的錯,也是大多數 AI 團隊 OGSM 最常見的失誤。第 6 個是 v3 才學到的新教訓。如果你正在為自己的團隊寫 OGSM,把這個清單貼在旁邊。

我們踩過的坑:6 個新學到的原則(v4 round 2 更新)

這些不是理論,是 v2 到 v4 升級過程中,我們實際犯錯後學到的設計原則。每一個都改變了某個版本的具體決策。v4 新增第 5 個原則:Subprocess Agent Isolation(subprocess 隔離原則)。Round 2 新增第 6 個原則:Brief Layering。

下一步

想了解這個架構如何建立起來?

回到主文章,看 Memory、Skills 和 OGSM 如何組成一個完整的 AI 團隊管理系統。

← 回到主文章 看 HSW-002 課程本身

這份 OGSM 的原始 Markdown 檔案

這份展示頁面的所有內容來自真實的工作計畫文件 WTR-HSW-002-OGSM-v4.md,儲存在 Waterson AI Growth System 的私有 repo 中。v3 版本保留在 WTR-HSW-002-OGSM-v3.md,v2 版本保留在 WTR-HSW-002-OGSM-v2.md,v1 版本保留在 WTR-HSW-002-OGSM.md 以供比較。

如果你正在考慮為自己的 AI 團隊建立類似的 OGSM 結構,文章中分享了一個可以直接 fork 的 starter kit 模板。