OGSM AI Agent 團隊 SOP — 標準作業流程

內部參考文件 • 版本 1.0 • 建立：2026-04-16

Part	讀者	內容
Part A	OGSM 顧問 / 講師	OGSM 品質指南（無 AI 術語）
Part B	AI 操作者	技術流程（8 個 Phase）
Part C	兩者	連接點：顧問建議如何落地

本段落為 AI 操作者設計。假設讀者已理解 Part A 的 OGSM 品質要求。

Phase 1：載入領域知識 + 定義 O

分析任務 → 載入知識 → 定義目標

▼

步驟

分析任務：這個任務屬於什麼領域？需要什麼專業知識？
載入知識：
- 已有 Skill → 載入（例：/ogsm-framework、/writing-guide）
- 沒有 Skill 但會重複使用 → 先建 Skill，存到 references/
- 一次性知識 → 直接當 context 提供
定義 O：用領域知識 + Part A 的品質要求寫 O

完成條件

領域知識已載入或建立
O 通過 Part A 的顧問檢查清單

Phase 2：AI 自動設計 Agent 團隊

分析複雜度 → 決定角色 → 設計波次

▼

步驟

1. 分析任務複雜度

簡單（1-3 步）→ 不需要團隊，直接執行
中型（4-10 步、多個面向）→ 3-7 個 agent
大型（跨領域、多波次）→ 8-20+ 個 agent

2. 決定角色類型

研究型（Investigator）：收集資料、驗證事實
寫作型（Writer）：產出內容
審核型（Reviewer）：品質把關
工程型（Engineer）：技術實作
協調型（Commander）：統籌派遣

3. 設計波次

研究 → 產出 → 審核 → 工程 → 發布
同波次的獨立角色可並行
波次之間設定 Gate 條件

4. 決定每個角色是 Agent 還是 Skill

需要判斷力 → Agent
純規則執行、可被任何 agent 呼叫 → Skill

完成條件

角色清單確定（含波次分配）
每個角色的類型明確（Agent vs Skill）
Gate 條件定義完成

Phase 3：撰寫每個 Agent 的 G/S/M

套用 Part A 品質要求撰寫每個 Agent 規格

▼

步驟

套用 Part A 的品質要求撰寫 G/S/M
S 必須包含：
- 使用的 Skill 命令（完整格式）
- 使用的 Model 命令（見 Phase 4）
- 資源承諾（資料來源、工具、流程）
M 必須包含：
- 每個 S 資源承諾的對應驗證
- 可測試的通過/失敗標準
撰寫 Tier 1 摘要（≤150 字）+ Tier 2 完整版

完成條件

每個 Agent 的 G/S/M 通過 Part A 檢查
每個 S 裡引用的 Skill 都有對應的 M 驗證
Tier 1 摘要可以獨立閱讀

Phase 4：Model Routing（模型路由）

按任務類型指派正確的 AI 模型

▼

決策規則

任務類型	首選 Model	Fallback
研究（搜尋、事實查證）	Gemini Pro / Flash	WebSearch → Claude
驗證（第二意見）	Gemini Flash	Claude
人物模擬（外部視角）	Gemini Pro	Claude
SEO / 搜尋分析	Gemini Flash	Claude
程式碼 / HTML	Codex	Claude
系統性審查	Codex	Claude
寫作（創意、判斷）	Claude	—
中文寫作	Claude	—
統籌決策	Claude Opus	—

實作方式

每個 Agent 的 S 段落必須寫明 Model 命令
使用 /ai-collab --task <type> 自動路由
使用 /ai-fallback 處理配額耗盡的降級

完成條件

每個 Agent 都有明確的 Model 指派
Fallback 路徑已定義

Phase 5：Direction Seed + 派遣

9 欄位模板 + Pilot 先行策略

▼

Direction Seed 9 欄位模板

每個子 Agent 的派遣簡報必須包含：

#	欄位	說明
1	Project ID + 角色名稱	明確身份
2	目標受眾 Persona	具體描述，不只是標籤
3	O（全文引用）	讓子 Agent 知道最終目標
4	該 Agent 的 G/S/M（Tier 1 摘要）	≤150 字
5	Skill + Model 命令（完整格式）	子 Agent 在隔離環境，看不到父層記憶
6	硬性限制	字數、格式、禁止事項
7	語氣 + 風格	專業 / 口語 / 學術
8	交付物格式 + 檔案路徑	明確的輸出位置
9	反模式清單	用「NOT: X — INSTEAD: Y」格式

派遣模式

Pilot Dispatch：先派 1 個 Agent 試跑，確認簡報無誤後再 fan-out 全部
並行派遣：同波次的獨立 Agent 一次全派，用背景模式
前景 vs 背景：需要結果才能繼續 → 前景；獨立任務 → 背景

完成條件

Direction Seed 9 欄位都填完
Pilot 已通過（如適用）
所有 Agent 已派遣

Phase 6：驗證

4-Robot Factory + Gate Review + Script-First

▼

4-Robot Factory 模式

用於打磨已有的 Agent 規格：

Robot	角色	工作
Spec Verifier	品規員	寫 BDD 場景，驗證 Agent 規格完整性
Dispatch Harness	測試員	用測試輸入派遣 Agent，收集產出
Iterator	優化員	分析失敗項，提出修改，回歸測試
Quality Auditor	稽核員	獨立審計產出品質，防止 scope creep

Gate Review

每個波次結束後，Commander 檢查：

該波次所有 Agent 的 M 是否通過？
產出是否足夠讓下一波次開始？
受眾是否「在場」？（讀產出時能感受到受眾的存在）

Script-First 原則

機械性工作（格式檢查、字數統計、schema 驗證）用腳本執行，不消耗 AI token。只有需要判斷力的工作才用 AI。

v3.2 決定性腳本驗證器（Deterministic Validators）

v3.2 新增三支 Python 腳本，取代純 LLM 事實查核，對規則執行 100% 機械判斷。LLM 負責判斷力工作，腳本負責規則執行，兩者不可互換。

腳本	用途	Pass 條件
`citation_backcheck.py`	驗證每個 `(waterson-product-facts.md:L…)` 引用的行號確實包含主張的事實	0 mismatches（≥40% 關鍵詞命中率）
`causal_inference_scan.py`	偵測含因果語言（because / 因此…）但同段落無引用的句子	0 INFERENCE / SPECULATIVE 判定
`trend_claim_scan.py`	偵測產業趨勢主張（increasingly / 近年來…）但缺乏外部權威引用	0 REJECT 判定

注意：Waterson 自身素材（waterson-product-facts.md）不算外部權威來源。趨勢主張必須引用 ASHE、FGI、NFPA、AIA、peer-reviewed study 等外部機構。

腳本位置：tools/validators/。執行方式：

python3 tools/validators/citation_backcheck.py blog/{slug}/index.html --gt docs/waterson-product-facts.md
python3 tools/validators/causal_inference_scan.py blog/{slug}/index.html
python3 tools/validators/trend_claim_scan.py blog/{slug}/index.html

完成條件

所有 Gate 通過
機械性驗證已用腳本完成
Quality Auditor 簽核
citation_backcheck.py exit 0（三支 HTML 全部通過）
causal_inference_scan.py exit 0（0 INFERENCE verdicts）
trend_claim_scan.py exit 0（0 REJECT verdicts）

Phase 7：生產執行

Commander 統籌 → 並行派遣 → 部署

▼

執行原則

Commander 不自己做事：只負責派遣、監控、決策
所有獨立任務並行派遣：不人為分批
錯誤處理：Agent 失敗 → 診斷原因 → 修改 Direction Seed → 重派
基礎設施同步更新：sitemap、llms.txt、blog index 等

完成條件

所有 Agent 交付完成
基礎設施已更新
Security check 通過
部署完成

Phase 8：回顧與迭代

記錄反模式 + 更新知識庫 + 版本管理

▼

該存的

類型	存到哪	範例
流程改進	feedback memory	「並行派遣比分批快 3 倍」
反模式	OGSM spec 的反模式段落	「Commander 自己寫文章」
領域知識	Skill references/	新發現的法規解釋

不該存的

可以從 code 或 git log 推導出來的東西
一次性的任務細節
已經寫在 CLAUDE.md 的東西

版本升級時機

發現 3+ 個新反模式 → minor version（v5.1 → v5.2）
新增/刪除角色 → major version（v5 → v6）
純文字修正 → 不升版

完成條件

新發現的反模式已記錄
feedback memory 已更新
OGSM spec 版本已升級（如適用）

附錄一：反模式清單

#	名稱	描述	預防方法
1	Commander 自己做事	統籌者直接寫內容，而不是派遣	Commander 只負責派遣和決策
2	G 變成 M	Goal 寫成交付物清單	用「受眾感受到⋯⋯」重寫
3	S 太通用	策略可以套用在任何專案	加上「for [受眾], because [原因]」
4	不確認就選題	高影響決策沒有先問人	高風險決策（課程主題）必須確認；低風險（blog 選題）可自行決定
5	人為分批	可以並行的任務卻分 Wave 1→2→3	沒有真正的 blocker 就全部並行
6	1 個 Agent 偷懶	該派全部 Agent 卻只派 1 個	獨立任務 + N>3 → 全部並行
7	沒指定 Model	所有 Agent 都用預設 Model	每個 Agent 的 S 必須寫明 Model
8	自評作業	團隊自己檢查自己的品質	加入外部視角的 Reviewer
9	用 AI 做機械工作	格式檢查、字數統計用 AI 做	Script-first：機械工作用腳本
10	前景模式卡住對話	長時間任務用前景模式執行	獨立任務用背景模式
11	LLM 為了滿足配額而捏造	要求「找 5 個來源」，模型編造假來源	允許不足額交付 + 要求可驗證來源
12	Skill 寫了但沒驗證	OGSM 引用了 Skill 但沒確認能用	Skill Integration Verification Protocol（靜態+乾跑+生產稽核）

附錄二：原則清單

#	原則	說明
1	受眾在場	每個 G 都要讓人感受到受眾的存在
2	M 對準 S	M 驗證的是 S 的資源承諾，不只是計數交付物
3	Script-First	機械工作用腳本，AI 只做需要判斷力的事
4	按任務類型路由 Model	不是按角色，而是按任務性質選 Model
5	Pilot 先行	先派 1 個試跑，確認無誤再 fan-out
6	Base Layer	產出留空間給人類補充，不做到「完美」
7	嵌入式命令	子 Agent 在隔離環境，Skill/Model 命令必須寫在 Direction Seed 裡
8	背景優先	獨立任務用背景模式，不卡主對話
9	先理解再動手	確認目標、範圍、受眾後才開始
10	允許不足額交付	寧可少交但真實，不要多交但捏造
11	外部視角	至少一個 Reviewer 用不同標準 / 不同模型
12	版本管理	每次重大變更升版，反模式寫入 spec

OGSM 顧問如何參與

顧問只看 Part A — 不需要理解 AI 技術
顧問的反饋進入 Phase 3 — 修改 G/S/M 的寫法
操作者負責翻譯 — 把顧問的 OGSM 建議轉化為技術實作

工作流程

顧問審閱 Part A 的檢查清單

↓

顧問指出 O/G/S/M 的問題

↓

操作者修改 Phase 3 的 Agent 規格

↓

操作者重跑 Phase 4-7

↓

產出改善 → 回報顧問

迭代循環

顧問的每次反饋 → 更新 Part A 的檢查清單
操作者的每次踩坑 → 更新 Part B 的反模式
兩邊的更新互相獨立，但通過 Part C 連接

角色	閱讀	輸出	更新目標
OGSM 顧問	Part A 檢查清單	O/G/S/M 問題反饋	Part A 的品質準則
AI 操作者	Part B Phase 1-8	修改後的 Agent 規格	Part B 的反模式清單
兩者	Part C（本段落）	協同改善產出	Part C 的工作流程

OGSM AI Agent 團隊 SOP — 標準作業流程

原則

好的寫法 vs 壞的寫法

O 的常見錯誤

顧問檢查點

原則

好的寫法 vs 壞的寫法

G 的常見錯誤

顧問檢查點

原則

好的寫法 vs 壞的寫法

S 的常見錯誤

顧問檢查點

原則

好的寫法 vs 壞的寫法

M 的常見錯誤

顧問檢查點

1. 角色間的銜接

2. 波次（Wave）邏輯

3. 角色 vs 流程的邊界

4. 防止「確認偏誤」

OGSM 顧問專用 — 總檢查清單

步驟

完成條件

步驟

1. 分析任務複雜度

2. 決定角色類型

3. 設計波次

4. 決定每個角色是 Agent 還是 Skill

完成條件

步驟

完成條件

決策規則

實作方式

完成條件

Direction Seed 9 欄位模板

派遣模式

完成條件

4-Robot Factory 模式

Gate Review

Script-First 原則

v3.2 決定性腳本驗證器（Deterministic Validators）

完成條件

執行原則

完成條件

該存的

不該存的

版本升級時機

完成條件

附錄一：反模式清單

附錄二：原則清單

OGSM 顧問如何參與

工作流程

迭代循環

💬 講師回饋 / Instructor Feedback