當 AI 加入團隊，誰該負責什麼？用 RACI 重新定義人機分工

2026 年 5 月 · 閱讀約 10 分鐘 · Aidaris Technologies AI & Engineering

RACI 人機協作 Multi-Agent 團隊設計

每個用過 RACI 矩陣的團隊都有相同的經驗：你們圍著白板坐下，列出利害關係人，畫出格子，填上字母。這個過程會迫使大家進行有意義的對話——誰真正擁有這個決策？誰需要在場？誰來拍板？

RACI 有效，是因為它把人們習慣留在隱性狀態的責任假設攤在檯面上。它是為一個所有角色都是真實人類的世界所設計的——每個人都有意圖、記憶、道德能動性，以及切身的利害關係。

現在 AI 加入了團隊。而大多數組織的直覺反應是：在 RACI 矩陣裡加一欄「AI」然後繼續。這個直覺是錯的——理解為什麼錯，能揭示如何真正建構有效的人機協作工作流程。

RACI 快速回顧

對於不常使用這個框架的人，RACI 為每個任務的每個參與者指定四種角色之一：

負責執行（Responsible，R）：做這件事的人，可以有多人。
當責（Accountable，A）：對結果負最終責任的人，必須只有一人——責任止於此。
諮詢（Consulted，C）：在決策定案前會被徵詢意見的人。
知會（Informed，I）：需要被告知進度但不需要採取行動的人。

這個模型預設了連續性：當責者可以在事後被追問責任；諮詢者可以根據專業提出反對意見；知會者接收資訊並調整自身行為。這些假設之所以成立，是因為每個角色都是人。

陷阱：把 AI 當成人

當團隊開始與 AI 合作時，往往會對它產生擬人化的投射。他們說 AI「理解」需求、「決定」採用哪種方案、「對輸出負責」。這些說法在日常對話中是方便的簡稱，但當你要設計工作流程時，它們會掩蓋一個危險的誤解。

一個 AI Agent——即使是能力極強的那種——並不具備讓 RACI 在人類身上有效運作的任何特質：

沒有跨對話的持久記憶。每次互動都從零開始。昨天幫你寫程式的 AI，今天對那段程式毫無印象，除非你明確地把上下文帶入。
沒有對後果的感知。當 AI 產出錯誤答案時，它不會感到遺憾，不會因此變得更謹慎，也不會把任何教訓帶到下一次。錯誤與修正之間沒有自然的回饋迴路。
沒有道德能動性。AI 無法在任何有意義的層面上被追責。它不會出現在事後檢討會議裡，不會意識到自己的自信是錯誤的，也不會在利害關係人眼中失去信譽。
不理解「為什麼這件事很重要」。AI 可以產出一份符合規格的成果，卻完全不理解那份規格因何而存在、它服務於什麼目的、或失敗的代價是什麼。

在 RACI 矩陣裡放一個「AI」欄位，會製造一種「有人在負責」的假象。事實上，那個角色是空的——問責已經消失進了一個黑盒子裡。

更深層的問題：AI 不是單一角色

還有第二個比較少被意識到的問題。當團隊談論「AI 在團隊裡」時，他們想像的是一個單一、連貫的 Agent——像是一個碰巧以機器速度工作的能幹新成員。但現代 AI 系統，尤其在工程情境中，幾乎從來都不是單一 Agent，而是由多個專門化 Agent 協作組成的網絡。

想想一個生產環境中的 AI 輔助工程工作流程在底層實際是什麼樣子：

協調 Agent（Orchestrator Agent）：接收高層次任務，將它分解成子任務，並將工作分派給各個專門 Agent。它像是一個專案經理——但對任務分解是否正確毫無判斷能力。
專門 Agent（Specialist Agents）：負責特定子任務：一個生成程式碼、一個撰寫測試、一個搜尋文件、一個產生摘要。每個都在自己狹窄的範疇內運作。
評審 Agent（Critic / Reviewer Agent）：根據評分標準評估各專門 Agent 的輸出——檢查錯誤、不一致或違反規範之處。它可以標記問題，但無法在沒有新一輪執行的情況下自行修正。
記憶 Agent（Memory / Context Agent）：跨任務維護狀態：儲存過去的決策、擷取的文件、相關歷史。但這份記憶的品質，取決於人類選擇儲存與結構化什麼資訊。

關鍵洞察在此：這些 Agent 彼此之間沒有任何問責關係。協調 Agent 並不真正在意專門 Agent 的輸出是否正確。評審 Agent 無法凌駕整條流程管線。記憶 Agent 不會在儲存的上下文過時時發出警告。它們是流程節點，不是隊友。

當多 Agent 流程管線出錯時，沒有一個自然的地方可以追究責任。協調 Agent 照指令行事。專門 Agent 產出了看似合理的輸出。評審 Agent 沒有發現明顯錯誤。然而最終結果卻在一個重要的層面上是錯的——甚至可能嚴重出錯。沒有人類的檢查點，這個失敗就這樣無聲無息地向下傳遞。

為人機工作流程重新設計 RACI

解決方案不是拋棄 RACI，而是在清楚理解 AI Agent 本質的前提下重新設計它：AI 是強大、快速、無狀態的執行節點，在人類設計的框架內、於人類把控的閘門處、朝著人類擁有的結果運作。

以下是每個 RACI 角色需要重新思考的方式：

負責執行（R）：AI 執行，人類把關

AI Agent 可以、也應該承擔執行任務的「R」角色：產出初稿、執行分析、生成測試案例、格式化輸出、摘要文件。這正是 AI 提供真實槓桿效應的地方——規模化的速度與一致性。

但人機協作情境中的「負責執行」，必須永遠在輸出成為下一個階段的輸入之前，包含一個人類審查閘門。AI 負責產出；人類負責驗證。兩者都是「R」角色不可或缺的部分。跳過人類閘門並不會讓 AI 更有責任感——它只會讓工作流程失去治理。

在實務上，這意味著你的 RACI 應該區分 R-AI（AI 執行）與 R-人類（人類審查並核准），而不是把兩者合併成一個「AI」條目。

當責（A）：永遠是人類

問責無法委派給 AI Agent——無論是一個還是多個。問責的前提是：有人可以被追問「為什麼會發生這件事？」並給出有意義的回答；有人會在結果出錯時承擔後果；有人有權在情境不符合規格時做出判斷。

在多 Agent 流程管線中，問責擴散的誘惑特別強。節點那麼多、輸出那麼多、中間步驟那麼多。很容易讓人覺得系統本身就是當責者。它不是。任何觸及真實世界的工作流程——一個上線的功能、一封發出的通訊、一個部署的設定、一份發布的文件——都必須有一個人類擁有其結果。

如果你無法說出當責者是誰，你的工作流程還沒有準備好自主執行。

諮詢（C）：AI 作為高速諮詢層

這是多 Agent 系統真正出類拔萃的地方。傳統的「諮詢」角色需要徵詢專家意見——一個緩慢、受制於行程安排的過程。AI Agent 可以以任何人類團隊都無法企及的速度與廣度提供諮詢。

需要對一個安全設計做第二意見審查？Agent 可以在幾秒鐘內對照已知漏洞模式進行評估。想在承諾之前探索三種備選架構？Agent 可以在你下次開會之前就把三種都草擬並評論完畢。想知道你的 API 合約是否有未考慮到的邊界案例？Agent 可以即時列舉出幾十種情境。

但 AI 諮詢有一個結構性的侷限：它有廣度，卻缺乏脈絡深度。它不知道你們組織的歷史、你們客戶未明言的期望、你們團隊的限制，或你們利害關係人的風險承受度。在這種脈絡深度至關重要的決策上，人類領域專家作為「諮詢」角色依然不可取代。正確的模型是：AI 負責廣度，人類負責深度——並且知道某個決策需要哪種諮詢。

知會（I）：結構化上下文是一門設計紀律

在傳統 RACI 中，「知會」角色是讓人們掌握進度以調整行為。對 AI Agent 而言，相對應的做法是透過結構化上下文維持情境感知：已做出哪些決策、適用哪些限制、系統目前的狀態是什麼。

但有一個關鍵差異：被「知會」的人類可以提問、注意到資訊看起來有誤、並提出疑慮。被動接收上下文的 AI Agent 無法可靠地做到這些事。它會使用被給予的任何上下文，即使那個上下文是過時的、不完整的，或者具有誤導性的。

這意味著上下文流程管線的設計——儲存什麼、如何擷取、何時更新——本身就是人類的責任。記憶 Agent 不會自我維護。必須有人決定 AI Agent 需要什麼資訊才能保持正確定向，而那個人永遠是人類工程師或架構師。

三件人類絕對不能委派的事

無論多 Agent 系統變得多麼強大，有三個責任必須留在人類手中——不是因為 AI 無法執行相關任務，而是因為這些責任需要 AI 所沒有的特質。

1. 最終決策權與道德判斷。當一個決策對真實世界——客戶、團隊成員、企業——有實際後果時，必須由人類做出。AI 可以呈現選項、評估利弊、推薦方向。但在充分意識到利害關係的前提下做出選擇這件事，屬於人類。這不是能力問題——而是後果問題：只有人類可以在任何有意義的層面上為選擇負責。

2. 具備完整脈絡的品質把關。AI Agent 依據它能觀察到的事物評估輸出：一個評分標準、一套測試、一組範例。它無法依據它不知道的事物進行評估。評審 Agent 可以告訴你程式碼通過了測試。它無法告訴你整個方案在公司上季的策略轉向後已經錯了方向，或者它遺漏的邊界案例恰好是你最大客戶最常遇到的情境。只有具備完整組織脈絡的人類才能發現這種失敗。

3. 框架設計與意圖訂定。在你告訴 Agent 要做什麼之前，你必須知道你想做什麼——以及為什麼。多 Agent 工作流程的架構、評審 Agent 使用的評分標準、自主執行的邊界、將決策路由回人類的觸發條件：這一切都必須由人類設計。AI 無法設計它自身運作的系統。在 AI 輔助的世界中，這是人類貢獻最高的槓桿點，也需要最深刻的判斷。

給工程團隊的實踐建議

以下是實際執行的具體做法：

在 RACI 中明確命名各個 Agent。不要在格子裡寫「AI」。寫「程式碼生成 Agent」、「評審 Agent」或「協調 Agent」。這會強制釐清使用了哪種能力，以及需要在哪裡設置人類檢查點。
建立並維護「AI 可自主執行」與「人類必須把關」的任務清單。有些輸出風險夠低，AI 可以端對端執行，只需人類定期審查。其他任務則需要在每個循環都設置人類閘門。把這個區分明確寫出來，並在回顧會議中持續更新。
不要讓 AI 的速度掩蓋問責的缺失。流程管線跑得越快，就越容易在沒有充分人類審查的情況下出貨。速度是特性；失控的速度是風險。在優化流程管線之前，先設計好你的審查閘門。
把上下文流程管線設計視為一等工程任務。AI Agent 所知道的品質，至少和它能做到的品質同樣重要。過時、不完整或結構不良的上下文，會產生自信但錯誤的輸出。用對待模型選擇同等的重視度來投資你的上下文架構。
對 AI 輔助工作流程進行回顧。哪些 Agent 處理的任務已經夠穩定，可以降低人類審查頻率？哪些產生了需要更嚴格把關的失敗？隨著 Agent 改進以及你對其失敗模式理解加深，正確的平衡點也會隨之移動。

重新定框

RACI 建立在一套對人類團隊行之有效的假設之上：角色有記憶、後果對他們很重要、矩陣裡的人可以被追責。當 AI 進入這個畫面，這些假設就失效了——不是因為 AI 能力不足，而是因為它是一種根本上不同類型的角色。

在 RACI 矩陣中思考 AI 的正確方式，不是把它當成一個填補現有角色的新團隊成員，而是把它視為一組強大的、無狀態的能力模組，在人類設計的框架內、於人類把控的閘門處、朝著人類擁有的結果運作。

多 Agent 系統不會改變這個原則——它只會放大它。更多的 Agent 意味著更強的執行能力，但也意味著更大的問責消失的風險面。答案不是更少的 Agent，而是在每個有後果的決策節點，更清晰的人類所有權。

在 AI 增強的團隊中，人類的角色並沒有被削弱，而是被提升了——從執行到設計、從運作到治理、從回答問題到決定哪些問題重要。這種提升只有在人類接受隨之而來的問責時才能發揮作用，而不是假設 AI 已經吸收了它。

在 AIDARIS，這就是我們的建構方式。不是把責任交給流程管線，而是設計讓責任精確地留在它該在之處的流程管線。如果這種對人機協作的思考方式與你對工程的理解產生共鳴，歡迎與我們聯繫。