Claude Fable 5 的系統提示詞,指向 Agent Harness 時代
Anthropic 官方 Claude system prompt 發布說明顯示,AI 正在從更聰明的聊天,走向面向智慧體的操作手冊。這也解釋了為什麼 harness、Artifact、權限與 MCPlato 式工作空間會變得重要。
發布於 2026-06-17
Claude Fable 5 的系統提示詞,指向 Agent Harness 時代
Anthropic 官方的 Claude system prompt 發布說明 值得閱讀,並不是因為它揭露了什麼魔法技巧,而是因為它呈現了一條產品方向。這個頁面發布了 Claude 網頁介面(claude.ai)以及 iOS/Android 行動應用所使用核心提示詞的帶日期快照。Anthropic 也把邊界說得很清楚:這些更新不適用於 Claude API。這個差異很重要。我們不應該把這個頁面當成 API prompt,也不應該把它理解成可以複製或產品化私有 prompt 文本的許可。
這個頁面真正說明的是,前沿模型正在被準備去完成的事情發生了持續變化。提示詞越來越不像一張聊天機器人「人設卡」,而更像一份智慧體操作手冊:如何使用工具,何時澄清,如何引用來源,怎樣處理檔案,如何守住安全邊界,怎樣從不確定性中恢復,以及如何在產品介面裡工作。
一本操作手冊轉化為智慧體工作流通道的編輯插畫
圖 1:system prompt 的趨勢正在從「回答使用者」轉向「在工作台中安全地執行任務」。
應使用官方名稱 Claude Fable 5。它的 API 模型 ID 是 claude-fable-5。Anthropic 也介紹了 Claude Mythos 5(claude-mythos-5),但這兩者不應被隨意混為一談。Claude Fable 5 是廣泛可用的模型;Mythos 5 的可用範圍受限。對本文來說,重點不是模型行銷,而是最新的 Claude 聊天介面提示詞像一個路標,指向更大的產業變化:模型被期待成為 harness 的一部分。
從增強型助手到操作手冊
閱讀 Opus 到 Fable 的演進,一個有用的角度是:它們假定的運行環境正在變化。
| 快照系列 | 發布說明時代可見的方向 | 實際含義 |
|---|---|---|
| Opus 4.5 / Opus 4.6 | 更多產品上下文、工具意識、檔案處理和對話歷史 | Claude 不再只是通用助手;它正被放進更豐富的產品介面中。 |
| Opus 4.7 | 更清楚地區分「先行動」與「先澄清」 | 模型不應該因為缺少一個細節就停住。如果任務可以合理推進,就應該推進;只有當缺失資訊會實質影響結果時才提問。 |
| Opus 4.8 | 更強的工具發現姿態 | 在說「做不到」之前,模型應該先檢查當前環境和可用工具。能力的一部分開始取決於 harness。 |
| Claude Fable 5 | 更完整的智慧體操作手冊 | 提示詞覆蓋產品介面、工具、記憶、檔案、引用、拒絕與安全行為、程式設計、瀏覽器工作、文件處理、簡潔表達、不確定性以及使用者福祉。 |
這種演進很細微,卻很關鍵。早期的助手提示詞主要關注回答品質:有幫助、安全、準確、遵循使用者意圖。新的模式關注的是工作執行。它假設 Claude 可能運行在一個有工具、檔案有狀態、歷史很重要、引用必須謹慎處理、部分操作需要拒絕或審批的地方。
這正是 AI 從「對話對象」走向「工作參與者」時會發生的事。對話對象可以回答一個問題然後消失。工作參與者需要桌面、記憶、行事曆、檔案櫃、請求許可的方式、交付成果的地方,以及讓人類審計過程的機制。
行動與澄清之間的變化
Opus 4.7 方向中最有意義的變化之一,是行動與澄清之間的平衡。許多早期 AI 工作流的失敗方式很無聊:即使下一步顯而易見,模型也會先要求澄清。使用者可能說:「根據這些筆記起草一份發布計畫」,助手卻在產出任何有用內容之前,停下來詢問語氣、受眾或時間線。
澄清仍然必要。如果某個決定會改變範圍、風險、成本、法律暴露或外部動作,模型就應該提問。但如果缺失的資訊很小、可逆,或者可以合理推斷,一個勝任的智慧體應該先帶著明確假設推進,並把假設標出來。
這聽起來像寫作建議,但本質上是 harness 設計。正確的環境應該允許模型在低風險階段繼續推進,同時在高風險檢查點暫停。例如:
- 現在起草計畫,但在發送給客戶前先詢問。
- 現在檢查程式碼倉庫,但在編輯檔案前先詢問。
- 現在收集公開來源,但在發布前標出不確定的說法。
- 現在準備資料庫遷移方案,但在執行前要求批准。
聊天視窗可以用文字表達這條規則。harness 可以把它落實到工作流裡。
工具發現的變化
Opus 4.8 的方向提出了另一個要點:模型在放棄之前,應該先發現自己的環境。如果瀏覽器、檔案讀取器、試算表工具、PDF 解析器、程式碼執行器或影像分析器可用,模型就應該使用這些介面,而不是假裝自己只有一段對話。
這改變了「智慧」的定義。模型說「我無法存取這個檔案」,在一個介面裡可能是對的,在另一個介面裡可能就是錯的。模型的實際能力現在是以下要素之和:
- 它自身的推理能力,
- 暴露給它的工具,
- 授予這些工具的權限,
- 跨步驟保留下來的狀態,以及
- 可供檢查結果的 Artifact 介面。
這就是為什麼 agent harness 這個詞很重要。harness 不是裝飾。它是給模型眼睛、雙手、記憶、邊界和輸出通道的系統。沒有它,即便是很強的模型,也可能只是困在小聊天框裡、異常會說話的乘客。
從聊天助手行為到完整智慧體操作手冊的手繪時間線
圖 2:提示詞演進指向從更豐富的輔助能力走向結構化執行:行動、發現工具、保留狀態並產出 Artifact。
為什麼 harness 時代不只是「更好的聊天」
真正重要的產業變化,不是模型能寫更長的答案,而是模型越來越被期待參與更長的工作循環。真實工作循環有狀態,也有風險。
以程式設計任務為例。使用者不需要一段聲稱 bug 已修復的文字。他們需要補丁、測試輸出、變更檔案摘要和評審說明。再看市場簡報。使用者不需要一篇沒有可追溯性的自信綜合。他們需要帶日期的來源、引用、與上一期報告相比的變化,以及下週能繼續更新簡報的地方。再看基於瀏覽器的操作。使用者不需要一句「報告已下載」的承諾。他們需要檔案、資料夾、異常清單,以及哪些步驟是自動化完成、哪些步驟由人工處理的記錄。
單一聊天 UI 很難勝任這一點,因為工作需要的東西它往往沒有:
- 外部狀態: 哪些內容已經被讀過、改過、下載過或決定過?
- 階段檢查點: 工作應該在哪裡暫停,以便審批或調整方向?
- 權限邊界: 哪些動作是唯讀、可逆、面向外部、破壞性或成本高昂的?
- 恢復能力: 如果任務中途失敗,能否不盲目重來,而是繼續執行?
- Artifact 生命週期: 聊天記錄滾走之後,最終結果在哪裡保存?
- 平行隔離: 研究、寫作、測試和評審能否在互不污染的獨立工作流中進行?
- 可觀測性: 人類能否檢查來源、動作、成本、失敗和假設?
這些不是 prompt engineering 細節,而是操作介面的細節。
MCPlato 如何承接這一趨勢
理解 MCPlato 的最好方式,是把它看作 AI 工作空間和智慧體操作介面,而不只是另一個回答框。它的產品詞彙很自然地映射到 Claude 新一代 system prompt 所暗示的方向。
Sprite 是協調者。當一個任務有多個階段或需要多個專家時,Sprite 可以拆解工作、委派給不同工作階段、追蹤進度,並把結果重新匯合。這很重要,因為長任務很少能裝進一條不間斷的思維鏈裡。
Wand 是有狀態的封裝工作流。與其每次都讓 AI 即興重複同一流程,不如用 Wand 定義階段、門禁、限定資源和預期 Artifact。結果更接近可重複運行的工作應用,而不是一個 prompt 模板。
Artifact 是持久的終點。輸出不應該被困在一堵聊天文字牆裡。它應該成為報告、補丁、簡報、試算表、資料夾、決策備忘錄、QA 記錄,或其他可檢查物件。
Skill 和 Distill Skill 保存 know-how。當一個工作流跑通後,可複用的部分應該能再次被調用。團隊正是這樣從孤立的「英雄 prompt」走向共享的操作實踐。
ClawMode 和 Scheduled Tasks 讓工作跨越時間。有些有價值的任務並不需要立刻完成:每週研究簡報、每晚程式碼倉庫掃描、週期性內容流水線,或在新資訊出現後的跟進。
權限與審批門禁 讓自主性保持邊界。MCPlato 不應該被描述成盲目自動化。更好的原則是受控自主:在低風險動作上讓 AI 繼續推進;當動作會修改檔案、發送訊息、觸碰外部系統或製造業務風險時,要求人類批准。
Channels 和 IM bridges 讓互動變成非同步。使用者應該可以從團隊聊天中委派任務,接收進度更新,並查看最終 Artifact,而不必守著前台聊天視窗。
本地優先的工作空間狀態 讓材料、狀態和輸出貼近使用者的工作場景。這並不能消除所有隱私或安全問題,但它改變了姿態:工作空間是組織、審閱和治理上下文的地方。
簡而言之,MCPlato 為模型提供了它們新的操作說明越來越假定存在的那種環境:工具、檔案、記憶、權限、階段、Artifact 與人類檢查點。
包含 Artifact、日程、審批和工作階段通道的工作空間 harness 平面編輯插畫
圖 3:harness 將模型能力轉化為可觀察、有權限邊界、圍繞 Artifact 運轉的工作循環。
四個具體例子
1. 從程式 issue 到補丁,再到 QA Artifact
使用者把一個 GitHub issue 丟進 MCPlato,並要求修復。在純聊天流程裡,助手可能直接跳到建議。在 harness 流程裡,這個任務會變成分階段工作:
- 閱讀 issue 和程式碼倉庫上下文,
- 起草範圍受限的計畫,
- 如果變更有風險,在編輯前先詢問,
- 製作補丁,
- 運行約定好的檢查,
- 產出 QA Artifact,包含變更檔案、測試輸出、未解決風險和評審說明。
Claude 在「行動與澄清」之間的行為變化很適合這裡。智慧體不應該在閱讀 issue 前提出不必要的問題,但在大範圍或破壞性變更前應該暫停。
2. 帶引用的定期研究簡報
每週研究簡報不是一次性回答,而是一個循環:收集批准來源、去重、與上週對比、總結變化、為每個具體說法附上引用,並交付報告。MCPlato 的 Scheduled Tasks 和 Artifacts 讓輸出保持持久;channels 讓交付變成非同步;Skills 讓格式可以複用。
當工作空間能把來源清單和簡報 Artifact 一起保存時,prompt 層面對引用來源的要求就更有價值。
3. 瀏覽器與文件工作流
想像一個財務團隊必須從網頁入口下載報告,把它們與試算表合併,並製作月度摘要。好的智慧體不應該聲稱自己可以存取所有網站。它應該尊重登入邊界,請使用者處理 MFA,發現是否存在匯出或 API,只自動化已獲批准且可重複的步驟,驗證檔案數量,並生成異常報告。
這就是「AI 能用瀏覽器」和「AI 能在受控的瀏覽器/文件循環中操作」之間的差別。
4. 高風險動作審批
假設智慧體起草了一封發給客戶的郵件、準備了一條會修改生產資料的命令,或者提出刪除某個資料夾。模型也許理解了指令,但理解並不等於授權。harness 應該把這一步轉成審批檢查點:展示預期動作、預期影響、回滾計畫和證據,然後等待。
在這裡,安全與生產力互相增強。使用者不需要拖慢每一個唯讀步驟。使用者確實需要在不可逆或面向外部的動作之前看到清晰門禁。
這對構建者意味著什麼
對 AI 產品構建者來說,Claude system prompt 發布說明是一個有用的設計信號。不要只問:「哪個模型最聰明?」還要問:
- 模型以為自己正在什麼環境裡運行?
- 產品能否暴露工具,同時不模糊權限?
- 工作流能否跨時間繼續,而不丟失狀態?
- 使用者能否檢查發生了什麼?
- 最終結果能否成為 Artifact,而不是一段聊天記錄?
- 系統能否在正確的時刻暫停,而不是問得太多或行動得太自由?
答案不會只來自更長的 system prompt。prompt 可以描述行為,但產品必須提供讓行為可靠發生的操作介面。
這就是 harness 時代:模型變得更強,但只有被狀態、工具、恢復機制、審批和 Artifact 包圍時,能力才真正有用。
結論
Claude Fable 5 的 system prompt 快照之所以有意思,是因為它指向的不只是模型能力。它展示了現代模型正在被準備進入的環境形態。前沿不再只是「更好的聊天」,而是智慧體工作:有狀態、懂工具、有權限、重視引用、可恢復,並以 Artifact 為中心。
MCPlato 正是為這個方向而構建。Sprite 協調、Wands、Artifacts、可複用 Skills、定時任務、channels、本地優先工作空間狀態和審批門禁,並不是模型外面的一圈裝飾。它們是讓強模型成為真實工作中有用參與者的操作介面。
模型仍然是引擎。harness 則把引擎變成一輛人們可以駕駛、檢查、維修並信任的車。
參考資料
- Anthropic docs, System Prompts release notes.
- Anthropic docs, Introducing Claude Fable 5 and Claude Mythos 5.
