Claude Fable 5 的系统提示词,指向 Agent Harness 时代
Anthropic 官方 Claude system prompt 发布说明显示,AI 正在从更聪明的聊天,走向面向智能体的操作手册。这也解释了为什么 harness、Artifact、权限与 MCPlato 式工作空间会变得重要。
发布于 2026-06-17
Claude Fable 5 的系统提示词,指向 Agent Harness 时代
Anthropic 官方的 Claude system prompt 发布说明 值得读,并不是因为它泄露了什么魔法技巧,而是因为它展示了一条产品方向。这个页面发布了 Claude 网页界面(claude.ai)以及 iOS/Android 移动应用所使用核心提示词的带日期快照。Anthropic 也把边界说得很清楚:这些更新不适用于 Claude API。这个区别很重要。我们不应该把这个页面当作 API prompt,也不应该把它理解成可以复制或产品化私有 prompt 文本的许可。
这个页面真正说明的是,前沿模型正在被准备去完成的事情发生了持续变化。提示词越来越不像一张聊天机器人“人设卡”,而更像一份智能体操作手册:如何使用工具,什么时候澄清,如何引用来源,怎样处理文件,如何守住安全边界,怎样从不确定性中恢复,以及如何在产品界面里工作。
一本操作手册转化为智能体工作流通道的编辑插画
图 1:system prompt 的趋势正在从“回答用户”转向“在工作台中安全地执行任务”。
应使用官方名称 Claude Fable 5。它的 API 模型 ID 是 claude-fable-5。Anthropic 也介绍了 Claude Mythos 5(claude-mythos-5),但这两者不应被随意混为一谈。Claude Fable 5 是广泛可用的模型;Mythos 5 的可用范围受限。对本文来说,重点不是模型营销,而是最新的 Claude 聊天界面提示词像一个路标,指向更大的行业变化:模型被期待成为 harness 的一部分。
从增强型助手到操作手册
阅读 Opus 到 Fable 的演进,一个有用的角度是:它们假定的运行环境正在变化。
| 快照系列 | 发布说明时代可见的方向 | 实际含义 |
|---|---|---|
| Opus 4.5 / Opus 4.6 | 更多产品上下文、工具意识、文件处理和对话历史 | Claude 不再只是通用助手;它正被放进更丰富的产品界面中。 |
| Opus 4.7 | 更清楚地区分“先行动”与“先澄清” | 模型不应该因为缺少一个细节就停住。如果任务可以合理推进,就应该推进;只有当缺失信息会实质影响结果时才提问。 |
| Opus 4.8 | 更强的工具发现姿态 | 在说“做不到”之前,模型应该先检查当前环境和可用工具。能力的一部分开始取决于 harness。 |
| Claude Fable 5 | 更完整的智能体操作手册 | 提示词覆盖产品界面、工具、记忆、文件、引用、拒绝与安全行为、编程、浏览器工作、文档处理、简洁表达、不确定性以及用户福祉。 |
这种演进很细微,却很关键。早期的助手提示词主要关注回答质量:有帮助、安全、准确、遵循用户意图。新的模式关注的是工作执行。它假设 Claude 可能运行在一个有工具、文件有状态、历史很重要、引用必须谨慎处理、部分操作需要拒绝或审批的地方。
这正是 AI 从“对话对象”走向“工作参与者”时会发生的事。对话对象可以回答一个问题然后消失。工作参与者需要桌面、记忆、日历、文件柜、请求许可的方式、交付成果的地方,以及让人类审计过程的机制。
行动与澄清之间的变化
Opus 4.7 方向中最有意义的变化之一,是行动与澄清之间的平衡。许多早期 AI 工作流的失败方式很无聊:即使下一步显而易见,模型也会先要求澄清。用户可能说:“根据这些笔记起草一份发布计划”,助手却在产出任何有用内容之前,停下来询问语气、受众或时间线。
澄清仍然必要。如果某个决定会改变范围、风险、成本、法律暴露或外部动作,模型就应该提问。但如果缺失的信息很小、可逆,或者可以合理推断,一个胜任的智能体应该先带着明确假设推进,并把假设标出来。
这听起来像写作建议,但本质上是 harness 设计。正确的环境应该允许模型在低风险阶段继续推进,同时在高风险检查点暂停。例如:
- 现在起草计划,但在发送给客户前先询问。
- 现在检查代码仓库,但在编辑文件前先询问。
- 现在收集公开来源,但在发布前标出不确定的说法。
- 现在准备数据库迁移方案,但在执行前要求批准。
聊天窗口可以用文字表达这条规则。harness 可以把它落实到工作流里。
工具发现的变化
Opus 4.8 的方向提出了另一个要点:模型在放弃之前,应该先发现自己的环境。如果浏览器、文件读取器、电子表格工具、PDF 解析器、代码运行器或图像分析器可用,模型就应该使用这些界面,而不是假装自己只有一段对话。
这改变了“智能”的定义。一个模型说“我无法访问这个文件”,在一个界面里可能是对的,在另一个界面里可能就是错的。模型的实际能力现在是以下要素之和:
- 它自身的推理能力,
- 暴露给它的工具,
- 授予这些工具的权限,
- 跨步骤保留下来的状态,以及
- 可供检查结果的 Artifact 界面。
这就是为什么 agent harness 这个词很重要。harness 不是装饰。它是给模型眼睛、双手、记忆、边界和输出通道的系统。没有它,即便是很强的模型,也可能只是一个困在小聊天框里的、异常会说话的乘客。
从聊天助手行为到完整智能体操作手册的手绘时间线
图 2:提示词演进指向从更丰富的辅助能力走向结构化执行:行动、发现工具、保留状态并产出 Artifact。
为什么 harness 时代不只是“更好的聊天”
真正重要的行业变化,不是模型能写更长的答案,而是模型越来越被期待参与更长的工作循环。真实工作循环有状态,也有风险。
以编程任务为例。用户不需要一段声称 bug 已修复的文字。他们需要补丁、测试输出、变更文件摘要和评审说明。再看市场简报。用户不需要一篇没有可追溯性的自信综合。他们需要带日期的来源、引用、与上一期报告相比的变化,以及下周能继续更新简报的地方。再看基于浏览器的操作。用户不需要一句“报告已下载”的承诺。他们需要文件、文件夹、异常清单,以及哪些步骤是自动化完成、哪些步骤由人工处理的记录。
单一聊天 UI 很难胜任这一点,因为工作需要的东西它往往没有:
- 外部状态: 哪些内容已经被读过、改过、下载过或决定过?
- 阶段检查点: 工作应该在哪里暂停,以便审批或调整方向?
- 权限边界: 哪些动作是只读、可逆、面向外部、破坏性或成本高昂的?
- 恢复能力: 如果任务中途失败,能否不盲目重来,而是继续执行?
- Artifact 生命周期: 聊天记录滚走之后,最终结果在哪里保存?
- 并行隔离: 研究、写作、测试和评审能否在互不污染的独立工作流中进行?
- 可观测性: 人类能否检查来源、动作、成本、失败和假设?
这些不是 prompt engineering 细节,而是操作界面的细节。
MCPlato 如何承接这一趋势
理解 MCPlato 的最好方式,是把它看作 AI 工作空间和智能体操作界面,而不只是另一个回答框。它的产品词汇很自然地映射到 Claude 新一代 system prompt 所暗示的方向。
Sprite 是协调者。当一个任务有多个阶段或需要多个专家时,Sprite 可以拆解工作、委派给不同会话、跟踪进度,并把结果重新汇合。这很重要,因为长任务很少能装进一条不间断的思维链里。
Wand 是有状态的封装工作流。与其每次都让 AI 即兴重复同一流程,不如用 Wand 定义阶段、门禁、限定资源和预期 Artifact。结果更接近可重复运行的工作应用,而不是一个 prompt 模板。
Artifact 是持久的终点。输出不应该被困在一堵聊天文本墙里。它应该成为报告、补丁、演示文稿、电子表格、文件夹、决策备忘录、QA 记录,或其他可检查对象。
Skill 和 Distill Skill 保存 know-how。当一个工作流跑通后,可复用的部分应该能再次被调用。团队正是这样从孤立的“英雄 prompt”走向共享的操作实践。
ClawMode 和 Scheduled Tasks 让工作跨越时间。有些有价值的任务并不需要立刻完成:每周研究简报、每晚代码仓库扫描、周期性内容流水线,或在新信息出现后的跟进。
权限与审批门禁 让自主性保持边界。MCPlato 不应该被描述成盲目自动化。更好的原则是受控自主:在低风险动作上让 AI 继续推进;当动作会修改文件、发送消息、触碰外部系统或制造业务风险时,要求人类批准。
Channels 和 IM bridges 让交互变成异步。用户应该可以从团队聊天中委派任务,接收进度更新,并查看最终 Artifact,而不必守着前台聊天窗口。
本地优先的工作空间状态 让材料、状态和输出贴近用户的工作场景。这并不能消除所有隐私或安全问题,但它改变了姿态:工作空间是组织、审阅和治理上下文的地方。
简而言之,MCPlato 为模型提供了它们新的操作说明越来越假定存在的那种环境:工具、文件、记忆、权限、阶段、Artifact 与人类检查点。
包含 Artifact、日程、审批和会话通道的工作空间 harness 平面编辑插画
图 3:harness 将模型能力转化为可观察、有权限边界、围绕 Artifact 运转的工作循环。
四个具体例子
1. 从编码 issue 到补丁,再到 QA Artifact
用户把一个 GitHub issue 丢进 MCPlato,并要求修复。在纯聊天流程里,助手可能直接跳到建议。在 harness 流程里,这个任务会变成分阶段工作:
- 阅读 issue 和代码仓库上下文,
- 起草范围受限的计划,
- 如果变更有风险,在编辑前先询问,
- 制作补丁,
- 运行约定好的检查,
- 产出 QA Artifact,包含变更文件、测试输出、未解决风险和评审说明。
Claude 在“行动与澄清”之间的行为变化很适合这里。智能体不应该在阅读 issue 前提出不必要的问题,但在大范围或破坏性变更前应该暂停。
2. 带引用的定期研究简报
每周研究简报不是一次性回答,而是一个循环:收集批准来源、去重、与上周对比、总结变化、为每个具体说法附上引用,并交付报告。MCPlato 的 Scheduled Tasks 和 Artifacts 让输出保持持久;channels 让交付变成异步;Skills 让格式可以复用。
当工作空间能把来源列表和简报 Artifact 一起保存时,prompt 层面对引用来源的要求就更有价值。
3. 浏览器与文档工作流
想象一个财务团队必须从网页门户下载报告,把它们与电子表格合并,并制作月度摘要。好的智能体不应该声称自己可以访问所有网站。它应该尊重登录边界,请用户处理 MFA,发现是否存在导出或 API,只自动化已获批准且可重复的步骤,验证文件数量,并生成异常报告。
这就是“AI 能用浏览器”和“AI 能在受控的浏览器/文档循环中操作”之间的区别。
4. 高风险动作审批
假设智能体起草了一封发给客户的邮件、准备了一条会修改生产数据的命令,或者提出删除某个文件夹。模型也许理解了指令,但理解并不等于授权。harness 应该把这一步转成审批检查点:展示预期动作、预期影响、回滚计划和证据,然后等待。
在这里,安全与生产力互相增强。用户不需要拖慢每一个只读步骤。用户确实需要在不可逆或面向外部的动作之前看到清晰门禁。
这对构建者意味着什么
对 AI 产品构建者来说,Claude system prompt 发布说明是一个有用的设计信号。不要只问:“哪个模型最聪明?”还要问:
- 模型以为自己正在什么环境里运行?
- 产品能否暴露工具,同时不模糊权限?
- 工作流能否跨时间继续,而不丢失状态?
- 用户能否检查发生了什么?
- 最终结果能否成为 Artifact,而不是一段聊天记录?
- 系统能否在正确的时刻暂停,而不是问得太多或行动得太自由?
答案不会只来自更长的 system prompt。prompt 可以描述行为,但产品必须提供让行为可靠发生的操作界面。
这就是 harness 时代:模型变得更强,但只有被状态、工具、恢复机制、审批和 Artifact 包围时,能力才真正有用。
结论
Claude Fable 5 的 system prompt 快照之所以有意思,是因为它指向的不只是模型能力。它展示了现代模型正在被准备进入的环境形态。前沿不再只是“更好的聊天”,而是智能体工作:有状态、懂工具、有权限、重视引用、可恢复,并以 Artifact 为中心。
MCPlato 正是为这个方向而构建。Sprite 协调、Wands、Artifacts、可复用 Skills、定时任务、channels、本地优先工作空间状态和审批门禁,并不是模型外面的一圈装饰。它们是让强模型成为真实工作中有用参与者的操作界面。
模型仍然是引擎。harness 则把引擎变成一辆人们可以驾驶、检查、维修并信任的车。
参考资料
- Anthropic docs, System Prompts release notes.
- Anthropic docs, Introducing Claude Fable 5 and Claude Mythos 5.
