claude-fable-5

system-prompts

agent-harness

ai-agents

mcplato

loop-engineering

Claude Fable 5 的系统提示词，指向 Agent Harness 时代

Anthropic 官方 Claude system prompt 发布说明显示，AI 正在从更聪明的聊天，走向面向智能体的操作手册。这也解释了为什么 harness、Artifact、权限与 MCPlato 式工作空间会变得重要。

MCPlato Research Team发布于 2026-06-17

Claude Fable 5 的系统提示词，指向 Agent Harness 时代

Anthropic 官方的 Claude system prompt 发布说明值得读，并不是因为它泄露了什么魔法技巧，而是因为它展示了一条产品方向。这个页面发布了 Claude 网页界面（claude.ai）以及 iOS/Android 移动应用所使用核心提示词的带日期快照。Anthropic 也把边界说得很清楚：这些更新不适用于 Claude API。这个区别很重要。我们不应该把这个页面当作 API prompt，也不应该把它理解成可以复制或产品化私有 prompt 文本的许可。

这个页面真正说明的是，前沿模型正在被准备去完成的事情发生了持续变化。提示词越来越不像一张聊天机器人“人设卡”，而更像一份智能体操作手册：如何使用工具，什么时候澄清，如何引用来源，怎样处理文件，如何守住安全边界，怎样从不确定性中恢复，以及如何在产品界面里工作。

一本操作手册转化为智能体工作流通道的编辑插画

图 1：system prompt 的趋势正在从“回答用户”转向“在工作台中安全地执行任务”。

应使用官方名称 Claude Fable 5。它的 API 模型 ID 是 claude-fable-5。Anthropic 也介绍了 Claude Mythos 5（claude-mythos-5），但这两者不应被随意混为一谈。Claude Fable 5 是广泛可用的模型；Mythos 5 的可用范围受限。对本文来说，重点不是模型营销，而是最新的 Claude 聊天界面提示词像一个路标，指向更大的行业变化：模型被期待成为 harness 的一部分。

从增强型助手到操作手册

阅读 Opus 到 Fable 的演进，一个有用的角度是：它们假定的运行环境正在变化。

快照系列	发布说明时代可见的方向	实际含义
Opus 4.5 / Opus 4.6	更多产品上下文、工具意识、文件处理和对话历史	Claude 不再只是通用助手；它正被放进更丰富的产品界面中。
Opus 4.7	更清楚地区分“先行动”与“先澄清”	模型不应该因为缺少一个细节就停住。如果任务可以合理推进，就应该推进；只有当缺失信息会实质影响结果时才提问。
Opus 4.8	更强的工具发现姿态	在说“做不到”之前，模型应该先检查当前环境和可用工具。能力的一部分开始取决于 harness。
Claude Fable 5	更完整的智能体操作手册	提示词覆盖产品界面、工具、记忆、文件、引用、拒绝与安全行为、编程、浏览器工作、文档处理、简洁表达、不确定性以及用户福祉。

这种演进很细微，却很关键。早期的助手提示词主要关注回答质量：有帮助、安全、准确、遵循用户意图。新的模式关注的是工作执行。它假设 Claude 可能运行在一个有工具、文件有状态、历史很重要、引用必须谨慎处理、部分操作需要拒绝或审批的地方。

这正是 AI 从“对话对象”走向“工作参与者”时会发生的事。对话对象可以回答一个问题然后消失。工作参与者需要桌面、记忆、日历、文件柜、请求许可的方式、交付成果的地方，以及让人类审计过程的机制。

行动与澄清之间的变化

Opus 4.7 方向中最有意义的变化之一，是行动与澄清之间的平衡。许多早期 AI 工作流的失败方式很无聊：即使下一步显而易见，模型也会先要求澄清。用户可能说：“根据这些笔记起草一份发布计划”，助手却在产出任何有用内容之前，停下来询问语气、受众或时间线。

澄清仍然必要。如果某个决定会改变范围、风险、成本、法律暴露或外部动作，模型就应该提问。但如果缺失的信息很小、可逆，或者可以合理推断，一个胜任的智能体应该先带着明确假设推进，并把假设标出来。

这听起来像写作建议，但本质上是 harness 设计。正确的环境应该允许模型在低风险阶段继续推进，同时在高风险检查点暂停。例如：

现在起草计划，但在发送给客户前先询问。
现在检查代码仓库，但在编辑文件前先询问。
现在收集公开来源，但在发布前标出不确定的说法。
现在准备数据库迁移方案，但在执行前要求批准。

聊天窗口可以用文字表达这条规则。harness 可以把它落实到工作流里。

工具发现的变化

Opus 4.8 的方向提出了另一个要点：模型在放弃之前，应该先发现自己的环境。如果浏览器、文件读取器、电子表格工具、PDF 解析器、代码运行器或图像分析器可用，模型就应该使用这些界面，而不是假装自己只有一段对话。

这改变了“智能”的定义。一个模型说“我无法访问这个文件”，在一个界面里可能是对的，在另一个界面里可能就是错的。模型的实际能力现在是以下要素之和：

它自身的推理能力，
暴露给它的工具，
授予这些工具的权限，
跨步骤保留下来的状态，以及
可供检查结果的 Artifact 界面。

这就是为什么 agent harness 这个词很重要。harness 不是装饰。它是给模型眼睛、双手、记忆、边界和输出通道的系统。没有它，即便是很强的模型，也可能只是一个困在小聊天框里的、异常会说话的乘客。

从聊天助手行为到完整智能体操作手册的手绘时间线

图 2：提示词演进指向从更丰富的辅助能力走向结构化执行：行动、发现工具、保留状态并产出 Artifact。

为什么 harness 时代不只是“更好的聊天”

真正重要的行业变化，不是模型能写更长的答案，而是模型越来越被期待参与更长的工作循环。真实工作循环有状态，也有风险。

以编程任务为例。用户不需要一段声称 bug 已修复的文字。他们需要补丁、测试输出、变更文件摘要和评审说明。再看市场简报。用户不需要一篇没有可追溯性的自信综合。他们需要带日期的来源、引用、与上一期报告相比的变化，以及下周能继续更新简报的地方。再看基于浏览器的操作。用户不需要一句“报告已下载”的承诺。他们需要文件、文件夹、异常清单，以及哪些步骤是自动化完成、哪些步骤由人工处理的记录。

单一聊天 UI 很难胜任这一点，因为工作需要的东西它往往没有：

外部状态： 哪些内容已经被读过、改过、下载过或决定过？
阶段检查点： 工作应该在哪里暂停，以便审批或调整方向？
权限边界： 哪些动作是只读、可逆、面向外部、破坏性或成本高昂的？
恢复能力： 如果任务中途失败，能否不盲目重来，而是继续执行？
Artifact 生命周期： 聊天记录滚走之后，最终结果在哪里保存？
并行隔离： 研究、写作、测试和评审能否在互不污染的独立工作流中进行？
可观测性： 人类能否检查来源、动作、成本、失败和假设？

这些不是 prompt engineering 细节，而是操作界面的细节。

MCPlato 如何承接这一趋势

理解 MCPlato 的最好方式，是把它看作 AI 工作空间和智能体操作界面，而不只是另一个回答框。它的产品词汇很自然地映射到 Claude 新一代 system prompt 所暗示的方向。

Sprite 是协调者。当一个任务有多个阶段或需要多个专家时，Sprite 可以拆解工作、委派给不同会话、跟踪进度，并把结果重新汇合。这很重要，因为长任务很少能装进一条不间断的思维链里。

Wand 是有状态的封装工作流。与其每次都让 AI 即兴重复同一流程，不如用 Wand 定义阶段、门禁、限定资源和预期 Artifact。结果更接近可重复运行的工作应用，而不是一个 prompt 模板。

Artifact 是持久的终点。输出不应该被困在一堵聊天文本墙里。它应该成为报告、补丁、演示文稿、电子表格、文件夹、决策备忘录、QA 记录，或其他可检查对象。

Skill 和 Distill Skill 保存 know-how。当一个工作流跑通后，可复用的部分应该能再次被调用。团队正是这样从孤立的“英雄 prompt”走向共享的操作实践。

ClawMode 和 Scheduled Tasks 让工作跨越时间。有些有价值的任务并不需要立刻完成：每周研究简报、每晚代码仓库扫描、周期性内容流水线，或在新信息出现后的跟进。

权限与审批门禁 让自主性保持边界。MCPlato 不应该被描述成盲目自动化。更好的原则是受控自主：在低风险动作上让 AI 继续推进；当动作会修改文件、发送消息、触碰外部系统或制造业务风险时，要求人类批准。

Channels 和 IM bridges 让交互变成异步。用户应该可以从团队聊天中委派任务，接收进度更新，并查看最终 Artifact，而不必守着前台聊天窗口。

本地优先的工作空间状态 让材料、状态和输出贴近用户的工作场景。这并不能消除所有隐私或安全问题，但它改变了姿态：工作空间是组织、审阅和治理上下文的地方。

简而言之，MCPlato 为模型提供了它们新的操作说明越来越假定存在的那种环境：工具、文件、记忆、权限、阶段、Artifact 与人类检查点。

包含 Artifact、日程、审批和会话通道的工作空间 harness 平面编辑插画

图 3：harness 将模型能力转化为可观察、有权限边界、围绕 Artifact 运转的工作循环。

四个具体例子

1. 从编码 issue 到补丁，再到 QA Artifact

用户把一个 GitHub issue 丢进 MCPlato，并要求修复。在纯聊天流程里，助手可能直接跳到建议。在 harness 流程里，这个任务会变成分阶段工作：

阅读 issue 和代码仓库上下文，
起草范围受限的计划，
如果变更有风险，在编辑前先询问，
制作补丁，
运行约定好的检查，
产出 QA Artifact，包含变更文件、测试输出、未解决风险和评审说明。

Claude 在“行动与澄清”之间的行为变化很适合这里。智能体不应该在阅读 issue 前提出不必要的问题，但在大范围或破坏性变更前应该暂停。

2. 带引用的定期研究简报

每周研究简报不是一次性回答，而是一个循环：收集批准来源、去重、与上周对比、总结变化、为每个具体说法附上引用，并交付报告。MCPlato 的 Scheduled Tasks 和 Artifacts 让输出保持持久；channels 让交付变成异步；Skills 让格式可以复用。

当工作空间能把来源列表和简报 Artifact 一起保存时，prompt 层面对引用来源的要求就更有价值。

3. 浏览器与文档工作流

想象一个财务团队必须从网页门户下载报告，把它们与电子表格合并，并制作月度摘要。好的智能体不应该声称自己可以访问所有网站。它应该尊重登录边界，请用户处理 MFA，发现是否存在导出或 API，只自动化已获批准且可重复的步骤，验证文件数量，并生成异常报告。

这就是“AI 能用浏览器”和“AI 能在受控的浏览器/文档循环中操作”之间的区别。

4. 高风险动作审批

假设智能体起草了一封发给客户的邮件、准备了一条会修改生产数据的命令，或者提出删除某个文件夹。模型也许理解了指令，但理解并不等于授权。harness 应该把这一步转成审批检查点：展示预期动作、预期影响、回滚计划和证据，然后等待。

在这里，安全与生产力互相增强。用户不需要拖慢每一个只读步骤。用户确实需要在不可逆或面向外部的动作之前看到清晰门禁。

这对构建者意味着什么

对 AI 产品构建者来说，Claude system prompt 发布说明是一个有用的设计信号。不要只问：“哪个模型最聪明？”还要问：

模型以为自己正在什么环境里运行？
产品能否暴露工具，同时不模糊权限？
工作流能否跨时间继续，而不丢失状态？
用户能否检查发生了什么？
最终结果能否成为 Artifact，而不是一段聊天记录？
系统能否在正确的时刻暂停，而不是问得太多或行动得太自由？

答案不会只来自更长的 system prompt。prompt 可以描述行为，但产品必须提供让行为可靠发生的操作界面。

这就是 harness 时代：模型变得更强，但只有被状态、工具、恢复机制、审批和 Artifact 包围时，能力才真正有用。

结论

Claude Fable 5 的 system prompt 快照之所以有意思，是因为它指向的不只是模型能力。它展示了现代模型正在被准备进入的环境形态。前沿不再只是“更好的聊天”，而是智能体工作：有状态、懂工具、有权限、重视引用、可恢复，并以 Artifact 为中心。

MCPlato 正是为这个方向而构建。Sprite 协调、Wands、Artifacts、可复用 Skills、定时任务、channels、本地优先工作空间状态和审批门禁，并不是模型外面的一圈装饰。它们是让强模型成为真实工作中有用参与者的操作界面。

模型仍然是引擎。harness 则把引擎变成一辆人们可以驾驶、检查、维修并信任的车。

参考资料

Anthropic docs, System Prompts release notes.
Anthropic docs, Introducing Claude Fable 5 and Claude Mythos 5.