返回博客
mcplato
ai-agents
agentic-ai
personal-agent-os
wand
virtual-employee
prompt-engineering
loops

为什么智能体是虚拟员工,而非工具:从提示词到循环

AI 正在从回答问题的工具,演变为独立工作的虚拟员工。本文探讨从提示词工程到可信任循环的架构转变,以及 MCPlato 如何以 Wand、Sprite 和 Artifact 封装这种新范式。

发布于 2026-06-12

提示词已不再是产品。在过去三年里,要从 AI 中获取价值,多半意味着把提示词写对:拼接示例、调节 temperature、祈祷模型不会捏造引用。界面是一个聊天框;契约是问题 → 答案。这个契约正在瓦解,而取代它的并不是更好的提示词,而是一个循环

Anthropic 将智能体定义为在循环中基于环境反馈使用工具的大语言模型。OpenAI 的 Agents SDK 把循环放在执行的中心。Microsoft 描述 AI 正从工具演变为虚拟员工。MindStudio 称我们进入了"后提示词时代"。这些不是营销包装,而是真实的架构转变:从回答你的模型,到在你停止输入后仍然继续工作的系统。

这种转变有一个名字。我们称之为虚拟员工。虚拟员工不是更锋利的搜索引擎,也不是更快的自动补全。它是一个拥有状态、记忆、主动性和对持久结果负责能力的实体。问题不再是"什么提示词能得到最好的答案?"而是"什么循环能产生一个我可以信任并继续迭代的结果?"

旧契约:AI 作为工具

在工具契约下,所有上下文组装都由人类完成。你写提示词、上传文件、解释约束,模型返回一段文字。如果答案错了,你重写提示词。如果上下文不完整,你粘贴更多上下文。模型默认无状态;每次交互都是一次全新的交易。价值来自压缩:对一个好问题给出好答案。

这个契约催生了一门完整的提示词工程学科——也带来了一种隐性税负。2026 年 CIODive 的一份报告指出,知识工作者现在每从 AI 获得一小时有用的产出,就要花大约一小时把 AI 的输出变得可用。工具契约掩盖了这一成本,因为人类正忙于为一个无法跨轮次推理的系统善后。

工具契约不会消失。搜索、摘要和编程辅助仍然受益于优秀的提示词。但它已不再是天花板。一旦任务需要多轮交互、多个工具或实时反馈,提示词就成了瓶颈。你不再是在寻求一个答案,而是试图在单个文本框里编写一个流程。

新契约:AI 作为虚拟员工

虚拟员工契约基于不同的假设:人类提供意图、上下文和边界,智能体完成其余工作。它感知环境、规划行动序列、通过工具执行、观察结果,然后循环。它记住发生了什么。失败时重试。遇到边界时升级。

这就是为什么越来越多的厂商将智能体描述为队友。Anthropic 报告称,截至 2026 年 5 月,超过 80% 的合并代码由 Claude 编写。PwC 2025 年 AI 智能体调查发现,早期采用者报告生产力提升 66%。Salesforce 2025 年服务状况报告指出,2025 年智能体已处理30% 的服务案例,预计到 2027 年将达50%,并将常规案例处理时间缩短20%

这些数字并不意味着智能体不会犯错。它们意味着工作成果的性质已经改变。虚拟员工不仅返回文本,还返回世界中的状态变化:工单关闭、测试通过、报告提交、消息发送。人类的角色从操作者转变为审阅者,从执行者转变为委托者。

从提示词到循环

典型的智能体循环是感知 → 规划 → 行动 → 观察。Microsoft 描述了自主智能体的七步感知-行动周期。MIT Sloan 的《Agentic AI, Explained》强调,智能体能够自主感知、推理和行动。MindStudio 的后提示词论题认为,未来属于主动发起工作而非等待被询问的智能体。

循环与提示词链的区别在于反馈。在提示词链中,人类是反馈机制。在循环中,环境才是。智能体读取文件、运行测试、看到错误、尝试修复。它检查数据库、发现缺失记录、创建记录。每一轮循环都在缩小意图与结果之间的距离,而无需人类重新解释目标。

循环也改变了智能体使用的信息。在工具契约下,提示词是全部输入。在虚拟员工契约下,它只是众多信号之一:文件、API、数据库、历史运行记录、团队消息和实时事件。智能体是环境的函数,而你的提示词则是目标函数。

这就是"不再写提示词,而是写循环"的真正含义。技艺从修辞转向架构。你设计的是控制系统,而不是查询。

为什么这改变了工作成果

工具交付答案。虚拟员工交付成果(Artifact)。这种区别很重要,因为答案是短暂的,而成果是持久的。

答案活在聊天窗口里。成果活在你的工作空间里:文档、代码变更、测试套件、设计文件、结构化报告。它可以被审阅、版本化、共享和改进。它把上下文向前传递,让下一个人——或下一个智能体——不必从零开始。

成果也是信任的边界。当智能体修改文件时,你可以做 diff。当它写报告时,你可以检查来源。当它发 Slack 时,你的团队可以质疑它。成果让智能体的行为变得可读。没有成果,循环只不过是更长的聊天。

这正是当前大多数生产力讨论所忽略的地方。智能体带来的收益不是来自打字更快,而是来自异步完成。虚拟员工在人类睡觉、开会或专注于其他事情时继续工作。当人类回来时,交付物已经等在原地。这只有在交付物可检查、可执行时才成立。

MCPlato 的方法:封装循环

MCPlato 围绕虚拟员工的假设构建。基本单位不是聊天消息,而是一个产生持久成果的循环

Wand 就是这个循环的封装。Wand 是一个可复用、可版本化的工作流,定义了阶段、每个阶段的提示词、关卡检查、工具白名单和运行时视图。它把工作拆分为离散阶段,只有在关卡通过后才推进——读取文件、调用 API、请求澄清、写出最终成果。Wand 是对"如何写循环而不是写提示词"的架构性回答。

虚拟员工 / Sprite 是工作空间级别的编排器。如果说 Wand 是封装好的流程,Sprite 就是分解更大任务并代表用户调度工作会话的管理者。它是一支朝着人类定义的目标协作的智能体团队:设定目标、批准检查点、审阅成果。

Skill / Distill Skill 将重复出现的工作流捕获为可复用指令。当 Sprite 解决过一次问题后,MCPlato 可以把这次执行蒸馏为 Skill,让相同的模式无需重新发明提示词就能再次运行。

本地优先 + 权限框架 让虚拟员工值得被独自运行。敏感数据默认留在用户机器上,细粒度权限模式限制循环能看见和能做什么。

模型路由 + 成本控制 把昂贵的推理留给真正需要的阶段。简单的提取阶段用廉价快速的模型运行;复杂的规划阶段升级到更大的模型。智能与难度相匹配。

IM Bridge + 持久交付物 把循环延伸到团队已在使用的工具中。Slack、Discord、Telegram、飞书、微信、企业微信和 QQ 成为异步委托界面。智能体报告进展并交付 Artifact——一种结构化、可版本化的文档包——而不是一堵聊天文本墙。

手绘风格的抽象扁平插图,一条循环箭头把静态命令转化为现代工作空间中的活跃虚拟员工形象手绘风格的抽象扁平插图,一条循环箭头把静态命令转化为现代工作空间中的活跃虚拟员工形象

工具 vs 虚拟员工

下表总结了架构层面的差异。这种转变无关模型大小或界面打磨,而是关于谁持有状态、谁发起行动、以及留下了什么。

维度AI 作为工具AI 作为虚拟员工
输入单条提示词,由人类完全指定意图加上环境信号;提示词只是众多输入之一
执行模型请求 → 响应,无状态感知 → 规划 → 行动 → 观察,有状态循环
记忆默认跨轮次无记忆,除非手动重新粘贴持久状态、检查点和跨会话上下文
交付物聊天窗口中的短暂答案持久的 Artifact:文件、报告、代码变更或结构化包
成本模型按查询计费;便宜但需要人工反复操作按循环计费;子任务路由到更小模型
失败模式答案错误,被忽略错误行动、循环重复、工具滥用;需要护栏
人类角色操作者、提示词撰写者、输出润色者委托者、审阅者、治理设计者

最后一行最难接受。大多数人通过擅长提示词而擅长使用 AI。下一项能力,是设计能够独自运行的系统。

风险与治理

没有治理的虚拟员工不是员工,而是负债。2026 年 IBM 关于 AI 控制缺口的研究令人警醒:77% 的 CIO 和 CTO 表示 AI 采用速度超过了治理建设89% 表示所在组织对智能体 AI 尚未完全准备好,企业平均每年报告54 起与智能体相关的事件。同样的自主性既让智能体高效,也让它们危险。

Microsoft Security 2026 年 6 月的更新报告称,2025 年与 Model Context Protocol 相关的 CVE 达到99 个。攻击面不再是模型的权重,而是智能体能调用的工具、它携带的权限、以及它能接触的数据。

这就是为什么虚拟员工的隐喻不只是愿景,更是一种治理要求。真正的员工有角色、范围、管理者和审计轨迹。虚拟员工也需要同样的事物:显式权限边界、对不可逆操作的强制检查点、可观察的运行时状态,以及可版本化的成果。

扁平手绘编辑风格插图,一个虚拟员工与人类正在协作审阅一份持久的文档成果扁平手绘编辑风格插图,一个虚拟员工与人类正在协作审阅一份持久的文档成果

结论:设计循环,而不是提示词

行业正在收敛到一个新契约。智能体不再是回答问题的工具,而是完成工作的虚拟员工。证据正在累积,即便数字还不均衡。

对于构建者而言,其含义是务实的。停止试图写出完美提示词。开始设计循环:智能体感知什么、如何规划、能使用哪些工具、哪些关卡检查保障安全、在哪里必须暂停等待人类、以及产出什么成果。AI 工程的技艺正在成为可信任自主性的技艺。

MCPlato 的赌注是,这种自主性最好表达为封装好的、可观察的、本地优先的循环:Wand 作为可复用流程,Sprite 作为编排器,Skill 作为蒸馏出的专业知识,Artifact 作为持久交付物。未来不是更好的聊天机器人,而是一个虚拟员工——它会出现,并在第二天早上留下你可以审阅的东西。

常见问题

AI 工具与 AI 虚拟员工有什么区别? 工具回答一条提示词后等待。虚拟员工运行持续循环,维护状态和记忆,主动使用工具,并交付持久成果。

为什么"循环"比提示词更重要? 提示词是一次性的。循环让智能体收集信息、对反馈进行推理、重试失败,并在人类离开时继续工作。

MCPlato 所说的 Wand 是什么? Wand 是一个封装好的、可复用的循环:一个多阶段工作流,包含提示词、关卡检查、工具白名单和运行时视图。

MCPlato 如何让虚拟员工值得信任? 通过本地优先执行、细粒度权限、显式关卡检查、模型路由、持久化检查点,以及对高风险操作的人类最终审批。

智能体正在取代员工吗? 现有证据指向增强,而非大规模替代。角色转向管理、验证和改进智能体产出。

将智能体视为虚拟员工的主要风险是什么? 没有治理的自主性会导致事件、权限滥用和安全暴露。治理必须从设计之初就嵌入循环。

如何开始为智能体而非提示词进行设计? 定义循环:感知、规划、行动、观察、检查点、成果。提示词成为更大控制系统中的一个约束条件。

参考资料

  1. Anthropic. "Building Effective Agents." 2024 年 12 月。https://www.anthropic.com/research/building-effective-agents
  2. OpenAI. "Running agents." OpenAI Agents SDK, 2025. https://developers.openai.com/api/docs/guides/agents/running-agents
  3. Microsoft. "What's next in AI: 7 trends to watch in 2026." 2025 年 12 月。https://news.microsoft.com/source/features/ai/whats-next-in-ai-7-trends-to-watch-in-2026/
  4. Microsoft. "What are autonomous AI agents?" Microsoft Copilot 101, 2025/2026. https://www.microsoft.com/en-us/microsoft-copilot/copilot-101/autonomous-ai-agents
  5. MindStudio. "The Post-Prompting Era: Proactive AI Agents." 2026 年 4 月。https://www.mindstudio.ai/blog/post-prompting-era-proactive-ai-agents
  6. MIT Sloan. "Agentic AI, Explained." 2026 年 2 月。https://mitsloan.mit.edu/ideas-made-to-matter/agentic-ai-explained
  7. Anthropic. "Recursive Self-Improvement." 2026 年 5 月。https://www.anthropic.com/institute/recursive-self-improvement
  8. PwC. "AI Agent Survey." 2025 年 5 月。https://www.pwc.com/us/en/tech-effect/ai-analytics/ai-agent-survey.html
  9. Salesforce. "2025 State of Service Report." 2025 年 11 月。https://www.salesforce.com/news/stories/state-of-service-report-announcement-2025/
  10. IBM. "New IBM study finds CIOs and CTOs face growing AI control gap as enterprise deployment scales." 2026 年 6 月。https://newsroom.ibm.com/2026-06-08-new-ibm-study-finds-cios-and-ctos-face-growing-ai-control-gap-as-enterprise-deployment-scales
  11. Microsoft Security. "Updating taxonomy and failure modes for agentic AI systems: a year of red teaming taught us." 2026 年 6 月。https://www.microsoft.com/en-us/security/blog/2026/06/04/updating-taxonomy-failure-modes-agentic-ai-systems-year-red-teaming-taught-us/
  12. CIODive. "Workers spend more time managing AI." 2026. https://www.ciodive.com/news/workers-spend-more-time-managing-ai/822554/