聊天之后的 AI Workspace:Artifacts、多窗口上下文与 Virtual Partners
一份技术报告,分析为什么 AI Workspace 正在从聊天走向持久 Artifacts、运行时纪律、并行工作界面,以及面向开发者和架构师工作流的 Virtual Partners。
发布于 2026-05-21
AI chat 让前沿模型变得可用,但它并没有让 AI 工作天然可靠。
对开发者和架构师来说,限制很快就会出现。一个聊天线程可以解释设计、起草迁移计划或总结日志。但真正的工作不会停留在 transcript 里。它会变成图表、规格说明、补丁、研究笔记、测试结果、pull-request 评论、事故时间线、决策记录和后续任务。工作也会分叉:一个窗口调查生产行为,另一个比较供应商约束,另一个写设计备忘录,还有一个准备实施步骤。
因此,下一个 AI workspace 不只是更大的聊天框,而是一个管理 work objects、execution state、parallel surfaces 和 delegated continuity 的系统。
本文用四个设计问题描述这一转变:
- 工作对象是什么? 系统是在生成答案,还是生成可检查、可修订、可交付的持久 artifact?
- 运行时真相在哪里? Workspace 是否区分说过什么、执行过什么以及改变了什么?
- 可以并行运行多少个界面? 用户能否同时保留多个窗口、session、pane 和 context,而不是把一切压进同一条线程?
- 谁负责连续性? 是否存在 workspace 级的 virtual partner,用来拆解、委派、跟踪并综合跨 session 的工作?
这些问题现在比产品是否有聊天界面更重要。Chat 是入口,workspace 才是控制平面。
Four layers of AI work: Chat, Artifact, Runtime, and Virtual Partner
1. 为什么聊天框不够
聊天框很适合轮流对话,却不擅长保留工作边界。单一 transcript 会混合用户意图、模型推理、工具结果、草稿、需要持久化的决策、临时失败,以及可能需要审计或重放的行动历史。
短问答可以容忍这种混合;一旦 AI 被要求执行多步骤流程、协调文件、使用工具或在 session 之间交接工作,它就会变得脆弱。开发者熟悉这个道理:日志、源码、构建、测试、部署状态和 issue 评论彼此相关,但不应该被存成一条没有区分的字符串。
同样的原则适用于 AI workspaces。当 AI 进入严肃工作流,workspace 必须区分 conversation 与 output、output 与 runtime state、runtime state 与长期 decision memory。
2. 面向后聊天时代 AI workspaces 的四个设计问题
Question 1: 什么算工作对象?
Response 是短暂的;artifact 是持久的。在 chat-first 系统里,价值单元默认是答案;在 workspace-first 系统里,价值单元通常是 work object:文档、代码补丁、研究表、图、测试计划、决策日志、spreadsheet、presentation 或 task board。这个对象应该有状态,能在生成它的那一轮之后继续存在,也能在不重放整个对话的情况下被审阅。
这就是 artifact 和 canvas 模式重要起来的原因。Claude 将 Artifacts 描述为独立且有实质内容的产物,通常超过 15 lines,其支持文档列出每个 artifact 可持久存储 20 MB。ChatGPT Canvas 也以不同方式处理较长内容;OpenAI 表示,当生成内容超过 10 lines 时,Canvas 可能自动打开。这些是小产品细节,却指向更大的方向:重要的 AI 输出需要自己的表面。
更深层的架构问题不是产品是否打开侧边栏,而是 artifact 是否有生命周期:draft、inspect、revise、validate、complete,必要时还可以 hand off。
Question 2: 运行时真相在哪里?
Transcript 是对话记录,但不总是执行真相的最佳来源。当 agent 编辑文件、调用外部工具、打开浏览器、读取文档或运行测试时,workspace 需要知道的不只是模型说了什么,还要知道尝试了什么、完成了什么、失败了什么、改变了什么,以及结果由什么证据支撑。Execution controller 和 transcript 应该相关,但不应相同。
这种分离有三点价值。第一,它提高可靠性:用户可以追问系统是真的运行了检查,还是只是声称运行了。第二,它提高恢复能力:长任务经常中途失败,理解 execution state 的 workspace 比只有部分叙述的 chat thread 更容易安全恢复或改道。第三,它改善治理:团队环境中的 audit trail 应区分 instruction、action、result 和 decision,尤其是在 agents 横跨 repositories、documents、SaaS systems 和 local materials 工作时。
原则很简单:transcript 应该解释工作,但不应是工作存在的唯一位置。
Question 3: 用户能承载多少并行界面?
AI 工作正在变成 multi-window。旧模式是一个用户、一个 assistant、一个 thread;新模式是拥有多层结构的 workspace:
- Workspace:围绕材料、sessions 和偏好的持久边界。
- Session:面向任务的 conversation 或 workstream。
- Tab:并行注意力的可见单元。
- Pane:artifact、browser、terminal、document 或 comparison view 的局部表面。
- Window:承载不同阶段或项目的操作系统级容器。
这个层级不是装饰,而是现实工作方式。开发者可能让一个 session 关注架构取舍,另一个关注实现,另一个关注测试,另一个关注 release notes。架构师可能在一个 pane 比较 cloud-agent 行为,同时在另一个 pane 起草内部标准。好的 multi-window AI workspace 不只是更多屏幕空间,而是 context partitioning system。
Question 4: 谁保持连续性?
Artifacts 和 windows 之后的下一步,是 workspace 级的 partner。它不应被理解为头像或装饰性助手;有用的版本更像 orchestrator:理解 workspace goal,拆解工作,委派子任务,跟踪进度,发现缺失证据,并总结决策。用户仍然拥有判断,partner 维护 operational memory。
这让 virtual partner 或 sprite-like workspace presence 具有技术意义。它可以帮助回答:哪些 sessions 是 active、blocked 或 complete?哪个 artifact 是当前候选交付物?哪些 assumptions 尚未验证?哪条工作分支应合并到最终输出?哪些 context 因属于不同任务或权限边界而应保持隔离?换言之,virtual partner 是 coordination layer。
3. Artifact discipline:从回复到交付物
Artifacts 常被当成 UI 功能介绍,但更重要的概念是纪律。Claude Artifacts 和 ChatGPT Canvas 都说明生成工作需要独立、可编辑的表面。Claude Projects 还加入了更广的项目上下文模型:Anthropic 描述 Projects 支持 200K context window,大约相当于一本 500-page book。ChatGPT Projects 则围绕 chats、files 和 instructions 建立 workspace-like 边界,文件和协作者限制取决于 plan。
对 MCPlato 来说,公开原则不是“我们又有一个文档面板”,而是 AI-native workspace 应让输出具备状态并可审阅。实用的 artifact discipline 包括:
- stateful deliverables,而不只是对话片段;
- phase awareness,让 draft、candidate 和 final output 不被等同处理;
- context and tool isolation,避免一个 workstream 继承无关假设或权限;
- completion checks,让“done”意味着证据已收集、约束已满足,而不是模型停止生成;
- decision trace,让用户理解 artifact 为什么变成这样。
这比“autonomous agent”听起来更不神奇,但也更有用。大多数专业用户不需要永远独立行动的 AI;他们需要留下可信、可检查、可修改对象的 AI。
4. Runtime 与 monolith 问题
许多 AI 产品最初都是 monolith:chat thread、tool runner、file picker、memory layer 和 UI 绑在一起。这有利于早期速度,但工作流增长后会受限。Workspace runtime 至少要协调四种 truth:
- Conversation truth:用户问了什么,assistant 回复了什么。
- Material truth:用了哪些 source files、documents、pages 和 data。
- Execution truth:执行了哪些 actions,返回了哪些 results。
- Decision truth:团队接受、拒绝、延后或交付了什么。
如果四者都被压进 transcript,workspace 难以检查;如果分离后没有连贯体验,系统又会碎片化。挑战是在分离关注点的同时让工作仍然清晰可读。
对开发者和架构师而言,这直接对应熟悉的设计模式:不要让 application logs 成为 database,不要让 CI job transcript 成为 release artifact,也不要让设计会议录音成为唯一的 architecture decision record。AI workspaces 需要同样的分离。
最好的 runtime 不是把一切藏在顺滑聊天动画后面的 runtime,而是当答案重要时能展示发生了什么的 runtime。
5. Multi-window context:从一条线程到多个工作表面
Agents 越强,单一 thread 就越不够。单线程模型迫使用户把天然并行的工作串行化:research 等 drafting,drafting 等 source checks,source checks 等 formatting,implementation 等 design confirmation,testing 等 implementation。这安全但缓慢,也让用户承担过多记忆负担。
Multi-window AI workspace 应支持并行而不失一致性。关键不只是同时运行多个 agents,而是给每条 workstream 清晰边界,并提供调和它们的方法。
Workspace comparison map: Chat/Canvas, IDE Agent, Cloud Agent, and AI-Native Workspace
不同产品类别优化不同表面:
| Surface | Center of gravity | Strength | Limitation |
|---|---|---|---|
| Chat / canvas | conversation plus editable output | 快速构思和起草 | 多流协调较弱 |
| IDE agent | codebase and developer loop | 本地实现上下文强 | 软件工作流之外较窄 |
| Cloud autonomous agent | long-running remote execution | 适合委派任务 | 若不透明则难以检查和治理 |
| AI-native workspace | sessions, artifacts, tools, and orchestration | 更适合跨职能工作 | 产品复杂度和治理负担更高 |
因此,post-chat workspace 不太可能是一种万能 UI,而会是能承载多种工作模式的分层环境。
6. Virtual Partner / Sprite:编排,而不是表演
“virtual partner” 很容易变成噱头。悬浮在 workspace 上方的一张脸并不能解决 context management。有用版本是 operational 的:像 workspace 级 coordinator,可以把高层目标翻译成 sub-workstreams,分配给不同 sessions 或 agents,跟踪 blockers、open questions 和 finished outputs,判断 artifact 何时可供 review,总结竞争 drafts 或 branches 的差异,并跨天保存 decision history。
区别很重要。Chatbot 是 interlocutor;virtual partner 是 coordinator。对 MCPlato 来说,这是重要的公开设计方向之一:AI-native workspace 应帮助用户把多个 AI sessions 作为一个连贯 partner system 来运行。这不是移除人类,而是降低人类作为唯一 scheduler、memory keeper 和 merge manager 的负担。
诚实的边界是 orchestration 很难。它需要清晰权限、可见状态和良好失败处理。一个静默委派却不展示状态的 workspace partner 会比聊天框更糟;partner 必须让 coordination 可检查。
7. Competitor comparison:数字揭示了什么
市场已经走向结构化 workspaces,但不同厂商在证明不同要点。
Claude and ChatGPT:从聊天到项目上下文和可编辑表面
Claude Projects 展示了大共享上下文的力量。Anthropic 表示 Projects 使用 200K context window,约等于 500-page book。Claude Artifacts 则为独立的实质输出提供单独表面,文档描述 artifacts 通常超过 15 lines,并列出每个 artifact 20 MB 的持久存储。ChatGPT Canvas 对生成内容呈现类似模式;OpenAI 表示生成内容超过 10 lines 时 Canvas 可能自动打开。ChatGPT Projects 增加项目级组织,覆盖 chats、uploaded files、instructions 和 collaborators,限制取决于 plan 和 workspace settings。
这些产品验证了 artifact 和 project boundaries,但用户体验仍倾向围绕主 assistant conversation。
GitHub Copilot and Cursor:codebase 作为 workspace
Developer tools 展示了另一种重心:repository。Microsoft 报告称 GitHub Copilot 有 20 million users,被 90% of the Fortune 100 使用,且 FY2025 Q4 中 Copilot Enterprise 客户环比增长 75%。GitHub 的 Copilot Workspace 公告也以超过 100 million developers 的 GitHub 为背景,并引用 Copilot “up to 55%” 的生产力提升说法。
Cursor 的 Series D 公告显示投资者和开发者对这一层的重视:Cursor 称其以 $29.3 billion post-money valuation 融资 $2.3 billion,年化收入超过 $1 billion,服务数百万开发者,并拥有超过 300 employees。
这些数字说明 developer workspaces 不再是旁支功能,而正成为主要 AI operating environments。
Replit and Devin:cloud execution 作为 workspace
Cloud agents 把 workspace 边界从本地机器推向云端。Replit Agent 3 强调更长的 autonomous execution:Replit 表示它可工作最多 200 minutes,10x more autonomous,并让测试 3x faster、10x more cost-effective。另据 Replit 公告,其以 $9 billion 估值融资 $400 million,拥有超过 50 million users,服务 85% of the Fortune 500,并预计到 2026 年底达到 $1 billion run-rate revenue。
Devin 的公开定价也体现 agent work 的运营化:pricing page 列出 Pro 为 $20/month,Max 为 $200/month,Teams 为 $80/month,相关 plan 最多支持 10 concurrent sessions。
这些产品强调 delegation 和 execution。风险在 inspectability:用户需要看到的不只是最终结果,还有路径和 assumptions。
Manus and Notion:广度与 workspace memory
Manus Wide Research 突出了 parallel breadth。其文档描述 hundreds of independent agents、最多测试 250 items、数分钟处理 50–100 items,并声称传统 AI 在超过 8–10 items 后会退化。不论是否同意每个 benchmark framing,产品方向很明确:通过分叉大量独立单元来扩展工作。
Notion 从 knowledge 和 organizational memory 进入这个问题。其 custom agents 文档描述试用后价格为 $10 per 1,000 credits,并在 80% 和 100% 时发送 usage notifications。这更少关于 agent autonomy,更多关于把 AI 嵌入持久团队知识表面。
共同信号是:AI 正从答案生成走向 managed work systems。
8. MCPlato 的位置
MCPlato 更适合被归入 AI-native workspace,而不是纯 chat product、IDE 或 cloud-only autonomous agent。它的公开价值主张最适合那些需要在 connected materials 之间协调多个 AI sessions,并产出可审阅输出的工作流。实际包括 research-to-article pipelines、multi-source analysis、document production、task decomposition、cross-session review,以及需要 traceable decisions 的 developer/architect workflows。
关键论点不是 MCPlato 会替代所有专用工具。它不会。Cursor 和 GitHub Copilot 更靠近编码 inner loop;Claude 和 ChatGPT 是强大的通用模型界面;Replit 和 Devin 聚焦 cloud execution 和软件委派;Notion 深度嵌入团队知识库。
MCPlato 的机会在这些模式之间的 coordination layer:
- session-based work,让不同任务线程保持分离但彼此连接;
- local-first material handling,在合适场景下处理 connected directories 和 files,而不是把每个任务都变成 cloud upload pattern;
- artifact discipline,让输出成为 deliverables,而不是丢失的 chat snippets;
- multi-window context,让 parallel workstreams 保持可见;
- virtual partner orchestration,帮助拆解、委派、跟踪和总结;
- decision trace,让用户审阅改变了什么以及为什么。
边界同样重要。MCPlato 不应假装 orchestration 能取消 review。Multi-session AI work 在 context boundaries 不清时会放大错误。Local-first workflows 仍需要谨慎的 permission management。Artifact completion checks 会降低风险,但不能保证正确。Virtual partner 可以跟踪工作,但必须暴露 assumptions 和 status。
这是正确取舍。目标不是完全自主的魔法,而是让 AI work 变得 inspectable、interruptible 和 composable。
9. Conclusion:workspace 就是产品
聊天框仍然有用,它是提问、澄清和迭代最快的方式。但它已不足以作为严肃 AI 工作的主要容器。
Post-chat AI workspace 需要四层:
- Chat:表达意图和对话。
- Artifacts:持久 work objects。
- Runtime:execution state、evidence 和 recovery。
- Virtual partners:跨 session 的 coordination 和 continuity。
这个类别的赢家不只是拥有最聪明的 assistant,而是让 AI work 可读:正在做什么、来自哪里、运行了什么、失败了什么、接受了什么,以及还有什么未解决。
对开发者和架构师来说,这是熟悉的经验:系统在 state 明确、boundaries 清晰、outputs 可检查时才值得信任。AI workspaces 终于开始学习同一条规则。
References
- Anthropic, “Introducing Projects,” https://www.anthropic.com/news/projects
- Anthropic Support, “What are Artifacts and how do I use them?”, https://support.claude.com/en/articles/9487310-what-are-artifacts-and-how-do-i-use-them
- OpenAI Help Center, “What is the Canvas feature in ChatGPT and how do I use it?”, https://help.openai.com/en/articles/9930697-what-is-the-canvas-feature-in-chatgpt-and-how-do-i-use-it
- OpenAI Help Center, “Projects in ChatGPT,” https://help.openai.com/en/articles/10169521-projects-in-chatgpt
- Microsoft Investor Relations, “FY25 Q4 Earnings,” https://www.microsoft.com/en-us/investor/events/fy-2025/earnings-fy-2025-q4.aspx
- GitHub Blog, “GitHub Copilot Workspace,” https://github.blog/news-insights/product-news/github-copilot-workspace/
- Replit Blog, “Introducing Agent 3,” https://replit.com/blog/introducing-agent-3-our-most-autonomous-agent-yet
- Replit Blog, “Replit raises $400 million,” https://replit.com/blog/replit-raises-400-million-dollars
- Devin, “Pricing,” https://devin.ai/pricing/
- Manus Docs, “Wide Research,” https://manus.im/docs/features/wide-research
- Cursor Blog, “Series D,” https://cursor.com/blog/series-d
- Notion Help, “Everything you can do with Notion AI,” https://www.notion.com/help/guides/everything-you-can-do-with-notion-ai
