ai-workspace

ai-agents

artifacts

developer-tools

workflow

mcplato

Der AI Workspace nach dem Chat: Artifacts, Multi-Window-Kontext und Virtual Partners

Ein technischer Bericht darüber, warum AI Workspaces über Chat hinaus zu dauerhaften Artifacts, Runtime-Disziplin, parallelen Arbeitsflächen und Virtual Partners für Entwickler- und Architektur-Workflows werden.

Veröffentlicht am 2026-05-21

AI chat machte Spitzenmodelle nutzbar. Er machte AI work jedoch nicht automatisch verlässlich.

Für Entwickler und Architekten zeigen sich die Grenzen schnell. Ein Chat-Thread kann ein Design erklären, einen Migrationsplan entwerfen oder Logs zusammenfassen. Echte Arbeit bleibt aber nicht in einem transcript. Sie wird zu diagrams, specs, patches, research notes, test results, pull-request comments, incident timelines, decision records und follow-up tasks. Die Arbeit verzweigt sich außerdem: ein Fenster untersucht Produktionsverhalten, ein anderes vergleicht Anbietergrenzen, ein weiteres schreibt ein Design-Memo, und ein weiteres bereitet Umsetzungsschritte vor.

Der nächste AI workspace ist daher nicht nur ein größerer Chatkasten. Er ist ein System zur Verwaltung von work objects, execution state, parallel surfaces und delegated continuity.

Dieser Artikel beschreibt den Wandel anhand von vier Designfragen:

Was ist das work object? Produziert das System eine Antwort oder ein dauerhaftes artifact, das geprüft, überarbeitet und ausgeliefert werden kann?
Wo liegt runtime truth? Trennt der Workspace das Gesagte, das Ausgeführte und das Geänderte?
Wie viele surfaces können parallel laufen? Kann der Nutzer mehrere windows, sessions, panes und contexts halten, ohne alles in einen thread zu pressen?
Wer erhält continuity? Gibt es einen virtual partner auf Workspace-Ebene, der Arbeit zerlegen, delegieren, verfolgen und zusammenführen kann?

Diese Fragen sind heute wichtiger als die bloße Frage, ob ein Produkt eine Chat-Oberfläche hat. Chat ist der Einstiegspunkt. Der workspace ist die Steuerungsebene.

Four layers of AI work: Chat, Artifact, Runtime, and Virtual Partner

1. Warum der Chatkasten nicht reicht

Der Chatkasten eignet sich gut für Dialoge. Er ist schwach darin, Arbeitsgrenzen zu bewahren. Ein einzelner transcript vermischt Nutzerabsicht, Modellannahmen, tool results, Entwürfe, Entscheidungen, temporäre Fehler und action history. Für kurze Q&A ist das akzeptabel; bei mehrstufigen Workflows, Dateien, Tools und Übergaben zwischen sessions wird es fragil.

Softwareteams kennen dieses Prinzip: Logs, source files, builds, tests, deployment state und issue comments gehören zusammen, sollten aber nicht als eine undifferenzierte Zeichenkette gespeichert werden. AI workspaces brauchen dieselbe Trennung zwischen conversation, output, runtime state und langfristigem decision memory.

2. Vier Designfragen für post-chat AI workspaces

Question 1: Was zählt als work object?

Eine Antwort ist flüchtig; ein artifact ist dauerhaft. In einem chat-first system ist die Werteinheit oft die Antwort. In einem workspace-first system ist sie häufig ein work object: Dokument, code patch, research table, diagram, test plan, decision log, spreadsheet, presentation oder task board. Dieses Objekt sollte Zustand haben, die erzeugende Runde überdauern und ohne Wiedergabe der ganzen Unterhaltung prüfbar sein.

Darum sind artifact- und canvas-Muster wichtig geworden. Claude beschreibt Artifacts als eigenständige substanzielle Inhalte, typischerweise mehr als 15 lines, und nennt 20 MB per artifact persistenten Speicher. OpenAI sagt, ChatGPT Canvas könne bei generierten Inhalten über 10 lines automatisch öffnen. Diese Produktdetails zeigen eine größere Richtung: Wichtige AI-Ausgaben brauchen eine eigene Oberfläche und einen Lebenszyklus von draft, inspect, revise, validate, complete und gegebenenfalls hand off.

Question 2: Wo liegt runtime truth?

Ein transcript ist eine Gesprächsaufzeichnung, aber nicht immer die beste Quelle der Ausführungswahrheit. Wenn ein agent Dateien bearbeitet, externe Tools aufruft, einen Browser öffnet, Dokumente liest oder Tests ausführt, muss der workspace wissen, was versucht wurde, was abgeschlossen ist, was fehlgeschlagen ist, was sich geändert hat und welche evidence das Ergebnis stützt.

Diese Trennung verbessert Zuverlässigkeit, Wiederaufnahme und Governance. Nutzer können prüfen, ob ein Check wirklich lief oder nur behauptet wurde. Längere Arbeit kann nach Fehlern sicherer fortgesetzt oder umgeleitet werden. In Teams sollte der audit trail instruction, action, result und decision unterscheiden.

Der transcript soll die Arbeit erklären, aber er darf nicht der einzige Ort sein, an dem die Arbeit existiert.

Question 3: Wie viele parallele surfaces kann der Nutzer halten?

AI work wird multi-window.

Workspace: die dauerhafte Grenze um Materialien, sessions und Präferenzen.
Session: eine aufgabenbezogene conversation oder ein workstream.
Tab: eine sichtbare Einheit paralleler Aufmerksamkeit.
Pane: eine lokale Oberfläche für artifact, browser, terminal, document oder comparison view.
Window: ein Betriebssystem-Container für unterschiedliche Phasen oder Projekte.

Diese Hierarchie ist nicht kosmetisch. Sie spiegelt echte Arbeit wider: Architekturabwägungen, Implementation, Testing, Release Notes, Recherche, Quellenprüfung und Entwurf laufen oft getrennt. Ein guter multi-window AI workspace ist nicht nur mehr Bildschirmfläche, sondern ein System zur Kontextpartitionierung.

Question 4: Wer erhält continuity?

Nach artifacts und windows kommt ein Partner auf Workspace-Ebene. Er ist kein Avatar, sondern ein Orchestrator: Er versteht das workspace goal, zerlegt Arbeit, delegiert subtasks, verfolgt Fortschritt, erkennt fehlende evidence und fasst Entscheidungen zusammen. Der Nutzer behält das Urteil; der partner pflegt operational memory.

Ein virtual partner kann zeigen, welche sessions active, blocked oder complete sind, welches artifact der aktuelle Kandidat ist, welche assumptions ungeprüft sind, welcher branch in das final output gehört und welcher context wegen anderer Aufgaben- oder Berechtigungsgrenzen isoliert bleiben muss.

3. Artifact discipline: von Antworten zu Deliverables

Artifacts werden oft als UI-Funktion eingeführt, wichtiger ist jedoch Disziplin. Claude Artifacts und ChatGPT Canvas zeigen, dass generierte Arbeit eine separate editierbare Fläche braucht. Claude Projects ergänzt ein größeres Projektkontextmodell mit einem 200K context window, ungefähr einem 500-page book. ChatGPT Projects zieht workspace-ähnliche Grenzen um chats, files, instructions und collaborators.

Für MCPlato bedeutet artifact discipline, dass Ausgaben zustandsbehaftet und prüfbar werden:

stateful deliverables, nicht nur Gesprächsschnipsel;
phase awareness, damit draft, candidate und final output nicht gleichbehandelt werden;
context and tool isolation, damit ein workstream keine fremden Annahmen oder Berechtigungen erbt;
completion checks, damit „done“ evidence und erfüllte constraints bedeutet;
decision trace, damit Nutzer verstehen, warum das artifact so aussieht.

Das ist weniger magisch als „autonomous agent“, aber nützlicher. Professionelle Nutzer brauchen meist keine AI, die für immer selbstständig handelt, sondern AI, die vertrauenswürdige, prüfbare und änderbare Objekte hinterlässt.

4. Runtime und das monolith-Problem

Viele AI-Produkte beginnen als monolith: chat thread, tool runner, file picker, memory layer und UI sind gekoppelt. Das hilft anfangs, wird aber bei wachsenden Workflows zur Grenze. Ein workspace runtime muss vier Wahrheiten koordinieren:

Conversation truth: was der Nutzer fragte und der Assistant antwortete.
Material truth: welche source files, documents, pages und data verwendet wurden.
Execution truth: welche actions liefen und welche results zurückkamen.
Decision truth: was das Team accepted, rejected, deferred oder shipped hat.

Wenn alles im transcript verschmilzt, wird Inspektion schwer. Wenn alles ohne kohärente Nutzererfahrung getrennt wird, fragmentiert das System. Die Herausforderung ist, Zuständigkeiten zu trennen und Arbeit dennoch lesbar zu halten.

5. Multi-window context: von einem thread zu vielen work surfaces

Je leistungsfähiger agents werden, desto weniger reicht ein einzelner thread. Research, drafting, source checks, formatting, implementation und testing sind natürlich parallel, werden im Single-thread-Modell aber serialisiert. Ein multi-window AI workspace sollte Parallelität ermöglichen und zugleich Kohärenz bewahren.

Workspace comparison map: Chat/Canvas, IDE Agent, Cloud Agent, and AI-Native Workspace

Surface	Center of gravity	Strength	Limitation
Chat / canvas	conversation plus editable output	schnelle Ideen und Entwürfe	schwache multi-stream coordination
IDE agent	codebase and developer loop	starker lokaler Implementierungskontext	enger außerhalb von Software-Workflows
Cloud autonomous agent	long-running remote execution	nützlich für delegierte Aufgaben	schwerer zu prüfen und zu steuern, wenn undurchsichtig
AI-native workspace	sessions, artifacts, tools, and orchestration	besser für funktionsübergreifende Arbeit	höhere Produktkomplexität und Governance-Last

Der post-chat workspace ist eher eine geschichtete Umgebung für mehrere Arbeitsmodi als eine universelle UI.

6. Virtual Partner / Sprite: Orchestrierung statt Theater

Ein schwebendes Gesicht über dem workspace löst kein Kontextmanagement. Die nützliche Version eines virtual partner übersetzt Ziele in sub-workstreams, weist sessions oder agents zu, verfolgt blockers, open questions und finished outputs, entscheidet, wann ein artifact review-bereit ist, fasst Unterschiede zwischen drafts oder branches zusammen und bewahrt decision history über Tage hinweg.

Für MCPlato ist dies eine wichtige öffentliche Designrichtung: Nutzer sollen mehrere AI sessions als kohärentes partner system betreiben können. Der Mensch bleibt für Urteil verantwortlich; der Workspace-Partner reduziert Planungs-, Gedächtnis- und Merge-Aufwand. Koordination muss prüfbar bleiben.

7. Competitor comparison: was die Zahlen zeigen

Der Markt bewegt sich zu strukturierten Workspaces, aber verschiedene Anbieter belegen verschiedene Punkte.

Claude und ChatGPT: vom Chat zu Projektkontext und editierbaren Arbeitsflächen

Claude Projects zeigt die Stärke eines großen gemeinsamen Kontexts. Anthropic nennt für Projects ein 200K context window, ungefähr ein 500-page book. Claude Artifacts bieten eine eigene Fläche für eigenständige substanzielle Ausgaben; die Dokumentation beschreibt Artifacts typischerweise als mehr als 15 lines und nennt 20 MB per artifact persistenten Speicher. ChatGPT Canvas folgt einem ähnlichen Muster; OpenAI sagt, dass Canvas bei generierten Inhalten über 10 lines automatisch geöffnet werden kann. ChatGPT Projects organisiert chats, uploaded files, instructions und collaborators auf Projektebene. Diese Produkte bestätigen artifact- und project-boundaries, auch wenn die Nutzererfahrung weiter um eine zentrale Assistant-Unterhaltung kreist.

GitHub Copilot und Cursor: die Codebasis als Workspace

Developer tools haben ein anderes Gravitationszentrum: das repository. Microsoft berichtete, GitHub Copilot habe 20 million users, werde von 90% of the Fortune 100 genutzt, und Copilot Enterprise customers seien in FY2025 Q4 um 75% quarter over quarter gewachsen. GitHub verwies außerdem auf mehr als 100 million developers und auf eine Produktivitätsbehauptung von “up to 55%” für Copilot.

Cursors Series D zeigt, wie viel Wert Investoren und Entwickler dieser Schicht beimessen. Cursor erklärte, $2.3 billion bei einer $29.3 billion post-money valuation aufgenommen zu haben, $1 billion in annualized revenue überschritten zu haben, Millionen Entwickler zu bedienen und mehr als 300 employees zu haben. Diese Zahlen zeigen, dass developer workspaces keine Nebenfunktionen mehr sind, sondern primäre AI operating environments werden.

Replit und Devin: Cloud-Ausführung als Workspace

Cloud agents verschieben die Workspace-Grenze weg vom lokalen Rechner. Replit Agent 3 wird für längere autonome Ausführung positioniert: Replit sagt, er könne bis zu 200 minutes arbeiten, sei 10x more autonomous und mache Testing 3x faster sowie 10x more cost-effective. Separat kündigte Replit eine $400 million Finanzierung bei einer $9 billion Bewertung an, nannte mehr als 50 million users, 85% of the Fortune 500 und einen erwarteten $1 billion run-rate revenue bis Ende 2026.

Devins öffentliche Preise zeigen ebenfalls die Operationalisierung von Agentenarbeit: Pro kostet $20/month, Max $200/month, Teams $80/month, und relevante Pläne unterstützen bis zu 10 concurrent sessions. Diese Produkte betonen Delegation und Ausführung. Das Risiko liegt in der Prüfbarkeit: Nutzer müssen nicht nur das Ergebnis sehen, sondern auch den Weg und die Annahmen.

Manus und Notion: Breite gegenüber Workspace-Gedächtnis

Manus Wide Research hebt eine weitere Dimension hervor: parallele Breite. Die Dokumentation beschreibt hundreds of independent agents, Tests mit bis zu 250 items, 50–100 items in minutes und die Behauptung, dass traditionelle AI jenseits von 8–10 items nachlässt. Unabhängig von jeder Benchmark-Formulierung ist die Richtung klar: Arbeit skaliert durch das Aufteilen in viele unabhängige Einheiten.

Notion nähert sich dem Thema über Wissen und Organisationsgedächtnis. Die Dokumentation zu custom agents nennt nach der Testphase $10 per 1,000 credits und Nutzungswarnungen bei 80% und 100%. Gemeinsam zeigen diese Kategorien: AI bewegt sich von answer generation zu managed work systems.

8. Wo MCPlato passt

MCPlato gehört eher in die Kategorie AI-native workspace als in pure chat, IDE oder cloud-only autonomous agent. Am stärksten ist es dort, wo Nutzer mehrere AI sessions über connected materials koordinieren und prüfbare Outputs erzeugen müssen: research-to-article pipelines, multi-source analysis, document production, task decomposition, cross-session review und developer/architect workflows mit traceable decisions.

MCPlato ersetzt nicht jedes Spezialwerkzeug. Cursor und GitHub Copilot liegen näher am coding inner loop. Claude und ChatGPT sind starke general-purpose model interfaces. Replit und Devin fokussieren cloud execution und Softwaredelegation. Notion ist tief in team knowledge bases eingebettet.

MCPlatos Chance liegt in der coordination layer zwischen diesen Mustern:

session-based work, damit task threads getrennt, aber verbunden bleiben;
local-first material handling, wo connected directories und files passend genutzt werden;
artifact discipline, damit outputs zu deliverables statt verlorenen chat snippets werden;
multi-window context, damit parallele workstreams sichtbar bleiben;
virtual partner orchestration, um decompose, delegate, track und summarize zu unterstützen;
decision trace, damit Nutzer sehen, was sich warum geändert hat.

Die Grenze ist ebenso wichtig: Orchestrierung ersetzt review nicht. Multi-session AI work kann Fehler verstärken, wenn context boundaries unklar sind. Local-first workflows brauchen sorgfältiges permission management. Ein virtual partner muss assumptions und status offenlegen.

9. Conclusion: Der workspace ist das Produkt

Der Chatkasten bleibt nützlich; er ist der schnellste Weg zum Fragen, Klären und Iterieren. Er reicht aber nicht mehr als Hauptcontainer für ernsthafte AI-Arbeit. Der post-chat AI workspace braucht vier Schichten:

Chat für Absicht und Dialog.
Artifacts für dauerhafte work objects.
Runtime für execution state, evidence und recovery.
Virtual partners für session-übergreifende coordination und continuity.

Die Gewinner werden nicht nur den klügsten Assistant haben. Sie machen AI work lesbar: was entsteht, woher es kam, was lief, was scheiterte, was akzeptiert wurde und was offen bleibt. Für Entwickler und Architekten ist das vertraut: Systeme werden vertrauenswürdig, wenn ihr Zustand explizit, ihre Grenzen klar und ihre Outputs prüfbar sind.

References

Anthropic, “Introducing Projects,” https://www.anthropic.com/news/projects
Anthropic Support, “What are Artifacts and how do I use them?”, https://support.claude.com/en/articles/9487310-what-are-artifacts-and-how-do-i-use-them
OpenAI Help Center, “What is the Canvas feature in ChatGPT and how do I use it?”, https://help.openai.com/en/articles/9930697-what-is-the-canvas-feature-in-chatgpt-and-how-do-i-use-it
OpenAI Help Center, “Projects in ChatGPT,” https://help.openai.com/en/articles/10169521-projects-in-chatgpt
Microsoft Investor Relations, “FY25 Q4 Earnings,” https://www.microsoft.com/en-us/investor/events/fy-2025/earnings-fy-2025-q4.aspx
GitHub Blog, “GitHub Copilot Workspace,” https://github.blog/news-insights/product-news/github-copilot-workspace/
Replit Blog, “Introducing Agent 3,” https://replit.com/blog/introducing-agent-3-our-most-autonomous-agent-yet
Replit Blog, “Replit raises $400 million,” https://replit.com/blog/replit-raises-400-million-dollars
Devin, “Pricing,” https://devin.ai/pricing/
Manus Docs, “Wide Research,” https://manus.im/docs/features/wide-research
Cursor Blog, “Series D,” https://cursor.com/blog/series-d
Notion Help, “Everything you can do with Notion AI,” https://www.notion.com/help/guides/everything-you-can-do-with-notion-ai