KI-Agenten

Coding-Agenten

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi, Hermes, Codex, Claude Code und MCPlato: Welcher Agent passt zu deiner Arbeit?

Ein praktischer, szenariobasierter Vergleich von Pi Agent, Hermes Agent, Codex, Claude Code und MCPlato mit Blick auf Kontrolle, Workflow-Fit, lang laufende Aufgaben und Berechtigungsstrategie.

MCPlato Research TeamVeröffentlicht am 2026-05-27

Die nützliche Frage lautet nicht: „Welcher KI-Agent ist am stärksten?“

Sie lautet: „Welcher Agent passt zu dieser Aufgabe, dieser Umgebung und diesem Risikoniveau?“

Pi Agent, Hermes Agent, Codex, Claude Code und MCPlato werden alle Agenten genannt, wollen aber nicht dasselbe Produkt sein. Pi ist ein minimales Terminal-Coding-Harness. Hermes ist ein Assistenten-Framework mit starkem Fokus auf Speicher und Automatisierung. Codex ist ein gemanagter Coding-Workflow über lokale und Cloud-Oberflächen hinweg. Claude Code ist eine ausgereifte agentic Coding-Schleife mit starken Repository-Workflows. MCPlato ist ein KI-Workspace für Recherche, Berichte, Office-Arbeit, lokale Materialien, Multi-Session-Ausführung und Hintergrundaufgaben.

Während der Recherche lieferte die GitHub API 56,110 stars und 6,677 forks für earendil-works/pi, 169,745 stars und 28,286 forks für NousResearch/hermes-agent und 86,227 stars und 12,601 forks für openai/codex.¹²³ Diese Zahlen sind Signale für Repository-Aufmerksamkeit, keine aktiven Nutzerzahlen.

Dies ist ein praktischer Vergleich, kein Produktranking.

Produkt-Fit auf einen Blick

Produkt	Bester Fit	Warum es gewählt wird	Wichtigster Trade-off
Pi Agent	Terminal-native Power-User, Agent-Builder, Nutzer minimaler Harnesses	Kleine Oberfläche, direkte Datei-/bash-Tools, interaktive und JSON/RPC/SDK-Modi, Session-Baum und Forking	Governance, Erweiterungen und Disziplin für lang laufende Workflows liegen bei dir
Hermes Agent	Always-on-Assistenten, Speicherexperimente, Automatisierungen, botartige Gateways	Persistenter Speicher, Selbstverbesserungsrahmen, Skill-Erstellung, 70+ integrierte Tools⁴, subagents und geplante/Hintergrund-Automatisierungen	Speicher, Kompression und Lernschleifen erhöhen Zustandskomplexität und Fehlermodi
Codex	Coding-Workflows über CLI, IDE, Desktop, Cloud und GitHub	Starke Sandbox- und Approval-Dokumentation, Cloud-Aufgaben, MCP, Websuche, Bildeingaben, exec-Scripting	Vor allem ein Coding-Workflow, kein allgemeiner Office- oder Multi-App-Workspace
Claude Code	Repository-Wartung, Refactoring, CI, Code-Review, subagent/skill-Workflows	Ausgereifte agentic Coding-Schleife über Terminal, IDEs, Desktop/Web, GitHub/GitLab, Slack, MCP, Agent SDK	Weniger hackbar als ein minimales Harness und weiterhin auf explizite Governance angewiesen
MCPlato	Recherche, Berichte, Office-Workflows, lokale Materialien, Multi-App-Aufgaben, asynchrone KI-Kollegenmuster	AI workspace, AI Partner, Multi-Session-Orchestrierung, local-first verbundene Materialien, artifacts, geplante/Hintergrundaufgaben, berechtigte Ausführung	Schwergewichtiger als ein minimales Terminal-Harness; nicht der schnellste Weg für einmaliges Shell-Coding

Szenario-Fit-Karte für Pi, Hermes, Codex, Claude Code und MCPlato

Abbildung 1: Denke in Szenarien und Arbeitsoberflächen, nicht in einer universellen Bestenliste.

Warum Pi Aufmerksamkeit bekommt

Pis Reiz ist leicht zu verstehen, wenn du von schwergewichtigen Agent-Produkten frustriert warst.

Das kanonische Projekt ist earendil-works/pi, mit der öffentlichen Website unter pi.dev; das npm-Paket @earendil-works/pi-coding-agent wurde während der Recherche als Version 0.75.5 gemeldet.⁵⁶ Die Positionierung ist bewusst eng: ein minimales Terminal-Coding-Harness mit Standardtools wie read, write, edit und bash sowie optionalen schreibgeschützten Such-/Navigationstools.

Dieser Minimalismus löst mehrere Nutzerprobleme:

Zu viele Agenten verstecken die Steuerungsebene. Pi zeigt eine kleinere, besser prüfbare Tool-Schleife.
Power-User wollen Komponierbarkeit. Interaktive Nutzung, print/JSON-Modus, RPC und SDK-Einstiege lassen Pi wie einen Baustein wirken, nicht nur wie eine App.
Lange Sessions brauchen Verzweigungen. Pis Session-Baum, fork/clone-Ablauf, Kompaktierung und JSONL-Session-Aufzeichnung passen dazu, wie Entwickler Alternativen tatsächlich erkunden.
Manche Nutzer wollen keine Popups als Produktphilosophie. Pi liefert standardmäßig kein eingebautes MCP, keine subagents, keine Berechtigungs-Popups, keinen plan mode und kein Hintergrund-bash. Diese gehören eher in Erweiterungen/Pakete als in den Kern.

Die Schwäche ist dieselbe wie die Stärke: Pi versucht nicht, eine gemanagte Governance-Schicht zu sein. Wenn du Berechtigungsrichtlinien, Wiederherstellung von Hintergrundausführung, Team-Review oder Non-Code-Office-Workflows direkt ab Werk brauchst, musst du diese Schicht selbst bauen oder hinzufügen.

Die fünf Auswahlprinzipien

1. Nach Aufgabe wählen, nicht nach „stärkstem Agenten“

Ein starker Coding-Agent ist nicht automatisch ein starker Rechercheassistent. Ein flexibler Speicher-Agent ist nicht automatisch sicher für Produktions-Repositories. Ein Workspace-Agent ist nicht automatisch das schnellste Terminal-Tool.

Beginne mit der Aufgabe:

Aufgabe	Guter Standard-Fit	Warum
Ein Terminal-Coding-Harness bauen oder anpassen	Pi	Minimaler Kern, direkte Tools, SDK/RPC-freundliche Form
Einen Always-on-Personal-Assistant oder Bot-Gateway betreiben	Hermes	Speicher, Skills, Automatisierungen, Voice/Gateway/MCP-orientierte Oberfläche
Coding-Arbeit über CLI, IDE, Cloud und GitHub delegieren	Codex	Mehrere Coding-Einstiege plus dokumentierte Sandbox- und Approval-Modi
Ein ernsthaftes Repo mit Refactorings, CI, subagents und Review-Schleifen warten	Claude Code	Reife Code-Agent-Workflows, Berechtigungen/Einstellungen, skills, subagents, CI/Slack-Oberflächen
Quellenbasierte Berichte, Office-artifacts, Multi-App-Arbeit und Hintergrundrecherche erstellen	MCPlato	Workspace, verbundene Materialien, Multi-Session-Orchestrierung, artifacts, geplante/Hintergrundaufgaben

Hier passt MCPlato natürlich hinein: nicht als „der beste Agent“, sondern als besserer Standard, wenn die Arbeit Dokumente, Browser-Recherche, lokale Materialien, Office-Ausgaben, mehrere Sessions und asynchrone Nachverfolgung umfasst. Wenn die Aufgabe einfach „diese Datei im Terminal bearbeiten“ lautet, ist Pi oder ein coding-natives Tool oft sauberer.

2. Kontrolle versus gemanagter Workflow ist ein echter Trade-off

Der Markt teilt sich in zwei nützliche Extreme.

Am einen Ende gibt Pi Expertennutzern ein kompaktes Harness. Du siehst die Teile, verdrahtest deine eigenen Erweiterungen und hältst den Agenten nahe an der Shell. Das ist hervorragend für Agent-Builder und Terminal-Power-User.

Am anderen Ende bieten Codex, Claude Code und MCPlato stärker gemanagte Produktoberflächen. Codex dokumentiert Sandbox-Modi wie read-only, workspace-write und danger-full-access sowie Approval-Policies wie untrusted, on-request und never; die Standardhaltung wird als workspace-write mit ausgeschaltetem Netzwerk beschrieben.⁷ Claude Code sagt im quickstart, dass es vor Dateiänderungen um Erlaubnis fragt, und seine Dokumentation zu settings/permissions gibt Teams Möglichkeiten zur Verhaltensabstimmung.⁸⁹ MCPlato stellt öffentliche Workspace-Konzepte wie AI Partner, Desktop AI Engine, verbundene Materialien, ClawMode, geplante/Hintergrundaufgaben, Entscheidungsspuren, Tagebuch und vier Berechtigungsstufen bereit.¹⁰¹¹

Hermes sitzt anders: Es bietet breite Autonomie und Erweiterbarkeit, aber das Zustandsmodell ist komplexer. Die Dokumentation betont Selbstverbesserung, persistenten Speicher, Skill-Erstellung, CLI/gateway/voice/MCP, Hintergrundaufgaben, geplante Automatisierungen und subagents.⁴ Das macht es vielversprechend für langlebige Assistenten, aber nicht automatisch sicherer. Speicher- und Kompressionsprobleme, einschließlich Diskussionen wie issue #33256, erinnern daran, dass persistenter Agent-Zustand sorgfältige Prüfung statt blindes Vertrauen braucht.¹²

Die beste Wahl hängt davon ab, ob du die Steuerungsebene selbst zusammenbauen oder ein Produkt mit bereits vorhandener Steuerungsebene nutzen willst.

3. Lang laufende Arbeit braucht Checkpoints, Recovery und artifacts

Kurze Coding-Aufgaben können als Chat überleben. Lang laufende Arbeit nicht.

Eine lang laufende Agent-Aufgabe sollte haben:

einen Prompt-Vertrag;
einen kuratierten Kontext/eine kuratierte Umgebung;
Berechtigungsgrenzen;
Checkpoints;
prüfbare artifacts;
einen Wiederherstellungs- oder Fortsetzungspfad.

Kontrollstack für lang laufende Aufgaben mit KI-Agenten

Abbildung 2: Lang laufende Agent-Arbeit ist sicherer, wenn Kontrolle geschichtet ist, statt in einem einzelnen Chat-Thread verborgen zu sein.

Jedes Produkt geht anders damit um:

Pi gibt nützliche Primitive wie Session-Bäume, forks, clones, Kompaktierung und JSONL-Aufzeichnungen. Großartig für kontrollierte Exploration, weniger vollständig als fertige Operationsschicht.
Hermes zielt auf dauerhaften Speicher und geplante/Hintergrund-Automatisierungen. Stark für Kontinuität, riskanter, wenn Speicherqualität, Kompression oder Selbstverbesserungs-Feedbackschleifen nicht geprüft werden.
Codex unterstützt lokale und Cloud-Coding-Aufgaben, MCP, Websuche, Bildeingaben und skriptgesteuerte Ausführung über seine Coding-Oberflächen hinweg.¹³
Claude Code ergänzt subagents mit unabhängigem Kontext/Toolzugriff, skills, MCP, GitHub Actions/GitLab CI, Slack und geplante/routineorientierte Workflows in der Dokumentation.¹⁴¹⁵¹⁶
MCPlato ist am stärksten, wenn lange Arbeit nicht nur Code ist: Recherche-Zweige, Dokumententwürfe, Browser-/Materialprüfung, Bild- oder Office-artifact-Produktion und Hintergrundaufgaben können als Workstreams auf Workspace-Ebene leben, statt in einem überladenen Chat.

Eine praktische Regel: Wenn die Aufgabe länger als eine Session dauert, verlange einen artifact und einen Checkpoint-Plan, bevor der Agent weit läuft.

4. Der beste Agent ist der, der zu deiner Umgebung passt

Oberflächen sind wichtig, weil sie Fehler formen.

Deine tägliche Umgebung	Bevorzugen	Worauf achten
Terminal und Skripte	Pi	Eigene Disziplin für Berechtigungen und Recovery ergänzen
Code-Editor + Repo + Cloud-Task-Queue	Codex	Non-Code-Workflows anderswo halten
Terminal/IDE/CI/chatops-Engineering-Schleife	Claude Code	Repo-Regeln, Tool-Berechtigungen und Review-Checkpoints setzen
Assistenten-Framework, Gateways, Voice, Speicher, Automatisierung	Hermes	Speicher und geplantes Verhalten sorgfältig auditieren
Desktop-Wissensarbeit über Dateien, Browser, Office-artifacts und mehrere Sessions	MCPlato	Kuratierte verbundene Materialien nutzen; nicht für winzige reine Shell-Aufgaben überverwenden

So vermeidest du auch am einfachsten Tool-Wildwuchs. Zwinge nicht jede Aufgabe durch den neuesten Agenten. Setze jedes Tool dort ein, wo seine Oberfläche bereits natürlich passt.

5. Die Berechtigungsstrategie muss zum Risiko passen

Der Agent mit der größten Autonomie hat nicht immer das beste Berechtigungsmodell für deine Aufgabe.

Eine leichte Berechtigungsstrategie funktioniert gut:

Risikostufe	Beispiele	Empfohlene Richtlinie
Niedrig	Dateien lesen, Dokumente zusammenfassen, freigegebene Materialien durchsuchen	Mit Logging erlauben
Mittel	Entwürfe bearbeiten, Berichte erstellen, lokale Skripte ausführen	Im Workspace oder Sandbox erlauben, artifacts verlangen
Hoch	Löschen, deployen, veröffentlichen, externe Nachrichten senden, auf sensible Systeme zugreifen	Explizite Bestätigung und Nachweise verlangen

Codex' öffentliche Sandbox- und Approval-Dokumente machen diese Diskussion explizit.⁷ Claude Code betont Berechtigungen/Einstellungen statt eines einzelnen Sandbox-Versprechens.⁹ Pis minimaler Standard bedeutet, dass die Berechtigungsstrategie oft Verantwortung deines Wrappers ist. Hermes-Nutzer sollten bei Hintergrundautomatisierungen und persistentem Speicher besonders vorsichtig sein. MCPlato nutzt man am besten mit einer Risikogrenze auf Workspace-Ebene: nur benötigte Materialien verbinden, eine passende Berechtigungsstufe wählen und den finalen artifact vor externen Aktionen prüfbar machen.

Produkt-Highlights und ehrliche Grenzen

Pi Agent: Minimalismus als Feature

Pi ist überzeugend, weil es sich weigert, ein vollständiger Workspace zu werden. Sein Standard-Toolset ist klein, seine Session-Mechanik ist entwicklerfreundlich, und seine mehreren Einstiegspunkte machen es attraktiv für Menschen, die eigene Agent-Workflows bauen.

Wähle Pi, wenn du Kontrolle, Hackbarkeit und terminal-native Iteration willst. Wähle es nicht in der Erwartung, sofort ausgereifte Governance, Office-Workflow-Abdeckung oder autonome Hintergrundoperationen zu bekommen.

Hermes Agent: Energie für langlebige Assistenten

Hermes ist in seiner Sprache zu Speicher und Selbstverbesserung am ambitioniertesten. Persistenter Speicher, Skill-Erstellung, Gateways, Voice, MCP, subagents und geplante/Hintergrund-Automatisierungen machen es attraktiv, wenn du einen Assistenten willst, der über Aufgaben hinweg bestehen bleibt.⁴

Wähle Hermes, wenn du zustandsbehaftete Autonomie verwalten kannst. Behandle seine Lernschleife nicht als inhärent zuverlässig. Speicher ist nur nützlich, wenn er prüfbar, korrigierbar und begrenzt ist.

Codex: gemanagtes Coding über Oberflächen hinweg

Codex passt am besten, wenn die Arbeitseinheit Softwareentwicklung ist und du ein System über Desktop, IDE, CLI, Cloud/Web und GitHub-@codex-Flows hinweg willst.¹³¹⁷¹⁸ Sein Sandbox- und Approval-Vokabular ist besonders hilfreich für Teams, die konkret über Risiko sprechen müssen.

Wähle Codex für Coding-Arbeit mit gemanagten Ausführungsoptionen. Erwarte nicht, dass es einen allgemeinen Workspace für Office-Dokumente, Recherchesynthese oder Multi-App-Wissensarbeit ersetzt.

Claude Code: ausgereifte agentic Coding-Schleife

Claude Code ist weniger ein winziges Harness als vielmehr ein vollständiger professioneller Coding-Begleiter. Die öffentliche Dokumentation deckt Terminalnutzung, IDE-Integrationen, Desktop/Web-Oberflächen, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack und Agent SDK-Einstiege ab.¹⁴¹⁹¹⁵¹⁶

Wähle Claude Code für ernsthafte Repository-Wartung und Engineering-Workflows. Die Grenze ist, dass Reife Governance nicht überflüssig macht: Teams brauchen weiterhin Berechtigungen, Coding-Standards, Testanforderungen und Review-Checkpoints.

MCPlato: Workspace-first KI-Arbeit

MCPlato versucht nicht, Pi als winziges Terminal-Harness zu schlagen. Die öffentliche Positionierung ist ein AI workspace mit AI Partners, Desktop AI Engine, asynchronen Workflows, local-first verbundenen Materialien, Multi-Session-Orchestrierung, Multi-Window-Arbeit, virtuellen Partner/Sprite-Konzepten, artifact-Disziplin, geplanten/Hintergrundaufgaben, ClawMode, berechtigter beobachtbarer Ausführung, Entscheidungsspur und Tagebuch.¹⁰

Wähle MCPlato, wenn das Ergebnis ein Bericht, Vergleich, Recherchebriefing, Office-artifact, Multi-App-Workflow oder lang laufende Hintergrundaufgabe ist. Es ist besonders nützlich, wenn Arbeit mehrere Sessions braucht: eine für Recherche, eine für Entwurf, eine für Bilderzeugung, eine für Quellenbereinigung und einen koordinierenden Partner, der den Fortschritt nachhält.

Die Grenze ist Komplexität. Wenn deine Aufgabe eine Ein-Datei-Bearbeitung im Terminal ist, kann sich ein minimales Harness schneller anfühlen.

Eine praktische Auswahlstrategie

Nutze ein kleines Portfolio, statt nach einem universellen Agenten zu suchen:

Standardmäßig Pi für kleine terminal-native Experimente und den Bau eigener Harnesses.
Codex oder Claude Code nutzen, wenn der Schwerpunkt auf Repository, Tests, pull requests und CI liegt.
Hermes nutzen für experimentelle Always-on-Assistenten, Speicher, Gateway- und Automatisierungsszenarien, wenn du den Zustand auditieren kannst.
MCPlato nutzen, wenn die Arbeit Recherche, lokale Materialien, Browser-Kontext, Office-artifacts, mehrere Sessions oder Hintergrund-Nachverfolgung überschreitet.
Berechtigungen nur erhöhen, wenn der artifact prüfbar ist. Erst lesen, dann entwerfen, dann schreiben, zuletzt veröffentlichen/deployen/senden.

Das Gewinner-Muster ist nicht maximale Autonomie. Es ist begrenzte Autonomie passend zur Aufgabe.

Fazit

Pis Aufstieg ergibt Sinn: Viele technische Nutzer wollen nach schweren Agent-Produkten ein kleineres, lesbareres Harness. Hermes zeigt Reiz und Risiko persistenten Assistentenzustands. Codex und Claude Code zeigen, wie schnell Coding-Agenten zu vollständigen Engineering-Workflows werden. MCPlato weist auf eine andere Kategorie: den AI workspace für Wissensarbeit, artifacts, lokale Materialien und parallele Ausführung.

Keines davon ist universell am besten. Der richtige Agent ist derjenige, dessen Oberfläche, Berechtigungsmodell und Recovery-Geschichte zu der Arbeit passen, die du tatsächlich machst.

Quellen

Footnotes

Kanonisches Pi GitHub-Repository, earendil-works/pi. https://github.com/earendil-works/pi ↩
Hermes Agent GitHub-Repository, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩
OpenAI Codex GitHub-Repository. https://github.com/openai/codex ↩
Hermes Agent-Dokumentation. https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Offizielle Pi-Website. https://pi.dev/ ↩
npm-Paket @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
OpenAI Codex Sandbox-Dokumentation. https://developers.openai.com/codex/sandbox ↩ ↩²
Claude Code quickstart-Dokumentation. https://code.claude.com/docs/en/quickstart ↩
Claude Code settings-Dokumentation. https://code.claude.com/docs/en/settings ↩ ↩²
Offizielle MCPlato-Website. https://mcplato.com/en/ ↩ ↩²
MCPlato-Preisinformationen. https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
OpenAI Codex-Dokumentation. https://developers.openai.com/codex ↩ ↩²
Claude Code Überblicksdokumentation. https://code.claude.com/docs/en/overview ↩ ↩²
Claude Code sub-agents-Dokumentation. https://code.claude.com/docs/en/sub-agents ↩ ↩²
Claude Code skills-Dokumentation. https://code.claude.com/docs/en/skills ↩ ↩²
OpenAI Codex CLI-Dokumentation. https://developers.openai.com/codex/cli ↩
OpenAI Codex IDE-Dokumentation. https://developers.openai.com/codex/ide ↩
Claude Code MCP-Dokumentation. https://code.claude.com/docs/en/mcp ↩

Weiterlesen

Der Agent-Stack im ersten Halbjahr 2026: Modelle, Harnesses, Runtimes und AI Workspaces
Eine knappe Landschaft des ersten Halbjahrs 2026 zu AI Agents, Coding Agents, Harnesses, Runtimes, Browser- und Sandbox-Infrastruktur, Observability, Governance und AI Workspaces — mit MCPlato als Teil der Workspace-Schicht.
So nutzen Sie allgemeine AI Agents, ohne die Kontrolle zu verlieren
Allgemeine AI Agents sind am nützlichsten, wenn sie in begrenzten, prüfbaren Workflows laufen. Dieser Leitfaden behandelt Prompt-Verträge, Strukturen für lang laufende Aufgaben, menschliche Checkpoints, kuratierte Umgebungen und überprüfbare Artefakte für Agents wie Hermes, OpenClaw-nahe Gateways und MCPlato.
MCPlato vs Codex: Personal Agent OS vs Cloud-Coding-Agent im Juni 2026
Ein Vergleich von OpenAI Codex und MCPlato im Juni 2026: wo Codex bei Cloud Coding, GitHub-Workflows, PR-Review, CLI/app/IDE und Sites-Deployments fuehrt, und wo MCPlato als Personal Agent Operating System anders ist.