Zurück zum Blog
KI-Agenten
Coding-Agenten
Pi Agent
Hermes Agent
Codex
Claude Code
MCPlato

Pi, Hermes, Codex, Claude Code und MCPlato: Welcher Agent passt zu deiner Arbeit?

Ein praktischer, szenariobasierter Vergleich von Pi Agent, Hermes Agent, Codex, Claude Code und MCPlato mit Blick auf Kontrolle, Workflow-Fit, lang laufende Aufgaben und Berechtigungsstrategie.

Veröffentlicht am 2026-05-27

Die nützliche Frage lautet nicht: „Welcher KI-Agent ist am stärksten?“

Sie lautet: „Welcher Agent passt zu dieser Aufgabe, dieser Umgebung und diesem Risikoniveau?“

Pi Agent, Hermes Agent, Codex, Claude Code und MCPlato werden alle Agenten genannt, wollen aber nicht dasselbe Produkt sein. Pi ist ein minimales Terminal-Coding-Harness. Hermes ist ein Assistenten-Framework mit starkem Fokus auf Speicher und Automatisierung. Codex ist ein gemanagter Coding-Workflow über lokale und Cloud-Oberflächen hinweg. Claude Code ist eine ausgereifte agentic Coding-Schleife mit starken Repository-Workflows. MCPlato ist ein KI-Workspace für Recherche, Berichte, Office-Arbeit, lokale Materialien, Multi-Session-Ausführung und Hintergrundaufgaben.

Während der Recherche lieferte die GitHub API 56,110 stars und 6,677 forks für earendil-works/pi, 169,745 stars und 28,286 forks für NousResearch/hermes-agent und 86,227 stars und 12,601 forks für openai/codex.123 Diese Zahlen sind Signale für Repository-Aufmerksamkeit, keine aktiven Nutzerzahlen.

Dies ist ein praktischer Vergleich, kein Produktranking.

Produkt-Fit auf einen Blick

ProduktBester FitWarum es gewählt wirdWichtigster Trade-off
Pi AgentTerminal-native Power-User, Agent-Builder, Nutzer minimaler HarnessesKleine Oberfläche, direkte Datei-/bash-Tools, interaktive und JSON/RPC/SDK-Modi, Session-Baum und ForkingGovernance, Erweiterungen und Disziplin für lang laufende Workflows liegen bei dir
Hermes AgentAlways-on-Assistenten, Speicherexperimente, Automatisierungen, botartige GatewaysPersistenter Speicher, Selbstverbesserungsrahmen, Skill-Erstellung, 70+ integrierte Tools4, subagents und geplante/Hintergrund-AutomatisierungenSpeicher, Kompression und Lernschleifen erhöhen Zustandskomplexität und Fehlermodi
CodexCoding-Workflows über CLI, IDE, Desktop, Cloud und GitHubStarke Sandbox- und Approval-Dokumentation, Cloud-Aufgaben, MCP, Websuche, Bildeingaben, exec-ScriptingVor allem ein Coding-Workflow, kein allgemeiner Office- oder Multi-App-Workspace
Claude CodeRepository-Wartung, Refactoring, CI, Code-Review, subagent/skill-WorkflowsAusgereifte agentic Coding-Schleife über Terminal, IDEs, Desktop/Web, GitHub/GitLab, Slack, MCP, Agent SDKWeniger hackbar als ein minimales Harness und weiterhin auf explizite Governance angewiesen
MCPlatoRecherche, Berichte, Office-Workflows, lokale Materialien, Multi-App-Aufgaben, asynchrone KI-KollegenmusterAI workspace, AI Partner, Multi-Session-Orchestrierung, local-first verbundene Materialien, artifacts, geplante/Hintergrundaufgaben, berechtigte AusführungSchwergewichtiger als ein minimales Terminal-Harness; nicht der schnellste Weg für einmaliges Shell-Coding

Szenario-Fit-Karte für Pi, Hermes, Codex, Claude Code und MCPlatoSzenario-Fit-Karte für Pi, Hermes, Codex, Claude Code und MCPlato

Abbildung 1: Denke in Szenarien und Arbeitsoberflächen, nicht in einer universellen Bestenliste.

Warum Pi Aufmerksamkeit bekommt

Pis Reiz ist leicht zu verstehen, wenn du von schwergewichtigen Agent-Produkten frustriert warst.

Das kanonische Projekt ist earendil-works/pi, mit der öffentlichen Website unter pi.dev; das npm-Paket @earendil-works/pi-coding-agent wurde während der Recherche als Version 0.75.5 gemeldet.56 Die Positionierung ist bewusst eng: ein minimales Terminal-Coding-Harness mit Standardtools wie read, write, edit und bash sowie optionalen schreibgeschützten Such-/Navigationstools.

Dieser Minimalismus löst mehrere Nutzerprobleme:

  1. Zu viele Agenten verstecken die Steuerungsebene. Pi zeigt eine kleinere, besser prüfbare Tool-Schleife.
  2. Power-User wollen Komponierbarkeit. Interaktive Nutzung, print/JSON-Modus, RPC und SDK-Einstiege lassen Pi wie einen Baustein wirken, nicht nur wie eine App.
  3. Lange Sessions brauchen Verzweigungen. Pis Session-Baum, fork/clone-Ablauf, Kompaktierung und JSONL-Session-Aufzeichnung passen dazu, wie Entwickler Alternativen tatsächlich erkunden.
  4. Manche Nutzer wollen keine Popups als Produktphilosophie. Pi liefert standardmäßig kein eingebautes MCP, keine subagents, keine Berechtigungs-Popups, keinen plan mode und kein Hintergrund-bash. Diese gehören eher in Erweiterungen/Pakete als in den Kern.

Die Schwäche ist dieselbe wie die Stärke: Pi versucht nicht, eine gemanagte Governance-Schicht zu sein. Wenn du Berechtigungsrichtlinien, Wiederherstellung von Hintergrundausführung, Team-Review oder Non-Code-Office-Workflows direkt ab Werk brauchst, musst du diese Schicht selbst bauen oder hinzufügen.

Die fünf Auswahlprinzipien

1. Nach Aufgabe wählen, nicht nach „stärkstem Agenten“

Ein starker Coding-Agent ist nicht automatisch ein starker Rechercheassistent. Ein flexibler Speicher-Agent ist nicht automatisch sicher für Produktions-Repositories. Ein Workspace-Agent ist nicht automatisch das schnellste Terminal-Tool.

Beginne mit der Aufgabe:

AufgabeGuter Standard-FitWarum
Ein Terminal-Coding-Harness bauen oder anpassenPiMinimaler Kern, direkte Tools, SDK/RPC-freundliche Form
Einen Always-on-Personal-Assistant oder Bot-Gateway betreibenHermesSpeicher, Skills, Automatisierungen, Voice/Gateway/MCP-orientierte Oberfläche
Coding-Arbeit über CLI, IDE, Cloud und GitHub delegierenCodexMehrere Coding-Einstiege plus dokumentierte Sandbox- und Approval-Modi
Ein ernsthaftes Repo mit Refactorings, CI, subagents und Review-Schleifen wartenClaude CodeReife Code-Agent-Workflows, Berechtigungen/Einstellungen, skills, subagents, CI/Slack-Oberflächen
Quellenbasierte Berichte, Office-artifacts, Multi-App-Arbeit und Hintergrundrecherche erstellenMCPlatoWorkspace, verbundene Materialien, Multi-Session-Orchestrierung, artifacts, geplante/Hintergrundaufgaben

Hier passt MCPlato natürlich hinein: nicht als „der beste Agent“, sondern als besserer Standard, wenn die Arbeit Dokumente, Browser-Recherche, lokale Materialien, Office-Ausgaben, mehrere Sessions und asynchrone Nachverfolgung umfasst. Wenn die Aufgabe einfach „diese Datei im Terminal bearbeiten“ lautet, ist Pi oder ein coding-natives Tool oft sauberer.

2. Kontrolle versus gemanagter Workflow ist ein echter Trade-off

Der Markt teilt sich in zwei nützliche Extreme.

Am einen Ende gibt Pi Expertennutzern ein kompaktes Harness. Du siehst die Teile, verdrahtest deine eigenen Erweiterungen und hältst den Agenten nahe an der Shell. Das ist hervorragend für Agent-Builder und Terminal-Power-User.

Am anderen Ende bieten Codex, Claude Code und MCPlato stärker gemanagte Produktoberflächen. Codex dokumentiert Sandbox-Modi wie read-only, workspace-write und danger-full-access sowie Approval-Policies wie untrusted, on-request und never; die Standardhaltung wird als workspace-write mit ausgeschaltetem Netzwerk beschrieben.7 Claude Code sagt im quickstart, dass es vor Dateiänderungen um Erlaubnis fragt, und seine Dokumentation zu settings/permissions gibt Teams Möglichkeiten zur Verhaltensabstimmung.89 MCPlato stellt öffentliche Workspace-Konzepte wie AI Partner, Desktop AI Engine, verbundene Materialien, ClawMode, geplante/Hintergrundaufgaben, Entscheidungsspuren, Tagebuch und vier Berechtigungsstufen bereit.1011

Hermes sitzt anders: Es bietet breite Autonomie und Erweiterbarkeit, aber das Zustandsmodell ist komplexer. Die Dokumentation betont Selbstverbesserung, persistenten Speicher, Skill-Erstellung, CLI/gateway/voice/MCP, Hintergrundaufgaben, geplante Automatisierungen und subagents.4 Das macht es vielversprechend für langlebige Assistenten, aber nicht automatisch sicherer. Speicher- und Kompressionsprobleme, einschließlich Diskussionen wie issue #33256, erinnern daran, dass persistenter Agent-Zustand sorgfältige Prüfung statt blindes Vertrauen braucht.12

Die beste Wahl hängt davon ab, ob du die Steuerungsebene selbst zusammenbauen oder ein Produkt mit bereits vorhandener Steuerungsebene nutzen willst.

3. Lang laufende Arbeit braucht Checkpoints, Recovery und artifacts

Kurze Coding-Aufgaben können als Chat überleben. Lang laufende Arbeit nicht.

Eine lang laufende Agent-Aufgabe sollte haben:

  • einen Prompt-Vertrag;
  • einen kuratierten Kontext/eine kuratierte Umgebung;
  • Berechtigungsgrenzen;
  • Checkpoints;
  • prüfbare artifacts;
  • einen Wiederherstellungs- oder Fortsetzungspfad.

Kontrollstack für lang laufende Aufgaben mit KI-AgentenKontrollstack für lang laufende Aufgaben mit KI-Agenten

Abbildung 2: Lang laufende Agent-Arbeit ist sicherer, wenn Kontrolle geschichtet ist, statt in einem einzelnen Chat-Thread verborgen zu sein.

Jedes Produkt geht anders damit um:

  • Pi gibt nützliche Primitive wie Session-Bäume, forks, clones, Kompaktierung und JSONL-Aufzeichnungen. Großartig für kontrollierte Exploration, weniger vollständig als fertige Operationsschicht.
  • Hermes zielt auf dauerhaften Speicher und geplante/Hintergrund-Automatisierungen. Stark für Kontinuität, riskanter, wenn Speicherqualität, Kompression oder Selbstverbesserungs-Feedbackschleifen nicht geprüft werden.
  • Codex unterstützt lokale und Cloud-Coding-Aufgaben, MCP, Websuche, Bildeingaben und skriptgesteuerte Ausführung über seine Coding-Oberflächen hinweg.13
  • Claude Code ergänzt subagents mit unabhängigem Kontext/Toolzugriff, skills, MCP, GitHub Actions/GitLab CI, Slack und geplante/routineorientierte Workflows in der Dokumentation.141516
  • MCPlato ist am stärksten, wenn lange Arbeit nicht nur Code ist: Recherche-Zweige, Dokumententwürfe, Browser-/Materialprüfung, Bild- oder Office-artifact-Produktion und Hintergrundaufgaben können als Workstreams auf Workspace-Ebene leben, statt in einem überladenen Chat.

Eine praktische Regel: Wenn die Aufgabe länger als eine Session dauert, verlange einen artifact und einen Checkpoint-Plan, bevor der Agent weit läuft.

4. Der beste Agent ist der, der zu deiner Umgebung passt

Oberflächen sind wichtig, weil sie Fehler formen.

Deine tägliche UmgebungBevorzugenWorauf achten
Terminal und SkriptePiEigene Disziplin für Berechtigungen und Recovery ergänzen
Code-Editor + Repo + Cloud-Task-QueueCodexNon-Code-Workflows anderswo halten
Terminal/IDE/CI/chatops-Engineering-SchleifeClaude CodeRepo-Regeln, Tool-Berechtigungen und Review-Checkpoints setzen
Assistenten-Framework, Gateways, Voice, Speicher, AutomatisierungHermesSpeicher und geplantes Verhalten sorgfältig auditieren
Desktop-Wissensarbeit über Dateien, Browser, Office-artifacts und mehrere SessionsMCPlatoKuratierte verbundene Materialien nutzen; nicht für winzige reine Shell-Aufgaben überverwenden

So vermeidest du auch am einfachsten Tool-Wildwuchs. Zwinge nicht jede Aufgabe durch den neuesten Agenten. Setze jedes Tool dort ein, wo seine Oberfläche bereits natürlich passt.

5. Die Berechtigungsstrategie muss zum Risiko passen

Der Agent mit der größten Autonomie hat nicht immer das beste Berechtigungsmodell für deine Aufgabe.

Eine leichte Berechtigungsstrategie funktioniert gut:

RisikostufeBeispieleEmpfohlene Richtlinie
NiedrigDateien lesen, Dokumente zusammenfassen, freigegebene Materialien durchsuchenMit Logging erlauben
MittelEntwürfe bearbeiten, Berichte erstellen, lokale Skripte ausführenIm Workspace oder Sandbox erlauben, artifacts verlangen
HochLöschen, deployen, veröffentlichen, externe Nachrichten senden, auf sensible Systeme zugreifenExplizite Bestätigung und Nachweise verlangen

Codex' öffentliche Sandbox- und Approval-Dokumente machen diese Diskussion explizit.7 Claude Code betont Berechtigungen/Einstellungen statt eines einzelnen Sandbox-Versprechens.9 Pis minimaler Standard bedeutet, dass die Berechtigungsstrategie oft Verantwortung deines Wrappers ist. Hermes-Nutzer sollten bei Hintergrundautomatisierungen und persistentem Speicher besonders vorsichtig sein. MCPlato nutzt man am besten mit einer Risikogrenze auf Workspace-Ebene: nur benötigte Materialien verbinden, eine passende Berechtigungsstufe wählen und den finalen artifact vor externen Aktionen prüfbar machen.

Produkt-Highlights und ehrliche Grenzen

Pi Agent: Minimalismus als Feature

Pi ist überzeugend, weil es sich weigert, ein vollständiger Workspace zu werden. Sein Standard-Toolset ist klein, seine Session-Mechanik ist entwicklerfreundlich, und seine mehreren Einstiegspunkte machen es attraktiv für Menschen, die eigene Agent-Workflows bauen.

Wähle Pi, wenn du Kontrolle, Hackbarkeit und terminal-native Iteration willst. Wähle es nicht in der Erwartung, sofort ausgereifte Governance, Office-Workflow-Abdeckung oder autonome Hintergrundoperationen zu bekommen.

Hermes Agent: Energie für langlebige Assistenten

Hermes ist in seiner Sprache zu Speicher und Selbstverbesserung am ambitioniertesten. Persistenter Speicher, Skill-Erstellung, Gateways, Voice, MCP, subagents und geplante/Hintergrund-Automatisierungen machen es attraktiv, wenn du einen Assistenten willst, der über Aufgaben hinweg bestehen bleibt.4

Wähle Hermes, wenn du zustandsbehaftete Autonomie verwalten kannst. Behandle seine Lernschleife nicht als inhärent zuverlässig. Speicher ist nur nützlich, wenn er prüfbar, korrigierbar und begrenzt ist.

Codex: gemanagtes Coding über Oberflächen hinweg

Codex passt am besten, wenn die Arbeitseinheit Softwareentwicklung ist und du ein System über Desktop, IDE, CLI, Cloud/Web und GitHub-@codex-Flows hinweg willst.131718 Sein Sandbox- und Approval-Vokabular ist besonders hilfreich für Teams, die konkret über Risiko sprechen müssen.

Wähle Codex für Coding-Arbeit mit gemanagten Ausführungsoptionen. Erwarte nicht, dass es einen allgemeinen Workspace für Office-Dokumente, Recherchesynthese oder Multi-App-Wissensarbeit ersetzt.

Claude Code: ausgereifte agentic Coding-Schleife

Claude Code ist weniger ein winziges Harness als vielmehr ein vollständiger professioneller Coding-Begleiter. Die öffentliche Dokumentation deckt Terminalnutzung, IDE-Integrationen, Desktop/Web-Oberflächen, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack und Agent SDK-Einstiege ab.14191516

Wähle Claude Code für ernsthafte Repository-Wartung und Engineering-Workflows. Die Grenze ist, dass Reife Governance nicht überflüssig macht: Teams brauchen weiterhin Berechtigungen, Coding-Standards, Testanforderungen und Review-Checkpoints.

MCPlato: Workspace-first KI-Arbeit

MCPlato versucht nicht, Pi als winziges Terminal-Harness zu schlagen. Die öffentliche Positionierung ist ein AI workspace mit AI Partners, Desktop AI Engine, asynchronen Workflows, local-first verbundenen Materialien, Multi-Session-Orchestrierung, Multi-Window-Arbeit, virtuellen Partner/Sprite-Konzepten, artifact-Disziplin, geplanten/Hintergrundaufgaben, ClawMode, berechtigter beobachtbarer Ausführung, Entscheidungsspur und Tagebuch.10

Wähle MCPlato, wenn das Ergebnis ein Bericht, Vergleich, Recherchebriefing, Office-artifact, Multi-App-Workflow oder lang laufende Hintergrundaufgabe ist. Es ist besonders nützlich, wenn Arbeit mehrere Sessions braucht: eine für Recherche, eine für Entwurf, eine für Bilderzeugung, eine für Quellenbereinigung und einen koordinierenden Partner, der den Fortschritt nachhält.

Die Grenze ist Komplexität. Wenn deine Aufgabe eine Ein-Datei-Bearbeitung im Terminal ist, kann sich ein minimales Harness schneller anfühlen.

Eine praktische Auswahlstrategie

Nutze ein kleines Portfolio, statt nach einem universellen Agenten zu suchen:

  1. Standardmäßig Pi für kleine terminal-native Experimente und den Bau eigener Harnesses.
  2. Codex oder Claude Code nutzen, wenn der Schwerpunkt auf Repository, Tests, pull requests und CI liegt.
  3. Hermes nutzen für experimentelle Always-on-Assistenten, Speicher, Gateway- und Automatisierungsszenarien, wenn du den Zustand auditieren kannst.
  4. MCPlato nutzen, wenn die Arbeit Recherche, lokale Materialien, Browser-Kontext, Office-artifacts, mehrere Sessions oder Hintergrund-Nachverfolgung überschreitet.
  5. Berechtigungen nur erhöhen, wenn der artifact prüfbar ist. Erst lesen, dann entwerfen, dann schreiben, zuletzt veröffentlichen/deployen/senden.

Das Gewinner-Muster ist nicht maximale Autonomie. Es ist begrenzte Autonomie passend zur Aufgabe.

Fazit

Pis Aufstieg ergibt Sinn: Viele technische Nutzer wollen nach schweren Agent-Produkten ein kleineres, lesbareres Harness. Hermes zeigt Reiz und Risiko persistenten Assistentenzustands. Codex und Claude Code zeigen, wie schnell Coding-Agenten zu vollständigen Engineering-Workflows werden. MCPlato weist auf eine andere Kategorie: den AI workspace für Wissensarbeit, artifacts, lokale Materialien und parallele Ausführung.

Keines davon ist universell am besten. Der richtige Agent ist derjenige, dessen Oberfläche, Berechtigungsmodell und Recovery-Geschichte zu der Arbeit passen, die du tatsächlich machst.

Quellen

Footnotes

  1. Kanonisches Pi GitHub-Repository, earendil-works/pi. https://github.com/earendil-works/pi

  2. Hermes Agent GitHub-Repository, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent

  3. OpenAI Codex GitHub-Repository. https://github.com/openai/codex

  4. Hermes Agent-Dokumentation. https://hermes-agent.nousresearch.com/docs/ 2 3

  5. Offizielle Pi-Website. https://pi.dev/

  6. npm-Paket @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent

  7. OpenAI Codex Sandbox-Dokumentation. https://developers.openai.com/codex/sandbox 2

  8. Claude Code quickstart-Dokumentation. https://code.claude.com/docs/en/quickstart

  9. Claude Code settings-Dokumentation. https://code.claude.com/docs/en/settings 2

  10. Offizielle MCPlato-Website. https://mcplato.com/en/ 2

  11. MCPlato-Preisinformationen. https://mcplato.com/pricing

  12. Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256

  13. OpenAI Codex-Dokumentation. https://developers.openai.com/codex 2

  14. Claude Code Überblicksdokumentation. https://code.claude.com/docs/en/overview 2

  15. Claude Code sub-agents-Dokumentation. https://code.claude.com/docs/en/sub-agents 2

  16. Claude Code skills-Dokumentation. https://code.claude.com/docs/en/skills 2

  17. OpenAI Codex CLI-Dokumentation. https://developers.openai.com/codex/cli

  18. OpenAI Codex IDE-Dokumentation. https://developers.openai.com/codex/ide

  19. Claude Code MCP-Dokumentation. https://code.claude.com/docs/en/mcp