Pi, Hermes, Codex, Claude Code et MCPlato : quel Agent correspond à votre travail ?
Une comparaison pratique, fondée sur les scénarios, de Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato selon le contrôle, l'adéquation au workflow, les tâches longues et la stratégie d'autorisations.
Publié le 2026-05-27
La question utile n'est pas : « Quel AI agent est le plus puissant ? »
Elle est plutôt : « Quel agent convient à ce travail, à cet environnement et à ce niveau de risque ? »
Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato sont tous appelés agents, mais ils n'essaient pas de devenir le même produit. Pi est un harnais de codage minimal pour le terminal. Hermes est un framework d'assistant fortement axé sur la mémoire et l'automatisation. Codex est un workflow de codage managé qui couvre des surfaces locales et cloud. Claude Code est une boucle de codage agentic mature, avec de solides workflows de dépôt. MCPlato est un AI workspace pour la recherche, les rapports, le travail bureautique, les matériaux locaux, l'exécution multi-session et les tâches en arrière-plan.
Pendant la recherche, l'API GitHub a renvoyé 56,110 stars et 6,677 forks pour earendil-works/pi, 169,745 stars et 28,286 forks pour NousResearch/hermes-agent, et 86,227 stars et 12,601 forks pour openai/codex.123 Considérez ces chiffres comme des signaux d'attention portée aux dépôts, pas comme des nombres d'utilisateurs actifs.
Il s'agit d'une comparaison pratique, pas d'un classement de produits.
Adéquation produit en un coup d'oeil
| Produit | Meilleure adéquation | Pourquoi il est choisi | Principal compromis |
|---|---|---|---|
| Pi Agent | Power users natifs du terminal, constructeurs d'agents, utilisateurs de harnais minimalistes | Surface réduite, outils directs de fichiers/bash, modes interactif et JSON/RPC/SDK, arbre de sessions et fork | Vous portez la gouvernance, les extensions et la discipline des workflows longs |
| Hermes Agent | Assistants toujours actifs, expériences de mémoire, automatisations, passerelles de type bot | Mémoire persistante, cadrage d'auto-amélioration, création de skills, plus de 70 outils intégrés4, subagents et automatisations planifiées/en arrière-plan | La mémoire, la compression et les boucles d'apprentissage ajoutent complexité d'état et modes de défaillance |
| Codex | Workflows de codage sur CLI, IDE, desktop, cloud et GitHub | Documentation solide sur sandbox et approbations, tâches cloud, MCP, recherche web, entrées image, scripts exec | Principalement un workflow de codage, pas un workspace général pour la bureautique ou le multi-app |
| Claude Code | Maintenance de dépôt, refactoring, CI, revue de code, workflows subagent/skill | Boucle de codage agentic mature sur terminal, IDE, desktop/web, GitHub/GitLab, Slack, MCP, Agent SDK | Moins hackable qu'un harnais minimal et nécessite toujours une gouvernance explicite |
| MCPlato | Recherche, rapports, workflows bureautiques, matériaux locaux, tâches multi-app, modèles de collègue IA asynchrone | AI workspace, AI Partner, orchestration multi-session, matériaux connectés local-first, artifacts, tâches planifiées/en arrière-plan, exécution avec autorisations | Plus lourd qu'un harnais terminal minimal ; pas le chemin le plus rapide pour du codage shell ponctuel |
Carte d'adéquation des scénarios pour Pi, Hermes, Codex, Claude Code et MCPlato
Illustration 1 : raisonnez en scénarios et en surfaces de travail, pas avec un classement universel unique.
Pourquoi Pi attire l'attention
L'attrait de Pi est facile à comprendre si vous avez été frustré par des produits agent lourds.
Le projet canonique est earendil-works/pi, avec le site public pi.dev, et le package npm @earendil-works/pi-coding-agent signalé en version 0.75.5 pendant la recherche.56 Son positionnement est volontairement étroit : un harnais minimal de codage dans le terminal, avec des outils par défaut comme read, write, edit et bash, ainsi que des outils optionnels de recherche/navigation en lecture seule.
Ce minimalisme répond à plusieurs douleurs utilisateur :
- Trop d'agents cachent le plan de contrôle. Pi expose une boucle d'outils plus petite et plus inspectable.
- Les power users veulent de la composabilité. L'usage interactif, le mode print/JSON, RPC et les points d'entrée SDK donnent à Pi l'allure d'un bloc de construction, pas seulement d'une application.
- Les longues sessions ont besoin de branches. L'arbre de sessions de Pi, le flux fork/clone, la compaction et l'enregistrement de session JSONL correspondent à la manière dont les développeurs explorent réellement des alternatives.
- Certains utilisateurs ne veulent pas que les popups deviennent une philosophie produit. Pi n'inclut pas par défaut MCP, subagents, popups d'autorisation, plan mode ou bash en arrière-plan. Ces éléments relèvent plutôt des extensions/packages que du coeur.
Sa faiblesse est la même que sa force : Pi ne cherche pas à être une couche de gouvernance managée. Si vous avez besoin, dès le départ, d'une politique d'autorisations, d'une reprise d'exécution en arrière-plan, d'une revue d'équipe ou de workflows bureautiques non liés au code, vous devrez construire ou ajouter cette couche vous-même.
Les cinq principes de choix
1. Choisir par tâche, pas par « agent le plus fort »
Un agent de codage puissant n'est pas automatiquement un bon assistant de recherche. Un agent de mémoire flexible n'est pas automatiquement sûr pour des dépôts de production. Un agent de workspace n'est pas automatiquement l'outil de terminal le plus rapide.
Commencez par la tâche :
| Tâche | Bon choix par défaut | Pourquoi |
|---|---|---|
| Construire ou personnaliser un harnais de codage terminal | Pi | Coeur minimal, outils directs, forme adaptée au SDK/RPC |
| Faire tourner un assistant personnel toujours actif ou une passerelle bot | Hermes | Mémoire, skills, automatisations, surface orientée voix/passerelle/MCP |
| Déléguer du codage sur CLI, IDE, cloud et GitHub | Codex | Plusieurs points d'entrée de codage plus des modes sandbox et approbation documentés |
| Maintenir un dépôt sérieux avec refactorings, CI, subagents et boucles de revue | Claude Code | Workflows d'agent de code matures, permissions/settings, skills, subagents, surfaces CI/Slack |
| Produire des rapports sourcés, des artifacts bureautiques, du travail multi-app et de la recherche en arrière-plan | MCPlato | Workspace, matériaux connectés, orchestration multi-session, artifacts, tâches planifiées/en arrière-plan |
C'est là que MCPlato s'insère naturellement : non comme « le meilleur agent », mais comme meilleur choix par défaut quand le travail couvre documents, recherche navigateur, matériaux locaux, livrables bureautiques, sessions multiples et suivi asynchrone. Si la tâche est simplement « modifier ce fichier depuis le terminal », Pi ou un outil natif du codage peut être plus net.
2. Contrôle et workflow managé sont un vrai compromis
Le marché se divise en deux extrêmes utiles.
À une extrémité, Pi donne aux utilisateurs experts un harnais compact. Vous pouvez voir les pièces, câbler vos propres extensions et garder l'agent proche du shell. C'est excellent pour les constructeurs d'agents et les power users du terminal.
À l'autre extrémité, Codex, Claude Code et MCPlato fournissent des surfaces produit plus managées. Codex documente des modes sandbox comme read-only, workspace-write et danger-full-access, ainsi que des politiques d'approbation comme untrusted, on-request et never ; sa posture par défaut est décrite comme workspace-write avec réseau désactivé.7 Le quickstart de Claude Code indique qu'il demande l'autorisation avant de modifier des fichiers, et sa documentation settings/permissions donne aux équipes des moyens d'ajuster le comportement.89 MCPlato expose des concepts publics de workspace comme AI Partner, Desktop AI Engine, matériaux connectés, ClawMode, tâches planifiées/en arrière-plan, traces de décision, journal et quatre niveaux d'autorisation.1011
Hermes occupe une autre position : il offre une large autonomie et une grande extensibilité, mais son modèle d'état est plus complexe. Sa documentation met en avant l'auto-amélioration, la mémoire persistante, la création de skills, CLI/gateway/voice/MCP, les tâches en arrière-plan, les automatisations planifiées et les subagents.4 Cela le rend prometteur pour des assistants de longue durée, mais pas automatiquement plus sûr. Les problèmes de mémoire et de compression, y compris des discussions comme issue #33256, rappellent qu'un état d'agent persistant exige une revue attentive plutôt qu'une confiance aveugle.12
Le meilleur choix dépend de votre envie de composer le plan de contrôle ou d'utiliser un produit qui vous en fournit déjà un.
3. Le travail long exige checkpoints, reprise et artifacts
Les courtes tâches de codage peuvent survivre dans un chat. Le travail long, non.
Une tâche agent longue devrait avoir :
- un contrat de prompt ;
- un contexte/environnement organisé ;
- des limites d'autorisation ;
- des checkpoints ;
- des artifacts vérifiables ;
- une voie de reprise ou de continuation.
Pile de contrôle des tâches longues pour agents IA
Illustration 2 : le travail agent long est plus sûr quand le contrôle est superposé, plutôt que caché dans un seul fil de discussion.
Chaque produit l'aborde différemment :
- Pi fournit des primitives utiles comme arbres de sessions, forks, clones, compaction et enregistrements JSONL. Très bon pour l'exploration contrôlée ; moins complet comme couche opérationnelle finie.
- Hermes vise la mémoire durable et les automatisations planifiées/en arrière-plan. Puissant pour la continuité ; plus risqué lorsque la qualité de la mémoire, la compression ou les boucles de rétroaction d'auto-amélioration ne sont pas inspectées.
- Codex prend en charge les tâches de codage locales et cloud, MCP, la recherche web, les entrées image et l'exécution scriptée sur ses surfaces de codage.13
- Claude Code ajoute des subagents avec contexte/accès outils indépendants, skills, MCP, GitHub Actions/GitLab CI, Slack et des workflows planifiés ou routiniers dans sa documentation.141516
- MCPlato est le plus fort quand le travail long n'est pas seulement du code : branches de recherche, rédaction de documents, revue navigateur/matériaux, production d'image ou d'artifact bureautique et tâches en arrière-plan peuvent vivre comme des flux de travail au niveau du workspace plutôt que dans un chat surchargé.
Règle pratique : si la tâche dure plus d'une session, exigez un artifact et un plan de checkpoints avant de laisser l'agent aller loin.
4. Le meilleur agent est celui qui correspond à votre environnement
Les interfaces comptent, car elles façonnent les erreurs.
| Votre environnement quotidien | Préférer | À surveiller |
|---|---|---|
| Terminal et scripts | Pi | Ajouter votre propre discipline d'autorisations et de reprise |
| Éditeur de code + dépôt + file de tâches cloud | Codex | Garder les workflows non liés au code ailleurs |
| Boucle d'ingénierie terminal/IDE/CI/chatops | Claude Code | Définir règles de dépôt, autorisations d'outils et checkpoints de revue |
| Framework d'assistant, passerelles, voix, mémoire, automatisation | Hermes | Auditer soigneusement mémoire et comportements planifiés |
| Travail de connaissance desktop entre fichiers, navigateur, artifacts bureautiques et sessions multiples | MCPlato | Utiliser des matériaux connectés bien sélectionnés ; ne pas l'employer à l'excès pour de minuscules tâches shell seules |
C'est aussi la manière la plus simple d'éviter la prolifération des outils. Ne forcez pas chaque tâche dans le dernier agent à la mode. Placez chaque outil là où son interface est déjà naturelle.
5. La stratégie d'autorisations doit correspondre au risque
L'agent qui a le plus d'autonomie n'a pas toujours le meilleur modèle d'autorisations pour votre tâche.
Une stratégie légère fonctionne bien :
| Niveau de risque | Exemples | Politique recommandée |
|---|---|---|
| Faible | Lire des fichiers, résumer des documents, chercher dans des matériaux approuvés | Autoriser avec journalisation |
| Moyen | Modifier des brouillons, créer des rapports, exécuter des scripts locaux | Autoriser dans le workspace ou la sandbox, exiger des artifacts |
| Élevé | Supprimer, déployer, publier, envoyer des messages externes, accéder à des systèmes sensibles | Exiger confirmation explicite et preuves |
Les documents publics de Codex sur sandbox et approbation rendent cette discussion explicite.7 La documentation de Claude Code met l'accent sur permissions/settings plutôt que sur une promesse unique de sandbox.9 Le défaut minimal de Pi signifie que la stratégie d'autorisations relève souvent de votre wrapper. Les utilisateurs de Hermes doivent être particulièrement prudents avec les automatisations en arrière-plan et la mémoire persistante. MCPlato s'utilise au mieux avec une limite de risque au niveau du workspace : connectez seulement les matériaux nécessaires, choisissez un niveau d'autorisation approprié et rendez l'artifact final vérifiable avant toute action externe.
Points forts des produits et limites honnêtes
Pi Agent : le minimalisme comme fonctionnalité
Pi est convaincant parce qu'il refuse de devenir un workspace complet. Son jeu d'outils par défaut est réduit, sa mécanique de sessions est favorable aux développeurs, et ses multiples points d'entrée attirent les personnes qui construisent leurs propres workflows agent.
Choisissez Pi si vous voulez contrôle, hackabilité et itération native du terminal. Ne le choisissez pas en attendant une gouvernance polie, une couverture des workflows bureautiques ou des opérations autonomes en arrière-plan dès le départ.
Hermes Agent : énergie d'assistant de longue durée
Hermes est le plus ambitieux dans son langage sur la mémoire et l'auto-amélioration. Mémoire persistante, création de skills, passerelles, voix, MCP, subagents et automatisations planifiées/en arrière-plan le rendent attrayant si vous voulez un assistant qui survit à travers les tâches.4
Choisissez Hermes si vous êtes à l'aise avec la gestion d'une autonomie avec état. Évitez de traiter sa boucle d'apprentissage comme intrinsèquement fiable. La mémoire n'est utile que si elle est inspectable, corrigible et bornée.
Codex : codage managé sur plusieurs surfaces
Codex est le meilleur choix lorsque l'unité de travail est l'ingénierie logicielle et que vous voulez un système unique sur desktop, IDE, CLI, cloud/web et les flux GitHub @codex.131718 Son vocabulaire de sandbox et d'approbation est particulièrement utile aux équipes qui doivent discuter du risque concrètement.
Choisissez Codex pour du travail de codage avec des choix d'exécution managés. N'attendez pas de lui qu'il remplace un workspace général pour documents bureautiques, synthèse de recherche ou travail de connaissance multi-app.
Claude Code : boucle de codage agentic mature
Claude Code est moins un petit harnais qu'un compagnon de codage professionnel complet. Sa documentation publique couvre l'usage terminal, les intégrations IDE, les surfaces desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack et les points d'entrée Agent SDK.14191516
Choisissez Claude Code pour la maintenance sérieuse de dépôts et les workflows d'ingénierie. Sa limite est que la maturité ne supprime pas le besoin de gouvernance : les équipes ont toujours besoin d'autorisations, de standards de codage, d'exigences de tests et de checkpoints de revue.
MCPlato : le travail IA centré workspace
MCPlato n'essaie pas de battre Pi sur le terrain du minuscule harnais de terminal. Son positionnement public est celui d'un AI workspace avec AI Partners, Desktop AI Engine, workflows asynchrones, matériaux connectés local-first, orchestration multi-session, travail multi-fenêtre, concepts de partenaire virtuel/Sprite, discipline d'artifact, tâches planifiées/en arrière-plan, ClawMode, exécution observable avec autorisations, trace de décision et journal.10
Choisissez MCPlato lorsque le livrable est un rapport, une comparaison, une note de recherche, un artifact bureautique, un workflow multi-app ou une longue tâche en arrière-plan. Il est particulièrement utile lorsque le travail exige plusieurs sessions : une pour la recherche, une pour la rédaction, une pour la génération d'images, une pour le nettoyage des sources, et un partenaire coordinateur qui suit ce qui est fait.
La limite est la complexité. Si votre travail est une modification terminal d'un seul fichier, un harnais minimal peut sembler plus rapide.
Une stratégie de sélection pratique
Utilisez un petit portefeuille plutôt que de chercher un agent universel :
- Pi par défaut pour les petites expériences natives du terminal et la construction de harnais personnalisés.
- Codex ou Claude Code lorsque le centre de gravité est un dépôt, des tests, des pull requests et la CI.
- Hermes pour des assistants toujours actifs expérimentaux, la mémoire, les passerelles et les scénarios d'automatisation où vous pouvez auditer l'état.
- MCPlato lorsque le travail traverse recherche, matériaux locaux, contexte navigateur, artifacts bureautiques, sessions multiples ou suivi en arrière-plan.
- N'élevez les autorisations que lorsque l'artifact est inspectable. Lire d'abord, brouillon ensuite, écriture ensuite, publication/déploiement/envoi en dernier.
Le modèle gagnant n'est pas l'autonomie maximale. C'est l'autonomie bornée adaptée à la tâche.
Conclusion
La montée de Pi se comprend : beaucoup d'utilisateurs techniques veulent un harnais plus petit et plus lisible après avoir subi des produits agent plus lourds. Hermes montre l'attrait et le risque d'un état d'assistant persistant. Codex et Claude Code montrent à quelle vitesse les agents de codage deviennent des workflows d'ingénierie complets. MCPlato pointe vers une autre catégorie : le AI workspace pour le travail de connaissance, les artifacts, les matériaux locaux et l'exécution parallèle.
Aucun n'est universellement le meilleur. Le bon agent est celui dont l'interface, le modèle d'autorisations et l'histoire de reprise correspondent au travail que vous faites réellement.
Références
Footnotes
-
Dépôt GitHub canonique de Pi,
earendil-works/pi. https://github.com/earendil-works/pi ↩ -
Dépôt GitHub de Hermes Agent,
NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩ -
Dépôt GitHub OpenAI Codex. https://github.com/openai/codex ↩
-
Documentation de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Site officiel de Pi. https://pi.dev/ ↩
-
Package npm
@earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
Documentation OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩2
-
Documentation quickstart de Claude Code. https://code.claude.com/docs/en/quickstart ↩
-
Documentation settings de Claude Code. https://code.claude.com/docs/en/settings ↩ ↩2
-
Site officiel de MCPlato. https://mcplato.com/en/ ↩ ↩2
-
Informations de tarification MCPlato. https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
Documentation OpenAI Codex. https://developers.openai.com/codex ↩ ↩2
-
Documentation de présentation de Claude Code. https://code.claude.com/docs/en/overview ↩ ↩2
-
Documentation sub-agents de Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Documentation skills de Claude Code. https://code.claude.com/docs/en/skills ↩ ↩2
-
Documentation OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
-
Documentation OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
-
Documentation MCP de Claude Code. https://code.claude.com/docs/en/mcp ↩
