Retour au blog
agents IA
agents de codage
Pi Agent
Hermes Agent
Codex
Claude Code
MCPlato

Pi, Hermes, Codex, Claude Code et MCPlato : quel Agent correspond à votre travail ?

Une comparaison pratique, fondée sur les scénarios, de Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato selon le contrôle, l'adéquation au workflow, les tâches longues et la stratégie d'autorisations.

Publié le 2026-05-27

La question utile n'est pas : « Quel AI agent est le plus puissant ? »

Elle est plutôt : « Quel agent convient à ce travail, à cet environnement et à ce niveau de risque ? »

Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato sont tous appelés agents, mais ils n'essaient pas de devenir le même produit. Pi est un harnais de codage minimal pour le terminal. Hermes est un framework d'assistant fortement axé sur la mémoire et l'automatisation. Codex est un workflow de codage managé qui couvre des surfaces locales et cloud. Claude Code est une boucle de codage agentic mature, avec de solides workflows de dépôt. MCPlato est un AI workspace pour la recherche, les rapports, le travail bureautique, les matériaux locaux, l'exécution multi-session et les tâches en arrière-plan.

Pendant la recherche, l'API GitHub a renvoyé 56,110 stars et 6,677 forks pour earendil-works/pi, 169,745 stars et 28,286 forks pour NousResearch/hermes-agent, et 86,227 stars et 12,601 forks pour openai/codex.123 Considérez ces chiffres comme des signaux d'attention portée aux dépôts, pas comme des nombres d'utilisateurs actifs.

Il s'agit d'une comparaison pratique, pas d'un classement de produits.

Adéquation produit en un coup d'oeil

ProduitMeilleure adéquationPourquoi il est choisiPrincipal compromis
Pi AgentPower users natifs du terminal, constructeurs d'agents, utilisateurs de harnais minimalistesSurface réduite, outils directs de fichiers/bash, modes interactif et JSON/RPC/SDK, arbre de sessions et forkVous portez la gouvernance, les extensions et la discipline des workflows longs
Hermes AgentAssistants toujours actifs, expériences de mémoire, automatisations, passerelles de type botMémoire persistante, cadrage d'auto-amélioration, création de skills, plus de 70 outils intégrés4, subagents et automatisations planifiées/en arrière-planLa mémoire, la compression et les boucles d'apprentissage ajoutent complexité d'état et modes de défaillance
CodexWorkflows de codage sur CLI, IDE, desktop, cloud et GitHubDocumentation solide sur sandbox et approbations, tâches cloud, MCP, recherche web, entrées image, scripts execPrincipalement un workflow de codage, pas un workspace général pour la bureautique ou le multi-app
Claude CodeMaintenance de dépôt, refactoring, CI, revue de code, workflows subagent/skillBoucle de codage agentic mature sur terminal, IDE, desktop/web, GitHub/GitLab, Slack, MCP, Agent SDKMoins hackable qu'un harnais minimal et nécessite toujours une gouvernance explicite
MCPlatoRecherche, rapports, workflows bureautiques, matériaux locaux, tâches multi-app, modèles de collègue IA asynchroneAI workspace, AI Partner, orchestration multi-session, matériaux connectés local-first, artifacts, tâches planifiées/en arrière-plan, exécution avec autorisationsPlus lourd qu'un harnais terminal minimal ; pas le chemin le plus rapide pour du codage shell ponctuel

Carte d'adéquation des scénarios pour Pi, Hermes, Codex, Claude Code et MCPlatoCarte d'adéquation des scénarios pour Pi, Hermes, Codex, Claude Code et MCPlato

Illustration 1 : raisonnez en scénarios et en surfaces de travail, pas avec un classement universel unique.

Pourquoi Pi attire l'attention

L'attrait de Pi est facile à comprendre si vous avez été frustré par des produits agent lourds.

Le projet canonique est earendil-works/pi, avec le site public pi.dev, et le package npm @earendil-works/pi-coding-agent signalé en version 0.75.5 pendant la recherche.56 Son positionnement est volontairement étroit : un harnais minimal de codage dans le terminal, avec des outils par défaut comme read, write, edit et bash, ainsi que des outils optionnels de recherche/navigation en lecture seule.

Ce minimalisme répond à plusieurs douleurs utilisateur :

  1. Trop d'agents cachent le plan de contrôle. Pi expose une boucle d'outils plus petite et plus inspectable.
  2. Les power users veulent de la composabilité. L'usage interactif, le mode print/JSON, RPC et les points d'entrée SDK donnent à Pi l'allure d'un bloc de construction, pas seulement d'une application.
  3. Les longues sessions ont besoin de branches. L'arbre de sessions de Pi, le flux fork/clone, la compaction et l'enregistrement de session JSONL correspondent à la manière dont les développeurs explorent réellement des alternatives.
  4. Certains utilisateurs ne veulent pas que les popups deviennent une philosophie produit. Pi n'inclut pas par défaut MCP, subagents, popups d'autorisation, plan mode ou bash en arrière-plan. Ces éléments relèvent plutôt des extensions/packages que du coeur.

Sa faiblesse est la même que sa force : Pi ne cherche pas à être une couche de gouvernance managée. Si vous avez besoin, dès le départ, d'une politique d'autorisations, d'une reprise d'exécution en arrière-plan, d'une revue d'équipe ou de workflows bureautiques non liés au code, vous devrez construire ou ajouter cette couche vous-même.

Les cinq principes de choix

1. Choisir par tâche, pas par « agent le plus fort »

Un agent de codage puissant n'est pas automatiquement un bon assistant de recherche. Un agent de mémoire flexible n'est pas automatiquement sûr pour des dépôts de production. Un agent de workspace n'est pas automatiquement l'outil de terminal le plus rapide.

Commencez par la tâche :

TâcheBon choix par défautPourquoi
Construire ou personnaliser un harnais de codage terminalPiCoeur minimal, outils directs, forme adaptée au SDK/RPC
Faire tourner un assistant personnel toujours actif ou une passerelle botHermesMémoire, skills, automatisations, surface orientée voix/passerelle/MCP
Déléguer du codage sur CLI, IDE, cloud et GitHubCodexPlusieurs points d'entrée de codage plus des modes sandbox et approbation documentés
Maintenir un dépôt sérieux avec refactorings, CI, subagents et boucles de revueClaude CodeWorkflows d'agent de code matures, permissions/settings, skills, subagents, surfaces CI/Slack
Produire des rapports sourcés, des artifacts bureautiques, du travail multi-app et de la recherche en arrière-planMCPlatoWorkspace, matériaux connectés, orchestration multi-session, artifacts, tâches planifiées/en arrière-plan

C'est là que MCPlato s'insère naturellement : non comme « le meilleur agent », mais comme meilleur choix par défaut quand le travail couvre documents, recherche navigateur, matériaux locaux, livrables bureautiques, sessions multiples et suivi asynchrone. Si la tâche est simplement « modifier ce fichier depuis le terminal », Pi ou un outil natif du codage peut être plus net.

2. Contrôle et workflow managé sont un vrai compromis

Le marché se divise en deux extrêmes utiles.

À une extrémité, Pi donne aux utilisateurs experts un harnais compact. Vous pouvez voir les pièces, câbler vos propres extensions et garder l'agent proche du shell. C'est excellent pour les constructeurs d'agents et les power users du terminal.

À l'autre extrémité, Codex, Claude Code et MCPlato fournissent des surfaces produit plus managées. Codex documente des modes sandbox comme read-only, workspace-write et danger-full-access, ainsi que des politiques d'approbation comme untrusted, on-request et never ; sa posture par défaut est décrite comme workspace-write avec réseau désactivé.7 Le quickstart de Claude Code indique qu'il demande l'autorisation avant de modifier des fichiers, et sa documentation settings/permissions donne aux équipes des moyens d'ajuster le comportement.89 MCPlato expose des concepts publics de workspace comme AI Partner, Desktop AI Engine, matériaux connectés, ClawMode, tâches planifiées/en arrière-plan, traces de décision, journal et quatre niveaux d'autorisation.1011

Hermes occupe une autre position : il offre une large autonomie et une grande extensibilité, mais son modèle d'état est plus complexe. Sa documentation met en avant l'auto-amélioration, la mémoire persistante, la création de skills, CLI/gateway/voice/MCP, les tâches en arrière-plan, les automatisations planifiées et les subagents.4 Cela le rend prometteur pour des assistants de longue durée, mais pas automatiquement plus sûr. Les problèmes de mémoire et de compression, y compris des discussions comme issue #33256, rappellent qu'un état d'agent persistant exige une revue attentive plutôt qu'une confiance aveugle.12

Le meilleur choix dépend de votre envie de composer le plan de contrôle ou d'utiliser un produit qui vous en fournit déjà un.

3. Le travail long exige checkpoints, reprise et artifacts

Les courtes tâches de codage peuvent survivre dans un chat. Le travail long, non.

Une tâche agent longue devrait avoir :

  • un contrat de prompt ;
  • un contexte/environnement organisé ;
  • des limites d'autorisation ;
  • des checkpoints ;
  • des artifacts vérifiables ;
  • une voie de reprise ou de continuation.

Pile de contrôle des tâches longues pour agents IAPile de contrôle des tâches longues pour agents IA

Illustration 2 : le travail agent long est plus sûr quand le contrôle est superposé, plutôt que caché dans un seul fil de discussion.

Chaque produit l'aborde différemment :

  • Pi fournit des primitives utiles comme arbres de sessions, forks, clones, compaction et enregistrements JSONL. Très bon pour l'exploration contrôlée ; moins complet comme couche opérationnelle finie.
  • Hermes vise la mémoire durable et les automatisations planifiées/en arrière-plan. Puissant pour la continuité ; plus risqué lorsque la qualité de la mémoire, la compression ou les boucles de rétroaction d'auto-amélioration ne sont pas inspectées.
  • Codex prend en charge les tâches de codage locales et cloud, MCP, la recherche web, les entrées image et l'exécution scriptée sur ses surfaces de codage.13
  • Claude Code ajoute des subagents avec contexte/accès outils indépendants, skills, MCP, GitHub Actions/GitLab CI, Slack et des workflows planifiés ou routiniers dans sa documentation.141516
  • MCPlato est le plus fort quand le travail long n'est pas seulement du code : branches de recherche, rédaction de documents, revue navigateur/matériaux, production d'image ou d'artifact bureautique et tâches en arrière-plan peuvent vivre comme des flux de travail au niveau du workspace plutôt que dans un chat surchargé.

Règle pratique : si la tâche dure plus d'une session, exigez un artifact et un plan de checkpoints avant de laisser l'agent aller loin.

4. Le meilleur agent est celui qui correspond à votre environnement

Les interfaces comptent, car elles façonnent les erreurs.

Votre environnement quotidienPréférerÀ surveiller
Terminal et scriptsPiAjouter votre propre discipline d'autorisations et de reprise
Éditeur de code + dépôt + file de tâches cloudCodexGarder les workflows non liés au code ailleurs
Boucle d'ingénierie terminal/IDE/CI/chatopsClaude CodeDéfinir règles de dépôt, autorisations d'outils et checkpoints de revue
Framework d'assistant, passerelles, voix, mémoire, automatisationHermesAuditer soigneusement mémoire et comportements planifiés
Travail de connaissance desktop entre fichiers, navigateur, artifacts bureautiques et sessions multiplesMCPlatoUtiliser des matériaux connectés bien sélectionnés ; ne pas l'employer à l'excès pour de minuscules tâches shell seules

C'est aussi la manière la plus simple d'éviter la prolifération des outils. Ne forcez pas chaque tâche dans le dernier agent à la mode. Placez chaque outil là où son interface est déjà naturelle.

5. La stratégie d'autorisations doit correspondre au risque

L'agent qui a le plus d'autonomie n'a pas toujours le meilleur modèle d'autorisations pour votre tâche.

Une stratégie légère fonctionne bien :

Niveau de risqueExemplesPolitique recommandée
FaibleLire des fichiers, résumer des documents, chercher dans des matériaux approuvésAutoriser avec journalisation
MoyenModifier des brouillons, créer des rapports, exécuter des scripts locauxAutoriser dans le workspace ou la sandbox, exiger des artifacts
ÉlevéSupprimer, déployer, publier, envoyer des messages externes, accéder à des systèmes sensiblesExiger confirmation explicite et preuves

Les documents publics de Codex sur sandbox et approbation rendent cette discussion explicite.7 La documentation de Claude Code met l'accent sur permissions/settings plutôt que sur une promesse unique de sandbox.9 Le défaut minimal de Pi signifie que la stratégie d'autorisations relève souvent de votre wrapper. Les utilisateurs de Hermes doivent être particulièrement prudents avec les automatisations en arrière-plan et la mémoire persistante. MCPlato s'utilise au mieux avec une limite de risque au niveau du workspace : connectez seulement les matériaux nécessaires, choisissez un niveau d'autorisation approprié et rendez l'artifact final vérifiable avant toute action externe.

Points forts des produits et limites honnêtes

Pi Agent : le minimalisme comme fonctionnalité

Pi est convaincant parce qu'il refuse de devenir un workspace complet. Son jeu d'outils par défaut est réduit, sa mécanique de sessions est favorable aux développeurs, et ses multiples points d'entrée attirent les personnes qui construisent leurs propres workflows agent.

Choisissez Pi si vous voulez contrôle, hackabilité et itération native du terminal. Ne le choisissez pas en attendant une gouvernance polie, une couverture des workflows bureautiques ou des opérations autonomes en arrière-plan dès le départ.

Hermes Agent : énergie d'assistant de longue durée

Hermes est le plus ambitieux dans son langage sur la mémoire et l'auto-amélioration. Mémoire persistante, création de skills, passerelles, voix, MCP, subagents et automatisations planifiées/en arrière-plan le rendent attrayant si vous voulez un assistant qui survit à travers les tâches.4

Choisissez Hermes si vous êtes à l'aise avec la gestion d'une autonomie avec état. Évitez de traiter sa boucle d'apprentissage comme intrinsèquement fiable. La mémoire n'est utile que si elle est inspectable, corrigible et bornée.

Codex : codage managé sur plusieurs surfaces

Codex est le meilleur choix lorsque l'unité de travail est l'ingénierie logicielle et que vous voulez un système unique sur desktop, IDE, CLI, cloud/web et les flux GitHub @codex.131718 Son vocabulaire de sandbox et d'approbation est particulièrement utile aux équipes qui doivent discuter du risque concrètement.

Choisissez Codex pour du travail de codage avec des choix d'exécution managés. N'attendez pas de lui qu'il remplace un workspace général pour documents bureautiques, synthèse de recherche ou travail de connaissance multi-app.

Claude Code : boucle de codage agentic mature

Claude Code est moins un petit harnais qu'un compagnon de codage professionnel complet. Sa documentation publique couvre l'usage terminal, les intégrations IDE, les surfaces desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack et les points d'entrée Agent SDK.14191516

Choisissez Claude Code pour la maintenance sérieuse de dépôts et les workflows d'ingénierie. Sa limite est que la maturité ne supprime pas le besoin de gouvernance : les équipes ont toujours besoin d'autorisations, de standards de codage, d'exigences de tests et de checkpoints de revue.

MCPlato : le travail IA centré workspace

MCPlato n'essaie pas de battre Pi sur le terrain du minuscule harnais de terminal. Son positionnement public est celui d'un AI workspace avec AI Partners, Desktop AI Engine, workflows asynchrones, matériaux connectés local-first, orchestration multi-session, travail multi-fenêtre, concepts de partenaire virtuel/Sprite, discipline d'artifact, tâches planifiées/en arrière-plan, ClawMode, exécution observable avec autorisations, trace de décision et journal.10

Choisissez MCPlato lorsque le livrable est un rapport, une comparaison, une note de recherche, un artifact bureautique, un workflow multi-app ou une longue tâche en arrière-plan. Il est particulièrement utile lorsque le travail exige plusieurs sessions : une pour la recherche, une pour la rédaction, une pour la génération d'images, une pour le nettoyage des sources, et un partenaire coordinateur qui suit ce qui est fait.

La limite est la complexité. Si votre travail est une modification terminal d'un seul fichier, un harnais minimal peut sembler plus rapide.

Une stratégie de sélection pratique

Utilisez un petit portefeuille plutôt que de chercher un agent universel :

  1. Pi par défaut pour les petites expériences natives du terminal et la construction de harnais personnalisés.
  2. Codex ou Claude Code lorsque le centre de gravité est un dépôt, des tests, des pull requests et la CI.
  3. Hermes pour des assistants toujours actifs expérimentaux, la mémoire, les passerelles et les scénarios d'automatisation où vous pouvez auditer l'état.
  4. MCPlato lorsque le travail traverse recherche, matériaux locaux, contexte navigateur, artifacts bureautiques, sessions multiples ou suivi en arrière-plan.
  5. N'élevez les autorisations que lorsque l'artifact est inspectable. Lire d'abord, brouillon ensuite, écriture ensuite, publication/déploiement/envoi en dernier.

Le modèle gagnant n'est pas l'autonomie maximale. C'est l'autonomie bornée adaptée à la tâche.

Conclusion

La montée de Pi se comprend : beaucoup d'utilisateurs techniques veulent un harnais plus petit et plus lisible après avoir subi des produits agent plus lourds. Hermes montre l'attrait et le risque d'un état d'assistant persistant. Codex et Claude Code montrent à quelle vitesse les agents de codage deviennent des workflows d'ingénierie complets. MCPlato pointe vers une autre catégorie : le AI workspace pour le travail de connaissance, les artifacts, les matériaux locaux et l'exécution parallèle.

Aucun n'est universellement le meilleur. Le bon agent est celui dont l'interface, le modèle d'autorisations et l'histoire de reprise correspondent au travail que vous faites réellement.

Références

Footnotes

  1. Dépôt GitHub canonique de Pi, earendil-works/pi. https://github.com/earendil-works/pi

  2. Dépôt GitHub de Hermes Agent, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent

  3. Dépôt GitHub OpenAI Codex. https://github.com/openai/codex

  4. Documentation de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ 2 3

  5. Site officiel de Pi. https://pi.dev/

  6. Package npm @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent

  7. Documentation OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox 2

  8. Documentation quickstart de Claude Code. https://code.claude.com/docs/en/quickstart

  9. Documentation settings de Claude Code. https://code.claude.com/docs/en/settings 2

  10. Site officiel de MCPlato. https://mcplato.com/en/ 2

  11. Informations de tarification MCPlato. https://mcplato.com/pricing

  12. Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256

  13. Documentation OpenAI Codex. https://developers.openai.com/codex 2

  14. Documentation de présentation de Claude Code. https://code.claude.com/docs/en/overview 2

  15. Documentation sub-agents de Claude Code. https://code.claude.com/docs/en/sub-agents 2

  16. Documentation skills de Claude Code. https://code.claude.com/docs/en/skills 2

  17. Documentation OpenAI Codex CLI. https://developers.openai.com/codex/cli

  18. Documentation OpenAI Codex IDE. https://developers.openai.com/codex/ide

  19. Documentation MCP de Claude Code. https://code.claude.com/docs/en/mcp