agents IA

agents de codage

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi, Hermes, Codex, Claude Code et MCPlato : quel Agent correspond à votre travail ?

Une comparaison pratique, fondée sur les scénarios, de Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato selon le contrôle, l'adéquation au workflow, les tâches longues et la stratégie d'autorisations.

MCPlato Research TeamPublié le 2026-05-27

La question utile n'est pas : « Quel AI agent est le plus puissant ? »

Elle est plutôt : « Quel agent convient à ce travail, à cet environnement et à ce niveau de risque ? »

Pi Agent, Hermes Agent, Codex, Claude Code et MCPlato sont tous appelés agents, mais ils n'essaient pas de devenir le même produit. Pi est un harnais de codage minimal pour le terminal. Hermes est un framework d'assistant fortement axé sur la mémoire et l'automatisation. Codex est un workflow de codage managé qui couvre des surfaces locales et cloud. Claude Code est une boucle de codage agentic mature, avec de solides workflows de dépôt. MCPlato est un AI workspace pour la recherche, les rapports, le travail bureautique, les matériaux locaux, l'exécution multi-session et les tâches en arrière-plan.

Pendant la recherche, l'API GitHub a renvoyé 56,110 stars et 6,677 forks pour earendil-works/pi, 169,745 stars et 28,286 forks pour NousResearch/hermes-agent, et 86,227 stars et 12,601 forks pour openai/codex.¹²³ Considérez ces chiffres comme des signaux d'attention portée aux dépôts, pas comme des nombres d'utilisateurs actifs.

Il s'agit d'une comparaison pratique, pas d'un classement de produits.

Adéquation produit en un coup d'oeil

Produit	Meilleure adéquation	Pourquoi il est choisi	Principal compromis
Pi Agent	Power users natifs du terminal, constructeurs d'agents, utilisateurs de harnais minimalistes	Surface réduite, outils directs de fichiers/bash, modes interactif et JSON/RPC/SDK, arbre de sessions et fork	Vous portez la gouvernance, les extensions et la discipline des workflows longs
Hermes Agent	Assistants toujours actifs, expériences de mémoire, automatisations, passerelles de type bot	Mémoire persistante, cadrage d'auto-amélioration, création de skills, plus de 70 outils intégrés⁴, subagents et automatisations planifiées/en arrière-plan	La mémoire, la compression et les boucles d'apprentissage ajoutent complexité d'état et modes de défaillance
Codex	Workflows de codage sur CLI, IDE, desktop, cloud et GitHub	Documentation solide sur sandbox et approbations, tâches cloud, MCP, recherche web, entrées image, scripts exec	Principalement un workflow de codage, pas un workspace général pour la bureautique ou le multi-app
Claude Code	Maintenance de dépôt, refactoring, CI, revue de code, workflows subagent/skill	Boucle de codage agentic mature sur terminal, IDE, desktop/web, GitHub/GitLab, Slack, MCP, Agent SDK	Moins hackable qu'un harnais minimal et nécessite toujours une gouvernance explicite
MCPlato	Recherche, rapports, workflows bureautiques, matériaux locaux, tâches multi-app, modèles de collègue IA asynchrone	AI workspace, AI Partner, orchestration multi-session, matériaux connectés local-first, artifacts, tâches planifiées/en arrière-plan, exécution avec autorisations	Plus lourd qu'un harnais terminal minimal ; pas le chemin le plus rapide pour du codage shell ponctuel

Carte d'adéquation des scénarios pour Pi, Hermes, Codex, Claude Code et MCPlato

Illustration 1 : raisonnez en scénarios et en surfaces de travail, pas avec un classement universel unique.

Pourquoi Pi attire l'attention

L'attrait de Pi est facile à comprendre si vous avez été frustré par des produits agent lourds.

Le projet canonique est earendil-works/pi, avec le site public pi.dev, et le package npm @earendil-works/pi-coding-agent signalé en version 0.75.5 pendant la recherche.⁵⁶ Son positionnement est volontairement étroit : un harnais minimal de codage dans le terminal, avec des outils par défaut comme read, write, edit et bash, ainsi que des outils optionnels de recherche/navigation en lecture seule.

Ce minimalisme répond à plusieurs douleurs utilisateur :

Trop d'agents cachent le plan de contrôle. Pi expose une boucle d'outils plus petite et plus inspectable.
Les power users veulent de la composabilité. L'usage interactif, le mode print/JSON, RPC et les points d'entrée SDK donnent à Pi l'allure d'un bloc de construction, pas seulement d'une application.
Les longues sessions ont besoin de branches. L'arbre de sessions de Pi, le flux fork/clone, la compaction et l'enregistrement de session JSONL correspondent à la manière dont les développeurs explorent réellement des alternatives.
Certains utilisateurs ne veulent pas que les popups deviennent une philosophie produit. Pi n'inclut pas par défaut MCP, subagents, popups d'autorisation, plan mode ou bash en arrière-plan. Ces éléments relèvent plutôt des extensions/packages que du coeur.

Sa faiblesse est la même que sa force : Pi ne cherche pas à être une couche de gouvernance managée. Si vous avez besoin, dès le départ, d'une politique d'autorisations, d'une reprise d'exécution en arrière-plan, d'une revue d'équipe ou de workflows bureautiques non liés au code, vous devrez construire ou ajouter cette couche vous-même.

Les cinq principes de choix

1. Choisir par tâche, pas par « agent le plus fort »

Un agent de codage puissant n'est pas automatiquement un bon assistant de recherche. Un agent de mémoire flexible n'est pas automatiquement sûr pour des dépôts de production. Un agent de workspace n'est pas automatiquement l'outil de terminal le plus rapide.

Commencez par la tâche :

Tâche	Bon choix par défaut	Pourquoi
Construire ou personnaliser un harnais de codage terminal	Pi	Coeur minimal, outils directs, forme adaptée au SDK/RPC
Faire tourner un assistant personnel toujours actif ou une passerelle bot	Hermes	Mémoire, skills, automatisations, surface orientée voix/passerelle/MCP
Déléguer du codage sur CLI, IDE, cloud et GitHub	Codex	Plusieurs points d'entrée de codage plus des modes sandbox et approbation documentés
Maintenir un dépôt sérieux avec refactorings, CI, subagents et boucles de revue	Claude Code	Workflows d'agent de code matures, permissions/settings, skills, subagents, surfaces CI/Slack
Produire des rapports sourcés, des artifacts bureautiques, du travail multi-app et de la recherche en arrière-plan	MCPlato	Workspace, matériaux connectés, orchestration multi-session, artifacts, tâches planifiées/en arrière-plan

C'est là que MCPlato s'insère naturellement : non comme « le meilleur agent », mais comme meilleur choix par défaut quand le travail couvre documents, recherche navigateur, matériaux locaux, livrables bureautiques, sessions multiples et suivi asynchrone. Si la tâche est simplement « modifier ce fichier depuis le terminal », Pi ou un outil natif du codage peut être plus net.

2. Contrôle et workflow managé sont un vrai compromis

Le marché se divise en deux extrêmes utiles.

À une extrémité, Pi donne aux utilisateurs experts un harnais compact. Vous pouvez voir les pièces, câbler vos propres extensions et garder l'agent proche du shell. C'est excellent pour les constructeurs d'agents et les power users du terminal.

À l'autre extrémité, Codex, Claude Code et MCPlato fournissent des surfaces produit plus managées. Codex documente des modes sandbox comme read-only, workspace-write et danger-full-access, ainsi que des politiques d'approbation comme untrusted, on-request et never ; sa posture par défaut est décrite comme workspace-write avec réseau désactivé.⁷ Le quickstart de Claude Code indique qu'il demande l'autorisation avant de modifier des fichiers, et sa documentation settings/permissions donne aux équipes des moyens d'ajuster le comportement.⁸⁹ MCPlato expose des concepts publics de workspace comme AI Partner, Desktop AI Engine, matériaux connectés, ClawMode, tâches planifiées/en arrière-plan, traces de décision, journal et quatre niveaux d'autorisation.¹⁰¹¹

Hermes occupe une autre position : il offre une large autonomie et une grande extensibilité, mais son modèle d'état est plus complexe. Sa documentation met en avant l'auto-amélioration, la mémoire persistante, la création de skills, CLI/gateway/voice/MCP, les tâches en arrière-plan, les automatisations planifiées et les subagents.⁴ Cela le rend prometteur pour des assistants de longue durée, mais pas automatiquement plus sûr. Les problèmes de mémoire et de compression, y compris des discussions comme issue #33256, rappellent qu'un état d'agent persistant exige une revue attentive plutôt qu'une confiance aveugle.¹²

Le meilleur choix dépend de votre envie de composer le plan de contrôle ou d'utiliser un produit qui vous en fournit déjà un.

3. Le travail long exige checkpoints, reprise et artifacts

Les courtes tâches de codage peuvent survivre dans un chat. Le travail long, non.

Une tâche agent longue devrait avoir :

un contrat de prompt ;
un contexte/environnement organisé ;
des limites d'autorisation ;
des checkpoints ;
des artifacts vérifiables ;
une voie de reprise ou de continuation.

Pile de contrôle des tâches longues pour agents IA

Illustration 2 : le travail agent long est plus sûr quand le contrôle est superposé, plutôt que caché dans un seul fil de discussion.

Chaque produit l'aborde différemment :

Pi fournit des primitives utiles comme arbres de sessions, forks, clones, compaction et enregistrements JSONL. Très bon pour l'exploration contrôlée ; moins complet comme couche opérationnelle finie.
Hermes vise la mémoire durable et les automatisations planifiées/en arrière-plan. Puissant pour la continuité ; plus risqué lorsque la qualité de la mémoire, la compression ou les boucles de rétroaction d'auto-amélioration ne sont pas inspectées.
Codex prend en charge les tâches de codage locales et cloud, MCP, la recherche web, les entrées image et l'exécution scriptée sur ses surfaces de codage.¹³
Claude Code ajoute des subagents avec contexte/accès outils indépendants, skills, MCP, GitHub Actions/GitLab CI, Slack et des workflows planifiés ou routiniers dans sa documentation.¹⁴¹⁵¹⁶
MCPlato est le plus fort quand le travail long n'est pas seulement du code : branches de recherche, rédaction de documents, revue navigateur/matériaux, production d'image ou d'artifact bureautique et tâches en arrière-plan peuvent vivre comme des flux de travail au niveau du workspace plutôt que dans un chat surchargé.

Règle pratique : si la tâche dure plus d'une session, exigez un artifact et un plan de checkpoints avant de laisser l'agent aller loin.

4. Le meilleur agent est celui qui correspond à votre environnement

Les interfaces comptent, car elles façonnent les erreurs.

Votre environnement quotidien	Préférer	À surveiller
Terminal et scripts	Pi	Ajouter votre propre discipline d'autorisations et de reprise
Éditeur de code + dépôt + file de tâches cloud	Codex	Garder les workflows non liés au code ailleurs
Boucle d'ingénierie terminal/IDE/CI/chatops	Claude Code	Définir règles de dépôt, autorisations d'outils et checkpoints de revue
Framework d'assistant, passerelles, voix, mémoire, automatisation	Hermes	Auditer soigneusement mémoire et comportements planifiés
Travail de connaissance desktop entre fichiers, navigateur, artifacts bureautiques et sessions multiples	MCPlato	Utiliser des matériaux connectés bien sélectionnés ; ne pas l'employer à l'excès pour de minuscules tâches shell seules

C'est aussi la manière la plus simple d'éviter la prolifération des outils. Ne forcez pas chaque tâche dans le dernier agent à la mode. Placez chaque outil là où son interface est déjà naturelle.

5. La stratégie d'autorisations doit correspondre au risque

L'agent qui a le plus d'autonomie n'a pas toujours le meilleur modèle d'autorisations pour votre tâche.

Une stratégie légère fonctionne bien :

Niveau de risque	Exemples	Politique recommandée
Faible	Lire des fichiers, résumer des documents, chercher dans des matériaux approuvés	Autoriser avec journalisation
Moyen	Modifier des brouillons, créer des rapports, exécuter des scripts locaux	Autoriser dans le workspace ou la sandbox, exiger des artifacts
Élevé	Supprimer, déployer, publier, envoyer des messages externes, accéder à des systèmes sensibles	Exiger confirmation explicite et preuves

Les documents publics de Codex sur sandbox et approbation rendent cette discussion explicite.⁷ La documentation de Claude Code met l'accent sur permissions/settings plutôt que sur une promesse unique de sandbox.⁹ Le défaut minimal de Pi signifie que la stratégie d'autorisations relève souvent de votre wrapper. Les utilisateurs de Hermes doivent être particulièrement prudents avec les automatisations en arrière-plan et la mémoire persistante. MCPlato s'utilise au mieux avec une limite de risque au niveau du workspace : connectez seulement les matériaux nécessaires, choisissez un niveau d'autorisation approprié et rendez l'artifact final vérifiable avant toute action externe.

Points forts des produits et limites honnêtes

Pi Agent : le minimalisme comme fonctionnalité

Pi est convaincant parce qu'il refuse de devenir un workspace complet. Son jeu d'outils par défaut est réduit, sa mécanique de sessions est favorable aux développeurs, et ses multiples points d'entrée attirent les personnes qui construisent leurs propres workflows agent.

Choisissez Pi si vous voulez contrôle, hackabilité et itération native du terminal. Ne le choisissez pas en attendant une gouvernance polie, une couverture des workflows bureautiques ou des opérations autonomes en arrière-plan dès le départ.

Hermes Agent : énergie d'assistant de longue durée

Hermes est le plus ambitieux dans son langage sur la mémoire et l'auto-amélioration. Mémoire persistante, création de skills, passerelles, voix, MCP, subagents et automatisations planifiées/en arrière-plan le rendent attrayant si vous voulez un assistant qui survit à travers les tâches.⁴

Choisissez Hermes si vous êtes à l'aise avec la gestion d'une autonomie avec état. Évitez de traiter sa boucle d'apprentissage comme intrinsèquement fiable. La mémoire n'est utile que si elle est inspectable, corrigible et bornée.

Codex : codage managé sur plusieurs surfaces

Codex est le meilleur choix lorsque l'unité de travail est l'ingénierie logicielle et que vous voulez un système unique sur desktop, IDE, CLI, cloud/web et les flux GitHub @codex.¹³¹⁷¹⁸ Son vocabulaire de sandbox et d'approbation est particulièrement utile aux équipes qui doivent discuter du risque concrètement.

Choisissez Codex pour du travail de codage avec des choix d'exécution managés. N'attendez pas de lui qu'il remplace un workspace général pour documents bureautiques, synthèse de recherche ou travail de connaissance multi-app.

Claude Code : boucle de codage agentic mature

Claude Code est moins un petit harnais qu'un compagnon de codage professionnel complet. Sa documentation publique couvre l'usage terminal, les intégrations IDE, les surfaces desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack et les points d'entrée Agent SDK.¹⁴¹⁹¹⁵¹⁶

Choisissez Claude Code pour la maintenance sérieuse de dépôts et les workflows d'ingénierie. Sa limite est que la maturité ne supprime pas le besoin de gouvernance : les équipes ont toujours besoin d'autorisations, de standards de codage, d'exigences de tests et de checkpoints de revue.

MCPlato : le travail IA centré workspace

MCPlato n'essaie pas de battre Pi sur le terrain du minuscule harnais de terminal. Son positionnement public est celui d'un AI workspace avec AI Partners, Desktop AI Engine, workflows asynchrones, matériaux connectés local-first, orchestration multi-session, travail multi-fenêtre, concepts de partenaire virtuel/Sprite, discipline d'artifact, tâches planifiées/en arrière-plan, ClawMode, exécution observable avec autorisations, trace de décision et journal.¹⁰

Choisissez MCPlato lorsque le livrable est un rapport, une comparaison, une note de recherche, un artifact bureautique, un workflow multi-app ou une longue tâche en arrière-plan. Il est particulièrement utile lorsque le travail exige plusieurs sessions : une pour la recherche, une pour la rédaction, une pour la génération d'images, une pour le nettoyage des sources, et un partenaire coordinateur qui suit ce qui est fait.

La limite est la complexité. Si votre travail est une modification terminal d'un seul fichier, un harnais minimal peut sembler plus rapide.

Une stratégie de sélection pratique

Utilisez un petit portefeuille plutôt que de chercher un agent universel :

Pi par défaut pour les petites expériences natives du terminal et la construction de harnais personnalisés.
Codex ou Claude Code lorsque le centre de gravité est un dépôt, des tests, des pull requests et la CI.
Hermes pour des assistants toujours actifs expérimentaux, la mémoire, les passerelles et les scénarios d'automatisation où vous pouvez auditer l'état.
MCPlato lorsque le travail traverse recherche, matériaux locaux, contexte navigateur, artifacts bureautiques, sessions multiples ou suivi en arrière-plan.
N'élevez les autorisations que lorsque l'artifact est inspectable. Lire d'abord, brouillon ensuite, écriture ensuite, publication/déploiement/envoi en dernier.

Le modèle gagnant n'est pas l'autonomie maximale. C'est l'autonomie bornée adaptée à la tâche.

Conclusion

La montée de Pi se comprend : beaucoup d'utilisateurs techniques veulent un harnais plus petit et plus lisible après avoir subi des produits agent plus lourds. Hermes montre l'attrait et le risque d'un état d'assistant persistant. Codex et Claude Code montrent à quelle vitesse les agents de codage deviennent des workflows d'ingénierie complets. MCPlato pointe vers une autre catégorie : le AI workspace pour le travail de connaissance, les artifacts, les matériaux locaux et l'exécution parallèle.

Aucun n'est universellement le meilleur. Le bon agent est celui dont l'interface, le modèle d'autorisations et l'histoire de reprise correspondent au travail que vous faites réellement.

Références

Footnotes

Dépôt GitHub canonique de Pi, earendil-works/pi. https://github.com/earendil-works/pi ↩
Dépôt GitHub de Hermes Agent, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩
Dépôt GitHub OpenAI Codex. https://github.com/openai/codex ↩
Documentation de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Site officiel de Pi. https://pi.dev/ ↩
Package npm @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
Documentation OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩²
Documentation quickstart de Claude Code. https://code.claude.com/docs/en/quickstart ↩
Documentation settings de Claude Code. https://code.claude.com/docs/en/settings ↩ ↩²
Site officiel de MCPlato. https://mcplato.com/en/ ↩ ↩²
Informations de tarification MCPlato. https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
Documentation OpenAI Codex. https://developers.openai.com/codex ↩ ↩²
Documentation de présentation de Claude Code. https://code.claude.com/docs/en/overview ↩ ↩²
Documentation sub-agents de Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩²
Documentation skills de Claude Code. https://code.claude.com/docs/en/skills ↩ ↩²
Documentation OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
Documentation OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
Documentation MCP de Claude Code. https://code.claude.com/docs/en/mcp ↩

Lire la suite

La pile d'agents au premier semestre 2026 : modèles, harnesses, runtimes et espaces de travail AI
Un panorama concis du premier semestre 2026 sur les AI agents, les agents de codage, les harnesses, les runtimes, l'infrastructure de navigateur et de sandbox, l'observabilité, la gouvernance et les espaces de travail AI, avec MCPlato positionne dans la couche workspace.
Comment utiliser des agents IA generaux sans perdre le controle
Les agents IA generaux sont les plus utiles lorsqu'ils fonctionnent dans des workflows bornes et inspectables. Ce guide couvre les contrats de prompt, la structure des taches longues, les points de controle humains, les environnements selectionnes et les artefacts revisables pour des agents comme Hermes, des passerelles de style OpenClaw et MCPlato.
Codex construit l'outil de marché. MCPlato exploite le bureau de recherche.
Guide pratique Codex vs MCPlato pour la recherche sur marchés prédictifs : briefings récurrents, modèles locaux, journaux de décision, Wands et revue humaine.