Pi, Hermes, Codex, Claude Code y MCPlato: ¿qué Agent encaja con tu trabajo?
Una comparación práctica y basada en escenarios de Pi Agent, Hermes Agent, Codex, Claude Code y MCPlato en control, ajuste al flujo de trabajo, tareas largas y estrategia de permisos.
Publicado el 2026-05-27
La pregunta útil no es: "¿Qué AI agent es el más potente?"
Es: "¿Qué agent encaja con este trabajo, este entorno y este nivel de riesgo?"
Pi Agent, Hermes Agent, Codex, Claude Code y MCPlato se llaman agentes, pero no intentan ser el mismo producto. Pi es un arnés mínimo de codificación para terminal. Hermes es un framework de asistente con mucho énfasis en memoria y automatización. Codex es un flujo de trabajo de codificación gestionado en superficies locales y de nube. Claude Code es un bucle de codificación agentic maduro con sólidos flujos de repositorio. MCPlato es un AI workspace para investigación, informes, trabajo de oficina, materiales locales, ejecución multisesión y tareas en segundo plano.
Durante la investigación, la GitHub API devolvió 56,110 stars y 6,677 forks para earendil-works/pi, 169,745 stars y 28,286 forks para NousResearch/hermes-agent, y 86,227 stars y 12,601 forks para openai/codex.123 Toma esas cifras como señales de atención del repositorio, no como conteos de usuarios activos.
Esta es una comparación práctica, no un ranking de productos.
Ajuste del producto de un vistazo
| Producto | Mejor encaje | Por qué lo elige la gente | Principal concesión |
|---|---|---|---|
| Pi Agent | Usuarios avanzados nativos de terminal, constructores de agentes, usuarios de arneses mínimos | Superficie pequeña, herramientas directas de archivos/bash, modos interactivo y JSON/RPC/SDK, árbol de sesiones y bifurcación | Tú asumes la gobernanza, las extensiones y la disciplina de flujos largos |
| Hermes Agent | Asistentes siempre activos, experimentos de memoria, automatizaciones, pasarelas tipo bot | Memoria persistente, marco de auto-mejora, creación de skills, más de 70 herramientas integradas4, subagents y automatizaciones programadas/en segundo plano | Memoria, compresión y bucles de aprendizaje añaden complejidad de estado y modos de fallo |
| Codex | Flujos de codificación en CLI, IDE, escritorio, nube y GitHub | Documentación sólida de sandbox y aprobaciones, tareas en la nube, MCP, búsqueda web, entradas de imagen, scripts exec | Principalmente un flujo de codificación, no un workspace general de oficina o multiapp |
| Claude Code | Mantenimiento de repositorios, refactorización, CI, revisión de código, flujos subagent/skill | Bucle de codificación agentic maduro en terminal, IDE, escritorio/web, GitHub/GitLab, Slack, MCP, Agent SDK | Menos hackeable que un arnés mínimo y aún necesita gobernanza explícita |
| MCPlato | Investigación, informes, flujos de oficina, materiales locales, tareas multiapp, patrones de compañero de IA asíncrono | AI workspace, AI Partner, orquestación multisesión, materiales conectados local-first, artifacts, tareas programadas/en segundo plano, ejecución con permisos | Más pesado que un arnés mínimo de terminal; no es la ruta más rápida para codificación shell puntual |
Mapa de ajuste por escenarios para Pi, Hermes, Codex, Claude Code y MCPlato
Figura 1: piensa en escenarios y superficies de trabajo, no en una única tabla universal de líderes.
Por qué Pi está recibiendo atención
El atractivo de Pi es fácil de entender si te han frustrado los productos agent pesados.
El proyecto canónico es earendil-works/pi, con el sitio público en pi.dev, y el paquete npm @earendil-works/pi-coding-agent reportado como versión 0.75.5 durante la investigación.56 Su posicionamiento es deliberadamente estrecho: un arnés mínimo de codificación en terminal con herramientas predeterminadas como read, write, edit y bash, además de herramientas opcionales de búsqueda/navegación de solo lectura.
Ese minimalismo resuelve varios dolores de usuario:
- Demasiados agentes esconden el plano de control. Pi expone un bucle de herramientas más pequeño y más inspeccionable.
- Los usuarios avanzados quieren componibilidad. El uso interactivo, el modo print/JSON, RPC y los puntos de entrada SDK hacen que Pi se sienta como un bloque de construcción, no solo como una app.
- Las sesiones largas necesitan ramas. El árbol de sesiones de Pi, el flujo fork/clone, la compactación y el registro de sesiones JSONL encajan con la forma real en que los desarrolladores exploran alternativas.
- Algunos usuarios no quieren popups como filosofía de producto. Pi no trae por defecto MCP integrado, subagents, popups de permisos, plan mode ni bash en segundo plano. Eso pertenece a extensiones/paquetes más que al núcleo.
La debilidad es la misma que la fortaleza: Pi no intenta ser una capa de gobernanza gestionada. Si necesitas política de permisos, recuperación de ejecución en segundo plano, revisión de equipo o flujos de oficina sin código desde el primer momento, tendrás que construir o añadir esa capa tú mismo.
Los cinco principios de elección
1. Elige por trabajo, no por "agent más potente"
Un agente de codificación fuerte no es automáticamente un buen asistente de investigación. Un agente de memoria flexible no es automáticamente seguro para repositorios de producción. Un agente de workspace no es automáticamente la herramienta de terminal más rápida.
Usa primero el trabajo:
| Trabajo | Buen encaje por defecto | Por qué |
|---|---|---|
| Construir o personalizar un arnés de codificación en terminal | Pi | Núcleo mínimo, herramientas directas, forma adecuada para SDK/RPC |
| Ejecutar un asistente personal siempre activo o una pasarela bot | Hermes | Memoria, skills, automatizaciones, superficie orientada a voz/pasarela/MCP |
| Delegar trabajo de codificación en CLI, IDE, nube y GitHub | Codex | Múltiples puntos de entrada de codificación más modos documentados de sandbox y aprobación |
| Mantener un repositorio serio con refactorizaciones, CI, subagents y bucles de revisión | Claude Code | Flujos maduros de agente de código, permissions/settings, skills, subagents, superficies CI/Slack |
| Producir informes con fuentes, artifacts de oficina, trabajo multiapp e investigación en segundo plano | MCPlato | Workspace, materiales conectados, orquestación multisesión, artifacts, tareas programadas/en segundo plano |
Ahí es donde MCPlato encaja de forma natural: no como "el mejor agent", sino como el mejor valor por defecto cuando el trabajo abarca documentos, investigación en navegador, materiales locales, salidas de oficina, varias sesiones y seguimiento asíncrono. Si la tarea es simplemente "editar este archivo desde la terminal", Pi o una herramienta nativa de codificación puede ser una opción más limpia.
2. Control frente a flujo gestionado es una concesión real
El mercado se está dividiendo en dos extremos útiles.
En un extremo, Pi da a usuarios expertos un arnés compacto. Puedes ver las piezas, conectar tus propias extensiones y mantener el agente cerca del shell. Eso es excelente para constructores de agentes y usuarios avanzados de terminal.
En el otro extremo, Codex, Claude Code y MCPlato ofrecen superficies de producto más gestionadas. Codex documenta modos sandbox como read-only, workspace-write y danger-full-access, además de políticas de aprobación como untrusted, on-request y never; su postura por defecto se describe como workspace-write con la red apagada.7 El quickstart de Claude Code dice que pide permiso antes de modificar archivos, y su documentación de settings/permissions da a los equipos formas de ajustar el comportamiento.89 MCPlato expone conceptos públicos de workspace como AI Partner, Desktop AI Engine, materiales conectados, ClawMode, tareas programadas/en segundo plano, trazas de decisión, diario y cuatro niveles de permisos.1011
Hermes ocupa otro lugar: ofrece amplia autonomía y extensibilidad, pero el modelo de estado es más complejo. Su documentación enfatiza auto-mejora, memoria persistente, creación de skills, CLI/gateway/voice/MCP, tareas en segundo plano, automatizaciones programadas y subagents.4 Eso lo hace prometedor para asistentes de larga vida, pero no automáticamente más seguro. Los problemas de memoria y compresión, incluidas discusiones como issue #33256, recuerdan que el estado persistente de un agente requiere revisión cuidadosa, no confianza ciega.12
La mejor elección depende de si quieres ensamblar el plano de control o usar un producto que ya te da uno.
3. El trabajo largo necesita checkpoints, recuperación y artifacts
Las tareas cortas de codificación pueden sobrevivir como chat. El trabajo largo no.
Una tarea larga de agente debería tener:
- un contrato de prompt;
- un contexto/entorno curado;
- límites de permisos;
- checkpoints;
- artifacts revisables;
- una ruta de recuperación o continuación.
Pila de control para tareas largas de agentes de IA
Figura 2: el trabajo largo con agentes es más seguro cuando el control está por capas, en lugar de oculto dentro de un único hilo de chat.
Cada producto lo aborda de forma distinta:
- Pi ofrece primitivas útiles como árboles de sesiones, forks, clones, compactación y registros JSONL. Excelente para exploración controlada; menos completo como capa operativa terminada.
- Hermes apunta a memoria durable y automatizaciones programadas/en segundo plano. Potente para continuidad; más arriesgado cuando la calidad de la memoria, la compresión o los bucles de retroalimentación de auto-mejora no se inspeccionan.
- Codex admite tareas de codificación locales y en la nube, MCP, búsqueda web, entradas de imagen y ejecución con scripts en sus superficies de codificación.13
- Claude Code añade subagents con contexto/acceso a herramientas independiente, skills, MCP, GitHub Actions/GitLab CI, Slack y flujos programados o rutinarios en su documentación.141516
- MCPlato es más fuerte cuando el trabajo largo no es solo código: ramas de investigación, redacción de documentos, revisión de navegador/materiales, producción de imagen o artifact de oficina y tareas en segundo plano pueden vivir como flujos a nivel de workspace, no como un chat sobrecargado.
Regla práctica: si la tarea durará más de una sesión, exige un artifact y un plan de checkpoints antes de dejar que el agente avance demasiado.
4. El mejor agente es el que encaja con tu entorno
Las interfaces importan porque moldean los errores.
| Tu entorno diario | Preferir | Vigilar |
|---|---|---|
| Terminal y scripts | Pi | Añade tu propia disciplina de permisos y recuperación |
| Editor de código + repositorio + cola de tareas en la nube | Codex | Mantén los flujos no relacionados con código en otro lugar |
| Bucle de ingeniería terminal/IDE/CI/chatops | Claude Code | Define reglas de repositorio, permisos de herramientas y checkpoints de revisión |
| Framework de asistente, pasarelas, voz, memoria, automatización | Hermes | Audita cuidadosamente la memoria y el comportamiento programado |
| Trabajo de conocimiento de escritorio entre archivos, navegador, artifacts de oficina y varias sesiones | MCPlato | Usa materiales conectados curados; no lo sobreutilices para tareas diminutas solo de shell |
Esta es también la forma más sencilla de evitar la proliferación de herramientas. No fuerces cada trabajo a pasar por el agente más nuevo. Pon cada herramienta donde su interfaz ya resulta natural.
5. La estrategia de permisos debe coincidir con el riesgo
El agente con más autonomía no siempre tiene el mejor modelo de permisos para tu tarea.
Una estrategia ligera de permisos funciona bien:
| Nivel de riesgo | Ejemplos | Política recomendada |
|---|---|---|
| Bajo | Leer archivos, resumir documentos, buscar materiales aprobados | Permitir con registro |
| Medio | Editar borradores, crear informes, ejecutar scripts locales | Permitir en workspace o sandbox, exigir artifacts |
| Alto | Borrar, desplegar, publicar, enviar mensajes externos, acceder a sistemas sensibles | Exigir confirmación explícita y evidencia |
La documentación pública de sandbox y aprobaciones de Codex hace explícita esta discusión.7 La documentación de Claude Code enfatiza permissions/settings más que una única promesa de sandbox.9 El valor por defecto mínimo de Pi significa que la estrategia de permisos suele ser responsabilidad de tu wrapper. Los usuarios de Hermes deberían tener especial cuidado con automatizaciones en segundo plano y memoria persistente. MCPlato se usa mejor con un límite de riesgo a nivel de workspace: conecta solo los materiales necesarios, elige un nivel de permisos adecuado y haz que el artifact final sea revisable antes de cualquier acción externa.
Aspectos destacados y limitaciones honestas
Pi Agent: minimalismo como función
Pi resulta convincente porque se niega a convertirse en un workspace completo. Su conjunto de herramientas por defecto es pequeño, su mecánica de sesiones es amigable para desarrolladores y sus múltiples puntos de entrada lo hacen atractivo para quienes construyen sus propios flujos de agentes.
Elige Pi cuando quieras control, hackabilidad e iteración nativa de terminal. No lo elijas esperando gobernanza pulida, cobertura de flujos de oficina u operaciones autónomas en segundo plano desde el primer momento.
Hermes Agent: energía de asistente de larga vida
Hermes es el más ambicioso en lenguaje de memoria y auto-mejora. Memoria persistente, creación de skills, pasarelas, voz, MCP, subagents y automatizaciones programadas/en segundo plano lo hacen atractivo si quieres un asistente que sobreviva entre tareas.4
Elige Hermes cuando te sientas cómodo gestionando autonomía con estado. Evita tratar su bucle de aprendizaje como inherentemente fiable. La memoria solo es útil cuando puede inspeccionarse, corregirse y limitarse.
Codex: codificación gestionada entre superficies
Codex encaja mejor cuando la unidad de trabajo es ingeniería de software y quieres un sistema en escritorio, IDE, CLI, nube/web y flujos GitHub @codex.131718 Su vocabulario de sandbox y aprobación es especialmente útil para equipos que necesitan hablar del riesgo de forma concreta.
Elige Codex para trabajo de codificación con opciones de ejecución gestionadas. No esperes que reemplace un workspace general para documentos de oficina, síntesis de investigación o trabajo de conocimiento multiapp.
Claude Code: bucle de codificación agentic maduro
Claude Code trata menos de ser un arnés pequeño y más de ser un compañero profesional completo de codificación. Su documentación pública cubre uso en terminal, integraciones IDE, superficies desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack y puntos de entrada Agent SDK.14191516
Elige Claude Code para mantenimiento serio de repositorios y flujos de ingeniería. La limitación es que la madurez no elimina la necesidad de gobernanza: los equipos aún necesitan permisos, estándares de codificación, requisitos de pruebas y checkpoints de revisión.
MCPlato: trabajo de IA centrado en workspace
MCPlato no intenta vencer a Pi como arnés diminuto de terminal. Su posicionamiento público es un AI workspace con AI Partners, Desktop AI Engine, flujos asíncronos, materiales conectados local-first, orquestación multisesión, trabajo multiventana, conceptos de socio virtual/Sprite, disciplina de artifacts, tareas programadas/en segundo plano, ClawMode, ejecución observable con permisos, traza de decisión y diario.10
Elige MCPlato cuando el entregable sea un informe, comparación, resumen de investigación, artifact de oficina, flujo multiapp o tarea larga en segundo plano. Es especialmente útil cuando el trabajo necesita varias sesiones: una para investigación, otra para redacción, otra para generación de imágenes, otra para limpieza de fuentes y un socio coordinador que sigue lo que está hecho.
La limitación es la complejidad. Si tu trabajo es editar un solo archivo en la terminal, un arnés mínimo puede sentirse más rápido.
Una estrategia práctica de selección
Usa una pequeña cartera en lugar de buscar un agente universal:
- Usa Pi por defecto para pequeños experimentos nativos de terminal y construcción de arneses personalizados.
- Usa Codex o Claude Code cuando el centro de gravedad sea un repositorio, pruebas, pull requests y CI.
- Usa Hermes para asistentes siempre activos experimentales, memoria, pasarelas y escenarios de automatización donde puedas auditar el estado.
- Usa MCPlato cuando el trabajo cruce investigación, materiales locales, contexto de navegador, artifacts de oficina, varias sesiones o seguimiento en segundo plano.
- Escala permisos solo cuando el artifact sea inspeccionable. Leer primero, redactar después, escribir luego, publicar/desplegar/enviar al final.
El patrón ganador no es la autonomía máxima. Es autonomía limitada ajustada al trabajo.
Conclusión
El ascenso de Pi tiene sentido: muchos usuarios técnicos quieren un arnés más pequeño y legible después de lidiar con productos agent más pesados. Hermes muestra el atractivo y el riesgo del estado persistente de asistente. Codex y Claude Code muestran lo rápido que los agentes de codificación se están convirtiendo en flujos completos de ingeniería. MCPlato apunta a otra categoría: el AI workspace para trabajo de conocimiento, artifacts, materiales locales y ejecución paralela.
Ninguno es universalmente el mejor. El agente correcto es aquel cuya interfaz, modelo de permisos e historia de recuperación coinciden con el trabajo que realmente estás haciendo.
Referencias
Footnotes
-
Repositorio GitHub canónico de Pi,
earendil-works/pi. https://github.com/earendil-works/pi ↩ -
Repositorio GitHub de Hermes Agent,
NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩ -
Repositorio GitHub de OpenAI Codex. https://github.com/openai/codex ↩
-
Documentación de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Sitio web oficial de Pi. https://pi.dev/ ↩
-
Paquete npm
@earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
Documentación de OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩2
-
Documentación quickstart de Claude Code. https://code.claude.com/docs/en/quickstart ↩
-
Documentación settings de Claude Code. https://code.claude.com/docs/en/settings ↩ ↩2
-
Sitio web oficial de MCPlato. https://mcplato.com/en/ ↩ ↩2
-
Información de precios de MCPlato. https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
Documentación de OpenAI Codex. https://developers.openai.com/codex ↩ ↩2
-
Documentación de visión general de Claude Code. https://code.claude.com/docs/en/overview ↩ ↩2
-
Documentación sub-agents de Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Documentación skills de Claude Code. https://code.claude.com/docs/en/skills ↩ ↩2
-
Documentación de OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
-
Documentación de OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
-
Documentación MCP de Claude Code. https://code.claude.com/docs/en/mcp ↩
