agentes de IA

agentes de codificación

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi, Hermes, Codex, Claude Code y MCPlato: ¿qué Agent encaja con tu trabajo?

Una comparación práctica y basada en escenarios de Pi Agent, Hermes Agent, Codex, Claude Code y MCPlato en control, ajuste al flujo de trabajo, tareas largas y estrategia de permisos.

MCPlato Research TeamPublicado el 2026-05-27

La pregunta útil no es: "¿Qué AI agent es el más potente?"

Es: "¿Qué agent encaja con este trabajo, este entorno y este nivel de riesgo?"

Pi Agent, Hermes Agent, Codex, Claude Code y MCPlato se llaman agentes, pero no intentan ser el mismo producto. Pi es un arnés mínimo de codificación para terminal. Hermes es un framework de asistente con mucho énfasis en memoria y automatización. Codex es un flujo de trabajo de codificación gestionado en superficies locales y de nube. Claude Code es un bucle de codificación agentic maduro con sólidos flujos de repositorio. MCPlato es un AI workspace para investigación, informes, trabajo de oficina, materiales locales, ejecución multisesión y tareas en segundo plano.

Durante la investigación, la GitHub API devolvió 56,110 stars y 6,677 forks para earendil-works/pi, 169,745 stars y 28,286 forks para NousResearch/hermes-agent, y 86,227 stars y 12,601 forks para openai/codex.¹²³ Toma esas cifras como señales de atención del repositorio, no como conteos de usuarios activos.

Esta es una comparación práctica, no un ranking de productos.

Ajuste del producto de un vistazo

Producto	Mejor encaje	Por qué lo elige la gente	Principal concesión
Pi Agent	Usuarios avanzados nativos de terminal, constructores de agentes, usuarios de arneses mínimos	Superficie pequeña, herramientas directas de archivos/bash, modos interactivo y JSON/RPC/SDK, árbol de sesiones y bifurcación	Tú asumes la gobernanza, las extensiones y la disciplina de flujos largos
Hermes Agent	Asistentes siempre activos, experimentos de memoria, automatizaciones, pasarelas tipo bot	Memoria persistente, marco de auto-mejora, creación de skills, más de 70 herramientas integradas⁴, subagents y automatizaciones programadas/en segundo plano	Memoria, compresión y bucles de aprendizaje añaden complejidad de estado y modos de fallo
Codex	Flujos de codificación en CLI, IDE, escritorio, nube y GitHub	Documentación sólida de sandbox y aprobaciones, tareas en la nube, MCP, búsqueda web, entradas de imagen, scripts exec	Principalmente un flujo de codificación, no un workspace general de oficina o multiapp
Claude Code	Mantenimiento de repositorios, refactorización, CI, revisión de código, flujos subagent/skill	Bucle de codificación agentic maduro en terminal, IDE, escritorio/web, GitHub/GitLab, Slack, MCP, Agent SDK	Menos hackeable que un arnés mínimo y aún necesita gobernanza explícita
MCPlato	Investigación, informes, flujos de oficina, materiales locales, tareas multiapp, patrones de compañero de IA asíncrono	AI workspace, AI Partner, orquestación multisesión, materiales conectados local-first, artifacts, tareas programadas/en segundo plano, ejecución con permisos	Más pesado que un arnés mínimo de terminal; no es la ruta más rápida para codificación shell puntual

Mapa de ajuste por escenarios para Pi, Hermes, Codex, Claude Code y MCPlato

Figura 1: piensa en escenarios y superficies de trabajo, no en una única tabla universal de líderes.

Por qué Pi está recibiendo atención

El atractivo de Pi es fácil de entender si te han frustrado los productos agent pesados.

El proyecto canónico es earendil-works/pi, con el sitio público en pi.dev, y el paquete npm @earendil-works/pi-coding-agent reportado como versión 0.75.5 durante la investigación.⁵⁶ Su posicionamiento es deliberadamente estrecho: un arnés mínimo de codificación en terminal con herramientas predeterminadas como read, write, edit y bash, además de herramientas opcionales de búsqueda/navegación de solo lectura.

Ese minimalismo resuelve varios dolores de usuario:

Demasiados agentes esconden el plano de control. Pi expone un bucle de herramientas más pequeño y más inspeccionable.
Los usuarios avanzados quieren componibilidad. El uso interactivo, el modo print/JSON, RPC y los puntos de entrada SDK hacen que Pi se sienta como un bloque de construcción, no solo como una app.
Las sesiones largas necesitan ramas. El árbol de sesiones de Pi, el flujo fork/clone, la compactación y el registro de sesiones JSONL encajan con la forma real en que los desarrolladores exploran alternativas.
Algunos usuarios no quieren popups como filosofía de producto. Pi no trae por defecto MCP integrado, subagents, popups de permisos, plan mode ni bash en segundo plano. Eso pertenece a extensiones/paquetes más que al núcleo.

La debilidad es la misma que la fortaleza: Pi no intenta ser una capa de gobernanza gestionada. Si necesitas política de permisos, recuperación de ejecución en segundo plano, revisión de equipo o flujos de oficina sin código desde el primer momento, tendrás que construir o añadir esa capa tú mismo.

Los cinco principios de elección

1. Elige por trabajo, no por "agent más potente"

Un agente de codificación fuerte no es automáticamente un buen asistente de investigación. Un agente de memoria flexible no es automáticamente seguro para repositorios de producción. Un agente de workspace no es automáticamente la herramienta de terminal más rápida.

Usa primero el trabajo:

Trabajo	Buen encaje por defecto	Por qué
Construir o personalizar un arnés de codificación en terminal	Pi	Núcleo mínimo, herramientas directas, forma adecuada para SDK/RPC
Ejecutar un asistente personal siempre activo o una pasarela bot	Hermes	Memoria, skills, automatizaciones, superficie orientada a voz/pasarela/MCP
Delegar trabajo de codificación en CLI, IDE, nube y GitHub	Codex	Múltiples puntos de entrada de codificación más modos documentados de sandbox y aprobación
Mantener un repositorio serio con refactorizaciones, CI, subagents y bucles de revisión	Claude Code	Flujos maduros de agente de código, permissions/settings, skills, subagents, superficies CI/Slack
Producir informes con fuentes, artifacts de oficina, trabajo multiapp e investigación en segundo plano	MCPlato	Workspace, materiales conectados, orquestación multisesión, artifacts, tareas programadas/en segundo plano

Ahí es donde MCPlato encaja de forma natural: no como "el mejor agent", sino como el mejor valor por defecto cuando el trabajo abarca documentos, investigación en navegador, materiales locales, salidas de oficina, varias sesiones y seguimiento asíncrono. Si la tarea es simplemente "editar este archivo desde la terminal", Pi o una herramienta nativa de codificación puede ser una opción más limpia.

2. Control frente a flujo gestionado es una concesión real

El mercado se está dividiendo en dos extremos útiles.

En un extremo, Pi da a usuarios expertos un arnés compacto. Puedes ver las piezas, conectar tus propias extensiones y mantener el agente cerca del shell. Eso es excelente para constructores de agentes y usuarios avanzados de terminal.

En el otro extremo, Codex, Claude Code y MCPlato ofrecen superficies de producto más gestionadas. Codex documenta modos sandbox como read-only, workspace-write y danger-full-access, además de políticas de aprobación como untrusted, on-request y never; su postura por defecto se describe como workspace-write con la red apagada.⁷ El quickstart de Claude Code dice que pide permiso antes de modificar archivos, y su documentación de settings/permissions da a los equipos formas de ajustar el comportamiento.⁸⁹ MCPlato expone conceptos públicos de workspace como AI Partner, Desktop AI Engine, materiales conectados, ClawMode, tareas programadas/en segundo plano, trazas de decisión, diario y cuatro niveles de permisos.¹⁰¹¹

Hermes ocupa otro lugar: ofrece amplia autonomía y extensibilidad, pero el modelo de estado es más complejo. Su documentación enfatiza auto-mejora, memoria persistente, creación de skills, CLI/gateway/voice/MCP, tareas en segundo plano, automatizaciones programadas y subagents.⁴ Eso lo hace prometedor para asistentes de larga vida, pero no automáticamente más seguro. Los problemas de memoria y compresión, incluidas discusiones como issue #33256, recuerdan que el estado persistente de un agente requiere revisión cuidadosa, no confianza ciega.¹²

La mejor elección depende de si quieres ensamblar el plano de control o usar un producto que ya te da uno.

3. El trabajo largo necesita checkpoints, recuperación y artifacts

Las tareas cortas de codificación pueden sobrevivir como chat. El trabajo largo no.

Una tarea larga de agente debería tener:

un contrato de prompt;
un contexto/entorno curado;
límites de permisos;
checkpoints;
artifacts revisables;
una ruta de recuperación o continuación.

Pila de control para tareas largas de agentes de IA

Figura 2: el trabajo largo con agentes es más seguro cuando el control está por capas, en lugar de oculto dentro de un único hilo de chat.

Cada producto lo aborda de forma distinta:

Pi ofrece primitivas útiles como árboles de sesiones, forks, clones, compactación y registros JSONL. Excelente para exploración controlada; menos completo como capa operativa terminada.
Hermes apunta a memoria durable y automatizaciones programadas/en segundo plano. Potente para continuidad; más arriesgado cuando la calidad de la memoria, la compresión o los bucles de retroalimentación de auto-mejora no se inspeccionan.
Codex admite tareas de codificación locales y en la nube, MCP, búsqueda web, entradas de imagen y ejecución con scripts en sus superficies de codificación.¹³
Claude Code añade subagents con contexto/acceso a herramientas independiente, skills, MCP, GitHub Actions/GitLab CI, Slack y flujos programados o rutinarios en su documentación.¹⁴¹⁵¹⁶
MCPlato es más fuerte cuando el trabajo largo no es solo código: ramas de investigación, redacción de documentos, revisión de navegador/materiales, producción de imagen o artifact de oficina y tareas en segundo plano pueden vivir como flujos a nivel de workspace, no como un chat sobrecargado.

Regla práctica: si la tarea durará más de una sesión, exige un artifact y un plan de checkpoints antes de dejar que el agente avance demasiado.

4. El mejor agente es el que encaja con tu entorno

Las interfaces importan porque moldean los errores.

Tu entorno diario	Preferir	Vigilar
Terminal y scripts	Pi	Añade tu propia disciplina de permisos y recuperación
Editor de código + repositorio + cola de tareas en la nube	Codex	Mantén los flujos no relacionados con código en otro lugar
Bucle de ingeniería terminal/IDE/CI/chatops	Claude Code	Define reglas de repositorio, permisos de herramientas y checkpoints de revisión
Framework de asistente, pasarelas, voz, memoria, automatización	Hermes	Audita cuidadosamente la memoria y el comportamiento programado
Trabajo de conocimiento de escritorio entre archivos, navegador, artifacts de oficina y varias sesiones	MCPlato	Usa materiales conectados curados; no lo sobreutilices para tareas diminutas solo de shell

Esta es también la forma más sencilla de evitar la proliferación de herramientas. No fuerces cada trabajo a pasar por el agente más nuevo. Pon cada herramienta donde su interfaz ya resulta natural.

5. La estrategia de permisos debe coincidir con el riesgo

El agente con más autonomía no siempre tiene el mejor modelo de permisos para tu tarea.

Una estrategia ligera de permisos funciona bien:

Nivel de riesgo	Ejemplos	Política recomendada
Bajo	Leer archivos, resumir documentos, buscar materiales aprobados	Permitir con registro
Medio	Editar borradores, crear informes, ejecutar scripts locales	Permitir en workspace o sandbox, exigir artifacts
Alto	Borrar, desplegar, publicar, enviar mensajes externos, acceder a sistemas sensibles	Exigir confirmación explícita y evidencia

La documentación pública de sandbox y aprobaciones de Codex hace explícita esta discusión.⁷ La documentación de Claude Code enfatiza permissions/settings más que una única promesa de sandbox.⁹ El valor por defecto mínimo de Pi significa que la estrategia de permisos suele ser responsabilidad de tu wrapper. Los usuarios de Hermes deberían tener especial cuidado con automatizaciones en segundo plano y memoria persistente. MCPlato se usa mejor con un límite de riesgo a nivel de workspace: conecta solo los materiales necesarios, elige un nivel de permisos adecuado y haz que el artifact final sea revisable antes de cualquier acción externa.

Aspectos destacados y limitaciones honestas

Pi Agent: minimalismo como función

Pi resulta convincente porque se niega a convertirse en un workspace completo. Su conjunto de herramientas por defecto es pequeño, su mecánica de sesiones es amigable para desarrolladores y sus múltiples puntos de entrada lo hacen atractivo para quienes construyen sus propios flujos de agentes.

Elige Pi cuando quieras control, hackabilidad e iteración nativa de terminal. No lo elijas esperando gobernanza pulida, cobertura de flujos de oficina u operaciones autónomas en segundo plano desde el primer momento.

Hermes Agent: energía de asistente de larga vida

Hermes es el más ambicioso en lenguaje de memoria y auto-mejora. Memoria persistente, creación de skills, pasarelas, voz, MCP, subagents y automatizaciones programadas/en segundo plano lo hacen atractivo si quieres un asistente que sobreviva entre tareas.⁴

Elige Hermes cuando te sientas cómodo gestionando autonomía con estado. Evita tratar su bucle de aprendizaje como inherentemente fiable. La memoria solo es útil cuando puede inspeccionarse, corregirse y limitarse.

Codex: codificación gestionada entre superficies

Codex encaja mejor cuando la unidad de trabajo es ingeniería de software y quieres un sistema en escritorio, IDE, CLI, nube/web y flujos GitHub @codex.¹³¹⁷¹⁸ Su vocabulario de sandbox y aprobación es especialmente útil para equipos que necesitan hablar del riesgo de forma concreta.

Elige Codex para trabajo de codificación con opciones de ejecución gestionadas. No esperes que reemplace un workspace general para documentos de oficina, síntesis de investigación o trabajo de conocimiento multiapp.

Claude Code: bucle de codificación agentic maduro

Claude Code trata menos de ser un arnés pequeño y más de ser un compañero profesional completo de codificación. Su documentación pública cubre uso en terminal, integraciones IDE, superficies desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack y puntos de entrada Agent SDK.¹⁴¹⁹¹⁵¹⁶

Elige Claude Code para mantenimiento serio de repositorios y flujos de ingeniería. La limitación es que la madurez no elimina la necesidad de gobernanza: los equipos aún necesitan permisos, estándares de codificación, requisitos de pruebas y checkpoints de revisión.

MCPlato: trabajo de IA centrado en workspace

MCPlato no intenta vencer a Pi como arnés diminuto de terminal. Su posicionamiento público es un AI workspace con AI Partners, Desktop AI Engine, flujos asíncronos, materiales conectados local-first, orquestación multisesión, trabajo multiventana, conceptos de socio virtual/Sprite, disciplina de artifacts, tareas programadas/en segundo plano, ClawMode, ejecución observable con permisos, traza de decisión y diario.¹⁰

Elige MCPlato cuando el entregable sea un informe, comparación, resumen de investigación, artifact de oficina, flujo multiapp o tarea larga en segundo plano. Es especialmente útil cuando el trabajo necesita varias sesiones: una para investigación, otra para redacción, otra para generación de imágenes, otra para limpieza de fuentes y un socio coordinador que sigue lo que está hecho.

La limitación es la complejidad. Si tu trabajo es editar un solo archivo en la terminal, un arnés mínimo puede sentirse más rápido.

Una estrategia práctica de selección

Usa una pequeña cartera en lugar de buscar un agente universal:

Usa Pi por defecto para pequeños experimentos nativos de terminal y construcción de arneses personalizados.
Usa Codex o Claude Code cuando el centro de gravedad sea un repositorio, pruebas, pull requests y CI.
Usa Hermes para asistentes siempre activos experimentales, memoria, pasarelas y escenarios de automatización donde puedas auditar el estado.
Usa MCPlato cuando el trabajo cruce investigación, materiales locales, contexto de navegador, artifacts de oficina, varias sesiones o seguimiento en segundo plano.
Escala permisos solo cuando el artifact sea inspeccionable. Leer primero, redactar después, escribir luego, publicar/desplegar/enviar al final.

El patrón ganador no es la autonomía máxima. Es autonomía limitada ajustada al trabajo.

Conclusión

El ascenso de Pi tiene sentido: muchos usuarios técnicos quieren un arnés más pequeño y legible después de lidiar con productos agent más pesados. Hermes muestra el atractivo y el riesgo del estado persistente de asistente. Codex y Claude Code muestran lo rápido que los agentes de codificación se están convirtiendo en flujos completos de ingeniería. MCPlato apunta a otra categoría: el AI workspace para trabajo de conocimiento, artifacts, materiales locales y ejecución paralela.

Ninguno es universalmente el mejor. El agente correcto es aquel cuya interfaz, modelo de permisos e historia de recuperación coinciden con el trabajo que realmente estás haciendo.

Referencias

Footnotes

Repositorio GitHub canónico de Pi, earendil-works/pi. https://github.com/earendil-works/pi ↩
Repositorio GitHub de Hermes Agent, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩
Repositorio GitHub de OpenAI Codex. https://github.com/openai/codex ↩
Documentación de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Sitio web oficial de Pi. https://pi.dev/ ↩
Paquete npm @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
Documentación de OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩²
Documentación quickstart de Claude Code. https://code.claude.com/docs/en/quickstart ↩
Documentación settings de Claude Code. https://code.claude.com/docs/en/settings ↩ ↩²
Sitio web oficial de MCPlato. https://mcplato.com/en/ ↩ ↩²
Información de precios de MCPlato. https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
Documentación de OpenAI Codex. https://developers.openai.com/codex ↩ ↩²
Documentación de visión general de Claude Code. https://code.claude.com/docs/en/overview ↩ ↩²
Documentación sub-agents de Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩²
Documentación skills de Claude Code. https://code.claude.com/docs/en/skills ↩ ↩²
Documentación de OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
Documentación de OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
Documentación MCP de Claude Code. https://code.claude.com/docs/en/mcp ↩

Leer más

La pila de agentes en H1 de 2026: modelos, harnesses, runtimes y espacios de trabajo AI
Un panorama conciso de H1 de 2026 sobre AI agents, agentes de código, harnesses, runtimes, infraestructura de navegador y sandbox, observabilidad, gobernanza y espacios de trabajo AI, con MCPlato situado en la capa de workspace.
Como usar agentes de IA generales sin perder el control
Los agentes de IA generales son mas utiles cuando operan dentro de workflows acotados e inspeccionables. Esta guia cubre contratos de prompt, estructura para tareas largas, puntos de control humanos, entornos curados y artefactos revisables para agentes como Hermes, gateways de estilo OpenClaw y MCPlato.
Codex construye la herramienta de mercado. MCPlato opera la mesa de investigación.
Guía práctica de Codex vs MCPlato para mercados predictivos: informes recurrentes, modelos locales, registros de decisión, Wands y revisión humana.