Pi, Hermes, Codex, Claude Code e MCPlato: qual Agent combina com o seu trabalho?
Uma comparação prática, baseada em cenários, entre Pi Agent, Hermes Agent, Codex, Claude Code e MCPlato em controle, ajuste ao fluxo de trabalho, tarefas longas e estratégia de permissões.
Publicado em 2026-05-27
A pergunta útil não é: "Qual AI agent é o mais forte?"
Ela é: "Qual agent combina com este trabalho, este ambiente e este nível de risco?"
Pi Agent, Hermes Agent, Codex, Claude Code e MCPlato são todos chamados de agentes, mas não tentam ser o mesmo produto. Pi é um harness mínimo de codificação no terminal. Hermes é um framework de assistente com forte foco em memória e automação. Codex é um fluxo de codificação gerenciado em superfícies locais e de nuvem. Claude Code é um loop de codificação agentic maduro com fortes fluxos de repositório. MCPlato é um AI workspace para pesquisa, relatórios, trabalho de escritório, materiais locais, execução multissessão e tarefas em segundo plano.
Durante a pesquisa, a GitHub API retornou 56,110 stars e 6,677 forks para earendil-works/pi, 169,745 stars e 28,286 forks para NousResearch/hermes-agent, e 86,227 stars e 12,601 forks para openai/codex.123 Trate esses números como sinais de atenção ao repositório, não como contagens de usuários ativos.
Esta é uma comparação prática, não um ranking de produtos.
Ajuste do produto em resumo
| Produto | Melhor encaixe | Por que as pessoas escolhem | Principal troca |
|---|---|---|---|
| Pi Agent | Usuários avançados nativos de terminal, construtores de agentes, usuários de harness mínimo | Superfície pequena, ferramentas diretas de arquivo/bash, modos interativo e JSON/RPC/SDK, árvore de sessões e fork | Você assume governança, extensões e disciplina de fluxos longos |
| Hermes Agent | Assistentes sempre ativos, experimentos de memória, automações, gateways tipo bot | Memória persistente, enquadramento de autoaperfeiçoamento, criação de skills, mais de 70 ferramentas integradas4, subagents e automações agendadas/em segundo plano | Memória, compressão e loops de aprendizado adicionam complexidade de estado e modos de falha |
| Codex | Fluxos de codificação em CLI, IDE, desktop, nuvem e GitHub | Documentação forte de sandbox e aprovações, tarefas em nuvem, MCP, busca web, entradas de imagem, scripts exec | Principalmente um fluxo de codificação, não um workspace geral de escritório ou multiapp |
| Claude Code | Manutenção de repositórios, refatoração, CI, revisão de código, fluxos subagent/skill | Loop de codificação agentic maduro em terminal, IDEs, desktop/web, GitHub/GitLab, Slack, MCP, Agent SDK | Menos hackeável que um harness mínimo e ainda precisa de governança explícita |
| MCPlato | Pesquisa, relatórios, fluxos de escritório, materiais locais, tarefas multiapp, padrões de colega de IA assíncrono | AI workspace, AI Partner, orquestração multissessão, materiais conectados local-first, artifacts, tarefas agendadas/em segundo plano, execução com permissões | Mais pesado que um harness mínimo de terminal; não é o caminho mais rápido para codificação shell pontual |
Mapa de ajuste por cenário para Pi, Hermes, Codex, Claude Code e MCPlato
Figura 1: pense em cenários e superfícies de trabalho, não em uma única tabela universal de líderes.
Por que Pi está chamando atenção
O apelo de Pi é fácil de entender se você já se frustrou com produtos agent pesados.
O projeto canônico é earendil-works/pi, com o site público em pi.dev, e o pacote npm @earendil-works/pi-coding-agent foi reportado como versão 0.75.5 durante a pesquisa.56 Seu posicionamento é deliberadamente estreito: um harness mínimo de codificação no terminal com ferramentas padrão como read, write, edit e bash, além de ferramentas opcionais de busca/navegação somente leitura.
Esse minimalismo resolve várias dores de usuários:
- Agentes demais escondem o plano de controle. Pi expõe um loop de ferramentas menor e mais inspecionável.
- Usuários avançados querem composabilidade. Uso interativo, modo print/JSON, RPC e pontos de entrada SDK fazem Pi parecer um bloco de construção, não apenas um app.
- Sessões longas precisam de ramificações. A árvore de sessões de Pi, o fluxo fork/clone, a compactação e o registro de sessão JSONL combinam com a forma como desenvolvedores realmente exploram alternativas.
- Alguns usuários não querem popups como filosofia de produto. Pi não inclui por padrão MCP embutido, subagents, popups de permissão, plan mode ou bash em segundo plano. Isso pertence a extensões/pacotes, não ao núcleo.
A fraqueza é a mesma que a força: Pi não tenta ser uma camada de governança gerenciada. Se você precisa de política de permissões, recuperação de execução em segundo plano, revisão em equipe ou fluxos de escritório sem código logo de saída, terá de construir ou adicionar essa camada.
Os cinco princípios de escolha
1. Escolha pelo trabalho, não pelo "agent mais forte"
Um agente de codificação forte não é automaticamente um forte assistente de pesquisa. Um agente de memória flexível não é automaticamente seguro para repositórios de produção. Um agente de workspace não é automaticamente a ferramenta de terminal mais rápida.
Use o trabalho primeiro:
| Trabalho | Bom encaixe padrão | Por quê |
|---|---|---|
| Construir ou personalizar um harness de codificação no terminal | Pi | Núcleo mínimo, ferramentas diretas, formato amigável a SDK/RPC |
| Executar um assistente pessoal sempre ativo ou gateway bot | Hermes | Memória, skills, automações, superfície orientada a voz/gateway/MCP |
| Delegar trabalho de codificação em CLI, IDE, nuvem e GitHub | Codex | Múltiplos pontos de entrada de codificação mais modos documentados de sandbox e aprovação |
| Manter um repositório sério com refatorações, CI, subagents e loops de revisão | Claude Code | Fluxos maduros de agente de código, permissions/settings, skills, subagents, superfícies CI/Slack |
| Produzir relatórios com fontes, artifacts de escritório, trabalho multiapp e pesquisa em segundo plano | MCPlato | Workspace, materiais conectados, orquestração multissessão, artifacts, tarefas agendadas/em segundo plano |
É aí que MCPlato se encaixa naturalmente: não como "o melhor agent", mas como o melhor padrão quando o trabalho atravessa documentos, pesquisa no navegador, materiais locais, saídas de escritório, várias sessões e acompanhamento assíncrono. Se a tarefa é simplesmente "editar este arquivo pelo terminal", Pi ou uma ferramenta nativa de codificação pode ser uma opção mais limpa.
2. Controle versus fluxo gerenciado é uma troca real
O mercado está se dividindo em dois extremos úteis.
Em uma ponta, Pi dá a usuários especialistas um harness compacto. Você pode ver as peças, conectar suas próprias extensões e manter o agente perto do shell. Isso é excelente para construtores de agentes e usuários avançados de terminal.
Na outra ponta, Codex, Claude Code e MCPlato oferecem superfícies de produto mais gerenciadas. Codex documenta modos sandbox como read-only, workspace-write e danger-full-access, além de políticas de aprovação como untrusted, on-request e never; sua postura padrão é descrita como workspace-write com rede desligada.7 O quickstart de Claude Code afirma que ele pede permissão antes de modificar arquivos, e sua documentação de settings/permissions dá às equipes formas de ajustar o comportamento.89 MCPlato expõe conceitos públicos de workspace como AI Partner, Desktop AI Engine, materiais conectados, ClawMode, tarefas agendadas/em segundo plano, trilhas de decisão, diário e quatro níveis de permissão.1011
Hermes fica em outro lugar: oferece ampla autonomia e extensibilidade, mas o modelo de estado é mais complexo. Sua documentação enfatiza autoaperfeiçoamento, memória persistente, criação de skills, CLI/gateway/voice/MCP, tarefas em segundo plano, automações agendadas e subagents.4 Isso o torna promissor para assistentes de longa duração, mas não automaticamente mais seguro. Problemas de memória e compressão, incluindo discussões como issue #33256, lembram que estado persistente de agente precisa de revisão cuidadosa, não de confiança cega.12
A melhor escolha depende de você querer montar o plano de controle ou usar um produto que já fornece um.
3. Trabalho de longa duração precisa de checkpoints, recuperação e artifacts
Tarefas curtas de codificação podem sobreviver como chat. Trabalho longo, não.
Uma tarefa longa de agente deve ter:
- um contrato de prompt;
- um contexto/ambiente curado;
- limites de permissão;
- checkpoints;
- artifacts revisáveis;
- um caminho de recuperação ou continuação.
Pilha de controle para tarefas longas de agentes de IA
Figura 2: trabalho agent longo é mais seguro quando o controle é em camadas, em vez de ficar escondido dentro de um único fio de chat.
Cada produto aborda isso de modo diferente:
- Pi oferece primitivas úteis como árvores de sessão, forks, clones, compactação e registros JSONL. Ótimo para exploração controlada; menos completo como camada operacional pronta.
- Hermes mira memória durável e automações agendadas/em segundo plano. Poderoso para continuidade; mais arriscado quando a qualidade da memória, a compressão ou os loops de feedback de autoaperfeiçoamento não são inspecionados.
- Codex dá suporte a tarefas de codificação locais e em nuvem, MCP, busca web, entradas de imagem e execução por scripts em suas superfícies de codificação.13
- Claude Code adiciona subagents com contexto/acesso a ferramentas independentes, skills, MCP, GitHub Actions/GitLab CI, Slack e fluxos agendados ou de rotina em sua documentação.141516
- MCPlato é mais forte quando o trabalho longo não é apenas código: ramos de pesquisa, redação de documentos, revisão de navegador/materiais, produção de imagem ou artifact de escritório e tarefas em segundo plano podem viver como fluxos de trabalho no nível do workspace, em vez de um chat sobrecarregado.
Regra prática: se a tarefa durar mais de uma sessão, exija um artifact e um plano de checkpoints antes de deixar o agente avançar muito.
4. O melhor agente é o que combina com o seu ambiente
Interfaces importam porque moldam erros.
| Seu ambiente diário | Prefira | Atenção a |
|---|---|---|
| Terminal e scripts | Pi | Adicione sua própria disciplina de permissões e recuperação |
| Editor de código + repositório + fila de tarefas na nuvem | Codex | Mantenha fluxos não relacionados a código em outro lugar |
| Loop de engenharia terminal/IDE/CI/chatops | Claude Code | Defina regras de repositório, permissões de ferramentas e checkpoints de revisão |
| Framework de assistente, gateways, voz, memória, automação | Hermes | Audite cuidadosamente memória e comportamento agendado |
| Trabalho de conhecimento no desktop entre arquivos, navegador, artifacts de escritório e várias sessões | MCPlato | Use materiais conectados curados; não exagere em tarefas minúsculas só de shell |
Esta também é a maneira mais simples de evitar proliferação de ferramentas. Não force todo trabalho pelo agente mais novo. Coloque cada ferramenta onde sua interface já é natural.
5. A estratégia de permissões deve corresponder ao risco
O agente com mais autonomia nem sempre tem o melhor modelo de permissões para sua tarefa.
Uma estratégia leve funciona bem:
| Nível de risco | Exemplos | Política recomendada |
|---|---|---|
| Baixo | Ler arquivos, resumir documentos, buscar materiais aprovados | Permitir com registro |
| Médio | Editar rascunhos, criar relatórios, executar scripts locais | Permitir no workspace ou sandbox, exigir artifacts |
| Alto | Excluir, implantar, publicar, enviar mensagens externas, acessar sistemas sensíveis | Exigir confirmação explícita e evidências |
A documentação pública de sandbox e aprovação do Codex torna essa discussão explícita.7 A documentação de Claude Code enfatiza permissions/settings em vez de uma única promessa de sandbox.9 O padrão mínimo de Pi significa que a estratégia de permissões muitas vezes é responsabilidade do seu wrapper. Usuários de Hermes devem ter cuidado extra com automações em segundo plano e memória persistente. MCPlato é melhor usado com um limite de risco no nível do workspace: conecte apenas os materiais necessários, escolha um nível de permissão apropriado e torne o artifact final revisável antes de qualquer ação externa.
Destaques dos produtos e limitações honestas
Pi Agent: minimalismo como recurso
Pi é convincente porque se recusa a virar um workspace completo. Seu conjunto padrão de ferramentas é pequeno, sua mecânica de sessões é amigável para desenvolvedores, e seus múltiplos pontos de entrada o tornam atraente para quem constrói seus próprios fluxos de agentes.
Escolha Pi quando quiser controle, hackabilidade e iteração nativa de terminal. Não o escolha esperando governança polida, cobertura de fluxos de escritório ou operações autônomas em segundo plano logo de saída.
Hermes Agent: energia de assistente duradouro
Hermes é o mais ambicioso na linguagem de memória e autoaperfeiçoamento. Memória persistente, criação de skills, gateways, voz, MCP, subagents e automações agendadas/em segundo plano o tornam atraente se você quer um assistente que sobreviva entre tarefas.4
Escolha Hermes quando estiver confortável em gerenciar autonomia com estado. Evite tratar seu loop de aprendizado como inerentemente confiável. Memória só é útil quando é inspecionável, corrigível e limitada.
Codex: codificação gerenciada entre superfícies
Codex é o melhor encaixe quando a unidade de trabalho é engenharia de software e você quer um sistema em desktop, IDE, CLI, nuvem/web e fluxos GitHub @codex.131718 Seu vocabulário de sandbox e aprovação é especialmente útil para equipes que precisam discutir risco de forma concreta.
Escolha Codex para trabalho de codificação com escolhas de execução gerenciadas. Não espere que ele substitua um workspace geral para documentos de escritório, síntese de pesquisa ou trabalho de conhecimento multiapp.
Claude Code: loop de codificação agentic maduro
Claude Code trata menos de ser um harness pequeno e mais de ser um companheiro profissional completo de codificação. Sua documentação pública cobre uso no terminal, integrações IDE, superfícies desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack e pontos de entrada Agent SDK.14191516
Escolha Claude Code para manutenção séria de repositórios e fluxos de engenharia. A limitação é que maturidade não remove a necessidade de governança: equipes ainda precisam de permissões, padrões de codificação, requisitos de testes e checkpoints de revisão.
MCPlato: trabalho de IA com workspace em primeiro lugar
MCPlato não tenta vencer Pi como um pequeno harness de terminal. Seu posicionamento público é um AI workspace com AI Partners, Desktop AI Engine, fluxos assíncronos, materiais conectados local-first, orquestração multissessão, trabalho multi-janela, conceitos de parceiro virtual/Sprite, disciplina de artifact, tarefas agendadas/em segundo plano, ClawMode, execução observável com permissões, trilha de decisão e diário.10
Escolha MCPlato quando a entrega for um relatório, comparação, briefing de pesquisa, artifact de escritório, fluxo multiapp ou tarefa longa em segundo plano. Ele é especialmente útil quando o trabalho precisa de várias sessões: uma para pesquisa, uma para redação, uma para geração de imagem, uma para limpeza de fontes e um parceiro coordenador que acompanha o que foi feito.
A limitação é a complexidade. Se seu trabalho é editar um único arquivo no terminal, um harness mínimo pode parecer mais rápido.
Uma estratégia prática de seleção
Use um pequeno portfólio em vez de procurar um agente universal:
- Use Pi por padrão para pequenos experimentos nativos de terminal e construção de harness personalizado.
- Use Codex ou Claude Code quando o centro de gravidade for repositório, testes, pull requests e CI.
- Use Hermes para assistentes experimentais sempre ativos, memória, gateway e cenários de automação em que você pode auditar o estado.
- Use MCPlato quando o trabalho atravessar pesquisa, materiais locais, contexto de navegador, artifacts de escritório, várias sessões ou acompanhamento em segundo plano.
- Eleve permissões apenas quando o artifact for inspecionável. Leia primeiro, rascunhe depois, escreva em seguida, publique/implante/envie por último.
O padrão vencedor não é autonomia máxima. É autonomia limitada combinada com o trabalho.
Conclusão
A ascensão de Pi faz sentido: muitos usuários técnicos querem um harness menor e mais legível depois de lidar com produtos agent mais pesados. Hermes mostra o apelo e o risco do estado persistente de assistente. Codex e Claude Code mostram a rapidez com que agentes de codificação estão se tornando fluxos completos de engenharia. MCPlato aponta para outra categoria: o AI workspace para trabalho de conhecimento, artifacts, materiais locais e execução paralela.
Nenhum é universalmente o melhor. O agente certo é aquele cuja interface, modelo de permissões e história de recuperação combinam com o trabalho que você realmente está fazendo.
Referências
Footnotes
-
Repositório GitHub canônico de Pi,
earendil-works/pi. https://github.com/earendil-works/pi ↩ -
Repositório GitHub de Hermes Agent,
NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩ -
Repositório GitHub OpenAI Codex. https://github.com/openai/codex ↩
-
Documentação de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Site oficial de Pi. https://pi.dev/ ↩
-
Pacote npm
@earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
Documentação OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩2
-
Documentação quickstart do Claude Code. https://code.claude.com/docs/en/quickstart ↩
-
Documentação settings do Claude Code. https://code.claude.com/docs/en/settings ↩ ↩2
-
Site oficial da MCPlato. https://mcplato.com/en/ ↩ ↩2
-
Informações de preços da MCPlato. https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
Documentação OpenAI Codex. https://developers.openai.com/codex ↩ ↩2
-
Documentação de visão geral do Claude Code. https://code.claude.com/docs/en/overview ↩ ↩2
-
Documentação sub-agents do Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Documentação skills do Claude Code. https://code.claude.com/docs/en/skills ↩ ↩2
-
Documentação OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
-
Documentação OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
-
Documentação MCP do Claude Code. https://code.claude.com/docs/en/mcp ↩
