agentes de IA

agentes de codificação

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi, Hermes, Codex, Claude Code e MCPlato: qual Agent combina com o seu trabalho?

Uma comparação prática, baseada em cenários, entre Pi Agent, Hermes Agent, Codex, Claude Code e MCPlato em controle, ajuste ao fluxo de trabalho, tarefas longas e estratégia de permissões.

MCPlato Research TeamPublicado em 2026-05-27

A pergunta útil não é: "Qual AI agent é o mais forte?"

Ela é: "Qual agent combina com este trabalho, este ambiente e este nível de risco?"

Pi Agent, Hermes Agent, Codex, Claude Code e MCPlato são todos chamados de agentes, mas não tentam ser o mesmo produto. Pi é um harness mínimo de codificação no terminal. Hermes é um framework de assistente com forte foco em memória e automação. Codex é um fluxo de codificação gerenciado em superfícies locais e de nuvem. Claude Code é um loop de codificação agentic maduro com fortes fluxos de repositório. MCPlato é um AI workspace para pesquisa, relatórios, trabalho de escritório, materiais locais, execução multissessão e tarefas em segundo plano.

Durante a pesquisa, a GitHub API retornou 56,110 stars e 6,677 forks para earendil-works/pi, 169,745 stars e 28,286 forks para NousResearch/hermes-agent, e 86,227 stars e 12,601 forks para openai/codex.¹²³ Trate esses números como sinais de atenção ao repositório, não como contagens de usuários ativos.

Esta é uma comparação prática, não um ranking de produtos.

Ajuste do produto em resumo

Produto	Melhor encaixe	Por que as pessoas escolhem	Principal troca
Pi Agent	Usuários avançados nativos de terminal, construtores de agentes, usuários de harness mínimo	Superfície pequena, ferramentas diretas de arquivo/bash, modos interativo e JSON/RPC/SDK, árvore de sessões e fork	Você assume governança, extensões e disciplina de fluxos longos
Hermes Agent	Assistentes sempre ativos, experimentos de memória, automações, gateways tipo bot	Memória persistente, enquadramento de autoaperfeiçoamento, criação de skills, mais de 70 ferramentas integradas⁴, subagents e automações agendadas/em segundo plano	Memória, compressão e loops de aprendizado adicionam complexidade de estado e modos de falha
Codex	Fluxos de codificação em CLI, IDE, desktop, nuvem e GitHub	Documentação forte de sandbox e aprovações, tarefas em nuvem, MCP, busca web, entradas de imagem, scripts exec	Principalmente um fluxo de codificação, não um workspace geral de escritório ou multiapp
Claude Code	Manutenção de repositórios, refatoração, CI, revisão de código, fluxos subagent/skill	Loop de codificação agentic maduro em terminal, IDEs, desktop/web, GitHub/GitLab, Slack, MCP, Agent SDK	Menos hackeável que um harness mínimo e ainda precisa de governança explícita
MCPlato	Pesquisa, relatórios, fluxos de escritório, materiais locais, tarefas multiapp, padrões de colega de IA assíncrono	AI workspace, AI Partner, orquestração multissessão, materiais conectados local-first, artifacts, tarefas agendadas/em segundo plano, execução com permissões	Mais pesado que um harness mínimo de terminal; não é o caminho mais rápido para codificação shell pontual

Mapa de ajuste por cenário para Pi, Hermes, Codex, Claude Code e MCPlato

Figura 1: pense em cenários e superfícies de trabalho, não em uma única tabela universal de líderes.

Por que Pi está chamando atenção

O apelo de Pi é fácil de entender se você já se frustrou com produtos agent pesados.

O projeto canônico é earendil-works/pi, com o site público em pi.dev, e o pacote npm @earendil-works/pi-coding-agent foi reportado como versão 0.75.5 durante a pesquisa.⁵⁶ Seu posicionamento é deliberadamente estreito: um harness mínimo de codificação no terminal com ferramentas padrão como read, write, edit e bash, além de ferramentas opcionais de busca/navegação somente leitura.

Esse minimalismo resolve várias dores de usuários:

Agentes demais escondem o plano de controle. Pi expõe um loop de ferramentas menor e mais inspecionável.
Usuários avançados querem composabilidade. Uso interativo, modo print/JSON, RPC e pontos de entrada SDK fazem Pi parecer um bloco de construção, não apenas um app.
Sessões longas precisam de ramificações. A árvore de sessões de Pi, o fluxo fork/clone, a compactação e o registro de sessão JSONL combinam com a forma como desenvolvedores realmente exploram alternativas.
Alguns usuários não querem popups como filosofia de produto. Pi não inclui por padrão MCP embutido, subagents, popups de permissão, plan mode ou bash em segundo plano. Isso pertence a extensões/pacotes, não ao núcleo.

A fraqueza é a mesma que a força: Pi não tenta ser uma camada de governança gerenciada. Se você precisa de política de permissões, recuperação de execução em segundo plano, revisão em equipe ou fluxos de escritório sem código logo de saída, terá de construir ou adicionar essa camada.

Os cinco princípios de escolha

1. Escolha pelo trabalho, não pelo "agent mais forte"

Um agente de codificação forte não é automaticamente um forte assistente de pesquisa. Um agente de memória flexível não é automaticamente seguro para repositórios de produção. Um agente de workspace não é automaticamente a ferramenta de terminal mais rápida.

Use o trabalho primeiro:

Trabalho	Bom encaixe padrão	Por quê
Construir ou personalizar um harness de codificação no terminal	Pi	Núcleo mínimo, ferramentas diretas, formato amigável a SDK/RPC
Executar um assistente pessoal sempre ativo ou gateway bot	Hermes	Memória, skills, automações, superfície orientada a voz/gateway/MCP
Delegar trabalho de codificação em CLI, IDE, nuvem e GitHub	Codex	Múltiplos pontos de entrada de codificação mais modos documentados de sandbox e aprovação
Manter um repositório sério com refatorações, CI, subagents e loops de revisão	Claude Code	Fluxos maduros de agente de código, permissions/settings, skills, subagents, superfícies CI/Slack
Produzir relatórios com fontes, artifacts de escritório, trabalho multiapp e pesquisa em segundo plano	MCPlato	Workspace, materiais conectados, orquestração multissessão, artifacts, tarefas agendadas/em segundo plano

É aí que MCPlato se encaixa naturalmente: não como "o melhor agent", mas como o melhor padrão quando o trabalho atravessa documentos, pesquisa no navegador, materiais locais, saídas de escritório, várias sessões e acompanhamento assíncrono. Se a tarefa é simplesmente "editar este arquivo pelo terminal", Pi ou uma ferramenta nativa de codificação pode ser uma opção mais limpa.

2. Controle versus fluxo gerenciado é uma troca real

O mercado está se dividindo em dois extremos úteis.

Em uma ponta, Pi dá a usuários especialistas um harness compacto. Você pode ver as peças, conectar suas próprias extensões e manter o agente perto do shell. Isso é excelente para construtores de agentes e usuários avançados de terminal.

Na outra ponta, Codex, Claude Code e MCPlato oferecem superfícies de produto mais gerenciadas. Codex documenta modos sandbox como read-only, workspace-write e danger-full-access, além de políticas de aprovação como untrusted, on-request e never; sua postura padrão é descrita como workspace-write com rede desligada.⁷ O quickstart de Claude Code afirma que ele pede permissão antes de modificar arquivos, e sua documentação de settings/permissions dá às equipes formas de ajustar o comportamento.⁸⁹ MCPlato expõe conceitos públicos de workspace como AI Partner, Desktop AI Engine, materiais conectados, ClawMode, tarefas agendadas/em segundo plano, trilhas de decisão, diário e quatro níveis de permissão.¹⁰¹¹

Hermes fica em outro lugar: oferece ampla autonomia e extensibilidade, mas o modelo de estado é mais complexo. Sua documentação enfatiza autoaperfeiçoamento, memória persistente, criação de skills, CLI/gateway/voice/MCP, tarefas em segundo plano, automações agendadas e subagents.⁴ Isso o torna promissor para assistentes de longa duração, mas não automaticamente mais seguro. Problemas de memória e compressão, incluindo discussões como issue #33256, lembram que estado persistente de agente precisa de revisão cuidadosa, não de confiança cega.¹²

A melhor escolha depende de você querer montar o plano de controle ou usar um produto que já fornece um.

3. Trabalho de longa duração precisa de checkpoints, recuperação e artifacts

Tarefas curtas de codificação podem sobreviver como chat. Trabalho longo, não.

Uma tarefa longa de agente deve ter:

um contrato de prompt;
um contexto/ambiente curado;
limites de permissão;
checkpoints;
artifacts revisáveis;
um caminho de recuperação ou continuação.

Pilha de controle para tarefas longas de agentes de IA

Figura 2: trabalho agent longo é mais seguro quando o controle é em camadas, em vez de ficar escondido dentro de um único fio de chat.

Cada produto aborda isso de modo diferente:

Pi oferece primitivas úteis como árvores de sessão, forks, clones, compactação e registros JSONL. Ótimo para exploração controlada; menos completo como camada operacional pronta.
Hermes mira memória durável e automações agendadas/em segundo plano. Poderoso para continuidade; mais arriscado quando a qualidade da memória, a compressão ou os loops de feedback de autoaperfeiçoamento não são inspecionados.
Codex dá suporte a tarefas de codificação locais e em nuvem, MCP, busca web, entradas de imagem e execução por scripts em suas superfícies de codificação.¹³
Claude Code adiciona subagents com contexto/acesso a ferramentas independentes, skills, MCP, GitHub Actions/GitLab CI, Slack e fluxos agendados ou de rotina em sua documentação.¹⁴¹⁵¹⁶
MCPlato é mais forte quando o trabalho longo não é apenas código: ramos de pesquisa, redação de documentos, revisão de navegador/materiais, produção de imagem ou artifact de escritório e tarefas em segundo plano podem viver como fluxos de trabalho no nível do workspace, em vez de um chat sobrecarregado.

Regra prática: se a tarefa durar mais de uma sessão, exija um artifact e um plano de checkpoints antes de deixar o agente avançar muito.

4. O melhor agente é o que combina com o seu ambiente

Interfaces importam porque moldam erros.

Seu ambiente diário	Prefira	Atenção a
Terminal e scripts	Pi	Adicione sua própria disciplina de permissões e recuperação
Editor de código + repositório + fila de tarefas na nuvem	Codex	Mantenha fluxos não relacionados a código em outro lugar
Loop de engenharia terminal/IDE/CI/chatops	Claude Code	Defina regras de repositório, permissões de ferramentas e checkpoints de revisão
Framework de assistente, gateways, voz, memória, automação	Hermes	Audite cuidadosamente memória e comportamento agendado
Trabalho de conhecimento no desktop entre arquivos, navegador, artifacts de escritório e várias sessões	MCPlato	Use materiais conectados curados; não exagere em tarefas minúsculas só de shell

Esta também é a maneira mais simples de evitar proliferação de ferramentas. Não force todo trabalho pelo agente mais novo. Coloque cada ferramenta onde sua interface já é natural.

5. A estratégia de permissões deve corresponder ao risco

O agente com mais autonomia nem sempre tem o melhor modelo de permissões para sua tarefa.

Uma estratégia leve funciona bem:

Nível de risco	Exemplos	Política recomendada
Baixo	Ler arquivos, resumir documentos, buscar materiais aprovados	Permitir com registro
Médio	Editar rascunhos, criar relatórios, executar scripts locais	Permitir no workspace ou sandbox, exigir artifacts
Alto	Excluir, implantar, publicar, enviar mensagens externas, acessar sistemas sensíveis	Exigir confirmação explícita e evidências

A documentação pública de sandbox e aprovação do Codex torna essa discussão explícita.⁷ A documentação de Claude Code enfatiza permissions/settings em vez de uma única promessa de sandbox.⁹ O padrão mínimo de Pi significa que a estratégia de permissões muitas vezes é responsabilidade do seu wrapper. Usuários de Hermes devem ter cuidado extra com automações em segundo plano e memória persistente. MCPlato é melhor usado com um limite de risco no nível do workspace: conecte apenas os materiais necessários, escolha um nível de permissão apropriado e torne o artifact final revisável antes de qualquer ação externa.

Destaques dos produtos e limitações honestas

Pi Agent: minimalismo como recurso

Pi é convincente porque se recusa a virar um workspace completo. Seu conjunto padrão de ferramentas é pequeno, sua mecânica de sessões é amigável para desenvolvedores, e seus múltiplos pontos de entrada o tornam atraente para quem constrói seus próprios fluxos de agentes.

Escolha Pi quando quiser controle, hackabilidade e iteração nativa de terminal. Não o escolha esperando governança polida, cobertura de fluxos de escritório ou operações autônomas em segundo plano logo de saída.

Hermes Agent: energia de assistente duradouro

Hermes é o mais ambicioso na linguagem de memória e autoaperfeiçoamento. Memória persistente, criação de skills, gateways, voz, MCP, subagents e automações agendadas/em segundo plano o tornam atraente se você quer um assistente que sobreviva entre tarefas.⁴

Escolha Hermes quando estiver confortável em gerenciar autonomia com estado. Evite tratar seu loop de aprendizado como inerentemente confiável. Memória só é útil quando é inspecionável, corrigível e limitada.

Codex: codificação gerenciada entre superfícies

Codex é o melhor encaixe quando a unidade de trabalho é engenharia de software e você quer um sistema em desktop, IDE, CLI, nuvem/web e fluxos GitHub @codex.¹³¹⁷¹⁸ Seu vocabulário de sandbox e aprovação é especialmente útil para equipes que precisam discutir risco de forma concreta.

Escolha Codex para trabalho de codificação com escolhas de execução gerenciadas. Não espere que ele substitua um workspace geral para documentos de escritório, síntese de pesquisa ou trabalho de conhecimento multiapp.

Claude Code: loop de codificação agentic maduro

Claude Code trata menos de ser um harness pequeno e mais de ser um companheiro profissional completo de codificação. Sua documentação pública cobre uso no terminal, integrações IDE, superfícies desktop/web, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack e pontos de entrada Agent SDK.¹⁴¹⁹¹⁵¹⁶

Escolha Claude Code para manutenção séria de repositórios e fluxos de engenharia. A limitação é que maturidade não remove a necessidade de governança: equipes ainda precisam de permissões, padrões de codificação, requisitos de testes e checkpoints de revisão.

MCPlato: trabalho de IA com workspace em primeiro lugar

MCPlato não tenta vencer Pi como um pequeno harness de terminal. Seu posicionamento público é um AI workspace com AI Partners, Desktop AI Engine, fluxos assíncronos, materiais conectados local-first, orquestração multissessão, trabalho multi-janela, conceitos de parceiro virtual/Sprite, disciplina de artifact, tarefas agendadas/em segundo plano, ClawMode, execução observável com permissões, trilha de decisão e diário.¹⁰

Escolha MCPlato quando a entrega for um relatório, comparação, briefing de pesquisa, artifact de escritório, fluxo multiapp ou tarefa longa em segundo plano. Ele é especialmente útil quando o trabalho precisa de várias sessões: uma para pesquisa, uma para redação, uma para geração de imagem, uma para limpeza de fontes e um parceiro coordenador que acompanha o que foi feito.

A limitação é a complexidade. Se seu trabalho é editar um único arquivo no terminal, um harness mínimo pode parecer mais rápido.

Uma estratégia prática de seleção

Use um pequeno portfólio em vez de procurar um agente universal:

Use Pi por padrão para pequenos experimentos nativos de terminal e construção de harness personalizado.
Use Codex ou Claude Code quando o centro de gravidade for repositório, testes, pull requests e CI.
Use Hermes para assistentes experimentais sempre ativos, memória, gateway e cenários de automação em que você pode auditar o estado.
Use MCPlato quando o trabalho atravessar pesquisa, materiais locais, contexto de navegador, artifacts de escritório, várias sessões ou acompanhamento em segundo plano.
Eleve permissões apenas quando o artifact for inspecionável. Leia primeiro, rascunhe depois, escreva em seguida, publique/implante/envie por último.

O padrão vencedor não é autonomia máxima. É autonomia limitada combinada com o trabalho.

Conclusão

A ascensão de Pi faz sentido: muitos usuários técnicos querem um harness menor e mais legível depois de lidar com produtos agent mais pesados. Hermes mostra o apelo e o risco do estado persistente de assistente. Codex e Claude Code mostram a rapidez com que agentes de codificação estão se tornando fluxos completos de engenharia. MCPlato aponta para outra categoria: o AI workspace para trabalho de conhecimento, artifacts, materiais locais e execução paralela.

Nenhum é universalmente o melhor. O agente certo é aquele cuja interface, modelo de permissões e história de recuperação combinam com o trabalho que você realmente está fazendo.

Referências

Footnotes

Repositório GitHub canônico de Pi, earendil-works/pi. https://github.com/earendil-works/pi ↩
Repositório GitHub de Hermes Agent, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩
Repositório GitHub OpenAI Codex. https://github.com/openai/codex ↩
Documentação de Hermes Agent. https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Site oficial de Pi. https://pi.dev/ ↩
Pacote npm @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
Documentação OpenAI Codex sandbox. https://developers.openai.com/codex/sandbox ↩ ↩²
Documentação quickstart do Claude Code. https://code.claude.com/docs/en/quickstart ↩
Documentação settings do Claude Code. https://code.claude.com/docs/en/settings ↩ ↩²
Site oficial da MCPlato. https://mcplato.com/en/ ↩ ↩²
Informações de preços da MCPlato. https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
Documentação OpenAI Codex. https://developers.openai.com/codex ↩ ↩²
Documentação de visão geral do Claude Code. https://code.claude.com/docs/en/overview ↩ ↩²
Documentação sub-agents do Claude Code. https://code.claude.com/docs/en/sub-agents ↩ ↩²
Documentação skills do Claude Code. https://code.claude.com/docs/en/skills ↩ ↩²
Documentação OpenAI Codex CLI. https://developers.openai.com/codex/cli ↩
Documentação OpenAI Codex IDE. https://developers.openai.com/codex/ide ↩
Documentação MCP do Claude Code. https://code.claude.com/docs/en/mcp ↩

Ler Mais

A pilha de agentes no H1 de 2026: modelos, harnesses, runtimes e workspaces AI
Um panorama conciso do H1 de 2026 sobre AI agents, agentes de código, harnesses, runtimes, infraestrutura de navegador e sandbox, observabilidade, governança e workspaces AI, com MCPlato posicionado como parte da camada de workspace.
Como usar agentes de IA gerais sem perder o controle
Agentes de IA gerais sao mais uteis quando operam dentro de workflows delimitados e inspecionaveis. Este guia cobre contratos de prompt, estrutura para tarefas longas, pontos de verificacao humanos, ambientes curados e artefatos revisaveis para agentes como Hermes, gateways no estilo OpenClaw e MCPlato.
Codex constrói a ferramenta de mercado. MCPlato opera a mesa de pesquisa.
Guia prático de Codex vs MCPlato para pesquisa em mercados preditivos: briefs recorrentes, modelos locais, logs de decisão, Wands e revisão humana.