AI 에이전트

코딩 에이전트

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi, Hermes, Codex, Claude Code, MCPlato: 내 작업에 맞는 Agent는 무엇일까?

Pi Agent, Hermes Agent, Codex, Claude Code, MCPlato를 제어, 워크플로 적합성, 장기 실행 작업, 권한 전략 관점에서 실용적으로 비교합니다.

MCPlato Research Team게시일 2026-05-27

유용한 질문은 "어떤 AI agent가 가장 강력한가?" 가 아닙니다.

진짜 질문은 "이 작업, 이 환경, 이 위험 수준에 맞는 agent는 무엇인가?" 입니다.

Pi Agent, Hermes Agent, Codex, Claude Code, MCPlato는 모두 agent라고 불리지만 같은 제품이 되려는 것은 아닙니다. Pi는 미니멀한 터미널 코딩 하네스입니다. Hermes는 메모리와 자동화에 강하게 초점을 맞춘 어시스턴트 프레임워크입니다. Codex는 로컬과 클라우드 표면을 아우르는 관리형 코딩 워크플로입니다. Claude Code는 강력한 저장소 워크플로를 갖춘 성숙한 agentic 코딩 루프입니다. MCPlato는 리서치, 보고서, 오피스 작업, 로컬 자료, 다중 세션 실행, 백그라운드 작업을 위한 AI workspace입니다.

조사 중 GitHub API는 earendil-works/pi에 대해 56,110 stars 및 6,677 forks, NousResearch/hermes-agent에 대해 169,745 stars 및 28,286 forks, openai/codex에 대해 86,227 stars 및 12,601 forks를 반환했습니다.¹²³ 이 숫자는 활성 사용자 수가 아니라 저장소 관심도의 신호로 보아야 합니다.

이 글은 실용적 비교이며 제품 순위가 아닙니다.

제품 적합성 한눈에 보기

제품	가장 잘 맞는 경우	사람들이 선택하는 이유	주요 절충점
Pi Agent	터미널 네이티브 파워 유저, agent 빌더, 미니멀 하네스 사용자	작은 표면, 직접적인 파일/bash 도구, 대화형 및 JSON/RPC/SDK 모드, 세션 트리와 포크	거버넌스, 확장, 장기 워크플로 규율을 직접 책임져야 함
Hermes Agent	상시 실행 어시스턴트, 메모리 실험, 자동화, 봇형 게이트웨이	영속 메모리, 자기 개선 프레이밍, skill 생성, 70개 이상 내장 도구⁴, subagents 및 예약/백그라운드 자동화	메모리, 압축, 학습 루프가 상태 복잡성과 실패 모드를 늘림
Codex	CLI, IDE, 데스크톱, 클라우드, GitHub를 넘나드는 코딩 워크플로	강력한 sandbox 및 승인 문서, 클라우드 작업, MCP, 웹 검색, 이미지 입력, exec 스크립팅	주로 코딩 워크플로이며 범용 오피스 또는 다중 앱 workspace는 아님
Claude Code	저장소 유지보수, 리팩터링, CI, 코드 리뷰, subagent/skill 워크플로	터미널, IDE, 데스크톱/웹, GitHub/GitLab, Slack, MCP, Agent SDK를 아우르는 성숙한 agentic 코딩 루프	미니멀 하네스만큼 개조하기 쉽지는 않으며 명시적 거버넌스가 여전히 필요
MCPlato	리서치, 보고서, 오피스 워크플로, 로컬 자료, 다중 앱 작업, 비동기 AI 동료 패턴	AI workspace, AI Partner, 다중 세션 오케스트레이션, local-first 연결 자료, artifacts, 예약/백그라운드 작업, 권한 기반 실행	미니멀 터미널 하네스보다 무겁고, 일회성 shell 코딩에는 가장 빠른 경로가 아님

Pi, Hermes, Codex, Claude Code, MCPlato의 시나리오 적합성 지도

그림 1: 하나의 보편적 순위표가 아니라 시나리오와 작업 표면으로 생각하라.

Pi가 주목받는 이유

무거운 agent 제품에 답답함을 느껴 본 적이 있다면 Pi의 매력은 이해하기 쉽습니다.

정식 프로젝트는 earendil-works/pi이고, 공개 웹사이트는 pi.dev이며, 조사 당시 npm 패키지 @earendil-works/pi-coding-agent는 0.75.5 버전으로 보고되었습니다.⁵⁶ 포지셔닝은 의도적으로 좁습니다. read, write, edit, bash 같은 기본 도구와 선택적 읽기 전용 검색/탐색 도구를 갖춘 미니멀 터미널 코딩 하네스입니다.

이 미니멀리즘은 몇 가지 사용자 고충을 해결합니다.

너무 많은 agent가 제어 평면을 숨긴다. Pi는 더 작고 검사하기 쉬운 도구 루프를 드러냅니다.
파워 유저는 조합 가능성을 원한다. 대화형 사용, print/JSON 모드, RPC, SDK 진입점 덕분에 Pi는 단순한 앱이 아니라 빌딩 블록처럼 느껴집니다.
긴 세션에는 분기가 필요하다. Pi의 세션 트리, fork/clone 흐름, 압축, JSONL 세션 기록은 개발자가 실제로 대안을 탐색하는 방식과 맞습니다.
일부 사용자는 팝업을 제품 철학으로 삼고 싶어 하지 않는다. Pi는 기본적으로 내장 MCP, subagents, 권한 팝업, plan mode, 백그라운드 bash를 제공하지 않습니다. 이런 것들은 핵심보다 확장/패키지에 속합니다.

약점은 강점과 같습니다. Pi는 관리형 거버넌스 계층이 되려 하지 않습니다. 권한 정책, 백그라운드 실행 복구, 팀 리뷰, 비코드 오피스 워크플로가 처음부터 필요하다면 그 계층을 직접 만들거나 추가해야 합니다.

다섯 가지 선택 원칙

1. "가장 강력한 agent"가 아니라 작업 기준으로 선택하라

강력한 코딩 agent가 자동으로 강력한 리서치 어시스턴트가 되지는 않습니다. 유연한 메모리 agent가 자동으로 프로덕션 저장소에 안전한 것도 아닙니다. workspace agent가 자동으로 가장 빠른 터미널 도구가 되는 것도 아닙니다.

작업을 먼저 보세요.

작업	좋은 기본 선택	이유
터미널 코딩 하네스를 만들거나 커스터마이즈	Pi	미니멀 코어, 직접 도구, SDK/RPC 친화적 형태
상시 실행 개인 어시스턴트 또는 봇 게이트웨이 운영	Hermes	메모리, skills, 자동화, 음성/게이트웨이/MCP 지향 표면
CLI, IDE, 클라우드, GitHub에 걸쳐 코딩 작업 위임	Codex	여러 코딩 진입점과 문서화된 sandbox 및 승인 모드
리팩터링, CI, subagents, 리뷰 루프가 있는 진지한 저장소 유지보수	Claude Code	성숙한 코드 agent 워크플로, permissions/settings, skills, subagents, CI/Slack 표면
출처 기반 보고서, 오피스 artifacts, 다중 앱 작업, 백그라운드 리서치 제작	MCPlato	workspace, 연결 자료, 다중 세션 오케스트레이션, artifacts, 예약/백그라운드 작업

여기서 MCPlato가 자연스럽게 맞습니다. "최고의 agent"가 아니라 작업이 문서, 브라우저 리서치, 로컬 자료, 오피스 산출물, 여러 세션, 비동기 후속 처리를 가로지를 때 더 나은 기본 선택입니다. 작업이 단순히 "터미널에서 이 파일을 편집"하는 것이라면 Pi나 코딩 네이티브 도구가 더 깔끔할 수 있습니다.

2. 제어와 관리형 워크플로는 실제 절충이다

시장은 두 가지 유용한 극단으로 나뉘고 있습니다.

한쪽 끝의 Pi는 전문가 사용자에게 컴팩트한 하네스를 제공합니다. 구성 요소를 볼 수 있고, 직접 확장을 연결할 수 있으며, agent를 shell 가까이에 둘 수 있습니다. 이는 agent 빌더와 터미널 파워 유저에게 훌륭합니다.

다른 쪽 끝의 Codex, Claude Code, MCPlato는 더 관리된 제품 표면을 제공합니다. Codex는 read-only, workspace-write, danger-full-access 같은 sandbox 모드와 untrusted, on-request, never 같은 승인 정책을 문서화하며, 기본 자세는 네트워크가 꺼진 workspace-write로 설명됩니다.⁷ Claude Code의 quickstart는 파일을 수정하기 전에 허가를 요청한다고 말하고, settings/permissions 문서는 팀이 동작을 조정할 방법을 제공합니다.⁸⁹ MCPlato는 AI Partner, Desktop AI Engine, 연결 자료, ClawMode, 예약/백그라운드 작업, 의사결정 추적, 다이어리, 네 가지 권한 수준 같은 공개 workspace 개념을 드러냅니다.¹⁰¹¹

Hermes는 다른 위치에 있습니다. 넓은 자율성과 확장성을 제공하지만 상태 모델은 더 복잡합니다. 문서는 자기 개선, 영속 메모리, skill 생성, CLI/gateway/voice/MCP, 백그라운드 작업, 예약 자동화, subagents를 강조합니다.⁴ 이는 장기 실행 어시스턴트에는 유망하지만 자동으로 더 안전하다는 뜻은 아닙니다. issue #33256 같은 논의를 포함한 메모리 및 압축 문제는 영속적인 agent 상태가 맹목적 신뢰가 아니라 신중한 검토를 필요로 함을 상기시킵니다.¹²

최선의 선택은 제어 평면을 직접 조립하고 싶은지, 아니면 이미 제어 평면을 제공하는 제품을 쓰고 싶은지에 달려 있습니다.

3. 장기 실행 작업에는 체크포인트, 복구, artifacts가 필요하다

짧은 코딩 작업은 채팅으로도 버틸 수 있습니다. 장기 실행 작업은 그렇지 않습니다.

장기 실행 agent 작업에는 다음이 있어야 합니다.

prompt 계약;
선별된 컨텍스트/환경;
권한 경계;
체크포인트;
검토 가능한 artifacts;
복구 또는 이어가기 경로.

AI agents를 위한 장기 작업 제어 스택

그림 2: 장기 실행 agent 작업은 제어가 단일 채팅 스레드 안에 숨겨져 있을 때보다 계층화되어 있을 때 더 안전하다.

각 제품의 접근 방식은 다릅니다.

Pi는 세션 트리, forks, clones, 압축, JSONL 기록 같은 유용한 기본 요소를 제공합니다. 통제된 탐색에는 좋지만 완성된 운영 계층으로는 덜 완전합니다.
Hermes는 지속 메모리와 예약/백그라운드 자동화를 목표로 합니다. 연속성에는 강력하지만 메모리 품질, 압축, 자기 개선 피드백 루프가 검사되지 않으면 더 위험합니다.
Codex는 로컬 및 클라우드 코딩 작업, MCP, 웹 검색, 이미지 입력, 코딩 표면 전반의 스크립트 실행을 지원합니다.¹³
Claude Code는 독립적인 컨텍스트/도구 접근을 가진 subagents, skills, MCP, GitHub Actions/GitLab CI, Slack, 예약/루틴 지향 워크플로를 문서에 추가합니다.¹⁴¹⁵¹⁶
MCPlato는 긴 작업이 코드만이 아닐 때 가장 강합니다. 리서치 분기, 문서 초안, 브라우저/자료 검토, 이미지 또는 오피스 artifact 제작, 백그라운드 작업이 과부하된 하나의 채팅이 아니라 workspace 수준의 작업 흐름으로 존재할 수 있습니다.

실용적 규칙은 다음과 같습니다. 작업이 한 세션을 넘길 것이라면 agent가 멀리 달리기 전에 artifact와 체크포인트 계획을 요구하세요.

4. 최고의 agent는 당신의 환경에 맞는 것이다

인터페이스는 중요합니다. 실수의 형태를 만들기 때문입니다.

일상 환경	선호	주의할 점
터미널과 스크립트	Pi	직접 권한 및 복구 규율 추가
코드 편집기 + 저장소 + 클라우드 작업 큐	Codex	비코드 워크플로는 다른 곳에 유지
터미널/IDE/CI/chatops 엔지니어링 루프	Claude Code	저장소 규칙, 도구 권한, 리뷰 체크포인트 설정
어시스턴트 프레임워크, 게이트웨이, 음성, 메모리, 자동화	Hermes	메모리와 예약 동작을 신중히 감사
파일, 브라우저, 오피스 artifacts, 여러 세션을 넘나드는 데스크톱 지식 작업	MCPlato	선별된 연결 자료를 사용하고, 작은 shell 전용 작업에 과도하게 사용하지 않기

이는 도구 난립을 피하는 가장 쉬운 방법이기도 합니다. 모든 작업을 최신 agent에 억지로 넣지 마세요. 각 도구를 그 인터페이스가 자연스럽게 맞는 곳에 두세요.

5. 권한 전략은 위험과 맞아야 한다

가장 자율적인 agent가 항상 당신의 작업에 가장 좋은 권한 모델을 가진 것은 아닙니다.

가벼운 권한 전략은 잘 작동합니다.

위험 수준	예시	권장 정책
낮음	파일 읽기, 문서 요약, 승인된 자료 검색	로깅과 함께 허용
중간	초안 편집, 보고서 작성, 로컬 스크립트 실행	workspace 또는 sandbox에서 허용하고 artifacts 요구
높음	삭제, 배포, 게시, 외부 메시지 전송, 민감 시스템 접근	명시적 확인과 증거 요구

Codex의 공개 sandbox 및 승인 문서는 이 논의를 명확하게 만듭니다.⁷ Claude Code의 문서는 단일 sandbox 약속보다 permissions/settings를 강조합니다.⁹ Pi의 미니멀 기본값은 권한 전략이 대개 wrapper의 책임임을 뜻합니다. Hermes 사용자는 백그라운드 자동화와 영속 메모리에 특히 주의해야 합니다. MCPlato는 workspace 수준의 위험 경계와 함께 쓰는 것이 가장 좋습니다. 필요한 자료만 연결하고, 적절한 권한 수준을 고르며, 외부 행동 전에 최종 artifact를 검토 가능하게 만드세요.

제품 하이라이트와 솔직한 한계

Pi Agent: 기능으로서의 미니멀리즘

Pi가 매력적인 이유는 완전한 workspace가 되기를 거부하기 때문입니다. 기본 도구 세트는 작고, 세션 메커니즘은 개발자 친화적이며, 여러 진입점은 자체 agent 워크플로를 만드는 사람들에게 매력적입니다.

제어, 해킹 가능성, 터미널 네이티브 반복을 원한다면 Pi를 선택하세요. 정교한 거버넌스, 오피스 워크플로 커버리지, 자율 백그라운드 운영이 처음부터 제공될 것이라고 기대하지는 마세요.

Hermes Agent: 장수 어시스턴트의 에너지

Hermes는 메모리와 자기 개선 언어에서 가장 야심적입니다. 영속 메모리, skill 생성, 게이트웨이, 음성, MCP, subagents, 예약/백그라운드 자동화는 작업을 넘나들며 살아남는 어시스턴트를 원할 때 매력적입니다.⁴

상태를 가진 자율성을 관리하는 데 익숙하다면 Hermes를 선택하세요. 학습 루프가 본질적으로 신뢰할 수 있다고 취급하지는 마세요. 메모리는 검사 가능하고, 수정 가능하며, 경계가 있을 때만 유용합니다.

Codex: 표면을 넘나드는 관리형 코딩

작업 단위가 소프트웨어 엔지니어링이고 데스크톱, IDE, CLI, 클라우드/웹, GitHub @codex 흐름 전반에서 하나의 시스템을 원한다면 Codex가 가장 잘 맞습니다.¹³¹⁷¹⁸ sandbox와 승인 어휘는 위험을 구체적으로 논의해야 하는 팀에 특히 유용합니다.

관리형 실행 선택지를 가진 코딩 작업에는 Codex를 선택하세요. 오피스 문서, 리서치 종합, 다중 앱 지식 작업을 위한 범용 workspace를 대체할 것이라고 기대하지는 마세요.

Claude Code: 성숙한 agentic 코딩 루프

Claude Code는 작은 하네스라기보다 완전한 전문 코딩 동반자에 가깝습니다. 공개 문서는 터미널 사용, IDE 통합, 데스크톱/웹 표면, MCP, GitHub Actions/GitLab CI, subagents, skills, settings, Slack, Agent SDK 진입점을 다룹니다.¹⁴¹⁹¹⁵¹⁶

진지한 저장소 유지보수와 엔지니어링 워크플로에는 Claude Code를 선택하세요. 한계는 성숙함이 거버넌스를 없애지 않는다는 점입니다. 팀에는 여전히 권한, 코딩 표준, 테스트 요구사항, 리뷰 체크포인트가 필요합니다.

MCPlato: workspace 우선 AI 작업

MCPlato는 작은 터미널 하네스 영역에서 Pi를 이기려 하지 않습니다. 공개 포지셔닝은 AI Partners, Desktop AI Engine, 비동기 워크플로, local-first 연결 자료, 다중 세션 오케스트레이션, 다중 창 작업, 가상 파트너/Sprite 개념, artifact 규율, 예약/백그라운드 작업, ClawMode, 권한 기반 관찰 가능 실행, 의사결정 추적, 다이어리를 갖춘 AI workspace입니다.¹⁰

산출물이 보고서, 비교, 리서치 브리프, 오피스 artifact, 다중 앱 워크플로, 장기 백그라운드 작업이라면 MCPlato를 선택하세요. 여러 세션이 필요한 작업에서 특히 유용합니다. 하나는 리서치, 하나는 초안 작성, 하나는 이미지 생성, 하나는 출처 정리, 그리고 조정 파트너가 완료 상황을 추적할 수 있습니다.

한계는 복잡성입니다. 작업이 단일 파일 터미널 편집이라면 미니멀 하네스가 더 빠르게 느껴질 수 있습니다.

실용적인 선택 전략

하나의 만능 agent를 찾기보다 작은 포트폴리오를 사용하세요.

작은 터미널 네이티브 실험과 커스텀 하네스 구축에는 Pi를 기본값으로 삼기.
중심이 저장소, 테스트, pull requests, CI라면 Codex 또는 Claude Code 사용.
상태를 감사할 수 있는 경우 실험적 상시 실행 어시스턴트, 메모리, 게이트웨이, 자동화 시나리오에는 Hermes 사용.
작업이 리서치, 로컬 자료, 브라우저 컨텍스트, 오피스 artifacts, 여러 세션, 백그라운드 후속 처리를 넘나들면 MCPlato 사용.
artifact가 검사 가능할 때만 권한을 올리기. 먼저 읽고, 다음에 초안 작성, 그다음 쓰기, 마지막에 게시/배포/전송하세요.

승리하는 패턴은 최대 자율성이 아닙니다. 작업에 맞춘 경계 있는 자율성입니다.

결론

Pi의 부상은 이해할 만합니다. 많은 기술 사용자는 더 무거운 agent 제품을 겪은 뒤 더 작고 읽기 쉬운 하네스를 원합니다. Hermes는 지속적인 어시스턴트 상태의 매력과 위험을 보여줍니다. Codex와 Claude Code는 코딩 agents가 얼마나 빠르게 완전한 엔지니어링 워크플로가 되고 있는지 보여줍니다. MCPlato는 다른 범주를 가리킵니다. 지식 작업, artifacts, 로컬 자료, 병렬 실행을 위한 AI workspace입니다.

어느 것도 보편적으로 최고는 아닙니다. 올바른 agent는 그 인터페이스, 권한 모델, 복구 방식이 실제로 수행하는 작업과 맞는 agent입니다.

참고 자료

Footnotes

Pi 정식 GitHub 저장소, earendil-works/pi. https://github.com/earendil-works/pi ↩
Hermes Agent GitHub 저장소, NousResearch/hermes-agent. https://github.com/NousResearch/hermes-agent ↩
OpenAI Codex GitHub 저장소. https://github.com/openai/codex ↩
Hermes Agent 문서. https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Pi 공식 웹사이트. https://pi.dev/ ↩
npm 패키지 @earendil-works/pi-coding-agent. https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
OpenAI Codex sandbox 문서. https://developers.openai.com/codex/sandbox ↩ ↩²
Claude Code quickstart 문서. https://code.claude.com/docs/en/quickstart ↩
Claude Code settings 문서. https://code.claude.com/docs/en/settings ↩ ↩²
MCPlato 공식 웹사이트. https://mcplato.com/en/ ↩ ↩²
MCPlato 가격 정보. https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256. https://github.com/NousResearch/hermes-agent/issues/33256 ↩
OpenAI Codex 문서. https://developers.openai.com/codex ↩ ↩²
Claude Code 개요 문서. https://code.claude.com/docs/en/overview ↩ ↩²
Claude Code sub-agents 문서. https://code.claude.com/docs/en/sub-agents ↩ ↩²
Claude Code skills 문서. https://code.claude.com/docs/en/skills ↩ ↩²
OpenAI Codex CLI 문서. https://developers.openai.com/codex/cli ↩
OpenAI Codex IDE 문서. https://developers.openai.com/codex/ide ↩
Claude Code MCP 문서. https://code.claude.com/docs/en/mcp ↩

더 읽기

2026년 상반기 에이전트 스택: 모델, 하니스, 런타임, AI 워크스페이스
AI 에이전트, 코딩 에이전트, 하니스, 런타임, 브라우저와 샌드박스 인프라, 관측성, 거버넌스, AI 워크스페이스를 다루는 2026년 상반기 간결한 지형도이며, MCPlato를 워크스페이스 계층의 일부로 위치시킨다.
일반 AI 에이전트를 통제력을 잃지 않고 사용하는 방법
일반 AI 에이전트는 경계가 있고 점검 가능한 워크플로 안에서 실행될 때 가장 유용합니다. 이 가이드는 Hermes, OpenClaw 스타일 게이트웨이, MCPlato 같은 에이전트를 위한 프롬프트 계약, 장기 작업 구조, 사람의 체크포인트, 선별된 환경, 검토 가능한 산출물을 다룹니다.
Codex는 시장 도구를 만들고, MCPlato는 리서치 데스크를 운영합니다.
예측시장 리서치 흐름을 위한 Codex vs MCPlato 실무 가이드입니다. 정기 브리핑, 시장 내재확률, 로컬 모델 검토, 의사결정 로그, Wands, 인간 검토를 다루며 투자 조언과 거래 실행은 하지 않는 전제를 분명히 합니다.