AI 智能体

编码智能体

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi、Hermes、Codex、Claude Code 与 MCPlato：哪个 Agent 更适合你的工作？

从控制权、工作流适配、长任务与权限策略出发，对 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基于场景的实用比较。

MCPlato Research Team发布于 2026-05-27

真正有用的问题不是：“哪个 AI agent 最强？”

而是：“哪个 agent 适合这项工作、这个环境，以及这一级别的风险？”

Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被称为 agent，但它们并不想成为同一种产品。Pi 是一个极简的终端编码框架。Hermes 是一个强调记忆和自动化的助手框架。Codex 是覆盖本地与云端界面的托管式编码工作流。Claude Code 是一个成熟的 agentic 编码循环，具备强大的仓库工作流。MCPlato 则是面向研究、报告、办公、本地资料、多会话执行和后台任务的 AI 工作区。

研究期间，GitHub API 返回的数据是：earendil-works/pi 有 56,110 stars 和 6,677 forks，NousResearch/hermes-agent 有 169,745 stars 和 28,286 forks，openai/codex 有 86,227 stars 和 12,601 forks。¹²³ 请把这些数字视为仓库关注度信号，而不是活跃用户数。

这是一篇实用比较，不是产品排名。

产品适配一览

产品	最适合	人们选择它的原因	主要取舍
Pi Agent	终端原生的高级用户、agent 构建者、极简框架用户	界面小而聚焦，直接的文件/bash 工具，交互与 JSON/RPC/SDK 模式，会话树与分叉	治理、扩展和长工作流纪律需要你自己负责
Hermes Agent	常驻助手、记忆实验、自动化、类似机器人的入口	持久记忆、自我改进叙事、技能创建、70+ 内置工具⁴、subagents 与定时/后台自动化	记忆、压缩和学习循环会增加状态复杂度与失效模式
Codex	横跨 CLI、IDE、桌面、云端、GitHub 的编码工作流	完整的沙箱与审批文档、云端任务、MCP、网页搜索、图像输入、exec 脚本	主要是编码工作流，而不是通用办公或多应用工作区
Claude Code	仓库维护、重构、CI、代码审查、subagent/skill 工作流	成熟的 agentic 编码循环，覆盖终端、IDE、桌面/网页、GitHub/GitLab、Slack、MCP、Agent SDK	不如极简框架那样可改造，同时仍需要明确治理
MCPlato	研究、报告、办公工作流、本地资料、多应用任务、异步 AI 同事模式	AI workspace、AI Partner、多会话编排、本地优先的连接资料、artifacts、定时/后台任务、带权限的执行	比极简终端框架更重；不是一次性 shell 编码的最快路径

Pi、Hermes、Codex、Claude Code 与 MCPlato 的场景适配地图

图 1：按场景和工作界面来思考，而不是追逐一个通用排行榜。

为什么 Pi 正在获得关注

如果你曾被重量级 agent 产品折磨过，Pi 的吸引力很容易理解。

其规范项目是 earendil-works/pi，公开网站位于 pi.dev，研究期间 npm 包 @earendil-works/pi-coding-agent 显示的版本为 0.75.5。⁵⁶ 它的定位刻意收窄：一个极简终端编码框架，默认工具包括 read、write、edit 和 bash，并可选择加入只读搜索/导航工具。

这种极简主义解决了几类用户痛点：

太多 agent 把控制平面藏起来。 Pi 暴露的是更小、更容易检查的工具循环。
高级用户想要可组合性。 交互使用、print/JSON 模式、RPC 和 SDK 入口让 Pi 更像一个构建块，而不只是一个应用。
长会话需要分支。 Pi 的会话树、fork/clone 流程、压缩和 JSONL 会话记录，贴近开发者实际探索替代方案的方式。
有些用户不希望把弹窗当成产品哲学。 Pi 默认不内置 MCP、subagents、权限弹窗、plan mode 或后台 bash。这些更属于扩展/包，而不是核心。

它的弱点也正是它的优势：Pi 并不试图成为一个托管治理层。如果你开箱即需要权限策略、后台执行恢复、团队审查或非代码办公工作流，就需要自己构建或添加那一层。

五条选择原则

1. 按工作选择，而不是按“最强 agent”选择

强大的编码 agent 不会自动成为强大的研究助手。灵活的记忆 agent 不会自动对生产仓库安全。工作区 agent 也不会自动成为最快的终端工具。

先看工作：

工作	合适的默认选择	原因
构建或定制终端编码框架	Pi	极简核心、直接工具、适合 SDK/RPC 的形态
运行常驻个人助手或机器人入口	Hermes	记忆、技能、自动化、面向语音/网关/MCP 的界面
在 CLI、IDE、云端和 GitHub 之间委派编码工作	Codex	多个编码入口，加上明确记录的沙箱与审批模式
维护严肃仓库，涉及重构、CI、subagents 和审查循环	Claude Code	成熟的代码 agent 工作流、权限/设置、skills、subagents、CI/Slack 界面
产出带来源的报告、办公 artifacts、多应用工作和后台研究	MCPlato	工作区、连接资料、多会话编排、artifacts、定时/后台任务

这正是 MCPlato 自然适配的位置：它不是“最好的 agent”，而是在工作横跨文档、浏览器研究、本地资料、办公输出、多个会话与异步跟进时更合适的默认选项。如果任务只是“从终端编辑这个文件”，Pi 或编码原生工具可能更干净。

2. 控制权与托管式工作流确实是一种取舍

市场正在分成两个有用的极端。

一端是 Pi，它给专家用户一个紧凑框架。你能看见各个部件，接入自己的扩展，并让 agent 靠近 shell。这对 agent 构建者和终端高级用户非常适合。

另一端是 Codex、Claude Code 和 MCPlato，它们提供更多托管式产品界面。Codex 记录了 read-only、workspace-write、danger-full-access 等沙箱模式，以及 untrusted、on-request、never 等审批策略；其默认姿态被描述为 workspace-write 且网络关闭。⁷ Claude Code 的 quickstart 说明它会在修改文件前请求许可，其设置/权限文档也为团队提供了调节行为的方法。⁸⁹ MCPlato 对外展示的工作区概念包括 AI Partner、Desktop AI Engine、连接资料、ClawMode、定时/后台任务、决策轨迹、日记和四级权限。¹⁰¹¹

Hermes 位于另一种位置：它提供广泛自治和可扩展性，但状态模型更复杂。其文档强调自我改进、持久记忆、技能创建、CLI/gateway/voice/MCP、后台任务、定时自动化和 subagents。⁴ 这让它很适合长期助手，但并不自动更安全。记忆与压缩问题，包括 issue #33256 这样的讨论，都提醒我们：持久 agent 状态需要认真审查，而不是盲目信任。¹²

最佳选择取决于你是想组装控制平面，还是使用一个已经提供控制平面的产品。

3. 长时间运行的工作需要检查点、恢复路径和 artifacts

短编码任务可以存在于一段聊天里。长时间运行的工作不行。

一个长时间运行的 agent 任务应该具备：

prompt 契约；
精心整理的上下文/环境；
权限边界；
检查点；
可审查的 artifacts；
恢复或继续路径。

AI agents 的长任务控制栈

图 2：当控制被分层，而不是隐藏在单个聊天线程里时，长时间运行的 agent 工作更安全。

每个产品的处理方式不同：

Pi 提供有用的原语，例如会话树、forks、clones、压缩和 JSONL 记录。它很适合受控探索；但作为完整运营层还不够完备。
Hermes 目标是持久记忆和定时/后台自动化。它对连续性很强；但当记忆质量、压缩或自我改进反馈循环没有被检查时，风险更高。
Codex 支持本地与云端编码任务、MCP、网页搜索、图像输入，以及贯穿其编码界面的脚本化执行。¹³
Claude Code 在文档中加入了具备独立上下文/工具访问的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack，以及面向定时/例行任务的工作流。¹⁴¹⁵¹⁶
MCPlato 在长工作不只是代码时最强：研究分支、文档起草、浏览器/资料审阅、图像或办公 artifact 生产，以及后台任务，都可以作为工作区级工作流存在，而不是挤在一个超载的聊天里。

一条实用规则：如果任务会跨越一个以上会话，在让 agent 跑远之前，先要求 artifact 和检查点计划。

4. 最好的 agent 是适合你环境的那个

界面很重要，因为界面会塑造错误。

你的日常环境	优先选择	需要注意
终端和脚本	Pi	自己加入权限与恢复纪律
代码编辑器 + 仓库 + 云端任务队列	Codex	把非代码工作流放在别处
终端/IDE/CI/chatops 工程循环	Claude Code	设置仓库规则、工具权限和审查检查点
助手框架、网关、语音、记忆、自动化	Hermes	仔细审计记忆和定时行为
横跨文件、浏览器、办公 artifacts 和多个会话的桌面知识工作	MCPlato	使用精心整理的连接资料；不要把它过度用于很小的纯 shell 任务

这也是避免工具蔓延的最简单办法。不要把每项工作都塞进最新的 agent。把每个工具放到它的界面天然适合的位置。

5. 权限策略必须匹配风险

自治最多的 agent，不一定拥有最适合你任务的权限模型。

一个轻量级权限策略通常有效：

风险级别	示例	推荐策略
低	读取文件、总结文档、搜索已批准资料	允许并记录日志
中	编辑草稿、创建报告、运行本地脚本	允许在工作区或沙箱中执行，并要求 artifacts
高	删除、部署、发布、发送外部消息、访问敏感系统	要求明确确认和证据

Codex 的公开沙箱和审批文档让这类讨论变得明确。⁷ Claude Code 的文档强调权限/设置，而不是单一的沙箱承诺。⁹ Pi 的极简默认意味着权限策略通常是你的 wrapper 的责任。Hermes 用户应格外谨慎对待后台自动化和持久记忆。MCPlato 最适合配合工作区级风险边界使用：只连接所需资料，选择合适的权限等级，并在外部动作之前让最终 artifact 可审查。

产品亮点与坦诚限制

Pi Agent：极简主义是一种功能

Pi 的吸引力在于它拒绝变成完整工作区。它的默认工具集很小，会话机制对开发者友好，并且多个入口让它对构建自有 agent 工作流的人很有吸引力。

当你想要控制权、可改造性和终端原生迭代时，选择 Pi。不要期待它开箱即提供打磨完善的治理、办公工作流覆盖或自主后台操作。

Hermes Agent：长期助手的能量

Hermes 在记忆和自我改进叙事上最有野心。持久记忆、技能创建、网关、语音、MCP、subagents，以及定时/后台自动化，让它在你想要一个跨任务存活的助手时很有吸引力。⁴

当你能舒服地管理有状态自治时，选择 Hermes。不要把它的学习循环视为天然可靠。只有当记忆可检查、可纠正且有边界时，它才有用。

Codex：跨界面的托管式编码

当工作单元是软件工程，并且你想要一个系统覆盖桌面、IDE、CLI、云端/网页和 GitHub @codex 流程时，Codex 最适合。¹³¹⁷¹⁸ 它的沙箱和审批词汇，尤其适合需要具体讨论风险的团队。

选择 Codex 来处理带有托管执行选项的编码工作。不要期待它取代面向办公文档、研究综合或多应用知识工作的通用工作区。

Claude Code：成熟的 agentic 编码循环

Claude Code 更像完整的专业编码伙伴，而不是一个小型框架。其公开文档覆盖终端使用、IDE 集成、桌面/网页界面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。¹⁴¹⁹¹⁵¹⁶

选择 Claude Code 来处理严肃的仓库维护和工程工作流。它的限制在于，成熟并不消除治理需求：团队仍然需要权限、编码标准、测试要求和审查检查点。

MCPlato：以工作区为先的 AI 工作

MCPlato 并不试图在“极小终端框架”这件事上打败 Pi。它的公开定位是一个 AI workspace，包含 AI Partners、Desktop AI Engine、异步工作流、本地优先的连接资料、多会话编排、多窗口工作、虚拟伙伴/Sprite 概念、artifact 纪律、定时/后台任务、ClawMode、带权限且可观察的执行、决策轨迹和日记。¹⁰

当交付物是报告、比较、研究简报、办公 artifact、多应用工作流或长时间后台任务时，选择 MCPlato。它在需要多个会话的工作中尤其有用：一个会话做研究，一个起草，一个生成图像，一个清理来源，再由一个协调伙伴跟踪完成情况。

限制在于复杂度。如果你的工作只是一个文件的终端编辑，极简框架可能感觉更快。

实用选择策略

与其寻找一个通用 agent，不如使用一个小型组合：

默认用 Pi 处理小型终端原生实验和自定义框架构建。
当重心是仓库、测试、pull requests 和 CI 时，使用 Codex 或 Claude Code。
用 Hermes 处理实验性的常驻助手、记忆、网关和自动化场景，前提是你能够审计状态。
当工作跨越研究、本地资料、浏览器上下文、办公 artifacts、多个会话或后台跟进时，使用 MCPlato。
只有在 artifact 可检查时才提升权限。 先读，再起草，再写入，最后才发布/部署/发送。

胜出的模式不是最大自治，而是与工作匹配的有边界自治。

结论

Pi 的走红是合理的：在经历更重的 agent 产品之后，很多技术用户想要一个更小、更清晰的框架。Hermes 展示了持久助手状态的吸引力和风险。Codex 与 Claude Code 展示了编码 agent 正在多快地成为完整工程工作流。MCPlato 指向的是另一个类别：面向知识工作、artifacts、本地资料和并行执行的 AI workspace。

没有哪个产品普遍最好。合适的 agent，是那个其界面、权限模型和恢复方案与你实际工作相匹配的 agent。

参考资料

Footnotes

Pi 规范 GitHub 仓库，earendil-works/pi。https://github.com/earendil-works/pi ↩
Hermes Agent GitHub 仓库，NousResearch/hermes-agent。https://github.com/NousResearch/hermes-agent ↩
OpenAI Codex GitHub 仓库。https://github.com/openai/codex ↩
Hermes Agent 文档。https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Pi 官方网站。https://pi.dev/ ↩
npm 包 @earendil-works/pi-coding-agent。https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
OpenAI Codex 沙箱文档。https://developers.openai.com/codex/sandbox ↩ ↩²
Claude Code quickstart 文档。https://code.claude.com/docs/en/quickstart ↩
Claude Code settings 文档。https://code.claude.com/docs/en/settings ↩ ↩²
MCPlato 官方网站。https://mcplato.com/en/ ↩ ↩²
MCPlato 价格信息。https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256 ↩
OpenAI Codex 文档。https://developers.openai.com/codex ↩ ↩²
Claude Code 概览文档。https://code.claude.com/docs/en/overview ↩ ↩²
Claude Code sub-agents 文档。https://code.claude.com/docs/en/sub-agents ↩ ↩²
Claude Code skills 文档。https://code.claude.com/docs/en/skills ↩ ↩²
OpenAI Codex CLI 文档。https://developers.openai.com/codex/cli ↩
OpenAI Codex IDE 文档。https://developers.openai.com/codex/ide ↩
Claude Code MCP 文档。https://code.claude.com/docs/en/mcp ↩