Pi、Hermes、Codex、Claude Code 与 MCPlato:哪个 Agent 更适合你的工作?
从控制权、工作流适配、长任务与权限策略出发,对 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基于场景的实用比较。
发布于 2026-05-27
真正有用的问题不是:“哪个 AI agent 最强?”
而是:“哪个 agent 适合这项工作、这个环境,以及这一级别的风险?”
Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被称为 agent,但它们并不想成为同一种产品。Pi 是一个极简的终端编码框架。Hermes 是一个强调记忆和自动化的助手框架。Codex 是覆盖本地与云端界面的托管式编码工作流。Claude Code 是一个成熟的 agentic 编码循环,具备强大的仓库工作流。MCPlato 则是面向研究、报告、办公、本地资料、多会话执行和后台任务的 AI 工作区。
研究期间,GitHub API 返回的数据是:earendil-works/pi 有 56,110 stars 和 6,677 forks,NousResearch/hermes-agent 有 169,745 stars 和 28,286 forks,openai/codex 有 86,227 stars 和 12,601 forks。123 请把这些数字视为仓库关注度信号,而不是活跃用户数。
这是一篇实用比较,不是产品排名。
产品适配一览
| 产品 | 最适合 | 人们选择它的原因 | 主要取舍 |
|---|---|---|---|
| Pi Agent | 终端原生的高级用户、agent 构建者、极简框架用户 | 界面小而聚焦,直接的文件/bash 工具,交互与 JSON/RPC/SDK 模式,会话树与分叉 | 治理、扩展和长工作流纪律需要你自己负责 |
| Hermes Agent | 常驻助手、记忆实验、自动化、类似机器人的入口 | 持久记忆、自我改进叙事、技能创建、70+ 内置工具4、subagents 与定时/后台自动化 | 记忆、压缩和学习循环会增加状态复杂度与失效模式 |
| Codex | 横跨 CLI、IDE、桌面、云端、GitHub 的编码工作流 | 完整的沙箱与审批文档、云端任务、MCP、网页搜索、图像输入、exec 脚本 | 主要是编码工作流,而不是通用办公或多应用工作区 |
| Claude Code | 仓库维护、重构、CI、代码审查、subagent/skill 工作流 | 成熟的 agentic 编码循环,覆盖终端、IDE、桌面/网页、GitHub/GitLab、Slack、MCP、Agent SDK | 不如极简框架那样可改造,同时仍需要明确治理 |
| MCPlato | 研究、报告、办公工作流、本地资料、多应用任务、异步 AI 同事模式 | AI workspace、AI Partner、多会话编排、本地优先的连接资料、artifacts、定时/后台任务、带权限的执行 | 比极简终端框架更重;不是一次性 shell 编码的最快路径 |
Pi、Hermes、Codex、Claude Code 与 MCPlato 的场景适配地图
图 1:按场景和工作界面来思考,而不是追逐一个通用排行榜。
为什么 Pi 正在获得关注
如果你曾被重量级 agent 产品折磨过,Pi 的吸引力很容易理解。
其规范项目是 earendil-works/pi,公开网站位于 pi.dev,研究期间 npm 包 @earendil-works/pi-coding-agent 显示的版本为 0.75.5。56 它的定位刻意收窄:一个极简终端编码框架,默认工具包括 read、write、edit 和 bash,并可选择加入只读搜索/导航工具。
这种极简主义解决了几类用户痛点:
- 太多 agent 把控制平面藏起来。 Pi 暴露的是更小、更容易检查的工具循环。
- 高级用户想要可组合性。 交互使用、print/JSON 模式、RPC 和 SDK 入口让 Pi 更像一个构建块,而不只是一个应用。
- 长会话需要分支。 Pi 的会话树、fork/clone 流程、压缩和 JSONL 会话记录,贴近开发者实际探索替代方案的方式。
- 有些用户不希望把弹窗当成产品哲学。 Pi 默认不内置 MCP、subagents、权限弹窗、plan mode 或后台 bash。这些更属于扩展/包,而不是核心。
它的弱点也正是它的优势:Pi 并不试图成为一个托管治理层。如果你开箱即需要权限策略、后台执行恢复、团队审查或非代码办公工作流,就需要自己构建或添加那一层。
五条选择原则
1. 按工作选择,而不是按“最强 agent”选择
强大的编码 agent 不会自动成为强大的研究助手。灵活的记忆 agent 不会自动对生产仓库安全。工作区 agent 也不会自动成为最快的终端工具。
先看工作:
| 工作 | 合适的默认选择 | 原因 |
|---|---|---|
| 构建或定制终端编码框架 | Pi | 极简核心、直接工具、适合 SDK/RPC 的形态 |
| 运行常驻个人助手或机器人入口 | Hermes | 记忆、技能、自动化、面向语音/网关/MCP 的界面 |
| 在 CLI、IDE、云端和 GitHub 之间委派编码工作 | Codex | 多个编码入口,加上明确记录的沙箱与审批模式 |
| 维护严肃仓库,涉及重构、CI、subagents 和审查循环 | Claude Code | 成熟的代码 agent 工作流、权限/设置、skills、subagents、CI/Slack 界面 |
| 产出带来源的报告、办公 artifacts、多应用工作和后台研究 | MCPlato | 工作区、连接资料、多会话编排、artifacts、定时/后台任务 |
这正是 MCPlato 自然适配的位置:它不是“最好的 agent”,而是在工作横跨文档、浏览器研究、本地资料、办公输出、多个会话与异步跟进时更合适的默认选项。如果任务只是“从终端编辑这个文件”,Pi 或编码原生工具可能更干净。
2. 控制权与托管式工作流确实是一种取舍
市场正在分成两个有用的极端。
一端是 Pi,它给专家用户一个紧凑框架。你能看见各个部件,接入自己的扩展,并让 agent 靠近 shell。这对 agent 构建者和终端高级用户非常适合。
另一端是 Codex、Claude Code 和 MCPlato,它们提供更多托管式产品界面。Codex 记录了 read-only、workspace-write、danger-full-access 等沙箱模式,以及 untrusted、on-request、never 等审批策略;其默认姿态被描述为 workspace-write 且网络关闭。7 Claude Code 的 quickstart 说明它会在修改文件前请求许可,其设置/权限文档也为团队提供了调节行为的方法。89 MCPlato 对外展示的工作区概念包括 AI Partner、Desktop AI Engine、连接资料、ClawMode、定时/后台任务、决策轨迹、日记和四级权限。1011
Hermes 位于另一种位置:它提供广泛自治和可扩展性,但状态模型更复杂。其文档强调自我改进、持久记忆、技能创建、CLI/gateway/voice/MCP、后台任务、定时自动化和 subagents。4 这让它很适合长期助手,但并不自动更安全。记忆与压缩问题,包括 issue #33256 这样的讨论,都提醒我们:持久 agent 状态需要认真审查,而不是盲目信任。12
最佳选择取决于你是想组装控制平面,还是使用一个已经提供控制平面的产品。
3. 长时间运行的工作需要检查点、恢复路径和 artifacts
短编码任务可以存在于一段聊天里。长时间运行的工作不行。
一个长时间运行的 agent 任务应该具备:
- prompt 契约;
- 精心整理的上下文/环境;
- 权限边界;
- 检查点;
- 可审查的 artifacts;
- 恢复或继续路径。
AI agents 的长任务控制栈
图 2:当控制被分层,而不是隐藏在单个聊天线程里时,长时间运行的 agent 工作更安全。
每个产品的处理方式不同:
- Pi 提供有用的原语,例如会话树、forks、clones、压缩和 JSONL 记录。它很适合受控探索;但作为完整运营层还不够完备。
- Hermes 目标是持久记忆和定时/后台自动化。它对连续性很强;但当记忆质量、压缩或自我改进反馈循环没有被检查时,风险更高。
- Codex 支持本地与云端编码任务、MCP、网页搜索、图像输入,以及贯穿其编码界面的脚本化执行。13
- Claude Code 在文档中加入了具备独立上下文/工具访问的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack,以及面向定时/例行任务的工作流。141516
- MCPlato 在长工作不只是代码时最强:研究分支、文档起草、浏览器/资料审阅、图像或办公 artifact 生产,以及后台任务,都可以作为工作区级工作流存在,而不是挤在一个超载的聊天里。
一条实用规则:如果任务会跨越一个以上会话,在让 agent 跑远之前,先要求 artifact 和检查点计划。
4. 最好的 agent 是适合你环境的那个
界面很重要,因为界面会塑造错误。
| 你的日常环境 | 优先选择 | 需要注意 |
|---|---|---|
| 终端和脚本 | Pi | 自己加入权限与恢复纪律 |
| 代码编辑器 + 仓库 + 云端任务队列 | Codex | 把非代码工作流放在别处 |
| 终端/IDE/CI/chatops 工程循环 | Claude Code | 设置仓库规则、工具权限和审查检查点 |
| 助手框架、网关、语音、记忆、自动化 | Hermes | 仔细审计记忆和定时行为 |
| 横跨文件、浏览器、办公 artifacts 和多个会话的桌面知识工作 | MCPlato | 使用精心整理的连接资料;不要把它过度用于很小的纯 shell 任务 |
这也是避免工具蔓延的最简单办法。不要把每项工作都塞进最新的 agent。把每个工具放到它的界面天然适合的位置。
5. 权限策略必须匹配风险
自治最多的 agent,不一定拥有最适合你任务的权限模型。
一个轻量级权限策略通常有效:
| 风险级别 | 示例 | 推荐策略 |
|---|---|---|
| 低 | 读取文件、总结文档、搜索已批准资料 | 允许并记录日志 |
| 中 | 编辑草稿、创建报告、运行本地脚本 | 允许在工作区或沙箱中执行,并要求 artifacts |
| 高 | 删除、部署、发布、发送外部消息、访问敏感系统 | 要求明确确认和证据 |
Codex 的公开沙箱和审批文档让这类讨论变得明确。7 Claude Code 的文档强调权限/设置,而不是单一的沙箱承诺。9 Pi 的极简默认意味着权限策略通常是你的 wrapper 的责任。Hermes 用户应格外谨慎对待后台自动化和持久记忆。MCPlato 最适合配合工作区级风险边界使用:只连接所需资料,选择合适的权限等级,并在外部动作之前让最终 artifact 可审查。
产品亮点与坦诚限制
Pi Agent:极简主义是一种功能
Pi 的吸引力在于它拒绝变成完整工作区。它的默认工具集很小,会话机制对开发者友好,并且多个入口让它对构建自有 agent 工作流的人很有吸引力。
当你想要控制权、可改造性和终端原生迭代时,选择 Pi。不要期待它开箱即提供打磨完善的治理、办公工作流覆盖或自主后台操作。
Hermes Agent:长期助手的能量
Hermes 在记忆和自我改进叙事上最有野心。持久记忆、技能创建、网关、语音、MCP、subagents,以及定时/后台自动化,让它在你想要一个跨任务存活的助手时很有吸引力。4
当你能舒服地管理有状态自治时,选择 Hermes。不要把它的学习循环视为天然可靠。只有当记忆可检查、可纠正且有边界时,它才有用。
Codex:跨界面的托管式编码
当工作单元是软件工程,并且你想要一个系统覆盖桌面、IDE、CLI、云端/网页和 GitHub @codex 流程时,Codex 最适合。131718 它的沙箱和审批词汇,尤其适合需要具体讨论风险的团队。
选择 Codex 来处理带有托管执行选项的编码工作。不要期待它取代面向办公文档、研究综合或多应用知识工作的通用工作区。
Claude Code:成熟的 agentic 编码循环
Claude Code 更像完整的专业编码伙伴,而不是一个小型框架。其公开文档覆盖终端使用、IDE 集成、桌面/网页界面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。14191516
选择 Claude Code 来处理严肃的仓库维护和工程工作流。它的限制在于,成熟并不消除治理需求:团队仍然需要权限、编码标准、测试要求和审查检查点。
MCPlato:以工作区为先的 AI 工作
MCPlato 并不试图在“极小终端框架”这件事上打败 Pi。它的公开定位是一个 AI workspace,包含 AI Partners、Desktop AI Engine、异步工作流、本地优先的连接资料、多会话编排、多窗口工作、虚拟伙伴/Sprite 概念、artifact 纪律、定时/后台任务、ClawMode、带权限且可观察的执行、决策轨迹和日记。10
当交付物是报告、比较、研究简报、办公 artifact、多应用工作流或长时间后台任务时,选择 MCPlato。它在需要多个会话的工作中尤其有用:一个会话做研究,一个起草,一个生成图像,一个清理来源,再由一个协调伙伴跟踪完成情况。
限制在于复杂度。如果你的工作只是一个文件的终端编辑,极简框架可能感觉更快。
实用选择策略
与其寻找一个通用 agent,不如使用一个小型组合:
- 默认用 Pi 处理小型终端原生实验和自定义框架构建。
- 当重心是仓库、测试、pull requests 和 CI 时,使用 Codex 或 Claude Code。
- 用 Hermes 处理实验性的常驻助手、记忆、网关和自动化场景,前提是你能够审计状态。
- 当工作跨越研究、本地资料、浏览器上下文、办公 artifacts、多个会话或后台跟进时,使用 MCPlato。
- 只有在 artifact 可检查时才提升权限。 先读,再起草,再写入,最后才发布/部署/发送。
胜出的模式不是最大自治,而是与工作匹配的有边界自治。
结论
Pi 的走红是合理的:在经历更重的 agent 产品之后,很多技术用户想要一个更小、更清晰的框架。Hermes 展示了持久助手状态的吸引力和风险。Codex 与 Claude Code 展示了编码 agent 正在多快地成为完整工程工作流。MCPlato 指向的是另一个类别:面向知识工作、artifacts、本地资料和并行执行的 AI workspace。
没有哪个产品普遍最好。合适的 agent,是那个其界面、权限模型和恢复方案与你实际工作相匹配的 agent。
参考资料
Footnotes
-
Pi 规范 GitHub 仓库,
earendil-works/pi。https://github.com/earendil-works/pi ↩ -
Hermes Agent GitHub 仓库,
NousResearch/hermes-agent。https://github.com/NousResearch/hermes-agent ↩ -
OpenAI Codex GitHub 仓库。https://github.com/openai/codex ↩
-
Hermes Agent 文档。https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Pi 官方网站。https://pi.dev/ ↩
-
npm 包
@earendil-works/pi-coding-agent。https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
OpenAI Codex 沙箱文档。https://developers.openai.com/codex/sandbox ↩ ↩2
-
Claude Code quickstart 文档。https://code.claude.com/docs/en/quickstart ↩
-
Claude Code settings 文档。https://code.claude.com/docs/en/settings ↩ ↩2
-
MCPlato 官方网站。https://mcplato.com/en/ ↩ ↩2
-
MCPlato 价格信息。https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
OpenAI Codex 文档。https://developers.openai.com/codex ↩ ↩2
-
Claude Code 概览文档。https://code.claude.com/docs/en/overview ↩ ↩2
-
Claude Code sub-agents 文档。https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Claude Code skills 文档。https://code.claude.com/docs/en/skills ↩ ↩2
-
OpenAI Codex CLI 文档。https://developers.openai.com/codex/cli ↩
-
OpenAI Codex IDE 文档。https://developers.openai.com/codex/ide ↩
-
Claude Code MCP 文档。https://code.claude.com/docs/en/mcp ↩
