返回博客
AI 智能体
编码智能体
Pi Agent
Hermes Agent
Codex
Claude Code
MCPlato

Pi、Hermes、Codex、Claude Code 与 MCPlato:哪个 Agent 更适合你的工作?

从控制权、工作流适配、长任务与权限策略出发,对 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基于场景的实用比较。

发布于 2026-05-27

真正有用的问题不是:“哪个 AI agent 最强?”

而是:“哪个 agent 适合这项工作、这个环境,以及这一级别的风险?”

Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被称为 agent,但它们并不想成为同一种产品。Pi 是一个极简的终端编码框架。Hermes 是一个强调记忆和自动化的助手框架。Codex 是覆盖本地与云端界面的托管式编码工作流。Claude Code 是一个成熟的 agentic 编码循环,具备强大的仓库工作流。MCPlato 则是面向研究、报告、办公、本地资料、多会话执行和后台任务的 AI 工作区。

研究期间,GitHub API 返回的数据是:earendil-works/pi56,110 stars 和 6,677 forksNousResearch/hermes-agent169,745 stars 和 28,286 forksopenai/codex86,227 stars 和 12,601 forks123 请把这些数字视为仓库关注度信号,而不是活跃用户数。

这是一篇实用比较,不是产品排名。

产品适配一览

产品最适合人们选择它的原因主要取舍
Pi Agent终端原生的高级用户、agent 构建者、极简框架用户界面小而聚焦,直接的文件/bash 工具,交互与 JSON/RPC/SDK 模式,会话树与分叉治理、扩展和长工作流纪律需要你自己负责
Hermes Agent常驻助手、记忆实验、自动化、类似机器人的入口持久记忆、自我改进叙事、技能创建、70+ 内置工具4、subagents 与定时/后台自动化记忆、压缩和学习循环会增加状态复杂度与失效模式
Codex横跨 CLI、IDE、桌面、云端、GitHub 的编码工作流完整的沙箱与审批文档、云端任务、MCP、网页搜索、图像输入、exec 脚本主要是编码工作流,而不是通用办公或多应用工作区
Claude Code仓库维护、重构、CI、代码审查、subagent/skill 工作流成熟的 agentic 编码循环,覆盖终端、IDE、桌面/网页、GitHub/GitLab、Slack、MCP、Agent SDK不如极简框架那样可改造,同时仍需要明确治理
MCPlato研究、报告、办公工作流、本地资料、多应用任务、异步 AI 同事模式AI workspace、AI Partner、多会话编排、本地优先的连接资料、artifacts、定时/后台任务、带权限的执行比极简终端框架更重;不是一次性 shell 编码的最快路径

Pi、Hermes、Codex、Claude Code 与 MCPlato 的场景适配地图Pi、Hermes、Codex、Claude Code 与 MCPlato 的场景适配地图

图 1:按场景和工作界面来思考,而不是追逐一个通用排行榜。

为什么 Pi 正在获得关注

如果你曾被重量级 agent 产品折磨过,Pi 的吸引力很容易理解。

其规范项目是 earendil-works/pi,公开网站位于 pi.dev,研究期间 npm 包 @earendil-works/pi-coding-agent 显示的版本为 0.75.556 它的定位刻意收窄:一个极简终端编码框架,默认工具包括 read、write、edit 和 bash,并可选择加入只读搜索/导航工具。

这种极简主义解决了几类用户痛点:

  1. 太多 agent 把控制平面藏起来。 Pi 暴露的是更小、更容易检查的工具循环。
  2. 高级用户想要可组合性。 交互使用、print/JSON 模式、RPC 和 SDK 入口让 Pi 更像一个构建块,而不只是一个应用。
  3. 长会话需要分支。 Pi 的会话树、fork/clone 流程、压缩和 JSONL 会话记录,贴近开发者实际探索替代方案的方式。
  4. 有些用户不希望把弹窗当成产品哲学。 Pi 默认不内置 MCP、subagents、权限弹窗、plan mode 或后台 bash。这些更属于扩展/包,而不是核心。

它的弱点也正是它的优势:Pi 并不试图成为一个托管治理层。如果你开箱即需要权限策略、后台执行恢复、团队审查或非代码办公工作流,就需要自己构建或添加那一层。

五条选择原则

1. 按工作选择,而不是按“最强 agent”选择

强大的编码 agent 不会自动成为强大的研究助手。灵活的记忆 agent 不会自动对生产仓库安全。工作区 agent 也不会自动成为最快的终端工具。

先看工作:

工作合适的默认选择原因
构建或定制终端编码框架Pi极简核心、直接工具、适合 SDK/RPC 的形态
运行常驻个人助手或机器人入口Hermes记忆、技能、自动化、面向语音/网关/MCP 的界面
在 CLI、IDE、云端和 GitHub 之间委派编码工作Codex多个编码入口,加上明确记录的沙箱与审批模式
维护严肃仓库,涉及重构、CI、subagents 和审查循环Claude Code成熟的代码 agent 工作流、权限/设置、skills、subagents、CI/Slack 界面
产出带来源的报告、办公 artifacts、多应用工作和后台研究MCPlato工作区、连接资料、多会话编排、artifacts、定时/后台任务

这正是 MCPlato 自然适配的位置:它不是“最好的 agent”,而是在工作横跨文档、浏览器研究、本地资料、办公输出、多个会话与异步跟进时更合适的默认选项。如果任务只是“从终端编辑这个文件”,Pi 或编码原生工具可能更干净。

2. 控制权与托管式工作流确实是一种取舍

市场正在分成两个有用的极端。

一端是 Pi,它给专家用户一个紧凑框架。你能看见各个部件,接入自己的扩展,并让 agent 靠近 shell。这对 agent 构建者和终端高级用户非常适合。

另一端是 CodexClaude CodeMCPlato,它们提供更多托管式产品界面。Codex 记录了 read-only、workspace-write、danger-full-access 等沙箱模式,以及 untrusted、on-request、never 等审批策略;其默认姿态被描述为 workspace-write 且网络关闭。7 Claude Code 的 quickstart 说明它会在修改文件前请求许可,其设置/权限文档也为团队提供了调节行为的方法。89 MCPlato 对外展示的工作区概念包括 AI Partner、Desktop AI Engine、连接资料、ClawMode、定时/后台任务、决策轨迹、日记和四级权限。1011

Hermes 位于另一种位置:它提供广泛自治和可扩展性,但状态模型更复杂。其文档强调自我改进、持久记忆、技能创建、CLI/gateway/voice/MCP、后台任务、定时自动化和 subagents。4 这让它很适合长期助手,但并不自动更安全。记忆与压缩问题,包括 issue #33256 这样的讨论,都提醒我们:持久 agent 状态需要认真审查,而不是盲目信任。12

最佳选择取决于你是想组装控制平面,还是使用一个已经提供控制平面的产品

3. 长时间运行的工作需要检查点、恢复路径和 artifacts

短编码任务可以存在于一段聊天里。长时间运行的工作不行。

一个长时间运行的 agent 任务应该具备:

  • prompt 契约;
  • 精心整理的上下文/环境;
  • 权限边界;
  • 检查点;
  • 可审查的 artifacts;
  • 恢复或继续路径。

AI agents 的长任务控制栈AI agents 的长任务控制栈

图 2:当控制被分层,而不是隐藏在单个聊天线程里时,长时间运行的 agent 工作更安全。

每个产品的处理方式不同:

  • Pi 提供有用的原语,例如会话树、forks、clones、压缩和 JSONL 记录。它很适合受控探索;但作为完整运营层还不够完备。
  • Hermes 目标是持久记忆和定时/后台自动化。它对连续性很强;但当记忆质量、压缩或自我改进反馈循环没有被检查时,风险更高。
  • Codex 支持本地与云端编码任务、MCP、网页搜索、图像输入,以及贯穿其编码界面的脚本化执行。13
  • Claude Code 在文档中加入了具备独立上下文/工具访问的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack,以及面向定时/例行任务的工作流。141516
  • MCPlato 在长工作不只是代码时最强:研究分支、文档起草、浏览器/资料审阅、图像或办公 artifact 生产,以及后台任务,都可以作为工作区级工作流存在,而不是挤在一个超载的聊天里。

一条实用规则:如果任务会跨越一个以上会话,在让 agent 跑远之前,先要求 artifact 和检查点计划。

4. 最好的 agent 是适合你环境的那个

界面很重要,因为界面会塑造错误。

你的日常环境优先选择需要注意
终端和脚本Pi自己加入权限与恢复纪律
代码编辑器 + 仓库 + 云端任务队列Codex把非代码工作流放在别处
终端/IDE/CI/chatops 工程循环Claude Code设置仓库规则、工具权限和审查检查点
助手框架、网关、语音、记忆、自动化Hermes仔细审计记忆和定时行为
横跨文件、浏览器、办公 artifacts 和多个会话的桌面知识工作MCPlato使用精心整理的连接资料;不要把它过度用于很小的纯 shell 任务

这也是避免工具蔓延的最简单办法。不要把每项工作都塞进最新的 agent。把每个工具放到它的界面天然适合的位置。

5. 权限策略必须匹配风险

自治最多的 agent,不一定拥有最适合你任务的权限模型。

一个轻量级权限策略通常有效:

风险级别示例推荐策略
读取文件、总结文档、搜索已批准资料允许并记录日志
编辑草稿、创建报告、运行本地脚本允许在工作区或沙箱中执行,并要求 artifacts
删除、部署、发布、发送外部消息、访问敏感系统要求明确确认和证据

Codex 的公开沙箱和审批文档让这类讨论变得明确。7 Claude Code 的文档强调权限/设置,而不是单一的沙箱承诺。9 Pi 的极简默认意味着权限策略通常是你的 wrapper 的责任。Hermes 用户应格外谨慎对待后台自动化和持久记忆。MCPlato 最适合配合工作区级风险边界使用:只连接所需资料,选择合适的权限等级,并在外部动作之前让最终 artifact 可审查。

产品亮点与坦诚限制

Pi Agent:极简主义是一种功能

Pi 的吸引力在于它拒绝变成完整工作区。它的默认工具集很小,会话机制对开发者友好,并且多个入口让它对构建自有 agent 工作流的人很有吸引力。

当你想要控制权、可改造性和终端原生迭代时,选择 Pi。不要期待它开箱即提供打磨完善的治理、办公工作流覆盖或自主后台操作。

Hermes Agent:长期助手的能量

Hermes 在记忆和自我改进叙事上最有野心。持久记忆、技能创建、网关、语音、MCP、subagents,以及定时/后台自动化,让它在你想要一个跨任务存活的助手时很有吸引力。4

当你能舒服地管理有状态自治时,选择 Hermes。不要把它的学习循环视为天然可靠。只有当记忆可检查、可纠正且有边界时,它才有用。

Codex:跨界面的托管式编码

当工作单元是软件工程,并且你想要一个系统覆盖桌面、IDE、CLI、云端/网页和 GitHub @codex 流程时,Codex 最适合。131718 它的沙箱和审批词汇,尤其适合需要具体讨论风险的团队。

选择 Codex 来处理带有托管执行选项的编码工作。不要期待它取代面向办公文档、研究综合或多应用知识工作的通用工作区。

Claude Code:成熟的 agentic 编码循环

Claude Code 更像完整的专业编码伙伴,而不是一个小型框架。其公开文档覆盖终端使用、IDE 集成、桌面/网页界面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。14191516

选择 Claude Code 来处理严肃的仓库维护和工程工作流。它的限制在于,成熟并不消除治理需求:团队仍然需要权限、编码标准、测试要求和审查检查点。

MCPlato:以工作区为先的 AI 工作

MCPlato 并不试图在“极小终端框架”这件事上打败 Pi。它的公开定位是一个 AI workspace,包含 AI Partners、Desktop AI Engine、异步工作流、本地优先的连接资料、多会话编排、多窗口工作、虚拟伙伴/Sprite 概念、artifact 纪律、定时/后台任务、ClawMode、带权限且可观察的执行、决策轨迹和日记。10

当交付物是报告、比较、研究简报、办公 artifact、多应用工作流或长时间后台任务时,选择 MCPlato。它在需要多个会话的工作中尤其有用:一个会话做研究,一个起草,一个生成图像,一个清理来源,再由一个协调伙伴跟踪完成情况。

限制在于复杂度。如果你的工作只是一个文件的终端编辑,极简框架可能感觉更快。

实用选择策略

与其寻找一个通用 agent,不如使用一个小型组合:

  1. 默认用 Pi 处理小型终端原生实验和自定义框架构建。
  2. 当重心是仓库、测试、pull requests 和 CI 时,使用 Codex 或 Claude Code
  3. 用 Hermes 处理实验性的常驻助手、记忆、网关和自动化场景,前提是你能够审计状态。
  4. 当工作跨越研究、本地资料、浏览器上下文、办公 artifacts、多个会话或后台跟进时,使用 MCPlato
  5. 只有在 artifact 可检查时才提升权限。 先读,再起草,再写入,最后才发布/部署/发送。

胜出的模式不是最大自治,而是与工作匹配的有边界自治

结论

Pi 的走红是合理的:在经历更重的 agent 产品之后,很多技术用户想要一个更小、更清晰的框架。Hermes 展示了持久助手状态的吸引力和风险。Codex 与 Claude Code 展示了编码 agent 正在多快地成为完整工程工作流。MCPlato 指向的是另一个类别:面向知识工作、artifacts、本地资料和并行执行的 AI workspace。

没有哪个产品普遍最好。合适的 agent,是那个其界面、权限模型和恢复方案与你实际工作相匹配的 agent。

参考资料

Footnotes

  1. Pi 规范 GitHub 仓库,earendil-works/pihttps://github.com/earendil-works/pi

  2. Hermes Agent GitHub 仓库,NousResearch/hermes-agenthttps://github.com/NousResearch/hermes-agent

  3. OpenAI Codex GitHub 仓库。https://github.com/openai/codex

  4. Hermes Agent 文档。https://hermes-agent.nousresearch.com/docs/ 2 3

  5. Pi 官方网站。https://pi.dev/

  6. npm 包 @earendil-works/pi-coding-agenthttps://www.npmjs.com/package/@earendil-works/pi-coding-agent

  7. OpenAI Codex 沙箱文档。https://developers.openai.com/codex/sandbox 2

  8. Claude Code quickstart 文档。https://code.claude.com/docs/en/quickstart

  9. Claude Code settings 文档。https://code.claude.com/docs/en/settings 2

  10. MCPlato 官方网站。https://mcplato.com/en/ 2

  11. MCPlato 价格信息。https://mcplato.com/pricing

  12. Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256

  13. OpenAI Codex 文档。https://developers.openai.com/codex 2

  14. Claude Code 概览文档。https://code.claude.com/docs/en/overview 2

  15. Claude Code sub-agents 文档。https://code.claude.com/docs/en/sub-agents 2

  16. Claude Code skills 文档。https://code.claude.com/docs/en/skills 2

  17. OpenAI Codex CLI 文档。https://developers.openai.com/codex/cli

  18. OpenAI Codex IDE 文档。https://developers.openai.com/codex/ide

  19. Claude Code MCP 文档。https://code.claude.com/docs/en/mcp