Pi、Hermes、Codex、Claude Code 與 MCPlato:哪個 Agent 更適合你的工作?
從控制權、工作流程適配、長任務與權限策略出發,對 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基於場景的實用比較。
發布於 2026-05-27
真正有用的問題不是:「哪個 AI agent 最強?」
而是:「哪個 agent 適合這項工作、這個環境,以及這一級別的風險?」
Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被稱為 agent,但它們並不想成為同一種產品。Pi 是一個極簡的終端編碼框架。Hermes 是一個強調記憶和自動化的助手框架。Codex 是覆蓋本地與雲端介面的託管式編碼工作流程。Claude Code 是一個成熟的 agentic 編碼循環,具備強大的倉庫工作流程。MCPlato 則是面向研究、報告、辦公、本地資料、多會話執行和後台任務的 AI 工作區。
研究期間,GitHub API 返回的資料是:earendil-works/pi 有 56,110 stars 和 6,677 forks,NousResearch/hermes-agent 有 169,745 stars 和 28,286 forks,openai/codex 有 86,227 stars 和 12,601 forks。123 請把這些數字視為倉庫關注度訊號,而不是活躍用戶數。
這是一篇實用比較,不是產品排名。
產品適配一覽
| 產品 | 最適合 | 人們選擇它的原因 | 主要取捨 |
|---|---|---|---|
| Pi Agent | 終端原生的進階用戶、agent 構建者、極簡框架用戶 | 介面小而聚焦,直接的檔案/bash 工具,互動與 JSON/RPC/SDK 模式,會話樹與分叉 | 治理、擴展和長工作流程紀律需要你自己負責 |
| Hermes Agent | 常駐助手、記憶實驗、自動化、類似機器人的入口 | 持久記憶、自我改進敘事、技能建立、70+ 內建工具4、subagents 與定時/後台自動化 | 記憶、壓縮和學習循環會增加狀態複雜度與失效模式 |
| Codex | 橫跨 CLI、IDE、桌面、雲端、GitHub 的編碼工作流程 | 完整的沙箱與審批文件、雲端任務、MCP、網頁搜尋、圖像輸入、exec 指令碼 | 主要是編碼工作流程,而不是通用辦公或多應用工作區 |
| Claude Code | 倉庫維護、重構、CI、程式碼審查、subagent/skill 工作流程 | 成熟的 agentic 編碼循環,覆蓋終端、IDE、桌面/網頁、GitHub/GitLab、Slack、MCP、Agent SDK | 不如極簡框架那樣可改造,同時仍需要明確治理 |
| MCPlato | 研究、報告、辦公工作流程、本地資料、多應用任務、異步 AI 同事模式 | AI workspace、AI Partner、多會話編排、本地優先的連接資料、artifacts、定時/後台任務、帶權限的執行 | 比極簡終端框架更重;不是一次性 shell 編碼的最快路徑 |
Pi、Hermes、Codex、Claude Code 與 MCPlato 的場景適配地圖
圖 1:按場景和工作介面來思考,而不是追逐一個通用排行榜。
為什麼 Pi 正在獲得關注
如果你曾被重量級 agent 產品折磨過,Pi 的吸引力很容易理解。
其規範專案是 earendil-works/pi,公開網站位於 pi.dev,研究期間 npm 套件 @earendil-works/pi-coding-agent 顯示的版本為 0.75.5。56 它的定位刻意收窄:一個極簡終端編碼框架,預設工具包括 read、write、edit 和 bash,並可選擇加入唯讀搜尋/導覽工具。
這種極簡主義解決了幾類用戶痛點:
- 太多 agent 把控制平面藏起來。 Pi 暴露的是更小、更容易檢查的工具循環。
- 進階用戶想要可組合性。 互動使用、print/JSON 模式、RPC 和 SDK 入口讓 Pi 更像一個構建塊,而不只是一個應用。
- 長會話需要分支。 Pi 的會話樹、fork/clone 流程、壓縮和 JSONL 會話記錄,貼近開發者實際探索替代方案的方式。
- 有些用戶不希望把彈窗當成產品哲學。 Pi 預設不內建 MCP、subagents、權限彈窗、plan mode 或後台 bash。這些更屬於擴展/套件,而不是核心。
它的弱點也正是它的優勢:Pi 並不試圖成為一個託管治理層。如果你開箱即需要權限策略、後台執行恢復、團隊審查或非程式碼辦公工作流程,就需要自己構建或添加那一層。
五條選擇原則
1. 按工作選擇,而不是按「最強 agent」選擇
強大的編碼 agent 不會自動成為強大的研究助手。靈活的記憶 agent 不會自動對生產倉庫安全。工作區 agent 也不會自動成為最快的終端工具。
先看工作:
| 工作 | 合適的預設選擇 | 原因 |
|---|---|---|
| 構建或定製終端編碼框架 | Pi | 極簡核心、直接工具、適合 SDK/RPC 的形態 |
| 運行常駐個人助手或機器人入口 | Hermes | 記憶、技能、自動化、面向語音/閘道/MCP 的介面 |
| 在 CLI、IDE、雲端和 GitHub 之間委派編碼工作 | Codex | 多個編碼入口,加上明確記錄的沙箱與審批模式 |
| 維護嚴肅倉庫,涉及重構、CI、subagents 和審查循環 | Claude Code | 成熟的程式碼 agent 工作流程、權限/設定、skills、subagents、CI/Slack 介面 |
| 產出帶來源的報告、辦公 artifacts、多應用工作和後台研究 | MCPlato | 工作區、連接資料、多會話編排、artifacts、定時/後台任務 |
這正是 MCPlato 自然適配的位置:它不是「最好的 agent」,而是在工作橫跨文件、瀏覽器研究、本地資料、辦公輸出、多個會話與異步跟進時更合適的預設選項。如果任務只是「從終端編輯這個檔案」,Pi 或編碼原生工具可能更乾淨。
2. 控制權與託管式工作流程確實是一種取捨
市場正在分成兩個有用的極端。
一端是 Pi,它給專家用戶一個緊湊框架。你能看見各個部件,接入自己的擴展,並讓 agent 靠近 shell。這對 agent 構建者和終端進階用戶非常適合。
另一端是 Codex、Claude Code 和 MCPlato,它們提供更多託管式產品介面。Codex 記錄了 read-only、workspace-write、danger-full-access 等沙箱模式,以及 untrusted、on-request、never 等審批策略;其預設姿態被描述為 workspace-write 且網路關閉。7 Claude Code 的 quickstart 說明它會在修改檔案前請求許可,其設定/權限文件也為團隊提供了調節行為的方法。89 MCPlato 對外展示的工作區概念包括 AI Partner、Desktop AI Engine、連接資料、ClawMode、定時/後台任務、決策軌跡、日記和四級權限。1011
Hermes 位於另一種位置:它提供廣泛自治和可擴展性,但狀態模型更複雜。其文件強調自我改進、持久記憶、技能建立、CLI/gateway/voice/MCP、後台任務、定時自動化和 subagents。4 這讓它很適合長期助手,但並不自動更安全。記憶與壓縮問題,包括 issue #33256 這樣的討論,都提醒我們:持久 agent 狀態需要認真審查,而不是盲目信任。12
最佳選擇取決於你是想組裝控制平面,還是使用一個已經提供控制平面的產品。
3. 長時間運行的工作需要檢查點、恢復路徑和 artifacts
短編碼任務可以存在於一段聊天裡。長時間運行的工作不行。
一個長時間運行的 agent 任務應該具備:
- prompt 契約;
- 精心整理的上下文/環境;
- 權限邊界;
- 檢查點;
- 可審查的 artifacts;
- 恢復或繼續路徑。
AI agents 的長任務控制棧
圖 2:當控制被分層,而不是隱藏在單個聊天執行緒裡時,長時間運行的 agent 工作更安全。
每個產品的處理方式不同:
- Pi 提供有用的原語,例如會話樹、forks、clones、壓縮和 JSONL 記錄。它很適合受控探索;但作為完整營運層還不夠完備。
- Hermes 目標是持久記憶和定時/後台自動化。它對連續性很強;但當記憶品質、壓縮或自我改進回饋循環沒有被檢查時,風險更高。
- Codex 支援本地與雲端編碼任務、MCP、網頁搜尋、圖像輸入,以及貫穿其編碼介面的指令碼化執行。13
- Claude Code 在文件中加入了具備獨立上下文/工具存取的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack,以及面向定時/例行任務的工作流程。141516
- MCPlato 在長工作不只是程式碼時最強:研究分支、文件起草、瀏覽器/資料審閱、圖像或辦公 artifact 產出,以及後台任務,都可以作為工作區級工作流存在,而不是擠在一個超載的聊天裡。
一條實用規則:如果任務會跨越一個以上會話,在讓 agent 跑遠之前,先要求 artifact 和檢查點計畫。
4. 最好的 agent 是適合你環境的那個
介面很重要,因為介面會塑造錯誤。
| 你的日常環境 | 優先選擇 | 需要注意 |
|---|---|---|
| 終端和指令碼 | Pi | 自己加入權限與恢復紀律 |
| 程式碼編輯器 + 倉庫 + 雲端任務佇列 | Codex | 把非程式碼工作流程放在別處 |
| 終端/IDE/CI/chatops 工程循環 | Claude Code | 設定倉庫規則、工具權限和審查檢查點 |
| 助手框架、閘道、語音、記憶、自動化 | Hermes | 仔細審計記憶和定時行為 |
| 橫跨檔案、瀏覽器、辦公 artifacts 和多個會話的桌面知識工作 | MCPlato | 使用精心整理的連接資料;不要把它過度用於很小的純 shell 任務 |
這也是避免工具蔓延的最簡單辦法。不要把每項工作都塞進最新的 agent。把每個工具放到它的介面天然適合的位置。
5. 權限策略必須匹配風險
自治最多的 agent,不一定擁有最適合你任務的權限模型。
一個輕量級權限策略通常有效:
| 風險級別 | 示例 | 推薦策略 |
|---|---|---|
| 低 | 讀取檔案、總結文件、搜尋已批准資料 | 允許並記錄日誌 |
| 中 | 編輯草稿、建立報告、運行本地指令碼 | 允許在工作區或沙箱中執行,並要求 artifacts |
| 高 | 刪除、部署、發布、發送外部消息、存取敏感系統 | 要求明確確認和證據 |
Codex 的公開沙箱和審批文件讓這類討論變得明確。7 Claude Code 的文件強調權限/設定,而不是單一的沙箱承諾。9 Pi 的極簡預設意味著權限策略通常是你的 wrapper 的責任。Hermes 用戶應格外謹慎對待後台自動化和持久記憶。MCPlato 最適合配合工作區級風險邊界使用:只連接所需資料,選擇合適的權限等級,並在外部動作之前讓最終 artifact 可審查。
產品亮點與坦誠限制
Pi Agent:極簡主義是一種功能
Pi 的吸引力在於它拒絕變成完整工作區。它的預設工具集很小,會話機制對開發者友好,並且多個入口讓它對構建自有 agent 工作流程的人很有吸引力。
當你想要控制權、可改造性和終端原生迭代時,選擇 Pi。不要期待它開箱即提供打磨完善的治理、辦公工作流程覆蓋或自主後台操作。
Hermes Agent:長期助手的能量
Hermes 在記憶和自我改進敘事上最有野心。持久記憶、技能建立、閘道、語音、MCP、subagents,以及定時/後台自動化,讓它在你想要一個跨任務存活的助手時很有吸引力。4
當你能舒服地管理有狀態自治時,選擇 Hermes。不要把它的學習循環視為天然可靠。只有當記憶可檢查、可糾正且有邊界時,它才有用。
Codex:跨介面的託管式編碼
當工作單元是軟體工程,並且你想要一個系統覆蓋桌面、IDE、CLI、雲端/網頁和 GitHub @codex 流程時,Codex 最適合。131718 它的沙箱和審批詞彙,尤其適合需要具體討論風險的團隊。
選擇 Codex 來處理帶有託管執行選項的編碼工作。不要期待它取代面向辦公文件、研究綜合或多應用知識工作的通用工作區。
Claude Code:成熟的 agentic 編碼循環
Claude Code 更像完整的專業編碼夥伴,而不是一個小型框架。其公開文件覆蓋終端使用、IDE 整合、桌面/網頁介面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。14191516
選擇 Claude Code 來處理嚴肅的倉庫維護和工程工作流程。它的限制在於,成熟並不消除治理需求:團隊仍然需要權限、編碼標準、測試要求和審查檢查點。
MCPlato:以工作區為先的 AI 工作
MCPlato 並不試圖在「極小終端框架」這件事上打敗 Pi。它的公開定位是一個 AI workspace,包含 AI Partners、Desktop AI Engine、異步工作流程、本地優先的連接資料、多會話編排、多視窗工作、虛擬夥伴/Sprite 概念、artifact 紀律、定時/後台任務、ClawMode、帶權限且可觀察的執行、決策軌跡和日記。10
當交付物是報告、比較、研究簡報、辦公 artifact、多應用工作流程或長時間後台任務時,選擇 MCPlato。它在需要多個會話的工作中尤其有用:一個會話做研究,一個起草,一個生成圖像,一個清理來源,再由一個協調夥伴追蹤完成情況。
限制在於複雜度。如果你的工作只是一個檔案的終端編輯,極簡框架可能感覺更快。
實用選擇策略
與其尋找一個通用 agent,不如使用一個小型組合:
- 預設用 Pi 處理小型終端原生實驗和自訂框架構建。
- 當重心是倉庫、測試、pull requests 和 CI 時,使用 Codex 或 Claude Code。
- 用 Hermes 處理實驗性的常駐助手、記憶、閘道和自動化場景,前提是你能夠審計狀態。
- 當工作跨越研究、本地資料、瀏覽器上下文、辦公 artifacts、多個會話或後台跟進時,使用 MCPlato。
- 只有在 artifact 可檢查時才提升權限。 先讀,再起草,再寫入,最後才發布/部署/發送。
勝出的模式不是最大自治,而是與工作匹配的有邊界自治。
結論
Pi 的走紅是合理的:在經歷更重的 agent 產品之後,很多技術用戶想要一個更小、更清晰的框架。Hermes 展示了持久助手狀態的吸引力和風險。Codex 與 Claude Code 展示了編碼 agent 正在多快地成為完整工程工作流程。MCPlato 指向的是另一個類別:面向知識工作、artifacts、本地資料和並行執行的 AI workspace。
沒有哪個產品普遍最好。合適的 agent,是那個其介面、權限模型和恢復方案與你實際工作相匹配的 agent。
參考資料
Footnotes
-
Pi 規範 GitHub 倉庫,
earendil-works/pi。https://github.com/earendil-works/pi ↩ -
Hermes Agent GitHub 倉庫,
NousResearch/hermes-agent。https://github.com/NousResearch/hermes-agent ↩ -
OpenAI Codex GitHub 倉庫。https://github.com/openai/codex ↩
-
Hermes Agent 文件。https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Pi 官方網站。https://pi.dev/ ↩
-
npm 套件
@earendil-works/pi-coding-agent。https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
OpenAI Codex 沙箱文件。https://developers.openai.com/codex/sandbox ↩ ↩2
-
Claude Code quickstart 文件。https://code.claude.com/docs/en/quickstart ↩
-
Claude Code settings 文件。https://code.claude.com/docs/en/settings ↩ ↩2
-
MCPlato 官方網站。https://mcplato.com/en/ ↩ ↩2
-
MCPlato 價格資訊。https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
OpenAI Codex 文件。https://developers.openai.com/codex ↩ ↩2
-
Claude Code 概覽文件。https://code.claude.com/docs/en/overview ↩ ↩2
-
Claude Code sub-agents 文件。https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Claude Code skills 文件。https://code.claude.com/docs/en/skills ↩ ↩2
-
OpenAI Codex CLI 文件。https://developers.openai.com/codex/cli ↩
-
OpenAI Codex IDE 文件。https://developers.openai.com/codex/ide ↩
-
Claude Code MCP 文件。https://code.claude.com/docs/en/mcp ↩
