返回部落格
AI 智能體
編碼智能體
Pi Agent
Hermes Agent
Codex
Claude Code
MCPlato

Pi、Hermes、Codex、Claude Code 與 MCPlato:哪個 Agent 更適合你的工作?

從控制權、工作流程適配、長任務與權限策略出發,對 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基於場景的實用比較。

發布於 2026-05-27

真正有用的問題不是:「哪個 AI agent 最強?」

而是:「哪個 agent 適合這項工作、這個環境,以及這一級別的風險?」

Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被稱為 agent,但它們並不想成為同一種產品。Pi 是一個極簡的終端編碼框架。Hermes 是一個強調記憶和自動化的助手框架。Codex 是覆蓋本地與雲端介面的託管式編碼工作流程。Claude Code 是一個成熟的 agentic 編碼循環,具備強大的倉庫工作流程。MCPlato 則是面向研究、報告、辦公、本地資料、多會話執行和後台任務的 AI 工作區。

研究期間,GitHub API 返回的資料是:earendil-works/pi56,110 stars 和 6,677 forksNousResearch/hermes-agent169,745 stars 和 28,286 forksopenai/codex86,227 stars 和 12,601 forks123 請把這些數字視為倉庫關注度訊號,而不是活躍用戶數。

這是一篇實用比較,不是產品排名。

產品適配一覽

產品最適合人們選擇它的原因主要取捨
Pi Agent終端原生的進階用戶、agent 構建者、極簡框架用戶介面小而聚焦,直接的檔案/bash 工具,互動與 JSON/RPC/SDK 模式,會話樹與分叉治理、擴展和長工作流程紀律需要你自己負責
Hermes Agent常駐助手、記憶實驗、自動化、類似機器人的入口持久記憶、自我改進敘事、技能建立、70+ 內建工具4、subagents 與定時/後台自動化記憶、壓縮和學習循環會增加狀態複雜度與失效模式
Codex橫跨 CLI、IDE、桌面、雲端、GitHub 的編碼工作流程完整的沙箱與審批文件、雲端任務、MCP、網頁搜尋、圖像輸入、exec 指令碼主要是編碼工作流程,而不是通用辦公或多應用工作區
Claude Code倉庫維護、重構、CI、程式碼審查、subagent/skill 工作流程成熟的 agentic 編碼循環,覆蓋終端、IDE、桌面/網頁、GitHub/GitLab、Slack、MCP、Agent SDK不如極簡框架那樣可改造,同時仍需要明確治理
MCPlato研究、報告、辦公工作流程、本地資料、多應用任務、異步 AI 同事模式AI workspace、AI Partner、多會話編排、本地優先的連接資料、artifacts、定時/後台任務、帶權限的執行比極簡終端框架更重;不是一次性 shell 編碼的最快路徑

Pi、Hermes、Codex、Claude Code 與 MCPlato 的場景適配地圖Pi、Hermes、Codex、Claude Code 與 MCPlato 的場景適配地圖

圖 1:按場景和工作介面來思考,而不是追逐一個通用排行榜。

為什麼 Pi 正在獲得關注

如果你曾被重量級 agent 產品折磨過,Pi 的吸引力很容易理解。

其規範專案是 earendil-works/pi,公開網站位於 pi.dev,研究期間 npm 套件 @earendil-works/pi-coding-agent 顯示的版本為 0.75.556 它的定位刻意收窄:一個極簡終端編碼框架,預設工具包括 read、write、edit 和 bash,並可選擇加入唯讀搜尋/導覽工具。

這種極簡主義解決了幾類用戶痛點:

  1. 太多 agent 把控制平面藏起來。 Pi 暴露的是更小、更容易檢查的工具循環。
  2. 進階用戶想要可組合性。 互動使用、print/JSON 模式、RPC 和 SDK 入口讓 Pi 更像一個構建塊,而不只是一個應用。
  3. 長會話需要分支。 Pi 的會話樹、fork/clone 流程、壓縮和 JSONL 會話記錄,貼近開發者實際探索替代方案的方式。
  4. 有些用戶不希望把彈窗當成產品哲學。 Pi 預設不內建 MCP、subagents、權限彈窗、plan mode 或後台 bash。這些更屬於擴展/套件,而不是核心。

它的弱點也正是它的優勢:Pi 並不試圖成為一個託管治理層。如果你開箱即需要權限策略、後台執行恢復、團隊審查或非程式碼辦公工作流程,就需要自己構建或添加那一層。

五條選擇原則

1. 按工作選擇,而不是按「最強 agent」選擇

強大的編碼 agent 不會自動成為強大的研究助手。靈活的記憶 agent 不會自動對生產倉庫安全。工作區 agent 也不會自動成為最快的終端工具。

先看工作:

工作合適的預設選擇原因
構建或定製終端編碼框架Pi極簡核心、直接工具、適合 SDK/RPC 的形態
運行常駐個人助手或機器人入口Hermes記憶、技能、自動化、面向語音/閘道/MCP 的介面
在 CLI、IDE、雲端和 GitHub 之間委派編碼工作Codex多個編碼入口,加上明確記錄的沙箱與審批模式
維護嚴肅倉庫,涉及重構、CI、subagents 和審查循環Claude Code成熟的程式碼 agent 工作流程、權限/設定、skills、subagents、CI/Slack 介面
產出帶來源的報告、辦公 artifacts、多應用工作和後台研究MCPlato工作區、連接資料、多會話編排、artifacts、定時/後台任務

這正是 MCPlato 自然適配的位置:它不是「最好的 agent」,而是在工作橫跨文件、瀏覽器研究、本地資料、辦公輸出、多個會話與異步跟進時更合適的預設選項。如果任務只是「從終端編輯這個檔案」,Pi 或編碼原生工具可能更乾淨。

2. 控制權與託管式工作流程確實是一種取捨

市場正在分成兩個有用的極端。

一端是 Pi,它給專家用戶一個緊湊框架。你能看見各個部件,接入自己的擴展,並讓 agent 靠近 shell。這對 agent 構建者和終端進階用戶非常適合。

另一端是 CodexClaude CodeMCPlato,它們提供更多託管式產品介面。Codex 記錄了 read-only、workspace-write、danger-full-access 等沙箱模式,以及 untrusted、on-request、never 等審批策略;其預設姿態被描述為 workspace-write 且網路關閉。7 Claude Code 的 quickstart 說明它會在修改檔案前請求許可,其設定/權限文件也為團隊提供了調節行為的方法。89 MCPlato 對外展示的工作區概念包括 AI Partner、Desktop AI Engine、連接資料、ClawMode、定時/後台任務、決策軌跡、日記和四級權限。1011

Hermes 位於另一種位置:它提供廣泛自治和可擴展性,但狀態模型更複雜。其文件強調自我改進、持久記憶、技能建立、CLI/gateway/voice/MCP、後台任務、定時自動化和 subagents。4 這讓它很適合長期助手,但並不自動更安全。記憶與壓縮問題,包括 issue #33256 這樣的討論,都提醒我們:持久 agent 狀態需要認真審查,而不是盲目信任。12

最佳選擇取決於你是想組裝控制平面,還是使用一個已經提供控制平面的產品

3. 長時間運行的工作需要檢查點、恢復路徑和 artifacts

短編碼任務可以存在於一段聊天裡。長時間運行的工作不行。

一個長時間運行的 agent 任務應該具備:

  • prompt 契約;
  • 精心整理的上下文/環境;
  • 權限邊界;
  • 檢查點;
  • 可審查的 artifacts;
  • 恢復或繼續路徑。

AI agents 的長任務控制棧AI agents 的長任務控制棧

圖 2:當控制被分層,而不是隱藏在單個聊天執行緒裡時,長時間運行的 agent 工作更安全。

每個產品的處理方式不同:

  • Pi 提供有用的原語,例如會話樹、forks、clones、壓縮和 JSONL 記錄。它很適合受控探索;但作為完整營運層還不夠完備。
  • Hermes 目標是持久記憶和定時/後台自動化。它對連續性很強;但當記憶品質、壓縮或自我改進回饋循環沒有被檢查時,風險更高。
  • Codex 支援本地與雲端編碼任務、MCP、網頁搜尋、圖像輸入,以及貫穿其編碼介面的指令碼化執行。13
  • Claude Code 在文件中加入了具備獨立上下文/工具存取的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack,以及面向定時/例行任務的工作流程。141516
  • MCPlato 在長工作不只是程式碼時最強:研究分支、文件起草、瀏覽器/資料審閱、圖像或辦公 artifact 產出,以及後台任務,都可以作為工作區級工作流存在,而不是擠在一個超載的聊天裡。

一條實用規則:如果任務會跨越一個以上會話,在讓 agent 跑遠之前,先要求 artifact 和檢查點計畫。

4. 最好的 agent 是適合你環境的那個

介面很重要,因為介面會塑造錯誤。

你的日常環境優先選擇需要注意
終端和指令碼Pi自己加入權限與恢復紀律
程式碼編輯器 + 倉庫 + 雲端任務佇列Codex把非程式碼工作流程放在別處
終端/IDE/CI/chatops 工程循環Claude Code設定倉庫規則、工具權限和審查檢查點
助手框架、閘道、語音、記憶、自動化Hermes仔細審計記憶和定時行為
橫跨檔案、瀏覽器、辦公 artifacts 和多個會話的桌面知識工作MCPlato使用精心整理的連接資料;不要把它過度用於很小的純 shell 任務

這也是避免工具蔓延的最簡單辦法。不要把每項工作都塞進最新的 agent。把每個工具放到它的介面天然適合的位置。

5. 權限策略必須匹配風險

自治最多的 agent,不一定擁有最適合你任務的權限模型。

一個輕量級權限策略通常有效:

風險級別示例推薦策略
讀取檔案、總結文件、搜尋已批准資料允許並記錄日誌
編輯草稿、建立報告、運行本地指令碼允許在工作區或沙箱中執行,並要求 artifacts
刪除、部署、發布、發送外部消息、存取敏感系統要求明確確認和證據

Codex 的公開沙箱和審批文件讓這類討論變得明確。7 Claude Code 的文件強調權限/設定,而不是單一的沙箱承諾。9 Pi 的極簡預設意味著權限策略通常是你的 wrapper 的責任。Hermes 用戶應格外謹慎對待後台自動化和持久記憶。MCPlato 最適合配合工作區級風險邊界使用:只連接所需資料,選擇合適的權限等級,並在外部動作之前讓最終 artifact 可審查。

產品亮點與坦誠限制

Pi Agent:極簡主義是一種功能

Pi 的吸引力在於它拒絕變成完整工作區。它的預設工具集很小,會話機制對開發者友好,並且多個入口讓它對構建自有 agent 工作流程的人很有吸引力。

當你想要控制權、可改造性和終端原生迭代時,選擇 Pi。不要期待它開箱即提供打磨完善的治理、辦公工作流程覆蓋或自主後台操作。

Hermes Agent:長期助手的能量

Hermes 在記憶和自我改進敘事上最有野心。持久記憶、技能建立、閘道、語音、MCP、subagents,以及定時/後台自動化,讓它在你想要一個跨任務存活的助手時很有吸引力。4

當你能舒服地管理有狀態自治時,選擇 Hermes。不要把它的學習循環視為天然可靠。只有當記憶可檢查、可糾正且有邊界時,它才有用。

Codex:跨介面的託管式編碼

當工作單元是軟體工程,並且你想要一個系統覆蓋桌面、IDE、CLI、雲端/網頁和 GitHub @codex 流程時,Codex 最適合。131718 它的沙箱和審批詞彙,尤其適合需要具體討論風險的團隊。

選擇 Codex 來處理帶有託管執行選項的編碼工作。不要期待它取代面向辦公文件、研究綜合或多應用知識工作的通用工作區。

Claude Code:成熟的 agentic 編碼循環

Claude Code 更像完整的專業編碼夥伴,而不是一個小型框架。其公開文件覆蓋終端使用、IDE 整合、桌面/網頁介面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。14191516

選擇 Claude Code 來處理嚴肅的倉庫維護和工程工作流程。它的限制在於,成熟並不消除治理需求:團隊仍然需要權限、編碼標準、測試要求和審查檢查點。

MCPlato:以工作區為先的 AI 工作

MCPlato 並不試圖在「極小終端框架」這件事上打敗 Pi。它的公開定位是一個 AI workspace,包含 AI Partners、Desktop AI Engine、異步工作流程、本地優先的連接資料、多會話編排、多視窗工作、虛擬夥伴/Sprite 概念、artifact 紀律、定時/後台任務、ClawMode、帶權限且可觀察的執行、決策軌跡和日記。10

當交付物是報告、比較、研究簡報、辦公 artifact、多應用工作流程或長時間後台任務時,選擇 MCPlato。它在需要多個會話的工作中尤其有用:一個會話做研究,一個起草,一個生成圖像,一個清理來源,再由一個協調夥伴追蹤完成情況。

限制在於複雜度。如果你的工作只是一個檔案的終端編輯,極簡框架可能感覺更快。

實用選擇策略

與其尋找一個通用 agent,不如使用一個小型組合:

  1. 預設用 Pi 處理小型終端原生實驗和自訂框架構建。
  2. 當重心是倉庫、測試、pull requests 和 CI 時,使用 Codex 或 Claude Code
  3. 用 Hermes 處理實驗性的常駐助手、記憶、閘道和自動化場景,前提是你能夠審計狀態。
  4. 當工作跨越研究、本地資料、瀏覽器上下文、辦公 artifacts、多個會話或後台跟進時,使用 MCPlato
  5. 只有在 artifact 可檢查時才提升權限。 先讀,再起草,再寫入,最後才發布/部署/發送。

勝出的模式不是最大自治,而是與工作匹配的有邊界自治

結論

Pi 的走紅是合理的:在經歷更重的 agent 產品之後,很多技術用戶想要一個更小、更清晰的框架。Hermes 展示了持久助手狀態的吸引力和風險。Codex 與 Claude Code 展示了編碼 agent 正在多快地成為完整工程工作流程。MCPlato 指向的是另一個類別:面向知識工作、artifacts、本地資料和並行執行的 AI workspace。

沒有哪個產品普遍最好。合適的 agent,是那個其介面、權限模型和恢復方案與你實際工作相匹配的 agent。

參考資料

Footnotes

  1. Pi 規範 GitHub 倉庫,earendil-works/pihttps://github.com/earendil-works/pi

  2. Hermes Agent GitHub 倉庫,NousResearch/hermes-agenthttps://github.com/NousResearch/hermes-agent

  3. OpenAI Codex GitHub 倉庫。https://github.com/openai/codex

  4. Hermes Agent 文件。https://hermes-agent.nousresearch.com/docs/ 2 3

  5. Pi 官方網站。https://pi.dev/

  6. npm 套件 @earendil-works/pi-coding-agenthttps://www.npmjs.com/package/@earendil-works/pi-coding-agent

  7. OpenAI Codex 沙箱文件。https://developers.openai.com/codex/sandbox 2

  8. Claude Code quickstart 文件。https://code.claude.com/docs/en/quickstart

  9. Claude Code settings 文件。https://code.claude.com/docs/en/settings 2

  10. MCPlato 官方網站。https://mcplato.com/en/ 2

  11. MCPlato 價格資訊。https://mcplato.com/pricing

  12. Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256

  13. OpenAI Codex 文件。https://developers.openai.com/codex 2

  14. Claude Code 概覽文件。https://code.claude.com/docs/en/overview 2

  15. Claude Code sub-agents 文件。https://code.claude.com/docs/en/sub-agents 2

  16. Claude Code skills 文件。https://code.claude.com/docs/en/skills 2

  17. OpenAI Codex CLI 文件。https://developers.openai.com/codex/cli

  18. OpenAI Codex IDE 文件。https://developers.openai.com/codex/ide

  19. Claude Code MCP 文件。https://code.claude.com/docs/en/mcp