AI 智能體

編碼智能體

Pi Agent

Hermes Agent

Codex

Claude Code

MCPlato

Pi、Hermes、Codex、Claude Code 與 MCPlato：哪個 Agent 更適合你的工作？

從控制權、工作流程適配、長任務與權限策略出發，對 Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 做一次基於場景的實用比較。

MCPlato Research Team發布於 2026-05-27

真正有用的問題不是：「哪個 AI agent 最強？」

而是：「哪個 agent 適合這項工作、這個環境，以及這一級別的風險？」

Pi Agent、Hermes Agent、Codex、Claude Code 和 MCPlato 都被稱為 agent，但它們並不想成為同一種產品。Pi 是一個極簡的終端編碼框架。Hermes 是一個強調記憶和自動化的助手框架。Codex 是覆蓋本地與雲端介面的託管式編碼工作流程。Claude Code 是一個成熟的 agentic 編碼循環，具備強大的倉庫工作流程。MCPlato 則是面向研究、報告、辦公、本地資料、多會話執行和後台任務的 AI 工作區。

研究期間，GitHub API 返回的資料是：earendil-works/pi 有 56,110 stars 和 6,677 forks，NousResearch/hermes-agent 有 169,745 stars 和 28,286 forks，openai/codex 有 86,227 stars 和 12,601 forks。¹²³ 請把這些數字視為倉庫關注度訊號，而不是活躍用戶數。

這是一篇實用比較，不是產品排名。

產品適配一覽

產品	最適合	人們選擇它的原因	主要取捨
Pi Agent	終端原生的進階用戶、agent 構建者、極簡框架用戶	介面小而聚焦，直接的檔案/bash 工具，互動與 JSON/RPC/SDK 模式，會話樹與分叉	治理、擴展和長工作流程紀律需要你自己負責
Hermes Agent	常駐助手、記憶實驗、自動化、類似機器人的入口	持久記憶、自我改進敘事、技能建立、70+ 內建工具⁴、subagents 與定時/後台自動化	記憶、壓縮和學習循環會增加狀態複雜度與失效模式
Codex	橫跨 CLI、IDE、桌面、雲端、GitHub 的編碼工作流程	完整的沙箱與審批文件、雲端任務、MCP、網頁搜尋、圖像輸入、exec 指令碼	主要是編碼工作流程，而不是通用辦公或多應用工作區
Claude Code	倉庫維護、重構、CI、程式碼審查、subagent/skill 工作流程	成熟的 agentic 編碼循環，覆蓋終端、IDE、桌面/網頁、GitHub/GitLab、Slack、MCP、Agent SDK	不如極簡框架那樣可改造，同時仍需要明確治理
MCPlato	研究、報告、辦公工作流程、本地資料、多應用任務、異步 AI 同事模式	AI workspace、AI Partner、多會話編排、本地優先的連接資料、artifacts、定時/後台任務、帶權限的執行	比極簡終端框架更重；不是一次性 shell 編碼的最快路徑

Pi、Hermes、Codex、Claude Code 與 MCPlato 的場景適配地圖

圖 1：按場景和工作介面來思考，而不是追逐一個通用排行榜。

為什麼 Pi 正在獲得關注

如果你曾被重量級 agent 產品折磨過，Pi 的吸引力很容易理解。

其規範專案是 earendil-works/pi，公開網站位於 pi.dev，研究期間 npm 套件 @earendil-works/pi-coding-agent 顯示的版本為 0.75.5。⁵⁶ 它的定位刻意收窄：一個極簡終端編碼框架，預設工具包括 read、write、edit 和 bash，並可選擇加入唯讀搜尋/導覽工具。

這種極簡主義解決了幾類用戶痛點：

太多 agent 把控制平面藏起來。 Pi 暴露的是更小、更容易檢查的工具循環。
進階用戶想要可組合性。 互動使用、print/JSON 模式、RPC 和 SDK 入口讓 Pi 更像一個構建塊，而不只是一個應用。
長會話需要分支。 Pi 的會話樹、fork/clone 流程、壓縮和 JSONL 會話記錄，貼近開發者實際探索替代方案的方式。
有些用戶不希望把彈窗當成產品哲學。 Pi 預設不內建 MCP、subagents、權限彈窗、plan mode 或後台 bash。這些更屬於擴展/套件，而不是核心。

它的弱點也正是它的優勢：Pi 並不試圖成為一個託管治理層。如果你開箱即需要權限策略、後台執行恢復、團隊審查或非程式碼辦公工作流程，就需要自己構建或添加那一層。

五條選擇原則

1. 按工作選擇，而不是按「最強 agent」選擇

強大的編碼 agent 不會自動成為強大的研究助手。靈活的記憶 agent 不會自動對生產倉庫安全。工作區 agent 也不會自動成為最快的終端工具。

先看工作：

工作	合適的預設選擇	原因
構建或定製終端編碼框架	Pi	極簡核心、直接工具、適合 SDK/RPC 的形態
運行常駐個人助手或機器人入口	Hermes	記憶、技能、自動化、面向語音/閘道/MCP 的介面
在 CLI、IDE、雲端和 GitHub 之間委派編碼工作	Codex	多個編碼入口，加上明確記錄的沙箱與審批模式
維護嚴肅倉庫，涉及重構、CI、subagents 和審查循環	Claude Code	成熟的程式碼 agent 工作流程、權限/設定、skills、subagents、CI/Slack 介面
產出帶來源的報告、辦公 artifacts、多應用工作和後台研究	MCPlato	工作區、連接資料、多會話編排、artifacts、定時/後台任務

這正是 MCPlato 自然適配的位置：它不是「最好的 agent」，而是在工作橫跨文件、瀏覽器研究、本地資料、辦公輸出、多個會話與異步跟進時更合適的預設選項。如果任務只是「從終端編輯這個檔案」，Pi 或編碼原生工具可能更乾淨。

2. 控制權與託管式工作流程確實是一種取捨

市場正在分成兩個有用的極端。

一端是 Pi，它給專家用戶一個緊湊框架。你能看見各個部件，接入自己的擴展，並讓 agent 靠近 shell。這對 agent 構建者和終端進階用戶非常適合。

另一端是 Codex、Claude Code 和 MCPlato，它們提供更多託管式產品介面。Codex 記錄了 read-only、workspace-write、danger-full-access 等沙箱模式，以及 untrusted、on-request、never 等審批策略；其預設姿態被描述為 workspace-write 且網路關閉。⁷ Claude Code 的 quickstart 說明它會在修改檔案前請求許可，其設定/權限文件也為團隊提供了調節行為的方法。⁸⁹ MCPlato 對外展示的工作區概念包括 AI Partner、Desktop AI Engine、連接資料、ClawMode、定時/後台任務、決策軌跡、日記和四級權限。¹⁰¹¹

Hermes 位於另一種位置：它提供廣泛自治和可擴展性，但狀態模型更複雜。其文件強調自我改進、持久記憶、技能建立、CLI/gateway/voice/MCP、後台任務、定時自動化和 subagents。⁴ 這讓它很適合長期助手，但並不自動更安全。記憶與壓縮問題，包括 issue #33256 這樣的討論，都提醒我們：持久 agent 狀態需要認真審查，而不是盲目信任。¹²

最佳選擇取決於你是想組裝控制平面，還是使用一個已經提供控制平面的產品。

3. 長時間運行的工作需要檢查點、恢復路徑和 artifacts

短編碼任務可以存在於一段聊天裡。長時間運行的工作不行。

一個長時間運行的 agent 任務應該具備：

prompt 契約；
精心整理的上下文/環境；
權限邊界；
檢查點；
可審查的 artifacts；
恢復或繼續路徑。

AI agents 的長任務控制棧

圖 2：當控制被分層，而不是隱藏在單個聊天執行緒裡時，長時間運行的 agent 工作更安全。

每個產品的處理方式不同：

Pi 提供有用的原語，例如會話樹、forks、clones、壓縮和 JSONL 記錄。它很適合受控探索；但作為完整營運層還不夠完備。
Hermes 目標是持久記憶和定時/後台自動化。它對連續性很強；但當記憶品質、壓縮或自我改進回饋循環沒有被檢查時，風險更高。
Codex 支援本地與雲端編碼任務、MCP、網頁搜尋、圖像輸入，以及貫穿其編碼介面的指令碼化執行。¹³
Claude Code 在文件中加入了具備獨立上下文/工具存取的 subagents、skills、MCP、GitHub Actions/GitLab CI、Slack，以及面向定時/例行任務的工作流程。¹⁴¹⁵¹⁶
MCPlato 在長工作不只是程式碼時最強：研究分支、文件起草、瀏覽器/資料審閱、圖像或辦公 artifact 產出，以及後台任務，都可以作為工作區級工作流存在，而不是擠在一個超載的聊天裡。

一條實用規則：如果任務會跨越一個以上會話，在讓 agent 跑遠之前，先要求 artifact 和檢查點計畫。

4. 最好的 agent 是適合你環境的那個

介面很重要，因為介面會塑造錯誤。

你的日常環境	優先選擇	需要注意
終端和指令碼	Pi	自己加入權限與恢復紀律
程式碼編輯器 + 倉庫 + 雲端任務佇列	Codex	把非程式碼工作流程放在別處
終端/IDE/CI/chatops 工程循環	Claude Code	設定倉庫規則、工具權限和審查檢查點
助手框架、閘道、語音、記憶、自動化	Hermes	仔細審計記憶和定時行為
橫跨檔案、瀏覽器、辦公 artifacts 和多個會話的桌面知識工作	MCPlato	使用精心整理的連接資料；不要把它過度用於很小的純 shell 任務

這也是避免工具蔓延的最簡單辦法。不要把每項工作都塞進最新的 agent。把每個工具放到它的介面天然適合的位置。

5. 權限策略必須匹配風險

自治最多的 agent，不一定擁有最適合你任務的權限模型。

一個輕量級權限策略通常有效：

風險級別	示例	推薦策略
低	讀取檔案、總結文件、搜尋已批准資料	允許並記錄日誌
中	編輯草稿、建立報告、運行本地指令碼	允許在工作區或沙箱中執行，並要求 artifacts
高	刪除、部署、發布、發送外部消息、存取敏感系統	要求明確確認和證據

Codex 的公開沙箱和審批文件讓這類討論變得明確。⁷ Claude Code 的文件強調權限/設定，而不是單一的沙箱承諾。⁹ Pi 的極簡預設意味著權限策略通常是你的 wrapper 的責任。Hermes 用戶應格外謹慎對待後台自動化和持久記憶。MCPlato 最適合配合工作區級風險邊界使用：只連接所需資料，選擇合適的權限等級，並在外部動作之前讓最終 artifact 可審查。

產品亮點與坦誠限制

Pi Agent：極簡主義是一種功能

Pi 的吸引力在於它拒絕變成完整工作區。它的預設工具集很小，會話機制對開發者友好，並且多個入口讓它對構建自有 agent 工作流程的人很有吸引力。

當你想要控制權、可改造性和終端原生迭代時，選擇 Pi。不要期待它開箱即提供打磨完善的治理、辦公工作流程覆蓋或自主後台操作。

Hermes Agent：長期助手的能量

Hermes 在記憶和自我改進敘事上最有野心。持久記憶、技能建立、閘道、語音、MCP、subagents，以及定時/後台自動化，讓它在你想要一個跨任務存活的助手時很有吸引力。⁴

當你能舒服地管理有狀態自治時，選擇 Hermes。不要把它的學習循環視為天然可靠。只有當記憶可檢查、可糾正且有邊界時，它才有用。

Codex：跨介面的託管式編碼

當工作單元是軟體工程，並且你想要一個系統覆蓋桌面、IDE、CLI、雲端/網頁和 GitHub @codex 流程時，Codex 最適合。¹³¹⁷¹⁸ 它的沙箱和審批詞彙，尤其適合需要具體討論風險的團隊。

選擇 Codex 來處理帶有託管執行選項的編碼工作。不要期待它取代面向辦公文件、研究綜合或多應用知識工作的通用工作區。

Claude Code：成熟的 agentic 編碼循環

Claude Code 更像完整的專業編碼夥伴，而不是一個小型框架。其公開文件覆蓋終端使用、IDE 整合、桌面/網頁介面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack 和 Agent SDK 入口。¹⁴¹⁹¹⁵¹⁶

選擇 Claude Code 來處理嚴肅的倉庫維護和工程工作流程。它的限制在於，成熟並不消除治理需求：團隊仍然需要權限、編碼標準、測試要求和審查檢查點。

MCPlato：以工作區為先的 AI 工作

MCPlato 並不試圖在「極小終端框架」這件事上打敗 Pi。它的公開定位是一個 AI workspace，包含 AI Partners、Desktop AI Engine、異步工作流程、本地優先的連接資料、多會話編排、多視窗工作、虛擬夥伴/Sprite 概念、artifact 紀律、定時/後台任務、ClawMode、帶權限且可觀察的執行、決策軌跡和日記。¹⁰

當交付物是報告、比較、研究簡報、辦公 artifact、多應用工作流程或長時間後台任務時，選擇 MCPlato。它在需要多個會話的工作中尤其有用：一個會話做研究，一個起草，一個生成圖像，一個清理來源，再由一個協調夥伴追蹤完成情況。

限制在於複雜度。如果你的工作只是一個檔案的終端編輯，極簡框架可能感覺更快。

實用選擇策略

與其尋找一個通用 agent，不如使用一個小型組合：

預設用 Pi 處理小型終端原生實驗和自訂框架構建。
當重心是倉庫、測試、pull requests 和 CI 時，使用 Codex 或 Claude Code。
用 Hermes 處理實驗性的常駐助手、記憶、閘道和自動化場景，前提是你能夠審計狀態。
當工作跨越研究、本地資料、瀏覽器上下文、辦公 artifacts、多個會話或後台跟進時，使用 MCPlato。
只有在 artifact 可檢查時才提升權限。 先讀，再起草，再寫入，最後才發布/部署/發送。

勝出的模式不是最大自治，而是與工作匹配的有邊界自治。

結論

Pi 的走紅是合理的：在經歷更重的 agent 產品之後，很多技術用戶想要一個更小、更清晰的框架。Hermes 展示了持久助手狀態的吸引力和風險。Codex 與 Claude Code 展示了編碼 agent 正在多快地成為完整工程工作流程。MCPlato 指向的是另一個類別：面向知識工作、artifacts、本地資料和並行執行的 AI workspace。

沒有哪個產品普遍最好。合適的 agent，是那個其介面、權限模型和恢復方案與你實際工作相匹配的 agent。

參考資料

Footnotes

Pi 規範 GitHub 倉庫，earendil-works/pi。https://github.com/earendil-works/pi ↩
Hermes Agent GitHub 倉庫，NousResearch/hermes-agent。https://github.com/NousResearch/hermes-agent ↩
OpenAI Codex GitHub 倉庫。https://github.com/openai/codex ↩
Hermes Agent 文件。https://hermes-agent.nousresearch.com/docs/ ↩ ↩² ↩³
Pi 官方網站。https://pi.dev/ ↩
npm 套件 @earendil-works/pi-coding-agent。https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩
OpenAI Codex 沙箱文件。https://developers.openai.com/codex/sandbox ↩ ↩²
Claude Code quickstart 文件。https://code.claude.com/docs/en/quickstart ↩
Claude Code settings 文件。https://code.claude.com/docs/en/settings ↩ ↩²
MCPlato 官方網站。https://mcplato.com/en/ ↩ ↩²
MCPlato 價格資訊。https://mcplato.com/pricing ↩
Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256 ↩
OpenAI Codex 文件。https://developers.openai.com/codex ↩ ↩²
Claude Code 概覽文件。https://code.claude.com/docs/en/overview ↩ ↩²
Claude Code sub-agents 文件。https://code.claude.com/docs/en/sub-agents ↩ ↩²
Claude Code skills 文件。https://code.claude.com/docs/en/skills ↩ ↩²
OpenAI Codex CLI 文件。https://developers.openai.com/codex/cli ↩
OpenAI Codex IDE 文件。https://developers.openai.com/codex/ide ↩
Claude Code MCP 文件。https://code.claude.com/docs/en/mcp ↩

閱讀更多

2026 H1 智能體技術棧：模型、編排框架、執行階段與 AI 工作空間
一份簡明的 2026 H1 AI 智能體、編碼智能體、編排框架、執行階段、瀏覽器與沙箱基礎設施、可觀測性、治理和 AI 工作空間版圖，並將 MCPlato 定位在工作空間層。
如何使用通用 AI 智能體而不失去控制
通用 AI 智能體最適合在有邊界、可檢查的工作流中運行。本指南介紹提示詞契約、長任務結構、人工檢查點、精選環境，以及適用於 Hermes、OpenClaw 風格閘道和 MCPlato 等智能體的可審查產物。
Codex 可打造市場工具，MCPlato 可營運研究台。
一份面向預測市場研究流程的 Codex vs MCPlato 實用指南，涵蓋週期簡報、市場隱含機率、本地模型複核、決策日誌與 Wands，強調不提供投資建議、不執行交易，並始終保留人工審閱、來源連結和可複盤記錄，以便把價格訊號轉為可追蹤的研究產物。