Pi、Hermes、Codex、Claude Code、MCPlato:あなたの仕事に合う Agent はどれか?
Pi Agent、Hermes Agent、Codex、Claude Code、MCPlato を、制御、ワークフロー適合性、長時間タスク、権限戦略の観点から実践的に比較します。
公開日 2026-05-27
本当に役に立つ問いは、「どの AI agent が最強か?」 ではありません。
大事なのは、「この仕事、この環境、このリスク水準に合う agent はどれか?」 です。
Pi Agent、Hermes Agent、Codex、Claude Code、MCPlato はいずれも agent と呼ばれますが、同じ製品を目指しているわけではありません。Pi はミニマルなターミナル向けコーディングハーネスです。Hermes は記憶と自動化を重視するアシスタントフレームワークです。Codex はローカルとクラウドの両方にまたがるマネージドなコーディングワークフローです。Claude Code は、強力なリポジトリワークフローを備えた成熟した agentic コーディングループです。MCPlato は、リサーチ、レポート、オフィス作業、ローカル資料、マルチセッション実行、バックグラウンドタスクのための AI ワークスペースです。
調査時点で GitHub API は、earendil-works/pi に 56,110 stars と 6,677 forks、NousResearch/hermes-agent に 169,745 stars と 28,286 forks、openai/codex に 86,227 stars と 12,601 forks を返しました。123 これらの数字はアクティブユーザー数ではなく、リポジトリへの注目度を示すシグナルとして見てください。
これは実践的な比較であり、製品ランキングではありません。
製品適合性の早見表
| 製品 | 最も合う用途 | 選ばれる理由 | 主なトレードオフ |
|---|---|---|---|
| Pi Agent | ターミナルネイティブなパワーユーザー、agent ビルダー、ミニマルなハーネスの利用者 | 小さな操作面、直接的なファイル/bash ツール、対話型と JSON/RPC/SDK モード、セッションツリーとフォーク | ガバナンス、拡張、長時間ワークフローの規律は自分で担う必要がある |
| Hermes Agent | 常駐型アシスタント、記憶実験、自動化、ボット的なゲートウェイ | 永続メモリ、自己改善の枠組み、スキル作成、70+ の内蔵ツール4、subagents とスケジュール/バックグラウンド自動化 | メモリ、圧縮、学習ループが状態の複雑さと失敗モードを増やす |
| Codex | CLI、IDE、デスクトップ、クラウド、GitHub にまたがるコーディングワークフロー | 強力なサンドボックスと承認の文書、クラウドタスク、MCP、ウェブ検索、画像入力、exec スクリプト | 主にコーディングワークフローであり、汎用オフィス作業やマルチアプリのワークスペースではない |
| Claude Code | リポジトリ保守、リファクタリング、CI、コードレビュー、subagent/skill ワークフロー | ターミナル、IDE、デスクトップ/ウェブ、GitHub/GitLab、Slack、MCP、Agent SDK にまたがる成熟した agentic コーディングループ | ミニマルなハーネスほど改造しやすくはなく、明確なガバナンスも依然として必要 |
| MCPlato | リサーチ、レポート、オフィスワークフロー、ローカル資料、マルチアプリ作業、非同期 AI 同僚パターン | AI workspace、AI Partner、マルチセッション編成、ローカル優先の接続資料、artifacts、スケジュール/バックグラウンドタスク、権限付き実行 | ミニマルなターミナルハーネスより重い。一回限りの shell コーディングには最短ではない |
Pi、Hermes、Codex、Claude Code、MCPlato のシナリオ適合マップ
図 1:単一の万能ランキングではなく、シナリオと作業面で考える。
Pi が注目されている理由
重い agent 製品に不満を感じたことがあるなら、Pi の魅力は理解しやすいはずです。
正規のプロジェクトは earendil-works/pi で、公開サイトは pi.dev、調査時点で npm パッケージ @earendil-works/pi-coding-agent はバージョン 0.75.5 と報告されていました。56 その位置づけは意図的に狭く、read、write、edit、bash などの標準ツールに加えて、任意の読み取り専用検索/ナビゲーションツールを持つミニマルなターミナルコーディングハーネスです。
このミニマリズムは、いくつかのユーザー課題を解決します。
- 多くの agent は制御プレーンを隠しすぎる。 Pi はより小さく、検査しやすいツールループを見せます。
- パワーユーザーは組み合わせやすさを求める。 対話利用、print/JSON モード、RPC、SDK の入口により、Pi は単なるアプリではなく構成要素のように感じられます。
- 長いセッションには分岐が必要。 Pi のセッションツリー、fork/clone フロー、圧縮、JSONL セッション記録は、開発者が代替案を探索する実際のやり方に合っています。
- ポップアップを製品思想にしたくないユーザーもいる。 Pi は標準で MCP、subagents、権限ポップアップ、plan mode、バックグラウンド bash を組み込みません。それらはコアではなく拡張/パッケージに属します。
弱点は強みと同じです。Pi はマネージドなガバナンス層を目指していません。権限ポリシー、バックグラウンド実行の回復、チームレビュー、非コードのオフィスワークフローを最初から必要とするなら、その層を自分で作るか追加する必要があります。
5 つの選択原則
1. 「最強 agent」ではなく仕事で選ぶ
強いコーディング agent が、自動的に強いリサーチアシスタントになるわけではありません。柔軟な記憶 agent が、本番リポジトリに自動的に安全なわけでもありません。ワークスペース agent が、常に最速のターミナルツールになるわけでもありません。
まず仕事から考えます。
| 仕事 | 適した標準候補 | 理由 |
|---|---|---|
| ターミナルコーディングハーネスを構築またはカスタマイズする | Pi | ミニマルなコア、直接的なツール、SDK/RPC に向いた形 |
| 常駐型の個人アシスタントやボットゲートウェイを動かす | Hermes | メモリ、スキル、自動化、音声/ゲートウェイ/MCP 向けの表面 |
| CLI、IDE、クラウド、GitHub にまたがってコーディング作業を委任する | Codex | 複数のコーディング入口と、文書化されたサンドボックス/承認モード |
| リファクタリング、CI、subagents、レビュー循環を伴う本格的なリポジトリを保守する | Claude Code | 成熟したコード agent ワークフロー、権限/設定、skills、subagents、CI/Slack の表面 |
| 出典付きレポート、オフィス artifacts、マルチアプリ作業、バックグラウンドリサーチを作る | MCPlato | ワークスペース、接続資料、マルチセッション編成、artifacts、スケジュール/バックグラウンドタスク |
ここで MCPlato は自然に収まります。「最高の agent」としてではなく、作業が文書、ブラウザ調査、ローカル資料、オフィス出力、複数セッション、非同期のフォローアップにまたがるときのより良い標準候補です。タスクが単に「このファイルをターミナルから編集する」だけなら、Pi やコーディングネイティブなツールの方がすっきりします。
2. 制御とマネージドワークフローは本物のトレードオフ
市場は、役に立つ 2 つの極へ分かれつつあります。
一方の端にある Pi は、専門ユーザーにコンパクトなハーネスを与えます。部品を見通し、自分の拡張を配線し、agent を shell の近くに置けます。これは agent ビルダーやターミナルのパワーユーザーに非常に向いています。
もう一方では、Codex、Claude Code、MCPlato が、よりマネージドな製品表面を提供します。Codex は read-only、workspace-write、danger-full-access などのサンドボックスモードと、untrusted、on-request、never などの承認ポリシーを文書化しています。標準の姿勢は、ネットワークをオフにした workspace-write と説明されています。7 Claude Code の quickstart は、ファイルを変更する前に許可を求めると述べており、設定/権限の文書はチームが挙動を調整する方法を示しています。89 MCPlato は、AI Partner、Desktop AI Engine、接続資料、ClawMode、スケジュール/バックグラウンドタスク、意思決定の痕跡、日記、4 段階の権限などの公開ワークスペース概念を提示しています。1011
Hermes は別の位置にあります。広い自律性と拡張性を提供しますが、状態モデルはより複雑です。文書では自己改善、永続メモリ、スキル作成、CLI/gateway/voice/MCP、バックグラウンドタスク、スケジュール自動化、subagents が強調されています。4 これは長寿命のアシスタントには有望ですが、自動的に安全になるわけではありません。issue #33256 のような議論を含むメモリや圧縮の問題は、永続的な agent 状態には盲信ではなく慎重なレビューが必要だと示しています。12
最適な選択は、制御プレーンを自分で組み立てたい のか、すでに制御プレーンを持つ製品を使いたい のかによって変わります。
3. 長時間作業にはチェックポイント、回復、artifacts が必要
短いコーディングタスクならチャットだけでも持ちこたえられます。長時間作業はそうはいきません。
長時間実行される agent タスクには、次が必要です。
- prompt の契約;
- 整理されたコンテキスト/環境;
- 権限境界;
- チェックポイント;
- レビュー可能な artifacts;
- 回復または継続の道筋。
AI agents の長時間タスク制御スタック
図 2:長時間の agent 作業は、制御が単一のチャットスレッドの中に隠れるのではなく、層として分かれているほど安全になる。
各製品のアプローチは異なります。
- Pi は、セッションツリー、forks、clones、圧縮、JSONL 記録などの有用なプリミティブを提供します。制御された探索には優れていますが、完成した運用層としては不十分です。
- Hermes は、永続メモリとスケジュール/バックグラウンド自動化を目指します。継続性には強力ですが、メモリ品質、圧縮、自己改善フィードバックループが検査されていない場合はリスクが高くなります。
- Codex は、ローカルとクラウドのコーディングタスク、MCP、ウェブ検索、画像入力、コーディング表面全体でのスクリプト実行をサポートします。13
- Claude Code は、独立したコンテキスト/ツールアクセスを持つ subagents、skills、MCP、GitHub Actions/GitLab CI、Slack、スケジュール/定型作業向けワークフローを文書で扱っています。141516
- MCPlato は、長い作業がコードだけではないときに最も強くなります。リサーチの分岐、文書ドラフト、ブラウザ/資料レビュー、画像やオフィス artifact の作成、バックグラウンドタスクを、過負荷の単一チャットではなくワークスペースレベルのワークストリームとして扱えます。
実践的なルールは、タスクが 1 セッションを超えるなら、agent を遠くまで走らせる前に artifact とチェックポイント計画を求めることです。
4. 最高の agent は、自分の環境に合うもの
インターフェースは重要です。ミスの形を作るからです。
| 日常の環境 | 優先候補 | 注意点 |
|---|---|---|
| ターミナルとスクリプト | Pi | 権限と回復の規律を自分で追加する |
| コードエディタ + リポジトリ + クラウドタスクキュー | Codex | 非コードのワークフローは別に置く |
| ターミナル/IDE/CI/chatops のエンジニアリングループ | Claude Code | リポジトリルール、ツール権限、レビューチェックポイントを設定する |
| アシスタントフレームワーク、ゲートウェイ、音声、記憶、自動化 | Hermes | メモリとスケジュール挙動を慎重に監査する |
| ファイル、ブラウザ、オフィス artifacts、複数セッションにまたがるデスクトップ知識作業 | MCPlato | 整理された接続資料を使う。小さな shell だけのタスクに使いすぎない |
これはツールの乱立を避ける最も簡単な方法でもあります。すべての仕事を最新の agent に押し込まないことです。それぞれのツールを、そのインターフェースが自然に合う場所に置きましょう。
5. 権限戦略はリスクに合わせるべき
最も自律的な agent が、そのタスクに最適な権限モデルを持つとは限りません。
軽量な権限戦略は有効です。
| リスクレベル | 例 | 推奨ポリシー |
|---|---|---|
| 低 | ファイルを読む、文書を要約する、承認済み資料を検索する | ログ付きで許可 |
| 中 | 下書きを編集する、レポートを作る、ローカルスクリプトを実行する | ワークスペースまたはサンドボックスで許可し、artifacts を要求 |
| 高 | 削除、デプロイ、公開、外部メッセージ送信、機密システムへのアクセス | 明示的な確認と証拠を要求 |
Codex の公開サンドボックスと承認文書は、この議論を明確にします。7 Claude Code の文書は、単一のサンドボックスの約束ではなく、権限/設定を強調します。9 Pi のミニマルな標準設定では、権限戦略は多くの場合 wrapper 側の責任です。Hermes ユーザーは、バックグラウンド自動化と永続メモリに特に注意すべきです。MCPlato はワークスペースレベルのリスク境界と組み合わせるのが最適です。必要な資料だけを接続し、適切な権限レベルを選び、外部アクションの前に最終 artifact をレビュー可能にします。
製品の強みと率直な限界
Pi Agent:ミニマリズムを機能にする
Pi が魅力的なのは、完全なワークスペースになることを拒むからです。標準ツールセットは小さく、セッション機構は開発者に優しく、複数の入口があるため、自分の agent ワークフローを構築する人に向いています。
制御、改造しやすさ、ターミナルネイティブな反復 が欲しいときは Pi を選びましょう。洗練されたガバナンス、オフィスワークフローの広いカバー、自律的なバックグラウンド運用が最初からあるとは期待しないでください。
Hermes Agent:長寿命アシスタントの力
Hermes は、記憶と自己改善の言語において最も野心的です。永続メモリ、スキル作成、ゲートウェイ、音声、MCP、subagents、スケジュール/バックグラウンド自動化により、タスクをまたいで生き続けるアシスタントが欲しい場合に魅力的です。4
状態を持つ自律性 を管理できるなら Hermes を選びましょう。その学習ループを本質的に信頼できるものとして扱うのは避けるべきです。メモリが有用なのは、検査でき、修正でき、境界づけられている場合だけです。
Codex:複数の表面をまたぐマネージドコーディング
作業単位がソフトウェアエンジニアリングであり、デスクトップ、IDE、CLI、クラウド/ウェブ、GitHub @codex フローをまたいで 1 つのシステムを使いたい場合、Codex は最も合います。131718 そのサンドボックスと承認の語彙は、リスクを具体的に話し合う必要があるチームに特に役立ちます。
マネージドな実行選択肢を持つコーディング作業 には Codex を選びましょう。オフィス文書、リサーチ統合、マルチアプリの知識作業向けの汎用ワークスペースを置き換えるとは期待しないでください。
Claude Code:成熟した agentic コーディングループ
Claude Code は小さなハーネスというより、完全なプロ向けコーディングコンパニオンです。公開文書は、ターミナル利用、IDE 統合、デスクトップ/ウェブ表面、MCP、GitHub Actions/GitLab CI、subagents、skills、settings、Slack、Agent SDK の入口を扱っています。14191516
本格的なリポジトリ保守とエンジニアリングワークフロー には Claude Code を選びましょう。ただし成熟していてもガバナンスは不要になりません。チームには権限、コーディング標準、テスト要件、レビューチェックポイントが必要です。
MCPlato:ワークスペース優先の AI 作業
MCPlato は、小さなターミナルハーネスとして Pi に勝とうとしているわけではありません。公開上の位置づけは、AI Partners、Desktop AI Engine、非同期ワークフロー、ローカル優先の接続資料、マルチセッション編成、マルチウィンドウ作業、仮想パートナー/Sprite の概念、artifact 規律、スケジュール/バックグラウンドタスク、ClawMode、権限付きで観察可能な実行、意思決定の痕跡、日記を備えた AI workspace です。10
成果物がレポート、比較、リサーチブリーフ、オフィス artifact、マルチアプリワークフロー、長時間のバックグラウンドタスクである場合は MCPlato を選びましょう。複数セッションが必要な作業では特に有用です。あるセッションはリサーチ、別のセッションはドラフト、別のセッションは画像生成、別のセッションは出典整理を行い、調整役のパートナーが完了状況を追跡できます。
限界は複雑さです。仕事が 1 ファイルのターミナル編集だけなら、ミニマルなハーネスの方が速く感じられるでしょう。
実践的な選択戦略
万能の agent を探すのではなく、小さなポートフォリオを使いましょう。
- 小さなターミナルネイティブ実験とカスタムハーネス構築には Pi を標準にする。
- 中心がリポジトリ、テスト、pull requests、CI なら Codex または Claude Code を使う。
- 状態を監査できるなら、実験的な常駐アシスタント、メモリ、ゲートウェイ、自動化には Hermes を使う。
- 作業がリサーチ、ローカル資料、ブラウザ文脈、オフィス artifacts、複数セッション、バックグラウンドのフォローアップにまたがるなら MCPlato を使う。
- artifact が検査可能なときだけ権限を上げる。 読む、下書きする、書く、公開/デプロイ/送信する、の順に進めます。
勝ち筋は最大の自律性ではありません。仕事に合った境界付き自律性です。
結論
Pi の台頭には理由があります。重い agent 製品を経験した多くの技術ユーザーは、より小さく、より読みやすいハーネスを求めています。Hermes は、永続的なアシスタント状態の魅力とリスクを示しています。Codex と Claude Code は、コーディング agent がどれほど速く完全なエンジニアリングワークフローになりつつあるかを示しています。MCPlato は別のカテゴリを指しています。知識作業、artifacts、ローカル資料、並列実行のための AI workspace です。
普遍的に最高のものはありません。正しい agent とは、そのインターフェース、権限モデル、回復ストーリーが、実際に行っている仕事に合っている agent です。
参考資料
Footnotes
-
Pi の正規 GitHub リポジトリ、
earendil-works/pi。https://github.com/earendil-works/pi ↩ -
Hermes Agent GitHub リポジトリ、
NousResearch/hermes-agent。https://github.com/NousResearch/hermes-agent ↩ -
OpenAI Codex GitHub リポジトリ。https://github.com/openai/codex ↩
-
Hermes Agent ドキュメント。https://hermes-agent.nousresearch.com/docs/ ↩ ↩2 ↩3
-
Pi 公式サイト。https://pi.dev/ ↩
-
npm パッケージ
@earendil-works/pi-coding-agent。https://www.npmjs.com/package/@earendil-works/pi-coding-agent ↩ -
OpenAI Codex サンドボックスドキュメント。https://developers.openai.com/codex/sandbox ↩ ↩2
-
Claude Code quickstart ドキュメント。https://code.claude.com/docs/en/quickstart ↩
-
Claude Code settings ドキュメント。https://code.claude.com/docs/en/settings ↩ ↩2
-
MCPlato 公式サイト。https://mcplato.com/en/ ↩ ↩2
-
MCPlato 価格情報。https://mcplato.com/pricing ↩
-
Hermes Agent GitHub issue #33256。https://github.com/NousResearch/hermes-agent/issues/33256 ↩
-
OpenAI Codex ドキュメント。https://developers.openai.com/codex ↩ ↩2
-
Claude Code 概要ドキュメント。https://code.claude.com/docs/en/overview ↩ ↩2
-
Claude Code sub-agents ドキュメント。https://code.claude.com/docs/en/sub-agents ↩ ↩2
-
Claude Code skills ドキュメント。https://code.claude.com/docs/en/skills ↩ ↩2
-
OpenAI Codex CLI ドキュメント。https://developers.openai.com/codex/cli ↩
-
OpenAI Codex IDE ドキュメント。https://developers.openai.com/codex/ide ↩
-
Claude Code MCP ドキュメント。https://code.claude.com/docs/en/mcp ↩
