mcplato

claude-fable-5

anthropic

personal-agent-os

ai-agents

mythos-class

model-routing

人工知能

エージェントOS

Claude Fable 5 × MCPlato：パーソナルエージェントOSの新たな地平

Claude Fable 5とMCPlatoパーソナルエージェントOSの融合が、自律的で数日にわたるマルチモーダルワークフローの新時代をいかに切り開くかを探る。

MCPlato Research Team公開日 2026-06-10

2026年6月9日、AnthropicはClaude Fable 5をリリースしました。これは初の公開"Mythosクラス"モデルであり、これまで企業パートナー向けにコードネーム"Project Glasswing"として提供されていました。ほとんどの独立した評価基準によれば、これは現時点で商用利用可能な最も高性能なコーディング・推論モデルです。しかし、raw capability（生の能力）は物語の半分に過ぎません。本当の問いは、この知能がMCPlatoのようなパーソナルエージェントOSに投入されたとき、何が起こるのか、ということです。答えは、「AIとチャットする」ことから、自律的で数日にわたるマルチモーダルワークフローをオーケストレーションすることへの転換です。これらのワークフローは持続し、協働し、成果を届けます。Fable 5が脳となり、MCPlatoが身体となります。記憶、感覚、手、そして声を含めて。

Claude Fable 5の正体

Claude Fable 5は、数か月にわたって社内ベンチマークを席巻してきたエンタープライズ限定プレビューであるClaude Mythos 5と同じコアアーキテクチャを共有しています。Fable 5を異なるものにしているのは、公開展開向けに設計された一連の安全ガードレールです。サイバーセキュリティ、特定の生物学・化学領域に触れるクエリ、またはモデル蒸留の疑いがある試行は、自動的にClaude Opus 4.8へ再ルーティングされます。Anthropicは、このフォールバックがセッションの5%未満に影響すると主張していますが、これはユーザーが理解すべき硬性のアーキテクチャ境界です。

このモデルは100万トークンのコンテキストウィンドウ（Opus 4.8の20万トークンの5倍）、12.8万トークンの最大出力、そして常時有効な"アダプティブシンキング"を搭載しています。これは、Fable 5がレスポンス前にどれだけ推論するかを自己選択することを意味します。価格設定は市場の最上位に位置づけられており、100万入力トークンあたり10ドル、100万出力トークンあたり50ドルです。ただし、プロンプトキャッシュにより、繰り返しのコンテキストに対して入力コストを90%削減します。データ保持期間は安全監視のため30日間で、明示的にトレーニングには使用されません。Fable 5は、Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry通じて利用可能です。

ベンチマーク比較

数字は明確な物語を語ります。Fable 5はソフトウェアエンジニアリング、推論、視覚のベンチマークでトップを走っており、しばしば大きな差をつけています。

ベンチマーク	Claude Fable 5	Claude Opus 4.8	GPT-5.5	Gemini 3.1 Pro	出典
SWE-bench Verified	95.0%	88.6%	82.6%	63.8%	BenchLM
SWE-bench Pro	80.3%	69.2%	58.6%	54.2%	Digital Applied
FrontierCode Diamond	29.3%	13.4%	5.7%	—	Digital Applied
GDPval-AA ELO	1932	1890	1769	1314	Digital Applied
Humanity's Last Exam (tools)	~64.5%	57.9%	52.2%	—	Digital Applied
Core Analytics Benchmark	>90% (初)	—	—	—	Anthropic
OSWorld-Verified	85.0%	83.4%	78.7%	—	Digital Applied
Blueprint-Bench 2 (spatial)	38.6%	14.5%	36.2%	—	Digital Applied

企業による検証も同様に衝撃的です。StripeはFable 5を使用して、1日で5000万行のRuby移行を完了させました。これは以前、2か月以上と見積もられていたプロジェクトです。Hexは、Fable 5が同社のコア分析ベンチマークで初めて90%を突破したモデルだと報告しました。物理学研究では、あるチームが36時間でGPT-5.5が4日間かけて完了した作業を達成し、推論トークンは3分の1で済みました。

ベンチマーク性能向上の抽象的なビジュアライゼーション

コミュニティの声

初期の反応は熱狂的だが無批判ではありませんでした。開発者は一貫して、Fable 5のコーディング精度、長期タスクを一貫性を失わずに推論する能力、そして視覚理解を称賛しています。特にOSWorldやBlueprint-Bench 2のような空間・UI重視のベンチマークにおいて顕著です。早期導入者の間のコンセンサスは、これが本当にシニアエンジニアとペアプログラミングしているように感じられる初のモデルだ、というものです。

一方で、批判も鋭く具体的です。価格はクラス最高です。100万トークンあたり10/50ドルでは、継続的な使用がすぐに積み上がります。AnthropicのProサブスクリプションは6月23日以降Fable 5をカバーしなくなり、ユーザーは従量課金制のクレジットに移行する必要があります。一部の開発者は、過度に敏感な安全ガードレールが無害なコーディングや生物学クエリをブロックすると報告しています。30日間のデータ保持ポリシーは安全目的のみと位置づけられていますが、プライバシーを重視する組織で注目を集めています。最後に、発売日時点では独立した第三者評価は依然として乏しく、公開されている数値の多くはAnthropicまたは密接に関連する研究グループからのものです。

Fable 5単独の限界

優れたモデルでも、それはあくまでモデルです。チャットインターフェースや生のAPIを通じて単独で使用するFable 5は、4つの硬性の制約に直面します。

第一に、コスト。 100万出力トークンあたり50ドルでは、20万トークン出力の複雑なコーディングセッション1回で10ドルかかります。数日にわたる調査実行は数百ドルを消費する可能性があります。スマートなルーティングなしでは、Fable 5は贅沢品であり、デフォルトではありません。

第二に、安全の過度な介入。 特定のクエリでOpus 4.8への自動フォールバックが発生すると、ワークフローの連続性が損なわれます。リファクタリングの途中で、Fable 5がコードパターンを"サイバーセキュリティツール"と判断したら、突然、挙動の異なる別のモデルと話していることになります。

第三に、持続性の欠如。 Fable 5は、全コンテキストを再送信しない限り、昨日聞かれたことを覚えていません。成果物をファイル化したり、プロジェクトwikiを更新したり、12時間の分析完了時にSlackでチームに通知したりすることはできません。

第四に、サブスクリプション変更。 Fable 5がProサブスクリプションの対象から外される予定は、ユーザーがクレジットとコストエクスポージャーを能動的に管理する必要があることを意味します。これにより、Fable 5は"オンにして忘れる"ツールから、規律を要求するリソースへと変わります。

これらの限界は欠陥ではありません。それらはOSが処理することを設計された境界です。

MCPlato + Fable 5：8つの新たな地平

MCPlatoはパーソナルエージェントOSです。AIパートナー、Skill、Artifact、ローカルデータがセッションをまたいで共存する持続的な環境です。このアーキテクチャにFable 5を投入することで、どちら単独でも達成できない能力が解き放たれます。

1. 数日にわたる調査の自動化 Fable 5は数時間の推論実行を維持できますが、MCPlatoのSpriteハーネスは数日にわたるプロジェクトを維持できます。Fable 5を推論エンジンとして設定されたSpriteは、月曜日に500ページのPDFを取り込み、夜間に調査結果を統合し、火曜朝にライブWebソースとクロスリファレンスし、水曜日までに構造化レポートのArtifactを配信できます。すべて、あなたが眠っている間に。Spriteは状態を保持し、API中断を処理し、正確に中断した場所から再開します。

2. 多層Spriteデリゲーション すべてのサブタスクにMythosクラスの推論が必要なわけではありません。MCPlatoにより、Fable 5を実行するプランニングマスターSpriteがプロジェクトを分解し、より安価なモデルを使用する軽量なワーカーSpriteに実行を委任できます。マスターはアーキテクチャと統合を処理し、ワーカーはボイラープレート、テスト、ドキュメントを処理します。結果は、Fable 5グレードの出力品質を、ごくわずかなコストで実現します。

3. 自動生成されるエンタープライズSkill Fable 5が複雑なワークフローを実行する際、例えばコードベースで非推奨APIの使用状況を監査する際、MCPlatoはその実行を再利用可能なSkillに蒸留できます。次に同じパターンが現れたとき、Skillは軽量なモデルでローカルに実行され、新規のエッジケースでのみFable 5にエスカレートされます。知識は複利で増殖します。

4. ビジョンからArtifactへの配信 スクリーンショット、スキャンしたPDF、ホワイトボードの写真をMCPlatoにアップロードしてください。Fable 5は視覚入力を読み取り、推論し、コードArtifact、構造化レポート、またはMermaidダイアグラムを生成します。すべてローカルワークスペースに保存されます。"何かを見た"から"成果物を持った"までのループが、数分に短縮されます。

5. ローカルファースト + Mythosクラスの推論 Fable 5の100万トークンのコンテキストウィンドウは、大規模コードベースに対して変革的ですが、10万行の独自ソースコードをどのAPIにもアップロードすることは、多くの組織にとって論外です。MCPlatoのローカルファーストアプローチは、コードベースをユーザーのマシン上に保持します。Fable 5は、必要な匿名化された抽象化または特定のスニペットのみを受け取るか、ローカルホスト推論が利用可能な場合はそれに対して実行されます。機密データは決してユーザーの管理下を離れません。

6. 動的難易度ルーティング MCPlatoのモデルルーターは、モデルを選択する前にタスクの複雑さを自動的に評価します。"このメールを要約して"という単純なクエリは、安価で高速なエンドポイントにヒットします。"このマイクロサービスをゼロダウンタイムでリファクタリングして"というクエリは、Fable 5にルーティングされます。ユーザーは透明に、適切な知能を適切な価格で得られます。

7. マルチモーダルの深い理解 2時間の製品デモ動画をMCPlatoに投入してください。文字起こしが音声を抽出し、フレームサンプリングがUIをキャプチャします。Fable 5は文字起こしテキスト + 重要な視覚フレームを同時に取り込み、ユーザビリティの問題を特定し、構造化された改善計画をライブArtifactとして出力します。これは"動画を見て、それについてチャットする"ではありません。"動画がデータになり、データがアクションになる"のです。

8. 非同期IMブリッジコラボレーション MCPlatoのIMブリッジは、SlackやDiscordを非同期タスク委任インターフェースに変えます。チャンネルにリクエストを投稿し、AIパートナーにメンションして、離れてください。Fable 5は次の4時間かけてリクエストを処理し、2時間の時点で進捗更新を投稿し、要約メッセージ付きの最終Artifactを配信します。チームチャットが、長時間実行される知能のコマンドラインになります。

入力、推論、出力ノード間を流れる非同期AIオーケストレーションのビジュアライゼーション

ワークフローシナリオ：動画からアクションプランへ

実際にどのように見えるか、以下に示します。プロダクトマネージャーが木曜日の午後、2時間のユーザビリティテスト録画をMCPlatoワークスペースにアップロードします。

取り込み：MCPlatoは音声を文字起こしし、動画から40の重要なフレームをサンプリングします。
分析：Spriteは文字起こしテキスト + 視覚データの組み合わせをFable 5にルーティングし、23の個別のユーザビリティ摩擦ポイントを特定し、重要度別に分類し、製品の既存デザインシステムとクロスリファレンスします。
統合：Fable 5は、優先順位付きの推奨事項、UI修正のモックコードスニペット、提案されたA/Bテスト仮説を含む構造化改善計画のArtifactを生成します。
報告：Spriteは、完全なArtifactへのリンク付きで、チームのSlackチャンネルに簡潔な要約を投稿します。プロダクトマネージャーは金曜朝にレビューします。

人間の関与合計：1回のアップロード、1件のSlack通知を読む、1件のArtifactをレビューする。総経過時間：約6時間のバックグラウンド処理。これはデモではありません。これは本番ワークフローです。

コスト管理とスマートルーティング

Fable 5の価格設定はバグではなく機能です。それは意図性を強制します。MCPlatoは、その意図性を自動化します。

デフォルトで、MCPlatoは日常的なクエリ（要約、軽度の編集、事実確認）をコスト最適化されたエンドポイントにルーティングします。Fable 5は、ルーターが複雑さのシグナルを検出した場合にのみ起動されます。大きなコンテキストボリューム、多段階推論、コード生成、またはユーザーの明示的な選択です。プロンプトキャッシュは、繰り返しまたは反復ワークフローの入力コストをさらに削減します。

チームにとって、これはFable 5が設備の整ったワークショップの中の専用ツールとなり、ツールボックスの唯一のツールではなくなることを意味します。シニアエンジニアは、作業がそれを要求したときに精密機器を手に取ります。MCPlatoは、ダイヤモンドのノコギリで紙を切らせないようにします。

よくある質問

MCPlatoはClaude Fable 5をサポートしますか？ はい。Fable 5は、あらゆるSkill、Sprite、Artifactワークフローのプライマリモデルとして設定できます。フォールバックガードレールは、MCPlatoのルーティング層によって透過的に処理されます。

Fable 5の100万トークンあたり10/50ドルの価格は価値がありますか？ 大規模リファクタリング、数日にわたる調査、深いマルチモーダル分析といった、複雑で長期間のタスクにおいては、出力品質と推論効率がコストを正当化する場合が多いです。日常的なタスクについては、MCPlatoのスマートルーティングが費用を予測可能に保ちます。

MCPlatoとClaude Fable 5を直接使うことの違いは何ですか？ MCPlatoは、セッションをまたいだ永続的なメモリ、ローカルファーストのデータ処理、マルチモデルオーケストレーション、Artifact生成、非同期コラボレーションブリッジを追加します。スタンドアロンのAPIをパーソナルオペレーティングシステムに変えます。

MCPlatoはFable 5の安全ガードレールをどのように扱いますか？ Fable 5がフォールバックをトリガーしたとき、MCPlatoはクエリをOpus 4.8などの代替モデルに透過的にルーティングします。ワークフローは継続し、ユーザーは通知を受けますがブロックされません。

Fable 5はMCPlato内で数日間実行できますか？ はい。Spriteは、チェックポイント、中断リカバリー、そしてIMブリッジやArtifact更新による進捗報告を備えた、24～48時間の非同期プロジェクトをサポートします。

Fable 5の30日間のデータ保持はプライバシーに影響しますか？ MCPlatoのローカルファースト設計により、機密性の高いソースコードやドキュメントはユーザーのマシン上に保持されます。必要な匿名化クエリのみがAPIにアクセスし、外部の保持ポリシーへの露出を最小限に抑えます。

参考資料

Anthropic. "Claude Fable 5: Introducing the First Public Mythos-Class Model." June 9, 2026. https://www.anthropic.com/news/claude-fable-5
BenchLM. "SWE-bench Verified Leaderboard — Claude Fable 5." June 2026. https://benchlm.ai/report/claude-fable-5
Digital Applied. "Claude Fable 5 Benchmark Analysis: SWE-bench Pro, FrontierCode, GDPval-AA." June 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-analysis
Digital Applied. "OSWorld-Verified and Blueprint-Bench 2 Vision Benchmarks." June 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-vision
Stripe Engineering. "Migrating 50 Million Lines of Ruby with Claude Fable 5." June 2026. https://stripe.com/blog/ruby-migration-claude-fable-5
Hex. "Core Analytics Benchmark: First Model to Exceed 90%." June 2026. https://hex.tech/blog/core-analytics-benchmark-fable-5
Anthropic. "Claude Fable 5 Enterprise Case Studies." June 2026. https://www.anthropic.com/customers/fable-5-case-studies

続きを読む

Claude Fable 5のシステムプロンプトが示す、ハーネス時代の到来
Anthropic公式のClaudeシステムプロンプトのリリースノートは、より賢いチャットから、エージェントの運用マニュアルへと重心が移っていることを示している。その変化が、ハーネス、Artifact、権限、そしてMCPlato型ワークスペースを重要にする理由を解説する。
Claude Fable 5：長期タスク向けAIモデルはソフトウェアエンジニアリングと知識労働をどう変えるのか
Claude Fable 5は、ソフトウェアエンジニアリング、研究統合、文書分析、マルチエージェントワークフローに向けた新しい長期タスクAIモデルのカテゴリを示している。ただし、チームがコスト、安全性、アクセス、検証を慎重に管理できる場合に限られる。
GPT 5.5 が登場。チームにとっての意味——そして MCPlato がどうルーティングするか
OpenAI の GPT 5.5 はトップクラスのエージェント型コーディングスコアと 100 万トークンコンテキストを備えて登場。データが実際に示すもの——そして MCPlato のスマートルーティングがワークスペースをどう接続するか。
DeepSeek V4-Pro: 1.6兆パラメータのMoEがAIインフラを変革する
DeepSeek V4-Proは1.6T総パラメータ、490億アクティブパラメータ、100万トークンコンテキスト、トップレベルのコードベンチマークでMoEアーキテクチャの爆発力を示す。開発者向けの完全解読——そしてMCPlatoのスマートルーティングがどう実用的にするか。
エージェントはツールではなく仮想社員だ：プロンプトからループへ
AI は質問に答えるツールから、自律して仕事を完了する仮想社員へと進化している。本稿では、プロンプト工学から信頼できるループへの構造的転換と、MCPlato が Wand、Sprite、Artifact でこの新しいパラダイムを実装する方法を論じる。