Retour au blog
mcplato
claude-fable-5
anthropic
personal-agent-os
ai-agents
mythos-class
model-routing
agents-IA
systeme-d-exploitation

Claude Fable 5 rencontre MCPlato : nouvelles frontières pour les systèmes d'exploitation d'agents personnels

Claude Fable 5, le premier modèle Mythos-class public d'Anthropic, rencontre le système d'exploitation d'agent personnel MCPlato. Découvrez comment les limites de la performance IA et de l'orchestration persistante se déplacent.

Publié le 2026-06-10

Le 9 juin 2026, Anthropic a publié Claude Fable 5 — le premier modèle public de classe « Mythos », auparavant réservé aux partenaires entreprise sous le nom de code « Project Glasswing ». C'est, selon la plupart des mesures indépendantes, le modèle de codage et de raisonnement le plus performant disponible commercialement. Mais la capacité brute n'est que la moitié de l'histoire. La vraie question est : que se passe-t-il lorsque cette intelligence est intégrée dans un système d'exploitation d'agent personnel comme MCPlato ? La réponse est un passage du « chat avec une IA » à l'orchestration de flux de travail autonomes, multimodaux et sur plusieurs jours qui persistent, collaborent et livrent des résultats. Fable 5 devient le cerveau ; MCPlato devient le corps — mémoire, sens, mains et voix inclus.

Ce qu'est réellement Claude Fable 5

Claude Fable 5 partage son architecture de base avec Claude Mythos 5, l'aperçu réservé aux entreprises qui domine les benchmarks internes depuis des mois. Ce qui différencie Fable 5, c'est un ensemble de garde-fous de sécurité conçus pour le déploiement public : les requêtes touchant à la cybersécurité, certains domaines de la biologie et de la chimie, ou les tentatives suspectées de distillation de modèle sont automatiquement redirigées vers Claude Opus 4.8. Anthropic affirme que ce basculement affectera moins de 5 % des sessions, mais il s'agit d'une limite architecturale stricte que les utilisateurs doivent comprendre.

Le modèle est livré avec une fenêtre de contexte d'un million de tokens (5× les 200K d'Opus 4.8), une sortie maximale de 128K tokens et une « réflexion adaptative » toujours activée — ce qui signifie que Fable 5 choisit lui-même combien de temps réfléchir avant de répondre. La tarification se positionne au sommet du marché : 10 $ par million de tokens d'entrée et 50 $ par million de tokens de sortie, bien que la mise en cache des prompts réduise les coûts d'entrée de 90 % pour un contexte répété. La conservation des données est de 30 jours pour la surveillance de sécurité, explicitement pas pour l'entraînement. Fable 5 est disponible via l'API Claude, Amazon Bedrock, Google Vertex AI et Microsoft Foundry.

Comparaison des benchmarks

Les chiffres racontent une histoire claire : Fable 5 domine en génie logiciel, raisonnement et benchmarks de vision, souvent avec des marges significatives.

BenchmarkClaude Fable 5Claude Opus 4.8GPT-5.5Gemini 3.1 ProSource
SWE-bench Verified95,0 %88,6 %82,6 %63,8 %BenchLM
SWE-bench Pro80,3 %69,2 %58,6 %54,2 %Digital Applied
FrontierCode Diamond29,3 %13,4 %5,7 %Digital Applied
GDPval-AA ELO1932189017691314Digital Applied
Humanity's Last Exam (tools)~64,5 %57,9 %52,2 %Digital Applied
Core Analytics Benchmark>90 % (first)Anthropic
OSWorld-Verified85,0 %83,4 %78,7 %Digital Applied
Blueprint-Bench 2 (spatial)38,6 %14,5 %36,2 %Digital Applied

La validation en entreprise est tout aussi frappante. Stripe a utilisé Fable 5 pour accomplir une migration Ruby de 50 millions de lignes en une seule journée, un projet précédemment estimé à plus de deux mois. Hex a rapporté que Fable 5 était le premier modèle à dépasser les 90 % sur leur benchmark d'analyse de base. En recherche physique, une équipe a accompli en 36 heures ce qui a pris quatre jours à GPT-5.5 — en utilisant un tiers des tokens de raisonnement.

Visualisation abstraite de l'ascension des performances sur les benchmarksVisualisation abstraite de l'ascension des performances sur les benchmarks

Ce que la communauté dit

L'accueil initial a été enthousiaste mais pas sans réserve. Les développeurs louent de manière cohérente la précision de codage de Fable 5, sa capacité à raisonner sur des tâches à long terme sans perdre la cohérence, et sa compréhension visuelle — en particulier sur les benchmarks spatiaux et riches en UI comme OSWorld et Blueprint-Bench 2. Le consensus parmi les premiers adopteurs est que c'est le premier modèle qui ressemble véritablement à un ingénieur senior programmant en binôme avec vous.

Les critiques, cependant, sont vives et spécifiques. La tarification est la plus élevée de sa catégorie : à 10/50 $ par million de tokens, une utilisation soutenue s'accumule rapidement. L'abonnement Pro d'Anthropic ne couvre plus Fable 5 après le 23 juin, poussant les utilisateurs vers des crédits basés sur l'utilisation. Certains développeurs rapportent des garde-fous de sécurité excessivement sensibles bloquant des requêtes de codage ou de biologie bénignes. La politique de conservation des données de 30 jours, bien que présentée comme uniquement liée à la sécurité, a soulevé des sourcils dans les organisations soucieuses de la confidentialité. Enfin, à la date de lancement, les évaluations indépendantes de tierces parties restent rares — la plupart des chiffres publiés proviennent d'Anthropic ou de groupes de recherche étroitement affiliés.

Où Fable 5 seul atteint ses limites

Un modèle brillant reste un modèle. Fable 5, utilisé isolément via une interface de chat ou une API brute, fait face à quatre contraintes strictes.

Premièrement, le coût. À 50 $ par million de tokens de sortie, une seule session de codage complexe avec 200K tokens de sortie coûte 10 $. Une session de recherche sur plusieurs jours peut consommer des centaines de dollars. Sans routage intelligent, Fable 5 est un luxe, pas une valeur par défaut.

Deuxièmement, le dépassement des garde-fous de sécurité. Le basculement automatique vers Opus 4.8 sur certaines requêtes rompt la continuité du workflow. Si vous êtes au milieu d'un refactoring et que Fable 5 décide que votre motif de code ressemble à un « outil de cybersécurité », vous parlez soudainement à un modèle différent avec un comportement différent.

Troisièmement, l'absence de persistance. Fable 5 ne se souvient pas de ce que vous avez demandé hier, à moins que vous ne renvoyiez l'intégralité du contexte. Il n'archive pas vos artifacts, ne met pas à jour votre wiki de projet, ni ne notifie votre équipe sur Slack lorsqu'une analyse de 12 heures est terminée.

Quatrièmement, les changements d'abonnement. Le retrait imminent de Fable 5 de la couverture de l'abonnement Pro signifie que les utilisateurs doivent gérer activement leurs crédits et leur exposition aux coûts. Cela transforme Fable 5 d'un outil « on puis oublier » en une ressource exigeant de la discipline.

Ces limites ne sont pas des défauts — ce sont des frontières qu'un système d'exploitation est conçu pour gérer.

MCPlato + Fable 5 : huit nouvelles frontières

MCPlato est un système d'exploitation d'agent personnel : un environnement persistant où les partenaires IA, les Skills, les Artifacts et les données locales coexistent d'une session à l'autre. Intégrer Fable 5 dans cette architecture débloque des capacités qu'aucun des deux ne peut atteindre seul.

1. Automatisation de la recherche sur plusieurs jours Fable 5 peut soutenir des sessions de raisonnement pendant des heures, mais le harnais Sprite de MCPlato peut soutenir des projets pendant des jours. Un Sprite configuré avec Fable 5 comme moteur de raisonnement peut ingérer un PDF de 500 pages lundi, synthétiser les découvertes pendant la nuit, croiser avec des sources web en direct mardi matin, et livrer un Artifact de rapport structuré d'ici mercredi — tout pendant que vous dormez. Le Sprite persiste l'état, gère les interruptions d'API et reprend exactement là où il s'était arrêté.

2. Délégation multi-niveaux Sprite Chaque sous-tâche n'a pas besoin d'un raisonnement de classe Mythos. MCPlato permet à un Sprite maître de planification exécutant Fable 5 de décomposer un projet et de déléguer l'exécution à des Sprites ouvriers plus légers utilisant des modèles moins chers. Le maître gère l'architecture et l'intégration ; les ouvriers gèrent le boilerplate, les tests et la documentation. Le résultat est une qualité de niveau Fable 5 à une fraction du coût.

3. Skills d'entreprise auto-générés Lorsque Fable 5 exécute un workflow complexe — par exemple, auditer une codebase pour des utilisations d'API obsolètes — MCPlato peut distiller cette exécution en un Skill réutilisable. La prochaine fois que le même motif apparaît, le Skill s'exécute localement avec des modèles plus légers, n'escaladant vers Fable 5 que pour des cas limites inédits. Les connaissances se cumulent.

4. Livraison Vision vers Artifact Téléchargez une capture d'écran, un PDF scanné ou une photo de tableau blanc dans MCPlato. Fable 5 lit l'entrée visuelle, raisonne à son sujet, et génère un Artifact de code, un rapport structuré ou un diagramme Mermaid — tous sauvegardés dans votre espace de travail local. La boucle de « j'ai vu quelque chose » à « j'ai un livrable » se réduit à quelques minutes.

5. Local-first + raisonnement Mythos La fenêtre de contexte de 1M de Fable 5 est transformatrice pour les grandes codebases, mais télécharger 100 000 lignes de code source propriétaire vers n'importe quelle API est un non-démarrage pour de nombreuses organisations. L'approche local-first de MCPlato conserve la codebase sur votre machine. Fable 5 ne reçoit que les abstractions anonymisées ou les extraits spécifiques dont il a besoin, ou s'exécute contre une inference auto-hébergée lorsque disponible. Les données sensibles ne quittent jamais votre contrôle.

6. Routage dynamique par difficulté Le routeur de modèles de MCPlato évalue automatiquement la complexité d'une tâche avant de sélectionner un modèle. Une requête simple comme « résume cet e-mail » atteint un point de terminaison bon marché et rapide. Une requête « refactorise ce microservice sans temps d'arrêt » est routée vers Fable 5. Les utilisateurs obtiennent la bonne intelligence au bon prix, de manière transparente.

7. Compréhension profonde multimodale Alimentez MCPlato avec une vidéo de démo produit de deux heures. La transcription extrait l'audio ; l'échantillonnage de frames capture l'UI. Fable 5 ingère transcription + frames visuelles clés ensemble, identifie les problèmes d'utilisabilité, et produit un plan d'amélioration structuré comme un Artifact vivant. Ce n'est pas « regarder une vidéo, puis en discuter » — c'est « la vidéo devient des données, et les données deviennent des actions ».

8. Collaboration asynchrone via IM Bridge L'IM Bridge de MCPlato transforme Slack ou Discord en une interface de délégation de tâches asynchrones. Déposez une requête dans un canal, mentionnez votre partenaire IA, et partez. Fable 5 traite la requête au cours des quatre heures suivantes, publie une mise à jour de progression à la marque de deux heures, et livre l'Artifact final avec un message de résumé. Votre chat d'équipe devient une ligne de commande pour une intelligence à long terme.

Visualisation de l'orchestration asynchrone de l'IA s'écoulant entre les nœuds d'entrée, de raisonnement et de sortieVisualisation de l'orchestration asynchrone de l'IA s'écoulant entre les nœuds d'entrée, de raisonnement et de sortie

Scénario de workflow : de la vidéo au plan d'action

Voici à quoi cela ressemble en pratique. Un chef de produit télécharge un enregistrement de test d'utilisabilité de deux heures dans son espace de travail MCPlato jeudi après-midi.

  1. Ingestion : MCPlato transcrit l'audio et échantillonne 40 frames clés de la vidéo.
  2. Analyse : Le Sprite achemine les données combinées transcription + visuelles vers Fable 5, qui identifie 23 points de friction d'utilisabilité distincts, les catégorise par sévérité, et les croise avec le système de design existant du produit.
  3. Synthèse : Fable 5 génère un Artifact de plan d'amélioration structuré — recommandations priorisées, extraits de code simulé pour les corrections d'UI, et hypothèses de tests A/B suggérées.
  4. Rapport : Le Sprite publie un résumé concis dans le canal Slack de l'équipe avec un lien vers l'Artifact complet. Le chef de produit le consulte vendredi matin.

Implication humaine totale : un téléchargement, une notification Slack lue, un Artifact consulté. Temps écoulé total : environ 6 heures de traitement en arrière-plan. Ce n'est pas une démo ; c'est un workflow de production.

Discipline des coûts et routage intelligent

La tarification de Fable 5 est une fonctionnalité, pas un bug — elle force l'intentionnalité. MCPlato rend cette intentionnalité automatique.

Par défaut, MCPlato achemine les requêtes de routine (résumé, édition légère, recherche factuelle) vers des points de terminaison optimisés pour le coût. Fable 5 n'est engagé que lorsque le routeur détecte des signaux de complexité : grand volume de contexte, raisonnement multi-étapes, génération de code, ou préférence utilisateur explicite. La mise en cache des prompts réduit davantage les coûts d'entrée pour les workflows répétés ou itératifs.

Pour les équipes, cela signifie que Fable 5 devient un outil spécialisé dans un atelier bien équipé, pas le seul outil dans la boîte. Un ingénieur senior saisit l'instrument de précision lorsque le travail l'exige. MCPlato garantit que vous ne coupez pas du papier avec une scie à diamant.

FAQ

MCPlato prendra-t-il en charge Claude Fable 5 ? Oui. Fable 5 peut être configuré comme modèle principal pour n'importe quel Skill, Sprite ou workflow Artifact. Les garde-fous de basculement sont gérés de manière transparente par la couche de routage de MCPlato.

Fable 5 vaut-il le prix de 10/50 $ par million de tokens ? Pour des tâches complexes et à long terme — refactoring à grande échelle, recherche sur plusieurs jours, analyse multimodale approfondie — la qualité de sortie et l'efficacité du raisonnement justifient souvent le coût. Pour les tâches de routine, le routage intelligent de MCPlato maintient les dépenses prévisibles.

Qu'est-ce qui différencie MCPlato de l'utilisation directe de Claude Fable 5 ? MCPlato ajoute une mémoire persistante d'une session à l'autre, une gestion des données en local, une orchestration multi-modèles, une génération d'Artifacts et des ponts de collaboration asynchrones. Il transforme une API autonome en un système d'exploitation personnel.

Comment MCPlato gère-t-il les garde-fous de sécurité de Fable 5 ? Lorsque Fable 5 déclenche un basculement, MCPlato achemine la requête de manière transparente vers un modèle alternatif comme Opus 4.8. Le workflow continue ; l'utilisateur est notifié mais pas bloqué.

Fable 5 peut-il fonctionner pendant des jours dans MCPlato ? Oui. Les Sprites prennent en charge des projets asynchrones de 24 à 48 heures avec des points de reprise, une récupération après interruption et des rapports de progression via des ponts IM ou des mises à jour d'Artifacts.

La conservation des données pendant 30 jours de Fable 5 affecte-t-elle la confidentialité ? La conception local-first de MCPlato conserve le code source sensible et les documents sur votre machine. Seules les requêtes nécessaires et anonymisées touchent l'API, minimisant l'exposition aux politiques de conservation externes.

Références

  1. Anthropic. « Claude Fable 5 : Introducing the First Public Mythos-Class Model. » 9 juin 2026. https://www.anthropic.com/news/claude-fable-5
  2. BenchLM. « SWE-bench Verified Leaderboard — Claude Fable 5. » Juin 2026. https://benchlm.ai/report/claude-fable-5
  3. Digital Applied. « Claude Fable 5 Benchmark Analysis : SWE-bench Pro, FrontierCode, GDPval-AA. » Juin 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-analysis
  4. Digital Applied. « OSWorld-Verified and Blueprint-Bench 2 Vision Benchmarks. » Juin 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-vision
  5. Stripe Engineering. « Migrating 50 Million Lines of Ruby with Claude Fable 5. » Juin 2026. https://stripe.com/blog/ruby-migration-claude-fable-5
  6. Hex. « Core Analytics Benchmark : First Model to Exceed 90 %. » Juin 2026. https://hex.tech/blog/core-analytics-benchmark-fable-5
  7. Anthropic. « Claude Fable 5 Enterprise Case Studies. » Juin 2026. https://www.anthropic.com/customers/fable-5-case-studies