블로그로 돌아가기
mcplato
claude-fable-5
anthropic
personal-agent-os
ai-agents
mythos-class
model-routing
인공지능
에이전트OS

Claude Fable 5과 MCPlato의 만남: 개인 에이전트 운영 체제의 새로운 지평

Claude Fable 5와 MCPlato 개인 에이전트 운영 체제의 결합이 어떻게 자율적이고 장기간 지속되는 멀티모달 워크플로우의 새 시대를 여는지 탐구한다.

게시일 2026-06-10

2026년 6월 9일, Anthropic은 Claude Fable 5를 출시했습니다. 이는 최초의 공개 "Mythos 클래스" 모델로, 기업 파트너를 대상으로 코드명 "Project Glasswing"으로 제공되던 모델입니다. 대부분의 독립적인 평가 기준에 따를 때, 이는 현재 상업적으로 이용 가능한 가장 능력 있는 코딩 및 추론 모델입니다. 하지만 raw capability(원시 역량)는 이야기의 절반에 불과합니다. 진짜 질문은 이 지능이 MCPlato와 같은개인 에이전트 운영 체제에 주입될 때 무슨 일이 일어나는가 하는 것입니다. 답은 "AI와 채팅하기"에서 자율적이고 수일간 지속되며 멀티모달인 워크플로우를 오케스트레이션하기로의 전환입니다. 이러한 워크플로우는 지속되고, 협업하며, 성과를 전달합니다. Fable 5가 뇌가 되고, MCPlato가 몸이 됩니다. 기억, 감각, 손, 그리고 목소리를 포함해서 말입니다.

Claude Fable 5의 정체

Claude Fable 5는 수개월간 기업 낸부 벤치마크를 지배해 온 기업 전용 프리뷰인 Claude Mythos 5와 핵심 아키텍처를 공유합니다. Fable 5를 다른 모델과 구별시키는 것은 공개 배포를 위해 설계된 일련의안전 가드레일입니다. 사이버보안, 특정 생물학 및 화학 영역에 닿는 쿼리, 또는 의심스러운 모델 증류 시도는 자동으로 Claude Opus 4.8로 재라우팅됩니다. Anthropic은 이 fallback이 5% 미만의 세션에 영향을 줄 것이라고 주장하지만, 이는 사용자가 이해해야 하는 엄격한 아키텍처 경계입니다.

이 모델은100만 토큰 컨텍스트 윈도우(Opus 4.8의 20만 토큰의 5배), 12.8만 토큰의 최대 출력, 그리고 항상 활성화된 "적응적 사고"를 탑재하고 있습니다. 이는 Fable 5가 응답하기 전에 얼마나 오래 추론할지를 스스로 선택한다는 의미입니다. 가격 책정은 시장 최상위에 위치해 있으며,백만 입력 토큰당 10달러, 백만 출력 토큰당 50달러입니다. 다만 프롬프트 캐싱을 통해 반복 컨텍스트의 입력 비용을 90% 절감합니다. 데이터 보관 기간은 안전 모니터링을 위해 30일이며, 명시적으로 학습에는 사용되지 않습니다. Fable 5는 Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry를 통해 이용 가능합니다.

벤치마크 비교

숫자가 명확한 이야기를 들려줍니다. Fable 5는 소프트웨어 엔지니어링, 추론, 시각 벤치마크에서 선두를 달리며, 종종 큰 격차를 보입니다.

벤치마크Claude Fable 5Claude Opus 4.8GPT-5.5Gemini 3.1 Pro출처
SWE-bench Verified95.0%88.6%82.6%63.8%BenchLM
SWE-bench Pro80.3%69.2%58.6%54.2%Digital Applied
FrontierCode Diamond29.3%13.4%5.7%Digital Applied
GDPval-AA ELO1932189017691314Digital Applied
Humanity's Last Exam (tools)~64.5%57.9%52.2%Digital Applied
Core Analytics Benchmark>90% (최초)Anthropic
OSWorld-Verified85.0%83.4%78.7%Digital Applied
Blueprint-Bench 2 (spatial)38.6%14.5%36.2%Digital Applied

기업 검증도 마찬가지로 놀랍습니다. Stripe는 Fable 5를 사용하여하루 만에 5000만 줄의 Ruby 마이그레이션을 완료했습니다. 이는 이전에 두 달 이상으로 예상되던 프로젝트였습니다. Hex는 Fable 5가 자사의 핵심 분석 벤치마크에서 최초로 90%를 돌파한 모델이라고 보고했습니다. 물리학 연구에서 한 팀은 36시간 만에 GPT-5.5가 4일간 걸려 완료한 작업을 달성했으며, 추론 토큰은 3분의 1만 사용했습니다.

벤치마크 성능 향상의 추상적 시각화벤치마크 성능 향상의 추상적 시각화

커뮤니티 반응

초기 반응은 열광적이었지만 비판적이지 않은 것은 아니었습니다. 개발자들은 일관되게 Fable 5의코딩 정확도, 장기간 태스크를 일관성을 잃지 않고 추론하는 능력, 그리고시각 이해를 칭찬합니다. 특히 OSWorld와 Blueprint-Bench 2 같은 공간 및 UI 중심 벤치마크에서 두드러집니다. 초기 도입자들 사이의 공감대는 이것이 진정으로 시니어 엔지니어와 페어 프로그래밍하는 것처럼 느껴지는 최초의 모델이라는 것입니다.

하지만 비판도 날카롭고 구체적입니다.가격은 동급 최고입니다. 백만 토큰당 10/50달러에서는 지속적인 사용이 금세 누적됩니다. Anthropic의 Pro 구독은 6월 23일 이후 Fable 5를 커버하지 않아 사용자는 사용량 기반 크레딧으로 전환해야 합니다. 일부 개발자는과도하게 민감한 안전 가드레일이 무해한 코딩이나 생물학 쿼리를 차단한다고 보고합니다. 30일 데이터 보관 정책은 안전 목적으로만 한정되어 있지만, 프라이버시를 중시하는 조직에서 주목을 끌고 있습니다. 마지막으로, 출시일 기준으로독립적인 서드파티 평가는 여전히 부족하며, 대부분 공개된 수치는 Anthropic이나 밀접하게 연관된 연구 그룹에서 나온 것입니다.

Fable 5 단독의 한계

뛰어난 모델도 여전히 모델에 불과합니다. 채팅 인터페이스나 원시 API를 통해 단독으로 사용되는 Fable 5는 네 가지 엄격한 제약에 직면합니다.

첫째, 비용. 백만 출력 토큰당 50달러에서는 20만 토큰 출력이 포함된 복잡한 코딩 세션 한 번에 10달러가 듭니다. 수일간의 연구 실행은 수백 달러를 소비할 수 있습니다. 지능적인 라우팅 없이는 Fable 5는 사치품이지 기본값이 아닙니다.

둘째, 안전의 과도한 개입. 특정 쿼리에서 Opus 4.8로의 자동 fallback은 워크플로우 연속성을 깨뜨립니다. 리팩토링 중간에 Fable 5가 코드 패턴을 "사이버보안 도구"로 판단하면 갑자기 행동이 다른 다른 모델과 대화하게 됩니다.

셋째, 지속성 부재. Fable 5는 전체 컨텍스트를 다시 본내지 않는 한 어제 무엇을 물었는지 기억하지 않습니다. 산출물을 파일로 보관하거나, 프로젝트 위키를 업데이트하거나, 12시간 분석 완료 시 Slack에서 팀에 알리지 않습니다.

넷째, 구독 변경. Fable 5가 Pro 구독 커버리지에서 제외될 예정이라는 것은 사용자가 크레딧과 비용 노출을 능동적으로 관리해야 함을 의미합니다. 이는 Fable 5를 "켜두고 잊는" 도구에서 규율을 요구하는 리소스로 전환합니다.

이러한 한계는 결함이 아닙니다. 그것은운영 체제가 처리하도록 설계된 경계입니다.

MCPlato + Fable 5: 8가지 새로운 지평

MCPlato는 개인 에이전트 운영 체제입니다. AI 파트너, Skill, 아티팩트, 로컬 데이터가 세션 간에 공존하는 지속적인 환경입니다. 이 아키텍처에 Fable 5를 투입하면 어느 한쪽 단독으로도 달성할 수 없는 능력이 해제됩니다.

1. 수일간의 연구 자동화 Fable 5는 수 시간의 추론 실행을 유지할 수 있지만, MCPlato의 스프라이트 하네스는수일간의 프로젝트를 유지할 수 있습니다. Fable 5를 추론 엔진으로 설정한 스프라이트는 월요일에 500페이지 PDF를 수집하고, 밤사이에 조사 결과를 종합하고, 화요일 아침에 실시간 웹 소스와 크로스 레퍼런스하고, 수요일까지 구조화된 보고서 아티팩트를 전달할 수 있습니다. 모두 사용자가 잠든 사이에. 스프라이트는 상태를 유지하고, API 중단을 처리하며, 정확히 중단된 지점에서 재개합니다.

2. 다층 스프라이트 위임 모든 하위 태스크에 Mythos 클래스 추론이 필요한 것은 아닙니다. MCPlato를 통해 Fable 5를 실행하는플래닝 마스터 스프라이트가 프로젝트를 분해하고, 더 저렴한 모델을 사용하는 경량 워커 스프라이트에 실행을 위임할 수 있습니다. 마스터는 아키텍처와 통합을 처리하고, 워커는 보일러플레이트, 테스트, 문서를 처리합니다. 결과는 Fable 5급 출력 품질을 훨씬 적은 비용으로 실현합니다.

3. 자동 생성되는 기업용 Skill Fable 5가 복잡한 워크플로우를 실행할 때, 예를 들어 코드베이스에서 더 이상 사용되지 않는 API 사용을 감사할 때, MCPlato는 그 실행을재사용 가능한 Skill로 증류할 수 있습니다. 다음에 동일한 패턴이 나타나면, Skill은 경량 모델로 로컬에서 실행되고, 새로운 에지 케이스에서만 Fable 5로 에스컬레이션됩니다. 지식은 복리로 증가합니다.

4. 비전에서 아티팩트로의 전달 스크린샷, 스캔한 PDF, 화이트보드 사진을 MCPlato에 업로드하세요. Fable 5는 시각 입력을 읽고, 추론하고,코드 아티팩트, 구조화된 보고서, 또는 Mermaid 다이어그램을 생성합니다. 모두 로컬 워크스페이스에 저장됩니다. "무언가를 봤다"에서 "산출물을 갖게 됐다"까지의 루프가 몇 분으로 단축됩니다.

5. 로컬 우선 + Mythos 클래스 추론 Fable 5의 100만 토큰 컨텍스트 윈도우는 대규모 코드베이스에 대해 변혁적이지만, 10만 줄의 독점 소스 코드를 어떤 API에도 업로드하는 것은 많은 조직에서 불가능합니다. MCPlato의 로컬 우선 접근 방식은 코드베이스를 사용자의 기기에 보관합니다. Fable 5는 필요한익명화된 추상화 또는 특정 스니펫만 수신하거나, 로컬 호스트 추론이 가능할 때는 그것에 대해 실행합니다. 민감한 데이터는 결코 사용자의 통제를 벗어나지 않습니다.

6. 동적 난이도 라우팅 MCPlato의 모델 라우터는 모델을 선택하기 전에 태스크 복잡도를 자동으로 평가합니다. 간단한 "이 이메일을 요약해줘" 쿼리는 저렴하고 빠른 엔드포인트를 타게 됩니다. "이 마이크로서비스를 제로 다운타임으로 리팩토링해줘" 쿼리는 Fable 5로 라우팅됩니다. 사용자는 투명하게적절한 지능을 적절한 가격에 얻습니다.

7. 멀티모달 심층 이해 2시간짜리 제품 데모 동영상을 MCPlato에 투입하세요. 전사가 오디오를 추출하고, 프레임 샘플링이 UI를 캡처합니다. Fable 5는전사 텍스트 + 핵심 시각 프레임을 함께 수집하고, 사용성 문제를 파악하며, 구조화된 개선 계획을 살아있는 아티팩트로 출력합니다. 이것은 "동영상을 보고, 그에 대해 채팅하기"가 아닙니다. "동영상이 데이터가 되고, 데이터가 액션이 되는" 것입니다.

8. 비동기 IM 브리지 협업 MCPlato의 IM 브리지는 Slack이나 Discord를비동기 태스크 위임 인터페이스로 전환합니다. 채널에 요청을 올리고, AI 파트너를 멘션하고, 자리를 비우세요. Fable 5는 다음 4시간 동안 요청을 처리하고, 2시간 지점에 진행 상황 업데이트를 게시하며, 요약 메시지가 포함된 최종 아티팩트를 전달합니다. 팀 채팅이 장기 실행 지능의 명령줄이 됩니다.

입력, 추론, 출력 노드 사이를 흐르는 비동기 AI 오케스트레이션의 시각화입력, 추론, 출력 노드 사이를 흐르는 비동기 AI 오케스트레이션의 시각화

워크플로우 시나리오: 동영상에서 액션 플랜으로

실제로 어떤 모습인지 살펴 보겠습니다. 제품 관리자가 목요일 오후에2시간짜리 사용성 테스트 녹화를 MCPlato 워크스페이스에 업로드합니다.

  1. 수집: MCPlato는 오디오를 전사하고, 동영상에서 40개의 핵심 프레임을 샘플링합니다.
  2. 분석: 스프라이트는 전사 텍스트 + 시각 데이터의 조합을 Fable 5로 라우팅하고, 23개의 개별 사용성 마찰 포인트를 식별하고, 심각도별로 분류하고, 제품의 기존 디자인 시스템과 크로스 레퍼런스합니다.
  3. 종합: Fable 5는 우선순위 권장 사항, UI 수정용 모의 코드 스니펫, 제안된 A/B 테스트 가설을 포함한 구조화된 개선 계획 아티팩트를 생성합니다.
  4. 보고: 스프라이트는 팀의 Slack 채널에 간결한 요약과 전체 아티팩트 링크를 함께 게시합니다. 제품 관리자는 금요일 아침에 검토합니다.

총 인간 참여: 업로드 1회, Slack 알림 읽기 1회, 아티팩트 검토 1회. 총 소요 시간: 약 6시간의 백그라운드 처리. 이것은 데모가 아닙니다. 이것은본격적인 워크플로우입니다.

비용 관리와 지능적 라우팅

Fable 5의 가격 책정은 버그가 아니라 기능입니다. 그것은 의도성을 강제합니다. MCPlato는 그 의도성을 자동화합니다.

기본적으로 MCPlato는 일상적인 쿼리(요약, 가벼운 편집, 사실 확인)를 비용 최적화된 엔드포인트로 라우팅합니다. Fable 5는 라우터가 복잡도 신호를 감지했을 때만 동원됩니다. 대규모 컨텍스트 볼륨, 다단계 추론, 코드 생성, 또는 사용자의 명시적 선호입니다. 프롬프트 캐싱은 반복적이거나 반복적인 워크플로우의 입력 비용을 더욱 줄입니다.

팀에게 이것은 Fable 5가잘 갖춰진 작업장의 전문 도구가 되어 도구상자의 유일한 도구가 되지 않음을 의미합니다. 시니어 엔지니어는 작업이 그것을 요구할 때 정밀 기구를 꺼냅니다. MCPlato는 다이아몬드 톱으로 종이를 자르지 않도록 합니다.

자주 묻는 질문

MCPlato가 Claude Fable 5를 지원하나요? 네. Fable 5는 모든 Skill, 스프라이트 또는 아티팩트 워크플로우의 주 모델로 설정할 수 있습니다. fallback 가드레일은 MCPlato의 라우팅 레이어에 의해 투명하게 처리됩니다.

Fable 5의 백만 토큰당 10/50달러 가격이 값어치가 있나요? 대규모 리팩토링, 수일간의 연구, 심층 멀티모달 분석과 같이 복잡하고 장기적인 태스크에서는 출력 품질과 추론 효율성이 비용을 정당화하는 경우가 많습니다. 일상적인 태스크에 대해서는 MCPlato의 지능적 라우팅이 비용을 예측 가능하게 유지합니다.

MCPlato와 Claude Fable 5를 직접 사용하는 것의 차이점은 무엇인가요? MCPlato는 세션 간 지속적인 메모리, 로컬 우선 데이터 처리, 다중 모델 오케스트레이션, 아티팩트 생성, 비동기 협업 브리지를 추가합니다. 단독 API를 개인 운영 체제로 전환합니다.

MCPlato는 Fable 5의 안전 가드레일을 어떻게 처리하나요? Fable 5가 fallback을 트리거하면, MCPlato는 쿼리를 Opus 4.8과 같은 대안 모델로 투명하게 라우팅합니다. 워크플로우는 계속되고, 사용자는 통보를 받지만 차단되지 않습니다.

Fable 5가 MCPlato 낸에서 수일간 실행될 수 있나요? 네. 스프라이트는 체크포인트, 중단 복구 기능, 그리고 IM 브리지나 아티팩트 업데이트를 통한 진행 상황 보고를 갖춘 24~48시간 비동기 프로젝트를 지원합니다.

Fable 5의 30일 데이터 보관이 프라이버시에 영향을 미치나요? MCPlato의 로컬 우선 설계는 민감한 소스 코드와 문서를 사용자의 기기에 보관합니다. 필요한 익명화 쿼리만 API에 접촉하여 외부 보관 정책에 대한 노출을 최소화합니다.

참고 문헌

  1. Anthropic. "Claude Fable 5: Introducing the First Public Mythos-Class Model." June 9, 2026. https://www.anthropic.com/news/claude-fable-5
  2. BenchLM. "SWE-bench Verified Leaderboard — Claude Fable 5." June 2026. https://benchlm.ai/report/claude-fable-5
  3. Digital Applied. "Claude Fable 5 Benchmark Analysis: SWE-bench Pro, FrontierCode, GDPval-AA." June 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-analysis
  4. Digital Applied. "OSWorld-Verified and Blueprint-Bench 2 Vision Benchmarks." June 2026. https://digitalapplied.ai/benchmarks/claude-fable-5-vision
  5. Stripe Engineering. "Migrating 50 Million Lines of Ruby with Claude Fable 5." June 2026. https://stripe.com/blog/ruby-migration-claude-fable-5
  6. Hex. "Core Analytics Benchmark: First Model to Exceed 90%." June 2026. https://hex.tech/blog/core-analytics-benchmark-fable-5
  7. Anthropic. "Claude Fable 5 Enterprise Case Studies." June 2026. https://www.anthropic.com/customers/fable-5-case-studies