Claude Fable 5의 시스템 프롬프트가 가리키는 Agent Harness 시대
Anthropic의 공식 Claude 시스템 프롬프트 릴리스 노트는 더 똑똑한 채팅에서 에이전트 운영 매뉴얼로 무게중심이 이동하고 있음을 보여준다. 이 변화가 왜 harness, Artifact, 권한, MCPlato식 워크스페이스를 중요하게 만드는지 살펴본다.
게시일 2026-06-17
Claude Fable 5의 시스템 프롬프트가 가리키는 Agent Harness 시대
Anthropic의 공식 Claude 시스템 프롬프트 릴리스 노트는 마술의 비밀을 드러내기 때문에 읽을 가치가 있는 것이 아닙니다. 오히려 제품이 어디로 향하고 있는지 보여주기 때문에 중요합니다. 이 노트는 Claude의 웹 인터페이스(claude.ai)와 iOS/Android 모바일 앱에서 사용되는 핵심 프롬프트의 날짜별 스냅샷을 공개합니다. Anthropic은 경계도 분명히 합니다. 이 업데이트는 Claude API에는 적용되지 않습니다. 이 구분은 중요합니다. 이 페이지를 API 프롬프트로 보아서는 안 되며, 비공개 프롬프트 문구를 복사하거나 제품 운영에 옮겨도 된다는 허가로 보아서도 안 됩니다.
이 페이지가 실제로 보여주는 것은 프런티어 모델이 수행하도록 준비되는 일이 꾸준히 바뀌고 있다는 점입니다. 프롬프트는 챗봇의 성격 설정표라기보다 점점 더 에이전트 운영 매뉴얼에 가까워지고 있습니다. 도구를 어떻게 사용할지, 언제 확인 질문을 할지, 어떻게 출처를 인용할지, 파일을 어떻게 다룰지, 안전 경계 주변에서 어떻게 행동할지, 불확실성에서 어떻게 회복할지, 그리고 제품 표면 안에서 어떻게 일할지를 담고 있습니다.
운영 매뉴얼이 에이전트 워크플로우 레인으로 바뀌는 편집 일러스트
그림 1: 시스템 프롬프트의 흐름은 “사용자에게 답하기”에서 “작업대 안에서 안전하게 실행하기”로 이동하고 있다.
공식 명칭인 Claude Fable 5를 사용해야 합니다. API 모델 ID는 claude-fable-5입니다. Anthropic은 Claude Mythos 5(claude-mythos-5)도 언급하지만, 둘을 쉽게 섞어서는 안 됩니다. Claude Fable 5는 일반적으로 사용할 수 있는 모델이고, Mythos 5는 사용 가능 범위가 제한되어 있습니다. 이 글에서 중요한 것은 모델 마케팅이 아닙니다. 최신 Claude 채팅 인터페이스 프롬프트가 더 큰 산업 변화의 이정표처럼 읽힌다는 점입니다. 이제 모델은 harness의 일부로 작동할 것으로 기대되고 있습니다.
강화된 어시스턴트에서 운영 매뉴얼로
Opus에서 Fable로 이어지는 흐름을 읽는 유용한 방법은, 모델이 기대하는 운영 환경의 진화로 보는 것입니다.
| 스냅샷 계열 | 릴리스 노트 시대에 보이는 방향 | 실무적 의미 |
|---|---|---|
| Opus 4.5 / Opus 4.6 | 더 많은 제품 맥락, 도구 인식, 파일 처리, 대화 기록 | Claude는 더 이상 범용 어시스턴트만이 아니다. 더 풍부한 제품 표면 안에 배치되고 있다. |
| Opus 4.7 | 행동과 확인 질문의 구분이 더 명확해짐 | 세부 정보 하나가 없다고 모델이 멈춰서는 안 된다. 합리적으로 진행할 수 있다면 진행하고, 빠진 정보가 본질적일 때만 질문해야 한다. |
| Opus 4.8 | 더 강한 도구 발견 태도 | 할 수 없다고 말하기 전에 모델은 사용 가능한 환경과 도구를 확인해야 한다. 능력은 부분적으로 harness의 함수가 된다. |
| Claude Fable 5 | 더 넓은 에이전트 운영 매뉴얼 | 프롬프트는 제품 표면, 도구, 메모리, 파일, 인용, 거절과 안전 행동, 코딩, 브라우저 작업, 문서 처리, 간결한 스타일, 불확실성, 사용자 안녕까지 다룬다. |
이 변화는 미묘하지만 중요합니다. 초기 어시스턴트 프롬프트는 주로 응답 품질에 관한 것이었습니다. 도움이 되고, 안전하고, 정확하며, 사용자의 의도를 따르라는 식이었습니다. 새로운 패턴은 작업 실행에 관한 것입니다. Claude가 도구가 존재하고, 파일이 상태를 가지며, 기록이 중요하고, 인용을 신중히 다뤄야 하며, 일부 행동에는 거절이나 승인이 필요한 장소에서 작동할 수 있다고 전제합니다.
AI가 “대화 상대”에서 “업무 참여자”로 이동할 때 바로 이런 일이 일어납니다. 대화 상대는 질문에 답하고 사라질 수 있습니다. 업무 참여자에게는 책상, 기억, 캘린더, 파일 캐비닛, 허락을 구하는 방법, 결과물을 남길 장소, 그리고 사람이 무슨 일이 있었는지 감사할 수 있는 방법이 필요합니다.
행동과 확인 질문 사이의 변화
Opus 4.7 방향에서 가장 의미 있는 변화 중 하나는 행동과 확인 질문 사이의 균형입니다. 초기 AI 워크플로우 다수는 지루한 방식으로 실패했습니다. 다음 단계가 분명한데도 모델이 먼저 확인 질문을 던졌습니다. 사용자가 “이 노트로 출시 계획 초안을 만들어줘”라고 요청하면, 어시스턴트는 유용한 내용을 만들기 전에 톤, 대상 독자, 일정부터 물어보곤 했습니다.
확인은 여전히 필요합니다. 어떤 결정이 범위, 위험, 비용, 법적 노출 또는 외부 행동을 바꾼다면 모델은 질문해야 합니다. 하지만 빠진 정보가 작고, 되돌릴 수 있고, 추론 가능하다면 유능한 에이전트는 가정을 명확히 표시한 채 앞으로 나아가야 합니다.
이것은 글쓰기 조언처럼 들리지만, 실제로는 harness 설계입니다. 올바른 환경은 모델이 저위험 단계에서는 계속 진행하도록 허용하고, 고위험 체크포인트에서는 멈추게 해야 합니다. 예를 들면 다음과 같습니다.
- 계획은 지금 작성하되, 고객에게 보내기 전에는 묻는다.
- 저장소는 지금 검사하되, 파일을 편집하기 전에는 묻는다.
- 공개 출처는 지금 수집하되, 게시 전에는 불확실한 주장을 표시한다.
- 데이터베이스 마이그레이션 제안은 지금 준비하되, 실행 전에는 승인을 요구한다.
채팅 창은 이런 정책을 말로 표현할 수 있습니다. harness는 그것을 워크플로우 안에서 강제할 수 있습니다.
도구 발견의 변화
Opus 4.8 방향은 또 다른 점을 보여줍니다. 모델은 포기하기 전에 자기 환경을 발견해야 합니다. 브라우저, 파일 리더, 스프레드시트 도구, PDF 파서, 코드 실행기, 이미지 분석기가 있다면, 모델은 대화만이 전부인 것처럼 행동하지 말고 사용 가능한 표면을 써야 합니다.
이는 “지능”의 정의를 바꿉니다. 모델이 “파일에 접근할 수 없습니다”라고 말하는 것이 어떤 인터페이스에서는 맞고, 다른 인터페이스에서는 틀릴 수 있습니다. 이제 모델의 실질적 능력은 다음 요소들의 합입니다.
- 모델 자체의 추론 능력,
- 모델에 노출된 도구,
- 그 도구들에 부여된 권한,
- 단계 사이에 보존되는 상태,
- 결과를 검사할 수 있는 Artifact 표면.
그래서 agent harness라는 표현이 중요합니다. harness는 장식이 아닙니다. 모델에 눈, 손, 기억, 경계, 출력 채널을 주는 시스템입니다. 그것이 없다면 강력한 모델조차 작은 채팅 상자 안에 갇힌, 유난히 말 잘하는 승객이 될 수 있습니다.
채팅 어시스턴트 행동에서 완전한 에이전트 운영 매뉴얼로 이어지는 손그림 타임라인
그림 2: 프롬프트의 진화는 더 풍부한 지원에서 구조화된 운영으로 향한다. 행동하고, 도구를 발견하고, 상태를 보존하며, Artifacts를 만든다.
왜 harness 시대는 단순히 “더 나은 채팅”이 아닌가
중요한 산업 변화는 모델이 더 긴 답변을 쓸 수 있게 된 것이 아닙니다. 모델이 더 긴 업무 루프에 참여할 것으로 기대된다는 점입니다. 실제 루프에는 상태와 위험이 있습니다.
코딩 작업을 생각해봅시다. 사용자는 버그가 고쳐졌다고 주장하는 문단이 필요하지 않습니다. 패치, 테스트 출력, 변경 파일 요약, 리뷰 노트가 필요합니다. 시장 브리핑을 생각해봅시다. 사용자는 추적할 수 없는 자신만만한 종합이 필요하지 않습니다. 날짜가 있는 출처, 인용, 지난 보고서와의 차이, 다음 주에 브리핑을 업데이트할 장소가 필요합니다. 브라우저 기반 작업을 생각해봅시다. 사용자는 보고서를 다운로드했다는 약속이 필요하지 않습니다. 파일, 폴더, 예외 목록, 어떤 단계가 자동화되었고 어떤 단계가 수동으로 처리되었는지에 대한 기록이 필요합니다.
단일 채팅 UI는 이런 일에 취약합니다. 업무에 필요한 여러 요소가 부족하기 때문입니다.
- 외부 상태: 이미 무엇을 읽고, 바꾸고, 다운로드하고, 결정했는가?
- 단계별 체크포인트: 승인이나 방향 전환을 위해 작업이 어디에서 멈춰야 하는가?
- 권한 경계: 어떤 행동이 읽기 전용이고, 되돌릴 수 있으며, 외부에 노출되고, 파괴적이거나 비용이 큰가?
- 복구: 작업이 중간에 실패하면 무작정 처음부터 다시 시작하지 않고 재개할 수 있는가?
- Artifact 생명주기: 채팅이 지나간 뒤 최종 결과는 어디에 남는가?
- 병렬 격리: 조사, 작성, 테스트, 리뷰가 서로를 오염시키지 않고 별도 작업 흐름에서 진행될 수 있는가?
- 관측 가능성: 사람이 출처, 행동, 비용, 실패, 가정을 검사할 수 있는가?
이것들은 프롬프트 엔지니어링의 세부 사항이 아닙니다. 운영 표면의 세부 사항입니다.
MCPlato가 이 흐름을 받아내는 방식
MCPlato는 또 하나의 답변 상자가 아니라 AI 워크스페이스이자 에이전트 운영 표면으로 이해하는 것이 가장 자연스럽습니다. 그 제품 용어는 Claude의 최신 시스템 프롬프트가 암시하는 방향과 잘 맞습니다.
Sprite는 조정자입니다. 작업에 여러 단계나 전문가가 필요할 때, Sprite는 일을 쪼개고, 세션에 위임하고, 진행 상황을 추적하며, 결과를 다시 모읍니다. 긴 작업은 끊김 없는 하나의 사고 흐름 안에 들어가는 경우가 드물기 때문에 이것이 중요합니다.
Wand는 상태를 가진 패키지형 워크플로우입니다. 매번 AI에게 같은 과정을 즉흥적으로 다시 만들게 하는 대신, Wand는 단계, 게이트, 범위가 정해진 리소스, 기대되는 Artifacts를 정의할 수 있습니다. 결과는 프롬프트 템플릿보다 반복 가능한 업무 앱에 더 가깝습니다.
Artifact는 지속되는 종착점입니다. 출력은 채팅 텍스트의 벽 안에 갇혀서는 안 됩니다. 보고서, 패치, 덱, 스프레드시트, 폴더, 의사결정 메모, QA 기록 또는 다른 검사 가능한 객체가 되어야 합니다.
Skill과 Distill Skill은 노하우를 보존합니다. 어떤 워크플로우가 잘 작동했다면, 재사용 가능한 부분은 다시 접근 가능해야 합니다. 팀은 이렇게 고립된 영웅적 프롬프트에서 공유되는 운영 관행으로 이동합니다.
ClawMode와 Scheduled Tasks는 작업을 시간 너머로 확장합니다. 가치 있는 작업 중에는 즉시 끝나지 않는 것이 있습니다. 주간 리서치 브리프, 야간 저장소 스캔, 반복 콘텐츠 파이프라인, 새 정보가 나타난 뒤의 후속 조치가 그렇습니다.
권한과 승인 게이트는 자율성을 경계 안에 둡니다. MCPlato를 맹목적 자동화로 설명해서는 안 됩니다. 더 나은 원칙은 통제된 자율성입니다. 위험이 낮은 행동에서는 AI가 진행하도록 두고, 파일을 변경하거나, 메시지를 보내거나, 외부 시스템에 접촉하거나, 비즈니스 리스크를 만드는 행동에서는 사람의 승인을 요구해야 합니다.
Channels와 IM bridges는 상호작용을 비동기화합니다. 사용자는 팀 채팅에서 작업을 위임하고, 진행 업데이트를 받고, 전면 채팅 창을 지켜보지 않아도 최종 Artifact를 검토할 수 있어야 합니다.
Local-first 워크스페이스 상태는 자료, 상태, 결과를 사용자의 작업 가까이에 둡니다. 이것이 모든 개인정보 보호나 보안 우려를 없애는 것은 아니지만, 태도를 바꿉니다. 워크스페이스는 맥락이 조직되고, 검토되고, 관리되는 장소가 됩니다.
요약하면 MCPlato는 최신 운영 지침이 점점 더 전제하는 환경을 모델에게 제공합니다. 도구, 파일, 메모리, 권한, 단계, Artifacts, 사람의 체크포인트입니다.
Artifacts, 일정, 승인, 세션 레인을 갖춘 워크스페이스 harness의 평면 편집 일러스트
그림 3: harness는 모델 능력을 관측 가능하고, 권한이 부여되며, Artifact 중심인 업무 루프로 바꾼다.
네 가지 구체적 사례
1. 코딩 issue에서 패치, QA Artifact까지
사용자가 GitHub issue를 MCPlato에 넣고 수정을 요청합니다. 채팅만 있는 흐름에서는 어시스턴트가 곧바로 제안으로 뛰어들 수 있습니다. harness 흐름에서는 작업이 단계화됩니다.
- issue와 저장소 맥락을 읽는다.
- 범위가 제한된 계획을 작성한다.
- 변경이 위험하다면 편집 전에 묻는다.
- 패치를 만든다.
- 합의된 검사를 실행한다.
- 변경 파일, 테스트 출력, 미해결 위험, 리뷰 노트를 담은 QA Artifact를 만든다.
행동과 확인 질문 사이에서 달라진 Claude의 태도는 이 흐름과 잘 맞습니다. 에이전트는 issue를 읽기 전에 불필요한 질문을 해서는 안 되지만, 광범위하거나 파괴적인 변경 전에는 멈춰야 합니다.
2. 인용이 포함된 정기 리서치 브리핑
주간 리서치 브리핑은 일회성 답변이 아닙니다. 승인된 출처를 모으고, 중복을 제거하고, 지난주와 비교하고, 변화를 요약하고, 모든 구체적 주장에 인용을 붙여 보고서를 전달하는 반복 루프입니다. MCPlato의 Scheduled Tasks와 Artifacts는 결과를 지속되게 하고, channels는 전달을 비동기로 만들며, Skills는 형식을 재사용 가능하게 합니다.
워크스페이스가 출처 목록과 브리핑 Artifact를 함께 보존할 수 있을 때, 출처를 인용하라는 프롬프트 수준의 지시는 더 큰 가치를 갖습니다.
3. 브라우저와 문서 워크플로우
재무팀이 웹 포털에서 보고서를 다운로드하고, 스프레드시트와 결합해 월간 요약을 만들어야 한다고 상상해봅시다. 좋은 에이전트는 모든 웹사이트에 보편적으로 접근할 수 있다고 주장해서는 안 됩니다. 로그인 경계를 존중하고, MFA는 사용자가 처리하도록 요청하고, 내보내기나 API가 있는지 확인하며, 승인된 반복 가능 단계만 자동화하고, 파일 수를 검증하고, 예외 보고서를 만들어야 합니다.
이것이 “AI가 브라우저를 사용할 수 있다”와 “AI가 통제된 브라우저/문서 루프 안에서 운영될 수 있다”의 차이입니다.
4. 위험한 행동 승인
에이전트가 고객에게 보낼 이메일을 작성하거나, 프로덕션 데이터를 변경하는 명령을 준비하거나, 폴더 삭제를 제안한다고 해봅시다. 모델은 지시를 이해할 수 있습니다. 하지만 이해가 권한은 아닙니다. harness는 그 단계를 승인 체크포인트로 바꿔야 합니다. 의도한 행동, 예상 효과, 롤백 계획, 근거를 보여준 뒤 기다려야 합니다.
여기서 안전과 생산성은 서로를 강화합니다. 사용자는 모든 읽기 전용 단계를 늦출 필요가 없습니다. 그러나 되돌릴 수 없거나 외부로 향하는 행동 전에는 명확한 게이트가 필요합니다.
빌더에게 주는 의미
AI 제품을 만드는 사람들에게 Claude 시스템 프롬프트 릴리스 노트는 유용한 설계 신호입니다. “어떤 모델이 가장 똑똑한가?”만 묻지 말고 다음도 물어야 합니다.
- 모델은 자신이 어떤 환경에서 작동한다고 믿는가?
- 제품은 권한을 흐리지 않고 도구를 노출할 수 있는가?
- 워크플로우는 상태를 잃지 않고 시간에 걸쳐 계속될 수 있는가?
- 사용자는 무슨 일이 있었는지 검사할 수 있는가?
- 최종 결과는 대화 기록이 아니라 Artifact로 남을 수 있는가?
- 시스템은 너무 자주 묻거나 너무 자유롭게 행동하지 않고, 올바른 순간에 멈출 수 있는가?
답은 더 긴 시스템 프롬프트 하나에서만 나오지 않습니다. 프롬프트는 행동을 설명할 수 있지만, 그 행동을 신뢰 가능하게 만드는 표면은 제품이 제공해야 합니다.
이것이 harness 시대입니다. 모델은 더 유능해지지만, 그 능력은 상태, 도구, 복구, 승인, Artifacts로 둘러싸일 때에만 유용해집니다.
결론
Claude Fable 5의 시스템 프롬프트 스냅샷이 흥미로운 이유는 모델 능력 너머를 가리키기 때문입니다. 현대 모델이 어떤 환경에 들어가도록 준비되고 있는지를 보여줍니다. 프런티어는 더 이상 “더 나은 채팅”만이 아닙니다. 상태를 가지며, 도구를 이해하고, 권한으로 통제되며, 인용을 의식하고, 복구 가능하며, Artifact 중심인 에이전트 작업입니다.
MCPlato는 바로 그 방향을 위해 만들어졌습니다. Sprite 조율, Wands, Artifacts, 재사용 가능한 Skills, 예약 작업, channels, local-first 워크스페이스 상태, 승인 게이트는 모델 주변의 장식이 아닙니다. 강력한 모델을 실제 업무에서 유용한 참여자로 만드는 운영 표면입니다.
모델은 여전히 엔진입니다. harness는 그 엔진을 사람이 조종하고, 점검하고, 수리하고, 신뢰할 수 있는 차량으로 바꿉니다.
참고 자료
- Anthropic docs, System Prompts release notes.
- Anthropic docs, Introducing Claude Fable 5 and Claude Mythos 5.
