Claude Fable 5·Mythos 5 총정리: Codex·Gemini에서 갈아타야 할까?

Claude Fable 5와 Mythos 5 비교 타이틀 이미지
Claude Fable 5는 공개형 Mythos급 모델, Claude Mythos 5는 제한 접근 모델입니다.

Anthropic이 2026년 6월 9일 공개한 Claude Fable 5와 Claude Mythos 5는 “Opus 다음 모델”이 아니라, Opus보다 위에 놓인 Mythos급 모델을 일반 사용자에게 처음 열었다는 점에서 의미가 큽니다. 다만 두 모델은 같은 기반 지능을 공유하더라도 접근 권한과 안전장치가 다릅니다.

결론부터 말하면, 긴 코드베이스 리팩터링·복잡한 문서 분석·멀티에이전트 기획을 자주 하는 사람은 Fable 5를 테스트할 가치가 있습니다. 반면 비용 효율이 중요하거나, Google 생태계·멀티모달·검색 grounding이 핵심이면 Gemini를 유지하고, 이미 Codex 워크플로우가 안정적이라면 Codex를 기본으로 두고 Fable 5를 난제 처리용으로 붙이는 전략이 더 현실적입니다.

목차

  • 최신 정보: Fable 5와 Mythos 5의 차이
  • 해외 실사용 후기: 좋았던 점과 막힌 점
  • 기존 Claude·Codex·Gemini와 비교
  • 토큰 비용과 체감 비용
  • 추천·비추천 사용자와 주의점

1. Claude Fable 5와 Mythos 5 최신 정보

Anthropic 공식 발표에 따르면 Claude Fable 5는 “일반 사용에 맞게 안전장치를 적용한 Mythos-class 모델”입니다. Anthropic은 Fable 5가 소프트웨어 엔지니어링, 지식 작업, 비전, 과학 연구 등 거의 모든 테스트 벤치마크에서 자사 일반 공개 모델 중 가장 강력하며, 작업이 길고 복잡할수록 기존 모델 대비 우위가 커진다고 설명했습니다(Anthropic 공식 발표).

개발자 문서 기준 API 모델 ID는 Fable 5가 claude-fable-5, Mythos 5가 claude-mythos-5입니다. 두 모델 모두 기본 1M 토큰 컨텍스트와 요청당 최대 128k 출력 토큰을 지원합니다(Anthropic 개발자 문서). 중요한 차이는 Mythos 5가 일반 공개가 아니라 Project Glasswing 등 승인된 고객에게 제한 제공된다는 점입니다.

TechCrunch는 Fable 5가 API와 소비 기반 Enterprise 플랜에서 바로 제공되지만, 사이버보안·생명과학·화학·증류 관련 고위험 요청은 차단되거나 Claude Opus 4.8로 폴백된다고 보도했습니다(TechCrunch). Ars Technica도 Fable 5의 안전 분류가 보수적으로 설계되어 정상 요청까지 막는 false positive가 생길 수 있다고 분석했습니다(Ars Technica).

핵심 차별성

  • 공개형 Mythos급 모델: Opus보다 위의 모델 계층을 일반 사용자에게 연 첫 사례입니다.
  • 1M 컨텍스트와 128k 출력: 긴 코드베이스·문서·에이전트 작업에 유리합니다.
  • 안전 폴백: Fable 5가 거절하면 HTTP 오류가 아니라 stop_reason: refusal이나 Opus 4.8 폴백 흐름이 발생할 수 있습니다.
  • 데이터 보존 주의: Anthropic 문서는 Fable 5·Mythos 5가 30일 데이터 보존이 적용되는 Covered Model이며 zero data retention을 지원하지 않는다고 설명합니다.

2. 실제 사용 후기: 강력하지만 안전장치가 체감된다

Hacker News의 Claude Fable 5 스레드에서 Simon Willison은 Fable 5를 “beast”라고 표현하며, Claude.ai에서 MicroPython WASM 라이브러리를 기반으로 CPython WASM 휠을 만드는 실험을 공유했습니다(Hacker News 스레드). 같은 스레드의 다른 사용자는 Opus 4.8보다 실제 리팩터링에서 덜 헤매고, Opus가 놓친 버그도 찾았다고 평가했습니다.

반면 같은 스레드에는 내부 데이터 수집 도구, 건강 데이터 분석, MRI 이미지 처리, 실험실 자동화 요청에서 안전장치에 걸려 Opus 4.8로 전환되거나 거절됐다는 사례도 올라왔습니다. 즉 초기 사용자 반응은 “엄청 똑똑하지만, 내 업무가 민감 영역으로 오해되면 갑자기 막힐 수 있다”에 가깝습니다.

Ethan Mollick은 One Useful Thing에서 Fable 5가 공개 모델 중 상당한 도약처럼 느껴졌고, Claude Code로 게임 제작·연구·복잡한 지도 제작을 수 시간 단위로 수행했다고 소개했습니다(Ethan Mollick 리뷰). Claire Vo의 Lenny’s Newsletter/How I AI 리뷰는 제품 그래프 스펙, 스킬 레지스트리 설계, 멀티에이전트 오케스트레이션에서 강했지만 실행에서는 때때로 보수적이라고 정리했습니다(Claire Vo 리뷰).

CodeRabbit의 초기 리뷰는 더 실무적입니다. Fable 5는 불완전한 프롬프트에서도 환경을 탐색하고 코딩 작업을 진행하는 능력이 좋지만, 프로덕션 코드 리뷰에서는 현재 베이스라인과 Opus 4.8이 더 안전해 보인다고 평가했습니다(CodeRabbit 리뷰).

Claude Fable 5, Mythos 5, Codex, Gemini 비교 이미지
Fable 5는 단답형 챗봇보다 긴 코딩·문서·에이전트 작업에서 장점이 뚜렷합니다.

3. 기존 모델·Codex·Gemini와 비교

Artificial Analysis는 Claude Fable 5가 agentic real-world knowledge work 벤치마크인 GDPval-AA에서 1932점을 기록해 1위에 올랐다고 공개했습니다. 이 평가는 최대 추론 노력과 Opus 4.8 폴백 구성을 사용했으며, GDPval-AA 작업 중 2%가 Opus 4.8로 폴백됐다고 설명합니다(Artificial Analysis). 따라서 “강한 독립 평가 신호”로 볼 수 있지만, 폴백 포함 조건이라는 점을 함께 봐야 합니다.

모델/도구 장점 주의점 추천 작업
Claude Fable 5 장기 에이전트, 코딩, 문서·비전 추론 민감 영역 폴백, 높은 비용, 30일 보존 대형 리팩터링, 복합 분석, 난제 해결
Claude Mythos 5 안전 분류가 일부 해제된 제한 모델 일반 사용자 접근 불가 승인된 사이버 방어·전문 연구
Opus 4.8 Fable보다 저렴하고 안정적 Fable급 장기 작업 지속력은 부족할 수 있음 일반 고급 코딩, 코드 리뷰
OpenAI Codex/GPT-5.5 CLI·샌드박스·PR 워크플로우 모델 성능보다 제품 흐름 의존 일상 개발 루프, 자동 PR
Gemini 3.1 Pro 저렴한 API, 멀티모달, Google grounding 코딩 에이전트 성공률은 작업별 검증 필요 문서·검색·비용 효율형 분석

4. 토큰 비용과 체감 비용

Anthropic 공식 가격표 기준 Fable 5와 Mythos 5는 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러입니다. Opus 4.8은 입력 5달러·출력 25달러, Sonnet 4.6은 입력 3달러·출력 15달러입니다(Anthropic 가격표). OpenAI 공식 가격표 기준 GPT-5.5는 짧은 컨텍스트에서 입력 5달러·출력 30달러, 긴 컨텍스트에서 입력 10달러·출력 45달러입니다(OpenAI 가격표). Google Gemini API 가격표 기준 Gemini 3.1 Pro Preview는 20만 토큰 이하 입력 2달러·출력 12달러, 20만 토큰 초과 입력 4달러·출력 18달러입니다(Google Gemini 가격표).

작업 예시 Fable 5 Opus 4.8 GPT-5.5 long Gemini 3.1 Pro >200k
입력 50k + 출력 5k 약 $0.75 약 $0.38 약 $0.72 약 $0.29
입력 500k + 출력 30k 약 $6.50 약 $3.25 약 $6.35 약 $2.54
입력 900k + 출력 80k 약 $13.00 약 $6.50 약 $12.60 약 $5.04

이 계산은 캐시·배치·웹검색·도구 호출 비용을 제외한 단순 토큰 비용입니다. 실제 에이전트 비용은 “한 답변의 가격”이 아니라 “성공한 작업 1개당 총비용”으로 봐야 합니다. Fable 5가 재시도를 줄이면 비싸도 이길 수 있고, 폴백·거절·긴 출력이 반복되면 Gemini나 Codex보다 비싸질 수 있습니다.

Codex, Gemini, Claude Fable 5 선택 기준 이미지
모델 선택은 성능 순위보다 작업 유형, 비용, 거절 가능성, 도구 생태계를 함께 봐야 합니다.

5. 추천·비추천 사용자와 주의점

Fable 5를 추천하는 경우

  • 며칠짜리 리팩터링, 마이그레이션, 대형 코드베이스 분석을 AI에게 맡기는 개발자
  • 문서·표·차트·PDF를 동시에 읽고 결론을 내야 하는 전략·리서치 담당자
  • Codex나 Gemini가 반복 실패한 난제를 별도 고성능 모델로 해결하고 싶은 팀

비추천 또는 보류할 경우

  • 짧은 질의응답, 간단한 블로그 초안, 일반 요약처럼 저렴한 모델로 충분한 작업
  • 의료·바이오·보안·화학처럼 안전 분류에 자주 걸릴 수 있는 업무
  • zero data retention이 필요한 기업 데이터 처리
  • Google Workspace, Search grounding, Maps 등 Google 도구 연동이 핵심인 워크플로우

Codex·Gemini를 계속 써야 할까?

Codex 사용자는 바로 갈아타기보다 병행이 낫습니다. Codex는 CLI, 샌드박스, PR 자동화 같은 개발자 경험이 강합니다. Fable 5는 기본 코딩 루프를 대체하기보다 “Codex가 막힌 고난도 작업”을 맡기는 보조 라우트로 시작하는 것이 안전합니다.

Gemini 사용자는 비용 효율과 Google 생태계가 강점이면 유지가 합리적입니다. 특히 대량 문서·멀티모달 분석에서는 Gemini 단가가 Fable 5보다 낮습니다. 다만 장기 코딩 에이전트의 끝까지 가는 힘이 부족하다고 느낀다면 Fable 5를 후보에 넣어 같은 작업으로 A/B 테스트해야 합니다.

5분 실행 팁: 최근 Codex나 Gemini가 실패한 실제 작업 1개를 고르고, 같은 요구사항을 Fable 5·기존 모델·저가 모델에 넣어보십시오. 성공 여부, 재시도 횟수, 사람이 고친 시간, 총 토큰 비용, 거절/폴백 여부를 기록하면 “갈아탈지 말지”가 감이 아니라 숫자로 보입니다.

FAQ

Q1. Mythos 5를 일반 사용자가 쓸 수 있나요?

일반적으로는 어렵습니다. Anthropic 문서는 Mythos 5가 Project Glasswing 등 승인된 고객에게 제한 제공된다고 설명합니다. 일반 개발자와 기업은 Fable 5가 현실적인 선택지입니다.

Q2. Fable 5가 Opus 4.8보다 무조건 좋은가요?

긴 작업과 복잡한 에이전트 업무에서는 우위가 클 수 있습니다. 그러나 비용은 Opus 4.8의 2배이고 안전 폴백이 있으므로 짧은 작업은 Opus 4.8이나 Sonnet 계열이 더 합리적일 수 있습니다.

Q3. 최종 결론은 무엇인가요?

Fable 5는 전면 교체용보다 선택적 고성능 라우터로 쓰는 편이 좋습니다. Codex는 개발 워크플로우, Gemini는 비용 효율과 Google 생태계, Fable 5는 장기·고난도 에이전트 작업에 배치하는 3모델 전략이 가장 현실적입니다.

작성 기준: 2026년 6월 10일. 가격·구독 포함 여부·접근 정책은 빠르게 바뀔 수 있으므로 실제 도입 전 Anthropic, OpenAI, Google의 공식 가격표와 콘솔 공지를 다시 확인해야 합니다.

이 글이 마음에 드세요?

RSS 피드를 구독하세요!

댓글 남기기