
Claude Fable 5 完整實戰指南:Anthropic 首個 Mythos-class 公開模型——中小企業 30 天採購節奏、$10/$50 定價、fallback API 與 Pro 訂閱 6/22 前免費窗口
Anthropic 在 2026 年 6 月 9 日(台灣時間 6/9 晚)發表 Claude Fable 5(API ID:claude-fable-5),這是 Anthropic 自己定義的「Mythos-class」首款一般使用者可碰得到的模型——也就是說,它的能力位於 Opus 4.8 之上整整一個級距。同日發布的 Claude Mythos 5 是「同模型把安全分類器拿掉」的版本,只開放給 Project Glasswing 計畫內審核過的少數客戶。
這篇是給:(a) 已經在用 Claude Pro / Max / Team 訂閱的上班族,(b) 已經把 Claude API 串進產品或內部工作流的中小企業老闆,(c) 正在 6 月做下半年 AI 採購預算盤點的決策者。我們把 Anthropic 官方 models overview 文件、Introducing Fable 5 / Mythos 5 技術介紹、Anthropic 官方 newsroom 發表稿 一條一條對過,把 定價、context、fallback API、6/22 之前免費窗口、合約紅線、與 Opus 4.8 的取捨 全部拆給你。
ℹ️我們做過這件事
恆遠團隊 6/9 凌晨就把 claude-fable-5 串進內部 agent harness 跟客戶 SEO 自動化流程做 A/B 對照,發現 long-horizon agentic task 一次跑完不需 fallback 的比例高出 Opus 4.8 一截,但對純摘要、純翻譯類短任務並沒有顯著差異——這篇給你的決策框架就是從這個實測長出來的。想看我們對你產品線怎麼拆,可以走文末 免費 AI 諮詢。
Mythos-class 是什麼——Fable 5 在 Anthropic 模型陣型中的位置
Anthropic 在官方介紹文裡寫得很直接:「Mythos-class models are a tier of Claude models that sit above our Opus class in capability」(Mythos 級模型的能力位階在 Opus 級之上)。Fable 和 Mythos 是同一個底層模型,差別只在 safety classifier——Fable 5 加了分類器、可給一般使用者用;Mythos 5 沒加、只給 Project Glasswing 內定義過的網路防禦研究員與基礎設施供應商。
Anthropic 還順手交代了命名:Fable 來自拉丁文 fabula(「被講述出來的故事」),語源上跟希臘文 mythos(神話)是同源。換句話說,Fable 就是「能讓你聽得到的那一版 Mythos」——這對台灣讀者意義在於:Anthropic 已經把命名跟「公開 vs 限定」綁進品牌語言裡,未來 6/7/8 系列也會延續這個分流模式。
把目前 Anthropic 五個現役模型擺在一張表,看 Fable 5 到底站在哪:
模型 | 定位 | Context | Max output | 定價(input / output) | 可用通路 |
|---|---|---|---|---|---|
Claude Fable 5 | Mythos-class,旗艦,最長 horizon 任務 | 1M tokens | 128k | $10 / $50 per MTok | Claude API / AWS / Bedrock / Vertex / Foundry |
Claude Mythos 5 | Fable 5 同模型,移除分類器,限 Project Glasswing | 1M tokens | 128k | $10 / $50 per MTok | 限邀請(走 Anthropic / AWS / GCP 帳戶經理) |
Claude Opus 4.8 | Opus 級,複雜推理 + agentic coding 主力 | 1M tokens | 128k | $5 / $25 per MTok | 全通路 |
Claude Sonnet 4.6 | 速度與智能平衡,日常工作流主力 | 1M tokens | 64k | $3 / $15 per MTok | 全通路 |
Claude Haiku 4.5 | 最快、最便宜、近 frontier 智能 | 200k tokens | 64k | $1 / $5 per MTok | 全通路 |
這張表的重點不是「Fable 比 Opus 強」,而是 Fable 5 跟 Opus 4.8 的價差是 2 倍(input $10 vs $5;output $50 vs $25),context 跟 max output 完全一樣。也就是說——你願意為「Mythos 級智能」付的溢價,就是 100%。這條決策線之後會反覆出現。
三大關鍵升級:adaptive thinking always-on、refusal API、fallback credit
跟 Opus 4.8 / Sonnet 4.6 比起來,Fable 5 在 Messages API 行為上有三件事是 結構性新增,不只是「模型變強」這麼簡單。如果你寫過 Anthropic SDK 程式碼,這三件事會直接影響你的 prompt 設計與計費試算。
1. Adaptive thinking 永遠開啟、無法關閉
Fable 5 跟 Mythos 5 是 Anthropic 第一批 不支援 extended thinking、也不能用 thinking: "disabled" 關掉 adaptive thinking 的旗艦模型。你只能透過 effort 參數 調整思考深度(也就是付出去的 thinking token 量)。實務影響:
舊 Opus 4.6 / Sonnet 4.5 那種「同一個請求快版慢版兩種都試」的策略不能直接搬過來,Fable 永遠在「邊想邊回」
raw chain-of-thought 不會回傳。thinking.display 預設 omitted;設成 summarized 才會給你摘要版的思考過程,適合做 audit log
多輪對話要把 thinking block 原封不動丟回去——這跟 4.6/4.7 generation 的 thinking block 是不能跨模型共用的
2. Refusal 回應是 HTTP 200,不是 4xx
Fable 5 內建了針對網路安全、生物、化學、distillation 攻擊的分類器。被擋下來的請求 Anthropic 回的是 stop_reason: "refusal" 加上 HTTP 200,而且 不計費(refused before any output is generated 就免費)。這件事對程式碼設計意義很大:
你不能再用 try/except HTTPError 處理拒絕——錯誤碼是 200,要看 response body 的 stop_reason
之前用 Opus 4.8 包了「萬一被拒就 retry」的 wrapper,現在 retry 邏輯要改成「retry on refusal,fallback 到 Opus 4.8」
Anthropic 在官方介紹文裡明說 safeguard「on average, in less than 5% of sessions」會被觸發。也就是你的 95% 流量正常走 Fable 5
3. Fallback credit:retry 不會被重複收 prompt-cache 費
這是這次發表裡最容易被忽略、但對「重度使用 prompt caching」的客戶最重要的設計。當 Fable 5 拒絕請求、你 retry 到 Opus 4.8,Anthropic 會自動退還 prompt-cache 切換的成本——也就是 fallback credit 機制。如果你不知道這個機制存在,可能會在月底收到比預期高一截的帳單(因為以為 retry 等於付兩次 cache write 費)。
Anthropic 同時開了 fallbacks 參數(beta) 給 Claude API 與 Claude Platform on AWS——你呼叫一次,API 內部就會幫你跑 retry。對應的 SDK middleware 在 TypeScript、Python、Go、Java、C# 五個 SDK 都有。如果你的整合是 Bedrock / Vertex,目前還是要走 client-side fallback。
定價 $10 / $50 — 為什麼是 Opus 4.8 的 2 倍、什麼時候值得
Fable 5 收 input $10 / output $50 per million tokens(每百萬 tokens),精確是 Opus 4.8($5 / $25)的 2 倍。Pro / Max / Team / seat-based Enterprise 用戶在 2026/6/9 ~ 6/22 之間不額外計費,6/23 起改成走 usage credit(月度信用池);Anthropic 在新聞稿說會「as soon as possible」恢復成標準方案內建功能,但沒給日期。
以下試算採用 Anthropic 官方 per-MTok 定價直接乘 token 數——Opus 4.8 input 是 $5/MTok,所以 300k tokens = 300/1000 × $5 = $1.50;output $25/MTok,30k tokens = 30/1000 × $25 = $0.75。同樣邏輯套到 Fable 5、Sonnet 4.6、Haiku 4.5,假設一個典型企業 agent 任務:300k input + 30k output:
模型 | Anthropic 官方 per-MTok 單價(input / output) | Input 300k 試算 | Output 30k 試算 | 單次任務小計 | 月跑 1,000 次 |
|---|---|---|---|---|---|
Haiku 4.5 | $1 / $5 | $0.30 | $0.15 | $0.45 | $450 |
Sonnet 4.6 | $3 / $15 | $0.90 | $0.45 | $1.35 | $1,350 |
Opus 4.8 | $5 / $25 | $1.50 | $0.75 | $2.25 | $2,250 |
Fable 5 | $10 / $50 | $3.00 | $1.50 | $4.50 | $4,500 |
這張表的意思是:把跑了 1,000 次的同一個工作流從 Opus 4.8 升到 Fable 5,月成本從 $2,250 跳到 $4,500——月增 $2,250 美金(約新台幣 7 萬)。中小企業的合理問法不是「Fable 比較強嗎」,而是「這 $2,250 換到的能力,有沒有讓我節省 $2,250 以上的人力或失誤成本」。
Refusal + fallback 機制怎麼運作——你不會被多收一筆錢

Anthropic 把這次的 refusal / fallback 設計成「對程式碼最不打擾」的形式。完整流程:
(1) 你呼叫 claude-fable-5,API 看請求內容後通過分類器
(2) 通過 → 正常回 stop_reason: "end_turn" 並計費
(3) 沒通過 → 回 HTTP 200 + stop_reason: "refusal",還會告訴你「是哪個分類器擋的」,不計費
(4) 如果你帶了 fallbacks 參數(beta header anthropic-beta: fallbacks-2026-06-09),API 直接幫你 retry 到 Opus 4.8、回該模型的結果
(5) retry 成功 → fallback credit 自動退還 prompt-cache 寫入成本,你只付 Opus 4.8 的實際使用量
換句話說,從帳單角度看,被 refusal 擋掉 + retry 到 Opus 4.8 的成本,跟你一開始就直接打 Opus 4.8 的成本一模一樣——這個保證讓 fallback 機制可以被當成預設策略放進生產環境,不會有「萬一被拒就被多收一次錢」的尾端風險。
🚨30 天 data retention 不能轉成 ZDR
Fable 5 與 Mythos 5 被歸類為 Anthropic 的 Covered Models,所有流量都被綁定 30-day retention 防禦,不適用 zero data retention(ZDR)選項。如果你的客戶合約上明文要 ZDR,Fable 5 暫時不能用;這時候 fallback 到 Opus 4.8(支援 ZDR)反而是合規路徑。詳見 Anthropic 的 Model-specific data retention requirements。
中小企業老闆 30 天行動清單——下半年採購節奏怎麼接這支新模型

Fable 5 不是一個「換上去馬上見效」的升級——它是「把幾個關鍵流程切到旗艦級智能」的機會。30 天內你要做的事拆成三條決策線:
決策線 A:6/9 ~ 6/22 期間免費試跑(零風險窗口)
把現有 Pro / Max / Team / Enterprise 訂閱底下「最會卡住、跑最久、需要重做最多次」的任務挑 3 個
在這 13 天 free trial 期間,把同樣 prompt 同步丟給 Fable 5 跟 Opus 4.8,記錄「次次需要重試 / 一次成形」的比例差
重點看 long-horizon agentic 任務(寫一份 30 頁市場分析、改 10 個檔案的 codebase、跑完整 ETL pipeline),Anthropic 自己也說「the longer and more complex the task, the larger Fable 5's lead」
決策線 B:把 API 整合的 fallback 機制串起來
如果你有自架 agent harness:換上 claude-fable-5,加上 fallbacks beta header 自動 retry 到 claude-opus-4-8
如果你用 SDK:升 TS/Python/Go/Java/C# 任一語言的 anthropic SDK 到最新版,直接套 fallback middleware
Bedrock / Vertex 整合:目前要走 client-side fallback,寫一個簡單的 wrapper 看 stop_reason 切模型
把 fallback log 寫進 observability,觀察 30 天內 refusal rate。Anthropic 給的數字是 <5%,你自己的業務 workload 可能更高或更低
決策線 C:合約與預算修正
Annual / commit contract 重新跟 Anthropic / AWS / GCP 對齊:Fable 5 的計費粒度不同(Mythos-class minimum 通常用量門檻是 Opus 級的 2 倍以上),原本壓的 commit volume 可能用不完
預算試算要按「最高用量場景」往上加 30%——adaptive thinking 永遠開,thinking token 用量會比 Opus 4.8 的 thinking-off 模式多
如果你之前合約寫了 ZDR 條款,先別把 Fable 5 寫進採購清單,優先用 Opus 4.8;等 Anthropic 公告 Fable 5 ZDR 支援再升級
團隊內部訂閱:Pro 用戶可以直接吃到 6/22 前免費試用,但 6/23 起會切回 usage credit,要提早跟 IT 預告 token 用量上限
上班族今天就可以做的 5 個 Pro / Max / Team 訂閱設定
你不需要等公司決策、不需要寫程式,如果你已經是 Claude Pro($20/月)、Max($100/月)或 Team 用戶,今天打開 claude.ai 就能用上 Fable 5。下面 5 個設定是給上班族 6/22 之前最值得做的事:
(1) 在 Claude 介面的模型下拉選單,把預設模型從 Opus 4.8 切成 Claude Fable 5——同樣的訂閱費就能拿到旗艦級智能
(2) 把你工作上「想了一週都沒進度的硬問題」一次丟給 Fable 5——它在 long-horizon 任務上勝出最明顯
(3) 跑「同一個 prompt 兩種模型對比」實驗,自己做 3-5 個案例的 A/B(便於 6/23 切回 Opus 4.8 時你心裡有底)
(4) 若你有 1M context 場景(讀整本書、整個 codebase、整年的 Slack 紀錄),把 Fable 5 當第一順位試——Mythos-class 在長 context 推理勝出明顯
(5) 6/22 之後如果你習慣了 Fable 5、想繼續用,評估是否要升級到 Max ($100/月) 拿更高的 usage credit 上限
💡免費下載「Fable 5 vs Opus 4.8 30 天採購試算表」
我們把上面 30 天行動清單做成 Google Sheet 範本——含 token 成本試算欄、refusal rate 觀察表、合約紅線檢查清單。留下 email 即可下載,適合中小企業老闆 + IT / 採購主管共用。立刻拿:填表 30 秒拿試算表。
常見迷思破解:Fable 5 不是「全面取代 Opus 4.8」
發表後 48 小時內,Threads 跟 LinkedIn 已經出現幾個錯誤敘事。我們把最常見的 4 個列出來逐條打掉:
迷思 | 事實 | 出處 |
|---|---|---|
「Fable 5 出來,Opus 4.8 就是過去式」 | Anthropic docs 把 Opus 4.8 仍列為「為複雜推理與長 horizon agentic coding 的首選 Opus-tier 模型」。Fable 5 主要服務「需要再往上一級智能」的 5-10% 工作流。 | Anthropic models overview, 2026-06-09 |
「Fable 5 跟 Mythos 5 是兩個不同模型」 | Anthropic 官方介紹文明說兩者「shares the same capabilities, the safeguards are what distinguish the two models」——是同模型,差別只在分類器。 | Anthropic introducing-claude-fable-5-and-claude-mythos-5 |
「Fable 5 比 Opus 4.8 強 30%」 | Anthropic system card(2026-06-09)官方數字:SWE-bench Verified 95.0% vs 88.6%(+6.4 pt)、SWE-bench Pro 80.0% vs 69.2%(+10.8 pt)、GraphWalks 1M context 79.4 vs 68.1 F1(+11.3 pt)。但 Vending-Bench Opus 4.8 略勝、Terminal-Bench / OSWorld 只贏 1-2 pt——不能直接套「強 30%」的 blanket 結論。 | Anthropic Fable 5 / Mythos 5 system card, 2026-06-09 |
「Pro $20 訂閱永久免費用 Fable 5」 | 免費窗口是 2026/6/9 至 6/22(共 14 天)。6/23 起 Pro 訂閱要用 usage credit;Anthropic 承諾未來會回歸標準方案,但沒給日期。 | TechCrunch 2026-06-09 報導 + Anthropic 新聞稿 |
📊 2026-06-10 驗證:Anthropic 官方 system card benchmark
Anthropic 在 6/9 發表稿同步公開了 Fable 5 的 system card。本節整理出來的數字分三層:(1) Anthropic 官方 system card 公布的標準 benchmark;(2) Anthropic 公布的專業領域 benchmark(法律 / 金融 / 長 context);(3) 一個非常重要的 nuance——這些分數是「Mythos 級底層 + safety classifier」一起跑出來的結果,你在 production 上拿到的可能會略低,因為 classifier 觸發後會 fallback 到 Opus 4.8。
規格與定價(Anthropic 官方,2026-06-09 確認)
項目 | Fable 5 | Mythos 5 | Opus 4.8 |
|---|---|---|---|
API ID | claude-fable-5 | claude-mythos-5 | claude-opus-4-8 |
Context window | 1M tokens | 1M tokens | 1M tokens(Foundry 上 200k) |
Max output | 128k | 128k | 128k |
Input pricing | $10 / MTok | $10 / MTok | $5 / MTok |
Output pricing | $50 / MTok | $50 / MTok | $25 / MTok |
Batch input / output | $5 / $25 / MTok | $5 / $25 / MTok | $2.50 / $12.50 / MTok |
Adaptive thinking | Always on | Always on | Yes(可控) |
Extended thinking | No | No | No |
Data retention | 30 天(強制) | 30 天(強制) | 支援 ZDR |
可用通路 | Claude API + AWS + Bedrock + Vertex + Foundry | 限 Project Glasswing 邀請 | 全通路 |
GA 日 | 2026-06-09 | 2026-06-09(限定) | 2026-05-29 |
編碼與 agentic benchmark(Anthropic system card 官方)
以下數字直接出自 Anthropic 官方 Fable 5 / Mythos 5 system card,非第三方測試。
Benchmark | Fable 5 | Opus 4.8 | 領先幅度 |
|---|---|---|---|
SWE-bench Verified | 95.0% | 88.6% | +6.4 pt |
SWE-bench Pro | 80.0% | 69.2% | +10.8 pt |
Terminal-Bench 2.1 | 84.3% | 82.7% | +1.6 pt |
OSWorld-Verified(GUI agent) | 85.0% | 83.4% | +1.6 pt |
OfficeQA Pro | 57.9% | 48.1% | +9.8 pt |
Toolathlon(Pass@1) | 61.7% | 59.9% | +1.8 pt |
MCP Atlas | 83.3% | 82.2% | +1.1 pt |
CursorBench(max effort) | 72.9% | —(領先 GPT-5.5 8.6 pt) | — |
這張表的關鍵訊號是 SWE-bench Pro 領先 10.8 個百分點,SWE-bench Verified 領先 6.4 個百分點——換句話說,「跨檔 codebase 重構、CI 失敗自動修、寫完整 PR」這類 agentic coding 場景,Fable 5 的 2 倍價差在中型以上的 codebase 比較容易回收。但 Terminal-Bench、OSWorld、Toolathlon 這類「單一桌面操作 / 工具呼叫」差距只有 1-2 個百分點,Opus 4.8 仍然是 CP 值最高的選擇。
FrontierCode(難度更高的 coding benchmark)
FrontierCode 是第三方機構 Tower Research 主導的「比 SWE-bench Pro 更難」coding benchmark,Anthropic 也在 launch 材料引用。
Benchmark | Fable 5 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|
FrontierCode Diamond(score / pass) | 29.3 / 30.2 | 13.4 / 14.5 | 5.7 / 6.4 |
FrontierCode Main(score / pass) | 46.3 / 48.8 | 34.3 / 37.3 | 25.5 / 28.2 |
FrontierSWE(mean@5, 越低越好) | 2.12(#1) | 3.26(#2) | 3.94(#3) |
Diamond 子集 Fable 5 的 score 是 Opus 4.8 的 2.2 倍(29.3 vs 13.4)、是 GPT-5.5 的 5.1 倍(29.3 vs 5.7)。這是發表稿裡最戲劇化的領先幅度,代表 Fable 5 在「frontier 等級難題」上跟其他模型不在同一個賽場。
長 context 推理(GraphWalks,Mythos 5 底層公布數)
Anthropic system card 用底層 Mythos 5(等於 Fable 5 的 unsafeguarded 版)跑 GraphWalks 長 context 測試:
Benchmark | Mythos 5 / Fable 5 底層 | Opus 4.8 | 領先幅度 |
|---|---|---|---|
GraphWalks BFS 256K(F1) | 91.1 | 85.9 | +5.2 pt |
GraphWalks BFS 1M(F1) | 79.4 | 68.1 | +11.3 pt |
在 1M context 上領先 11.3 個百分點是最有實戰意義的單一數字——如果你的 use case 是「丟整本書 / 整年 Slack / 整套 codebase 進 prompt 做摘要與推理」,Fable 5 在長 context 場景的優勢比短 prompt 場景明顯太多。
專業領域 benchmark:法律、金融、桌面工作
Benchmark | Fable 5 | Opus 4.8 | 備註 |
|---|---|---|---|
Finance Agent v2 | 56.31% | 53.92% | +2.4 pt |
Real-World Finance v2(pairwise 偏好率) | 74% | — | 人類評審 pairwise 比較 |
Harvey Legal Benchmark(all-pass) | 16.91% | — | 全題目通過率 |
Harvey Legal Benchmark(criterion-pass mean) | 92.0% | — | 單一準則通過率均值 |
Vending-Bench(模擬自助販賣機,$ 越多越好) | $5,680.26 | $5,787.43 | ⚠️ Opus 4.8 略勝 |
GDP.pdf 推理 | 29.8% | 22.5% | GPT-5.5 24.9% / Gemini 3.1 Pro 16.7% |
Vending-Bench 是個值得指出的 反例:Opus 4.8 在這個模擬經營任務上 略勝 Fable 5 約 $107(差 1.9%)。這呼應前面 token 成本表的判斷——不是所有任務升級 Fable 5 都會更好,Anthropic 自己也誠實列出來。
重要 nuance:你 production 上跑的成績未必等於 Anthropic 公布的
⚠️Safety classifier 在某些 benchmark 上觸發率很高
Anthropic 官方明說 Fable 5 全站 safeguard 平均 <5% 觸發,但在某些任務上會明顯高很多。**Terminal-Bench 2.1 上,Fable 5 有 20.9% 的試驗被 classifier 攔下、fallback 到 Opus 4.8。** 這代表上表那 84.3% 其實是「79.1% Fable 5 原生 + 20.9% Opus 4.8 fallback」的混合結果。Anthropic 在 system card 明標。Nathan Lambert 在 Interconnects 評論:「these aren't necessarily the scores that the public will get」——如果你的 prompt 偏 cyber / bio / chem 類型,實際拿到的成績可能會比 system card 低。
資料來源(2026-06-10 驗證)
Anthropic — Claude Fable 5 and Claude Mythos 5(官方公告 + system card)
Anthropic — Introducing Claude Fable 5 and Claude Mythos 5(API 行為)
Interconnects — Nathan Lambert: Claude Fable 5 and new AI safety
Agentpedia Codes — Claude Fable 5 Benchmarks and Prompting Guide(system card 整理)
VentureBeat — Anthropic brings Mythos to the masses with Claude Fable 5
TechCrunch — Anthropic's Claude Fable 5 is a version of Mythos the public can access today
常見問題(FAQ)
QClaude Fable 5 跟 Mythos 5 有什麼差別?
底層模型完全相同,差別只在 Anthropic 加在 Fable 5 上的 safety classifier(網路安全、生物、化學、distillation 四類)。Mythos 5 沒有這層分類器,只給 Project Glasswing 計畫內審核過的網路防禦研究員與基礎設施供應商使用。一般使用者拿不到 Mythos 5,要的是 Fable 5。
QPro 訂閱($20/月)現在用 Fable 5 要不要另外付錢?
2026 年 6 月 9 日到 6 月 22 日之間不用——Pro、Max、Team 與 seat-based Enterprise 在這 14 天內免額外收費。6 月 23 日起會切換到 usage credit(月度信用池)。Anthropic 在新聞稿說會「as soon as possible」把 Fable 5 變成標準方案內建功能,但沒給確切日期。
Q我們公司簽過 ZDR(zero data retention)合約,可以用 Fable 5 嗎?
暫時不行。Anthropic 把 Fable 5 與 Mythos 5 列為 Covered Models,所有流量強制 30-day retention 防禦,不支援 ZDR。如果合約上明文要 ZDR,優先用 Claude Opus 4.8(支援 ZDR),等 Anthropic 公告 Fable 5 的 ZDR 支援再升級。
Q如果我把 Opus 4.8 改成 Fable 5,API 串接需要改什麼?
三件事:(1) model ID 從 claude-opus-4-8 換成 claude-fable-5;(2) 確認你沒有依賴 raw chain-of-thought——Fable 5 預設 thinking.display=omitted,要 summarized 要明設;(3) 加上 fallback 處理 stop_reason=refusal 的回應,推薦用 Anthropic 官方 fallbacks beta 參數或 SDK middleware 自動 retry 到 Opus 4.8,可享 fallback credit 退 prompt-cache 成本。
QAnthropic 自己有公布 SWE-Bench Pro 之類的精確 benchmark 分數嗎?
截至 2026/6/10 還沒有。Anthropic 6/9 的新聞稿與官方 docs 只給「state-of-the-art on nearly all tested benchmarks」這類定性描述,正式 system card 尚未公開。目前流傳的 SWE-Bench Pro 80.3%、Terminal-Bench 88.0% 等數字來自第三方獨立測試(本文表格已標註),Anthropic 官方版本出來前,treat as preliminary。
QFable 5 適合所有工作流嗎?還是只有特定情境值得升級?
Anthropic 自己定位 Fable 5 是「the most demanding reasoning and long-horizon agentic work」。對應的場景包括:跨檔 codebase 重構、整年合約 / 報表批量分析、需要連續呼叫 10+ 個工具的 agent、1M context 的長文件推理。純對話、純翻譯、單一短任務摘要,Opus 4.8 甚至 Sonnet 4.6 在性價比上仍勝過 Fable 5。
結論:Fable 5 是「可量產的 Mythos-class」,但採購要分線思考
把這篇拆下來最重要的三條:
(1) Mythos-class 是 Anthropic 自己定義的新級距,Fable 5 是它的「加了 safeguard 的公開版本」。能力比 Opus 4.8 高一級,定價也是 2 倍。
(2) 6/9 ~ 6/22 共 14 天 Pro / Max / Team / seat-based Enterprise 免費用——這是零風險試跑窗口,先驗證再決定要不要付 2 倍價錢。
(3) Refusal / fallback / fallback credit 三件事一起設計,代表 Anthropic 把「萬一被拒」的尾端風險完全擋掉——只要你寫對 fallback 流程,Fable 5 可以放生產環境跑,不用怕被多收錢。
如果你已經在用 Claude Opus 4.8 dynamic workflows、想知道這次 Fable 5 對你 6 月採購節奏的衝擊,或者你正在評估 Mythos preview / Project Glasswing 的後續走向,可以直接看相關文章。我們團隊 6/9 凌晨就跑完內部 A/B,如果想針對你的產品線、合約、ZDR 條款做客製評估,走 免費 AI 諮詢 30 分鐘對齊。
AUTHOR
自由揚AntonyLin
CONTENTS
留言(0)
尚無留言,成為第一個留言的人吧!