Claude 史上最强模型发布：你能用的叫「寓言」，真正的「神话」不卖给你

今天早上我照例升级了 Claude Code，版本号跳到 v2.1.170，欢迎语下面多了一块橙色横幅：

「Fable 5 is here! Our newest model for complex, long-running work. Included in your plan limits until Jun 22, then switch to usage credits to continue.」

新模型，订阅直接能用。我顺手敲了 /model 切了过去，切完才回过神来读完第二句——到 6 月 22 日为止，之后要切换按量付费才能继续。

用 Claude 快三年，新模型发布见过七八次，惯例一直是：订阅用户直接用，用到下一代出来为止，没有期限，也没有任何小字条款。一个新模型自带截止日期，这是头一回。我决定先别急着干活，把这件事查清楚再说。

Claude Code v2.1.170 的升级提示：Fable 5 包含在订阅额度内，截止 6 月 22 日。

菜单里那两行字，一行是广告，一行是账单

模型菜单里，Fable 5 的描述写了两句话。前一句是宣传：「为你最难、运行时间最长的任务准备」。后一句其实是账单预警：「消耗订阅额度的速度约为 Opus 的 2 倍」。

宣传那句没掺水。官方对比表里，SWE-Bench Pro（agentic 编程基准）拿到 80.3%，比上一代旗舰 Opus 4.8 高出 11 个百分点，比 GPT 5.5 高出 21 个；上下文窗口 100 万 token，单次输出最高 12.8 万 token。在大模型排行榜按零点几分掰手腕的今天，两位数的领先是很罕见的事。

Anthropic 官方基准对比表官方基准对比表：SWE-Bench Pro 80.3%，领先自家 Opus 4.8 约 11 个百分点、领先 GPT 5.5 约 21 个。注意第一列的表头写了两个模型的名字——我第一遍看的时候没在意，这个细节后面会说到。

账单那句也没掺水。我去查了 API 定价：每百万 token 输入 10 美元、输出 50 美元，正好是 Opus 4.8 的两倍，也是目前所有大模型实验室公开发售的模型里最贵的。

但 2 倍只是表面数字，文档里还埋着两个细节。第一，Fable 5 换了新的 tokenizer，同样一段内容要多切出大约 30% 的 token——也就是说单价翻倍的同时，计量单位还变密了。第二，它的思考模式永远开启、无法关闭，Hacker News 上发布当天就有人报告，复杂的 agentic 会话动辄烧掉 50 万到 100 万 token。三件事叠在一起，跑同一个任务的真实成本不是 Opus 的 2 倍，而是接近 2.5 到 3 倍。

Hacker News 上的 Claude Fable 5 讨论串 HN 讨论串冲到 2019 分、1554 条评论。高赞评论很能说明问题：「如果完全不在乎价格，我会只用这个模型……这是第一个让我觉得它在抢我饭碗的模型。」

所以升级完五分钟，我做的第一个决定是把默认模型留在原处，Fable 5 只留给那几个真正难啃的任务。

公告标题里，还有另一个模型的名字

带着「倒计时到底什么意思」的疑问，我去读了官方公告。结果倒计时还没查明白，先被标题绊住了——《Claude Fable 5 and Claude Mythos 5》。

两个模型？发布会上明明只能用到一个。

Anthropic 官方公告页 Anthropic 官网公告，2026 年 6 月 9 日：标题里并列着两个模型的名字，配图是蝴蝶拼成的「5」。

读下去才明白：这不是两个能力不同的模型，是同一个底层模型的两种发行版。Fable 5 面向所有人，内置一套安全分类器；Mythos 5 移除了部分护栏，只通过一个叫 Project Glasswing 的计划，开放给约 150 个经过审核的机构——网络防御方、关键基础设施运营者、生物医学研究机构。这时候再回头看基准表那个表头——「Claude Mythos 5 / Fable 5」共用一列分数，原因就在这儿。

护栏的工作方式值得说一下：分类器实时拦截三类请求——攻击性网络安全、生物与化学、模型蒸馏——拦下之后，自动改由 Opus 4.8 来回答。官方称超过 95% 的会话不会触发回退。换句话说，你在 Fable 5 里问了某些问题，实际回答你的是上一代模型，而界面上不一定看得出来。基准表的角注也印证了这一点：带星号的网络安全和生物类测试上，官方注明 Fable 5 的成绩「因回退而更接近 Opus 4.8」，因为那些题实际答题的就是 Opus。

然后是命名。Fable 是寓言，Mythos 是神话。寓言是被驯化过的故事，有寓意、有边界、适合讲给所有人听；神话是原始的力量叙事。Anthropic 在公告里自己挑明了：「护栏差异是区分这两个模型的原因。」把名字和发行结构放在一起看，意思再清楚不过——你我能买到的，永远是修剪过的「寓言」；「神话」不卖，只批给特定身份的机构。

Anthropic 官方公告 Anthropic 在 X 上的发布公告：「一款神话级模型，我们已将其安全化以供一般使用」。Mythos 5 仅限 Glasswing 合作伙伴。

这件事让我愣了一会儿。过去两年这个行业的默认规则是付费即平等：你是个人开发者还是世界五百强，20 美元订阅拿到的模型是同一个。而从这次发布开始，AI 能力的获取第一次出现了钱买不到的档位——多出来的那道门槛，不收钱，查身份。

顺带一提，公告里有一处措辞很少被报道引用。Anthropic 写道：「我们不确定仅阻止狭义的生物武器查询是否足够」，紧接着又说「希望尽快收窄这些护栏」。一段话同时承认护栏不一定够用、又承认它当前过于宽泛。再配上英国 AI 安全研究所在早期测试里对通用越狱「取得进展」的披露，以及几天前 Anthropic 自己刚发过的递归自我改进风险警告——先警告危险，几天后发布史上最强模型。我猜这家公司里安全团队和商业团队大概各赢了一半。

回到那个倒计时

查完这一圈，回头看那行「截止 6 月 22 日」，官方解释是容量：先让订阅用户用着，等算力跟上再恢复为订阅标配。

我反复琢磨，觉得这个解释有说不通的地方。如果纯粹是产能问题，限流、排队、高峰降速都是现成手段，各家都这么干过，没必要把模型从订阅里整个摘出去、改成按量计费——后者要改计费系统、改产品逻辑，动作大得多。

更说得通的解释是：这 14 天是一场定价实验。先让所有订阅用户切身体验到 Fable 5 和日常模型的差距，再撤掉订阅供给，看有多少人愿意真金白银地掏 usage credits 继续用。体验期结束的那一刻，Anthropic 会拿到一份非常精确的数据：最强模型在用户心里到底值多少钱。

当然，这只是我的猜测，而且有一个地方我没想通：如果只是想测付费意愿，Anthropic 从来不缺直接定高价的勇气，犯不着绕这么个弯。也可能两种解释都是真的——产能确实紧张，顺手把需求也测了。这一段我没有答案。

可以确定的是，「付一份订阅费就能用最强模型」这个默认设定，塑造了过去两年所有人的工作流——反正包月，无脑开最贵的。Fable 5 是第一个打破这个默认的主力模型。它要是跑通了，OpenAI 和 Google 大概率会跟，毕竟每家实验室都面对同一本账：顶级模型的推理成本涨得比订阅费快，包月制越来越难摊平。

至于「容量允许后恢复订阅标配」这句承诺——它没说什么时候，也没说以什么形式。到底是权宜之计还是新常态，等 6 月 23 日之后看它怎么做。

我的 11 天清单

距离 6 月 22 日还剩 11 天。我翻了翻自己的待办，挑了两件压箱底的：一个是拖了半年不敢动的老项目重构，文件多、耦合深，之前让 AI 上手过两次，都是改到一半越改越乱，回滚收场；另一个是跨十几个文件的依赖迁移，枯燥、琐碎、量大，正适合扔给它整段跑。如果这两件它都接得住，我再试试放手让它独立跑一个一小时以上的任务，全程不插手，看它自己能撑多久。

拿贪吃蛇这类玩具题去试它没什么意义，那是 Sonnet 的活。要测就拿你积压最久、最贵的任务去喂它，等 22 号窗口关上，「要不要为它付费」这个问题你自己就有答案了。

测完欢迎来评论区对答案，尤其想听它搞砸了的那些。

参考来源

Anthropic 官方公告：Claude Fable 5 and Claude Mythos 5（anthropic.com/news/claude-fable-5-mythos-5）
TechCrunch：Anthropic released Claude Fable 5 days after warning AI is getting too dangerous
CNBC：Anthropic releases Mythos-like AI model to the public
Vellum：Claude Fable 5 & Claude Mythos 5 Full Benchmark Breakdown
Hacker News 发布日讨论串