Claude 史上最强模型发布:你能用的叫「寓言」,真正的「神话」不卖给你
Anthropic 发布史上最强模型 Fable 5,但订阅只能用到 6 月 22 日,而真正未删减的 Mythos 5 不对公众出售——付费即平等的时代,可能正在结束。
Claude 史上最强模型发布:你能用的叫「寓言」,真正的「神话」不卖给你
今天早上我照例升级了 Claude Code,版本号跳到 v2.1.170,欢迎语下面多了一块橙色横幅:
「Fable 5 is here! Our newest model for complex, long-running work. Included in your plan limits until Jun 22, then switch to usage credits to continue.」
新模型,订阅直接能用。我顺手敲了 /model 切了过去,切完才回过神来读完第二句——到 6 月 22 日为止,之后要切换按量付费才能继续。
用 Claude 快三年,新模型发布见过七八次,惯例一直是:订阅用户直接用,用到下一代出来为止,没有期限,也没有任何小字条款。一个新模型自带截止日期,这是头一回。我决定先别急着干活,把这件事查清楚再说。
Claude Code v2.1.170 的升级提示:Fable 5 包含在订阅额度内,截止 6 月 22 日。
菜单里那两行字,一行是广告,一行是账单
模型菜单里,Fable 5 的描述写了两句话。前一句是宣传:「为你最难、运行时间最长的任务准备」。后一句其实是账单预警:「消耗订阅额度的速度约为 Opus 的 2 倍」。
宣传那句没掺水。官方对比表里,SWE-Bench Pro(agentic 编程基准)拿到 80.3%,比上一代旗舰 Opus 4.8 高出 11 个百分点,比 GPT 5.5 高出 21 个;上下文窗口 100 万 token,单次输出最高 12.8 万 token。在大模型排行榜按零点几分掰手腕的今天,两位数的领先是很罕见的事。
官方基准对比表:SWE-Bench Pro 80.3%,领先自家 Opus 4.8 约 11 个百分点、领先 GPT 5.5 约 21 个。注意第一列的表头写了两个模型的名字——我第一遍看的时候没在意,这个细节后面会说到。
账单那句也没掺水。我去查了 API 定价:每百万 token 输入 10 美元、输出 50 美元,正好是 Opus 4.8 的两倍,也是目前所有大模型实验室公开发售的模型里最贵的。
但 2 倍只是表面数字,文档里还埋着两个细节。第一,Fable 5 换了新的 tokenizer,同样一段内容要多切出大约 30% 的 token——也就是说单价翻倍的同时,计量单位还变密了。第二,它的思考模式永远开启、无法关闭,Hacker News 上发布当天就有人报告,复杂的 agentic 会话动辄烧掉 50 万到 100 万 token。三件事叠在一起,跑同一个任务的真实成本不是 Opus 的 2 倍,而是接近 2.5 到 3 倍。
HN 讨论串冲到 2019 分、1554 条评论。高赞评论很能说明问题:「如果完全不在乎价格,我会只用这个模型……这是第一个让我觉得它在抢我饭碗的模型。」
所以升级完五分钟,我做的第一个决定是把默认模型留在原处,Fable 5 只留给那几个真正难啃的任务。
公告标题里,还有另一个模型的名字
带着「倒计时到底什么意思」的疑问,我去读了官方公告。结果倒计时还没查明白,先被标题绊住了——《Claude Fable 5 and Claude Mythos 5》。
两个模型?发布会上明明只能用到一个。
Anthropic 官网公告,2026 年 6 月 9 日:标题里并列着两个模型的名字,配图是蝴蝶拼成的「5」。
读下去才明白:这不是两个能力不同的模型,是同一个底层模型的两种发行版。Fable 5 面向所有人,内置一套安全分类器;Mythos 5 移除了部分护栏,只通过一个叫 Project Glasswing 的计划,开放给约 150 个经过审核的机构——网络防御方、关键基础设施运营者、生物医学研究机构。这时候再回头看基准表那个表头——「Claude Mythos 5 / Fable 5」共用一列分数,原因就在这儿。
护栏的工作方式值得说一下:分类器实时拦截三类请求——攻击性网络安全、生物与化学、模型蒸馏——拦下之后,自动改由 Opus 4.8 来回答。官方称超过 95% 的会话不会触发回退。换句话说,你在 Fable 5 里问了某些问题,实际回答你的是上一代模型,而界面上不一定看得出来。基准表的角注也印证了这一点:带星号的网络安全和生物类测试上,官方注明 Fable 5 的成绩「因回退而更接近 Opus 4.8」,因为那些题实际答题的就是 Opus。
然后是命名。Fable 是寓言,Mythos 是神话。寓言是被驯化过的故事,有寓意、有边界、适合讲给所有人听;神话是原始的力量叙事。Anthropic 在公告里自己挑明了:「护栏差异是区分这两个模型的原因。」把名字和发行结构放在一起看,意思再清楚不过——你我能买到的,永远是修剪过的「寓言」;「神话」不卖,只批给特定身份的机构。
Anthropic 在 X 上的发布公告:「一款神话级模型,我们已将其安全化以供一般使用」。Mythos 5 仅限 Glasswing 合作伙伴。
这件事让我愣了一会儿。过去两年这个行业的默认规则是付费即平等:你是个人开发者还是世界五百强,20 美元订阅拿到的模型是同一个。而从这次发布开始,AI 能力的获取第一次出现了钱买不到的档位——多出来的那道门槛,不收钱,查身份。
顺带一提,公告里有一处措辞很少被报道引用。Anthropic 写道:「我们不确定仅阻止狭义的生物武器查询是否足够」,紧接着又说「希望尽快收窄这些护栏」。一段话同时承认护栏不一定够用、又承认它当前过于宽泛。再配上英国 AI 安全研究所在早期测试里对通用越狱「取得进展」的披露,以及几天前 Anthropic 自己刚发过的递归自我改进风险警告——先警告危险,几天后发布史上最强模型。我猜这家公司里安全团队和商业团队大概各赢了一半。
回到那个倒计时
查完这一圈,回头看那行「截止 6 月 22 日」,官方解释是容量:先让订阅用户用着,等算力跟上再恢复为订阅标配。
我反复琢磨,觉得这个解释有说不通的地方。如果纯粹是产能问题,限流、排队、高峰降速都是现成手段,各家都这么干过,没必要把模型从订阅里整个摘出去、改成按量计费——后者要改计费系统、改产品逻辑,动作大得多。
更说得通的解释是:这 14 天是一场定价实验。先让所有订阅用户切身体验到 Fable 5 和日常模型的差距,再撤掉订阅供给,看有多少人愿意真金白银地掏 usage credits 继续用。体验期结束的那一刻,Anthropic 会拿到一份非常精确的数据:最强模型在用户心里到底值多少钱。
当然,这只是我的猜测,而且有一个地方我没想通:如果只是想测付费意愿,Anthropic 从来不缺直接定高价的勇气,犯不着绕这么个弯。也可能两种解释都是真的——产能确实紧张,顺手把需求也测了。这一段我没有答案。
可以确定的是,「付一份订阅费就能用最强模型」这个默认设定,塑造了过去两年所有人的工作流——反正包月,无脑开最贵的。Fable 5 是第一个打破这个默认的主力模型。它要是跑通了,OpenAI 和 Google 大概率会跟,毕竟每家实验室都面对同一本账:顶级模型的推理成本涨得比订阅费快,包月制越来越难摊平。
至于「容量允许后恢复订阅标配」这句承诺——它没说什么时候,也没说以什么形式。到底是权宜之计还是新常态,等 6 月 23 日之后看它怎么做。
我的 11 天清单
距离 6 月 22 日还剩 11 天。我翻了翻自己的待办,挑了两件压箱底的:一个是拖了半年不敢动的老项目重构,文件多、耦合深,之前让 AI 上手过两次,都是改到一半越改越乱,回滚收场;另一个是跨十几个文件的依赖迁移,枯燥、琐碎、量大,正适合扔给它整段跑。如果这两件它都接得住,我再试试放手让它独立跑一个一小时以上的任务,全程不插手,看它自己能撑多久。
拿贪吃蛇这类玩具题去试它没什么意义,那是 Sonnet 的活。要测就拿你积压最久、最贵的任务去喂它,等 22 号窗口关上,「要不要为它付费」这个问题你自己就有答案了。
测完欢迎来评论区对答案,尤其想听它搞砸了的那些。
参考来源
- Anthropic 官方公告:Claude Fable 5 and Claude Mythos 5(anthropic.com/news/claude-fable-5-mythos-5)
- TechCrunch:Anthropic released Claude Fable 5 days after warning AI is getting too dangerous
- CNBC:Anthropic releases Mythos-like AI model to the public
- Vellum:Claude Fable 5 & Claude Mythos 5 Full Benchmark Breakdown
- Hacker News 发布日讨论串