本文首发于黑粉科技公众号
Claude Opus 4.8 正式发布 三个功能一个比一个香
努力控制 · 动态工作流 · Fast 模式降价三分之二 🚀
2026年5月28日 · Anthropic 官方公告 · 全球同步上线

先说结论:这次升级值得关注
5月28日,Anthropic 官宣 Claude Opus 4.8。官方的定调是「modest but tangible improvement」——适度但切实的提升。
听起来很保守对不对?但别被这个措辞骗了。这次最值得聊的,是三个配套功能:努力程度控制、Dynamic Workflows、Fast 模式大降价。每一个单独拿出来,都够写一篇文章。
好消息:价格和 Opus 4.7 完全一样,$5/M 输入,$25/M 输出。三个新功能白送,没有涨价陷阱。
功能一:你现在可以控制 Claude「有多努力」
你有没有遇到过这种情况——问 Claude 一个简单问题,结果它给你写了一篇论文,rate limit 跑了一大截,你还没用上多少?
现在好了。claude.ai 的模型选择器旁边新增了一个 Effort 控制项,让你自己决定这次回复 Claude 要「拼多用力」。
档位 | 行为 | 适合场景 |
Low | 快速响应,省速率配额 | 简单问答、快速查找 |
Default (High) | 默认档,质量与体验平衡 | 日常使用,推荐首选 |
Extra | 思考更深更频繁,Claude Code 对应 xhigh | 复杂任务、长时间异步工作流 |
Max | 全力以赴,Token 消耗最多 | 最高难度任务,不差钱用户 |
※ 默认 High 档 Token 消耗量与 Opus 4.7 持平,但效果更好 | 来源:Anthropic 官方公告
重点:同样的 Token 预算,High 档现在能做到 Opus 4.7 做不到的事。不是要你花更多钱,是把同样的钱用得更值。
功能二:Claude Code 变身「项目经理」,一次调度数百个子 Agent
这个功能面向 Claude Code 的重度用户,也是这次最「科幻」的更新。
Dynamic Workflows(动态工作流)目前以研究预览形式,向 Enterprise、Team 和 Max 计划的 Claude Code 用户开放。
怎么理解?你给 Claude 一个超大任务——比如「把这个 50 万行的代码库从 Python 2 迁到 Python 3,跑通所有测试」。以前你得自己拆分、监督、验收。现在 Claude 会:
- 制定整体迁移计划
- 自动拆分成数百个子任务
- 并行启动对应的子 Agent 同时干活
- 每个子任务验收完才算数
- 最后整合结果,一次性交付给你
Anthropic 官方用了一个很具体的案例:「从启动到 merge,一气呵成」。结合 Opus 4.8,每个子 Agent 还能跑更长时间,处理更深度的工作。
目前仅限 Claude Code Enterprise / Team / Max 计划,研究预览阶段。普通 Pro 用户还用不上,但方向已经很清晰了。
功能三:Fast 模式价格砍掉三分之二
这条消息对批量处理党来说是实实在在的省钱。
Fast 模式就是让 Claude 以 2.5 倍速运行的加速档,牺牲一点推理深度,换来更快的响应和更低的成本。现在这个「更低」变得更低了——价格直接降至原来的三分之一。
模式 | 输入价格 | 输出价格 |
常规模式 | $5 / M Token | $25 / M Token |
Fast 模式 | $10 / M Token | $50 / M Token |
※ 常规价格与 4.7 一致;Fast 模式较此前大幅降低 | API: claude-opus-4-8
顺带一提:它现在「说话更老实」了
AI 模型有个让人抓狂的毛病:做 Agentic 任务时,自信满满地汇报「搞定了」,但代码里其实藏着 bug 它一字没提。
Opus 4.8 专门针对这个问题训练过。根据 Anthropic 的评测数据,发现代码缺陷却不主动报告的概率比 Opus 4.7 降低了 4 倍。
它现在会主动问关键问题,发现自己的错误,遇到不合理的方案会推回,在动大改动前会先积累信心。
对齐团队那边的结论更有意思:Opus 4.8 的欺骗率和配合滥用的概率,已经降到和 Claude Mythos Preview(Anthropic 目前最优对齐模型)同等水平了。

基准测试:几乎全赢,就差一项
官方放出的基准数据,Opus 4.8 和 GPT-5.5、Gemini 3.1 Pro 的对比:
测试项目 | Opus 4.8 | Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro |
代理编码 | 69.2% ✅ | 64.3% | 58.6% | 54.2% |
计算机使用 (Mind2Web) | 84.0% ✅ | — | 78.7% | 76.2% |
Super-Agent 全案例 | 唯一通过 ✅ | — | 持平(同成本) | — |
法律代理全通过 | 首破 10% ✅ | — | — | — |
代理终端编码 | 低于 GPT-5.5 ❌ | — | 83.4% | — |
※ 代理终端编码是唯一输了的项目 | 来源:Anthropic 官方公告
唯一输了的是「代理终端编码」,GPT-5.5 用 Codex CLI 跑出了 83.4%,Opus 4.8 低一些。其他方向基本是:Opus 4.8 赢,GPT-5.5 第二,Gemini 3.1 Pro 第三。

开发者彩蛋:系统提示现在可以中途插入
Messages API 现在支持在消息数组的任意位置插入 role: system 消息。
以前的问题是:如果你在对话中途要更新 Claude 的指令(权限变了、Token 预算调了),你得打断 Prompt 缓存,或者把更新硬塞进「用户消息」里,很别扭。现在直接在 messages 数组里插入 system 消息,缓存不断、接口干净。
这对构建长时间运行的 Agentic 应用特别有用——权限动态变更、Token 预算实时调整,不再需要 workaround。
接下来:Mythos 1 正在路上
Anthropic 在公告里顺带透露:Mythos 级别的模型将在「未来数周内」向所有用户开放。
目前 Claude Mythos Preview 只对特定网络安全机构(Project Glasswing 计划)开放,普通用户还摸不到。社区里也有 Sonnet 4.8 即将发布的传言,若属实,Claude 4 模型族的性价比梯队就更完整了。
一句话总结
Opus 4.8 是一次稳扎稳打的升级:功能更实用,诚实更可靠,价格更友好。开发者用 Claude Code 跑大项目,Dynamic Workflows 这项就值回票价;普通用户,Effort 控制让你可以自己选择「快速够用」还是「拼命一博」。
本文数据来源:Anthropic 官方公告(anthropic.com/news/claude-opus-4-8)、The New Stack、9to5Google,2026年5月28日发布。
分享到:
