Claude Opus 4.8 发布:三个新功能,一个比一个香

Claude Opus 4.8 发布:三个新功能,一个比一个香

2026/05/296 分钟
分类:AI大模型
标签:#Claude#Anthropic#Agent#AI大模型#工作流#热点速递
📡
本文首发于黑粉科技公众号

Claude Opus 4.8 正式发布 三个功能一个比一个香

努力控制 · 动态工作流 · Fast 模式降价三分之二 🚀
2026年5月28日 · Anthropic 官方公告 · 全球同步上线
Claude Opus 4.8 官方公告图 · anthropic.com/news/claude-opus-4-8
Claude Opus 4.8 官方公告图 · anthropic.com/news/claude-opus-4-8

先说结论:这次升级值得关注

5月28日,Anthropic 官宣 Claude Opus 4.8。官方的定调是「modest but tangible improvement」——适度但切实的提升。
听起来很保守对不对?但别被这个措辞骗了。这次最值得聊的,是三个配套功能:努力程度控制、Dynamic Workflows、Fast 模式大降价。每一个单独拿出来,都够写一篇文章。
💰
好消息:价格和 Opus 4.7 完全一样,$5/M 输入,$25/M 输出。三个新功能白送,没有涨价陷阱。

功能一:你现在可以控制 Claude「有多努力」

你有没有遇到过这种情况——问 Claude 一个简单问题,结果它给你写了一篇论文,rate limit 跑了一大截,你还没用上多少?
现在好了。claude.ai 的模型选择器旁边新增了一个 Effort 控制项,让你自己决定这次回复 Claude 要「拼多用力」。
档位
行为
适合场景
Low
快速响应,省速率配额
简单问答、快速查找
Default (High)
默认档,质量与体验平衡
日常使用,推荐首选
Extra
思考更深更频繁,Claude Code 对应 xhigh
复杂任务、长时间异步工作流
Max
全力以赴,Token 消耗最多
最高难度任务,不差钱用户
※ 默认 High 档 Token 消耗量与 Opus 4.7 持平,但效果更好 | 来源:Anthropic 官方公告
重点:同样的 Token 预算,High 档现在能做到 Opus 4.7 做不到的事。不是要你花更多钱,是把同样的钱用得更值。

功能二:Claude Code 变身「项目经理」,一次调度数百个子 Agent

这个功能面向 Claude Code 的重度用户,也是这次最「科幻」的更新。
Dynamic Workflows(动态工作流)目前以研究预览形式,向 Enterprise、Team 和 Max 计划的 Claude Code 用户开放。
怎么理解?你给 Claude 一个超大任务——比如「把这个 50 万行的代码库从 Python 2 迁到 Python 3,跑通所有测试」。以前你得自己拆分、监督、验收。现在 Claude 会:
  • 制定整体迁移计划
  • 自动拆分成数百个子任务
  • 并行启动对应的子 Agent 同时干活
  • 每个子任务验收完才算数
  • 最后整合结果,一次性交付给你
Anthropic 官方用了一个很具体的案例:「从启动到 merge,一气呵成」。结合 Opus 4.8,每个子 Agent 还能跑更长时间,处理更深度的工作。
⚠️
目前仅限 Claude Code Enterprise / Team / Max 计划,研究预览阶段。普通 Pro 用户还用不上,但方向已经很清晰了。

功能三:Fast 模式价格砍掉三分之二

这条消息对批量处理党来说是实实在在的省钱。
Fast 模式就是让 Claude 以 2.5 倍速运行的加速档,牺牲一点推理深度,换来更快的响应和更低的成本。现在这个「更低」变得更低了——价格直接降至原来的三分之一
模式
输入价格
输出价格
常规模式
$5 / M Token
$25 / M Token
Fast 模式
$10 / M Token
$50 / M Token
※ 常规价格与 4.7 一致;Fast 模式较此前大幅降低 | API: claude-opus-4-8

顺带一提:它现在「说话更老实」了

AI 模型有个让人抓狂的毛病:做 Agentic 任务时,自信满满地汇报「搞定了」,但代码里其实藏着 bug 它一字没提。
Opus 4.8 专门针对这个问题训练过。根据 Anthropic 的评测数据,发现代码缺陷却不主动报告的概率比 Opus 4.7 降低了 4 倍
它现在会主动问关键问题,发现自己的错误,遇到不合理的方案会推回,在动大改动前会先积累信心。
对齐团队那边的结论更有意思:Opus 4.8 的欺骗率和配合滥用的概率,已经降到和 Claude Mythos Preview(Anthropic 目前最优对齐模型)同等水平了。
Opus 4.8 能力对比 · 来源:Anthropic 官方公告
Opus 4.8 能力对比 · 来源:Anthropic 官方公告

基准测试:几乎全赢,就差一项

官方放出的基准数据,Opus 4.8 和 GPT-5.5、Gemini 3.1 Pro 的对比:
测试项目
Opus 4.8
Opus 4.7
GPT-5.5
Gemini 3.1 Pro
代理编码
69.2% ✅
64.3%
58.6%
54.2%
计算机使用 (Mind2Web)
84.0% ✅
78.7%
76.2%
Super-Agent 全案例
唯一通过 ✅
持平(同成本)
法律代理全通过
首破 10% ✅
代理终端编码
低于 GPT-5.5 ❌
83.4%
※ 代理终端编码是唯一输了的项目 | 来源:Anthropic 官方公告
唯一输了的是「代理终端编码」,GPT-5.5 用 Codex CLI 跑出了 83.4%,Opus 4.8 低一些。其他方向基本是:Opus 4.8 赢,GPT-5.5 第二,Gemini 3.1 Pro 第三
Anthropic 官方发布截图 · anthropic.com
Anthropic 官方发布截图 · anthropic.com

开发者彩蛋:系统提示现在可以中途插入

Messages API 现在支持在消息数组的任意位置插入 role: system 消息
以前的问题是:如果你在对话中途要更新 Claude 的指令(权限变了、Token 预算调了),你得打断 Prompt 缓存,或者把更新硬塞进「用户消息」里,很别扭。现在直接在 messages 数组里插入 system 消息,缓存不断、接口干净
🔧
这对构建长时间运行的 Agentic 应用特别有用——权限动态变更、Token 预算实时调整,不再需要 workaround。

接下来:Mythos 1 正在路上

Anthropic 在公告里顺带透露:Mythos 级别的模型将在「未来数周内」向所有用户开放
目前 Claude Mythos Preview 只对特定网络安全机构(Project Glasswing 计划)开放,普通用户还摸不到。社区里也有 Sonnet 4.8 即将发布的传言,若属实,Claude 4 模型族的性价比梯队就更完整了。

📌
一句话总结 Opus 4.8 是一次稳扎稳打的升级:功能更实用,诚实更可靠,价格更友好。开发者用 Claude Code 跑大项目,Dynamic Workflows 这项就值回票价;普通用户,Effort 控制让你可以自己选择「快速够用」还是「拼命一博」。
本文数据来源:Anthropic 官方公告(anthropic.com/news/claude-opus-4-8)、The New Stack、9to5Google,2026年5月28日发布。
分享到:

相关文章

返回首页