
GLM-5.2 全量开放:1M 上下文与开源,智谱重注开发者入口战
国产 Coding 模型把上下文拉到百万级,是秀肌肉还是重塑生产力工具链的底线?

国产 Coding 模型把上下文拉到百万级,是秀肌肉还是重塑生产力工具链的底线?

从资本、技术到监管的全面大洗牌,2026 上半年的 AI 圈到底发生了什么?

Anthropic 同步发布 Fable 5 与 Mythos 5:同一底座、双重铠甲。SWE-bench Pro 80.3% 断层领先,Stripe 5000万行代码一天迁完,Glasswing 找出数千个零日漏洞。附官方一手跑分图表。

编程·推理·中文创作·长文理解·多语言,19道题、62个测试用例,每题展示原题+详细结果。综合评分91/100,推理99最强,创作88最弱但仍优秀。

从「回答问题」到「替你做事」,Google 用1800亿美元押注全栈Agent生态。托管式智能体、主动工作流、Gemini Spark 24/7后台Agent——深度解读I/O 2026全部重磅发布。

2026年高考刚结束,13款AI大模型同场竞技数学卷。GLM-5.1亲自上阵实测语文作文、数学、英语三科,坦白成绩单。AI能考130分,但永远拿不到「感情真挚」。探讨AI进步与人类学识的矛盾。

100k文件上下文 + 26h自主编程 + 首月Pro免费 + 微信/钉钉/飞书IM直连 + 教师学生额外4000积分。深度分析 + 竞品对比 + 白嫖攻略。

全球限量4999台,5599美元的天价背后,是科技与狠活,还是纯纯的智商税?

解读英伟达背后的“五层蛋糕”定律,与 150 年来的财富底层逻辑

看似碾压的纸面数据背后,是一场教科书级的田忌赛马。

打工人还在卷学历,华尔街已经准备把真金白银交给AI智能体了

我用一个飞碟吸小兵网页游戏,测试 AI 能不能像员工一样按目标、边界、验收单持续推进,并整理出可复用提示词模板。

昔日盟友变最强对手,承诺不蒸馏第三方模型到底在暗讽谁?

内部定调「最高战略优先级」,腾讯这回是来真的

中国台湾2026,老黄宣布Vera Rubin量产、为Agent造CPU、40年来头一回重新发明PC。一句话:过去6个月,一切都变了。
我把同一套电影数据分析任务交给 Codex、Claude、DeepSeek、GLM 和 MiniMax,逐项拆解数据搜集、Excel、Word、PPT 的真实体验。结论:Codex 小胜 Claude,DeepSeek 因未参与数据搜索测试,不能当完整端到端样本看。

万亿参数实时推理成现实,中小团队部署千亿大模型的算力平权时代来了

努力程度控制(四档)、Dynamic Workflows 数百并行子 Agent、Fast 模式降价三分之二——Opus 4.8 是一次稳扎稳打的升级,诚实性提升 4 倍,欺骗率降至 Mythos Preview 水平。

Nous Research 祭出开源大招 Goose,AI 编程工具的“割韭菜”时代迎来终结者?

逻辑折叠、55%密度提升、2031年等同1.4nm——华为用6年381款芯片,悄悄走出了一条绕开EUV的新路。

Ramp AI Index 4月数据:Anthropic 企业消费份额 34.4% 首次超越 OpenAI 32.3%,单月涨 3.8 个百分点,用户基数年增4倍,已在软件/金融/专业服务三大行业领先。数据来自5万+美国企业真实信用卡消费。