
你们的 Anthropic 账号还好么Claude 新模型 Sonnet 5 来了 我大概测了一下有点东西。这几天大家都说 Opus 4.8 疯狂降智原来是为了它我快速看了它们的官方博客快速总结一下Sonnet 主打一个“物美”价廉是最适合日常工作的模型先说物美这一波更新对 Sonnet 4.6 的用户来说绝对是一个巨大的好消息Sonnet 5 在推理、工具使用、编码和知识工作方面比 Sonnet 4.6 有显著改进各方面参数都比 Sonnet 4.6 有巨大的提升已经非常接近 Opus 4.8 了。也就是说Sonnet 是个各种工作都能干的模型包括编程这一类工作智能体编程能力真的是提升巨大知识工作方面也是提升巨大甚至超过了 Opus 4.8除了这些基准指标之外还有标准的 100 万上下文它的思考模式也从原来的扩展改为了自适应Adaptive thinking replaces extended thinking. Its on by default in Claude Code and the API. Start at medium effort, and bump to high for long agentic runs or memory-heavy work. Most coding and tool use wont need more than that.这些变化其实都是为更加复杂的长任务而准备的。根据他们的测试Sonnet 5 和 Sonnet 4.6 最大的差别就是“能和不能的差别”。很多任务 Sonnet 4.6 直接摆烂但是 Sonnet 5 可以很好地完成再说价廉物美很重要价廉就更好了。说 Claude 便宜骗鬼呢确实相对国产模型不可能便宜。但是相比同样的国外模型确实很便宜了。模型输入缓存输入输出备注Claude Sonnet 5$2$0.20$102026 年 8 月 31 日前优惠价Claude Sonnet 5$3$0.30$152026 年 9 月 1 日起Claude Opus 4.8$5$0.50$25Anthropic 高端旗舰档GPT-5.5$5$0.50$30短上下文价格GPT-5.5 长上下文$10$1.00$45OpenAI 单独长上下文档Gemini 3.1 Pro Preview ≤200k$2$0.20$12标准档Gemini 3.1 Pro Preview 200k$4$0.40$18超过 200k 输入后涨价从上面的表格可以看到Opus 4.8 的价格是输入 $5、输出 $25Sonnet 5 的价格是输入 $3、输出 $15然后在特惠期间只要 $2 和 $10。这一档是国外顶级模型中最便宜的存在了虽然相比国产模型还是贵但是拥有接近 Opus 4.8 的能力价格却能打六折这么看性价比就很高了。所有人都能用Fable 5 疯狂作妖一会儿上一会儿封一会儿要认证。实在是让人太难了。Sonnet 5 在这方面就好多了。直接全平台推送手机、电脑、网页端立马可以用上。无论你是 Pro 用户还是免费用户也能立马用上当然前提是你有账号你的账号还活着~~做个小测试我手里有非常多的测试项目但是鉴于时间和 token 量的考虑我就做一个最新的题目“天文机械表”这个题目是有点难度的是多方面能力的考验。最近测了一批模型国产模型全躺没有一个可以完成所有功能。之前只有 Opus 4.8 几乎满分。完整的题目如下用单个 HTML 文件实现一只机械腕表风格的天文时钟纯原生实现不许使用任何库、框架或 CDN。要求 1. 主表盘读取本地系统时间秒针平滑扫秒使用 requestAnimationFrame 驱动且长时间运行不得累积漂移切到其他标签页再切回来时指针必须立即校准到正确时间。 2. 包含一个月相小表盘根据当前日期计算并显示月相连续变化公式需要自行实现精度要求误差控制在 1 天内。 3. 包含一个可用的计时码表通过子表盘指针显示支持开始、暂停、继续、归零与计圈lap按钮在任意顺序点击都不能出现状态错误。 4. 日期窗显示当前日期正确处理大小月与闰年。 5. 包含昼夜 / 日出日落指示用户可在三到四个预设城市之间切换并根据经纬度现场计算当地日出日落时刻。 6. 页面需要响应式并尊重 prefers-reduced-motion开启时秒针改为跳秒并关闭装饰动画同时为各表盘补充 ARIA 标注。 7. 整体视觉要像一只真实的高级腕表而不是普通练习作业。 只输出最终代码不要解释。测试说明这是一个面向前沿模型的**长规格前端综合题**。与普通模拟时钟不同它故意把数学推导、动画工程、状态机正确性、无障碍适配与高级审美堆叠在同一题中观察模型是否会在实现过程中静默漏需求。 题目的核心目标不是“做一个能转的表盘”而是要求模型在**闭卷推导**与**高约束实现**之间保持稳定。月相算法、日出日落计算、后台切回后的时间校准以及计时码表的开始 / 暂停 / 继续 / 归零 / 计圈边界行为都是高频失分点。 工程要求主表盘必须使用 **requestAnimationFrame** 驱动平滑扫秒不能依赖会累积漂移的定时器切换后台标签页后返回前台时指针必须立即与系统时间重新对齐。 设计要求页面必须保持单文件、纯原生、响应式同时尊重 **prefers-reduced-motion**为关键表盘与控件补齐 ARIA 标注并在整体视觉上呈现出真实机械天文腕表的精致感而不是普通练习作业。 我直接用 Claude 桌面版的 Chat 功能进行测试思考强度是中等Medium它上面还有三个大哥High、Extra、Max结果出来了好像又是全对时钟显示正常地区切换联动正常秒表启动、停止、重置、lap 全部正常月相应该也是正常的。当前基本上属于整个月亮被点亮的状态十五的月亮十六圆现在刚十七。Claude 诚不欺我Sonnet 5 在这个题目上的结果和 Opus 4.8 几乎一致而且我这次只开了中档当时 Opus 4.8 跑的是高档。事实证明这个任务对应 Claude 最新系列的模型只要中档就够了。但是除了它家的模型之外几乎都无法把这个题目全部做对。所有的测试结果我都放在了 Jarvis Uni 的 TOPAI 板块中大家可以进行非常直观的对比。更多测试稍后奉上Sonnet 5 的思维能力这么强这种复杂编程都不在话下那么作为日常工作绝对是游刃有余了。再配合它们家的 Cowork 功能不就是办公神器么现在有各种各样的Work工具腾讯workbuddy字节的traework豆包专业版等等。其实最关键的还是底层模型和Harness的调教。这方面Claude Cowork绝对是鼻祖级别的存在了总结现在 Sonnet 5 真的是媲美 Opus 4.8 的存在了成为了 Claude 系列中最具性价比、最适合日常工作的模型也完全可以拿来做编程工作。Anthropic 对我还算友好账号一直都在所以我也一直免费给他们做“自来水”实话实说他们家的产品确实是最硬核的存在真正的智能是这道题它没见过但是能做对。目前大部分模型只是应试教育只有Claude家的模型有一点智能