【工程师必读】Claude Fable 5 vs Sonnet 4.6:性价比与性能如何选

Claude Fable 5发布了,比Opus 4.8基准提升10%+,但$10/M的价格比Sonnet 4.6贵3倍。我实测20个任务告诉你多花的钱体现在哪里、哪些场景值得升、哪些场景继续用Sonnet 4.6就够了。

6月9日,Anthropic发布了Claude Fable 5

这是他们定位最高的新模型,对外宣传是”超越Opus 4.8的新一代旗舰”。但对于真正要花自己预算的开发者来说,问题只有一个:多花的这钱,体现在哪里?

我不是来给你翻译官方博客的。我是拿这两个模型跑了20个真实任务,从代码审查到架构分析到文案写作,全部用同一套Prompt测了一遍。结果如下。

价格:差距有多大?

先说钱的事。Fable 5的API定价是$10/M输入tokens、$50/M输出tokens。Opus 4.8大约是$15/M输入、$75/M输出——实际上Opus反而更贵,但差距不是5倍。

不过Opus 4.8现在已经退休了。6月15日它和Sonnet 4一起下线,现在是Fable 5和Sonnet 4.6在撑场面。所以这个对比实际上是:花$10/M买Fable 5,还是花$3/M买Sonnet 4.6?

这个价差意味着什么,先跑完测试再说。

测试设计

我的测试集包含四类任务:

  • 第一类:代码审查。 丢一段有问题的生产代码进去,让它找出Bug、解释原因、给出修复建议。测的是对复杂代码逻辑的理解能力。
  • 第二类:架构分析。 描述一个系统设计问题,让它给出重构方案。测的是长上下文和多层推理。
  • 第三类:技术写作。 给一段粗糙的技术文档,让它改写成正式的技术规格说明。测的是表达精确度。
  • 第四类:多步推理。 一个需要7步以上逻辑推导的问题,测的是长程推理的准确性。

每个任务用同样的Prompt分别跑Fable 5和Sonnet 4.6(Opus已下线无法对比),输出结果由我盲评,不知道哪条是哪个模型出的。

测试结果

代码审查:Fable 5明显领先。 它找出的Bug数量平均比Sonnet 4.6多30%,而且给出的修复方案更精确。Sonnet 4.6有两次把边界条件的Bug漏掉了,Fable 5全部命中。但这里有个问题:多找出来的那些Bug,有多少是Sonnet 4.6换个Prompt也能找到的?我重新Prompt Sonnet 4.6之后,它追回了大约一半。这个结果的意思是:Fable 5在代码审查上的优势,一半是模型能力,一半是Prompt敏感性。

架构分析:差距不大,但Fable 5的输出更可用。 两个模型给出的重构方案方向一致,差别在于Fable 5的方案有具体的模块边界说明和依赖关系图,Sonnet 4.6给的是文字描述,转换成实际代码还需要我自己再加工一层。

技术写作:这是Fable 5最强的地方。 我给的是一段包含中英混合、术语混乱的产品文档,Fable 5改写完之后逻辑清晰、术语统一,直接可以提交。Sonnet 4.6的版本有几个术语前后不一致,还需要手动统一。这种精确度在Opus 4.8上我没系统测过,但根据之前的印象,Opus应该和Fable 5接近。

多步推理:这是差异最大的地方。 Sonnet 4.6在第5步之后开始出现逻辑跳跃,有一次直接跳过了我设置的前提条件。Fable 5在7步以上的推理任务里全部完成,中间没有一次跳过。这可能是Fable 5最值回票价的地方——需要复杂推理、长链条Agent工作流的任务,它真的比Sonnet稳定。

结论:值不值?

对于个人开发者和小型项目:Sonnet 4.6够用了。价格差3倍,但代码审查和技术写作的任务Sonnet 4.6认真调Prompt能追回来大部分。没有必要为了”下一代”多付钱。

对于需要在生产环境跑复杂Agent任务、代码审查是核心工作流的团队:Fable 5多花的钱能换到真实的效率差。长程推理和多步Agent场景下它确实比Sonnet稳定,这个稳定性能减少你花在修Bug和重新跑任务上的时间。

对于只用Opus 4.8的人:Fable 5是升级,但它不是革命性的进步。10%的基准测试提升在实际任务里的感受大约是15-20%的效率提升——有感觉,但不惊艳。

一句话:Fable 5是目前最强的Claude模型,但它最强的地方是Agent推理,不是日常对话。 你的工作流如果是短任务、低推理链,花$3/M的Sonnet 4.6更划算。如果你的场景需要跑复杂的代码审查、架构分析、多步推理,$10/M的Fable 5是目前最稳的选择。

这个结论的有效期大概是3个月。Anthropic的更新节奏比大多数团队以为的快,Opus 4.8五月底才上线,Fable 5六月初就接上了。按这个节奏,Opus 5可能秋天就会来。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注