谷歌开源Gemma 4、性能直逼闭源旗舰，本周AI圈”王炸”频出 4月的第一周，AI圈就这么不平静。谷歌刚深夜放了个大招——Gemma 4正式开源，参数仅31B，数学竞赛成绩却从20.8%飙升至89.2%，代码能力更是从110 ELO直接拉到2150。阿里紧随其后，Qwen3.6-Plus直指Coding Agent痛点，百万上下文、性价比碾压同类。Cursor 3发布，软件开发宣告进入”智能体自主”阶段。印度AI公司Sarvam融资3.5亿美元，亚马逊、英伟达集体入局。一夜之间，全球AI版图又变了。

## 谷歌Gemma 4开源：31B参数，Apache 2.0许可证

4月3日凌晨，Google DeepMind正式发布了Gemma 4开源模型系列。这次的亮点不只是性能——更重要的是，谷歌把许可证从自有协议换成了Apache 2.0，开发者终于可以自由商用和二次开发了。

Gemma 4一口气推出四款规格，覆盖从手机端到工作站的全场景。旗舰版31B Dense支持256K超长上下文，在Arena AI开源排行榜中高居第三，未量化版本仅需一张H100即可运行。性价比最高的26B A4B MoE采用混合专家架构，总参数252亿，激活参数只有38亿，推理速度接近4B模型但质量远超同级别。

性能提升是这次最令人震惊的部分。相比上一代Gemma3 27B，数学竞赛测试（AIME2026）从20.8%飙升至89.2%；Codeforces ELO评分从110拉升至2150，LiveCodeBench测试从29.1%涨至80.0%，成为目前最可用的开源编程辅助模型之一；研究生级科学问答（GPQA Diamond）得分从42.4%几乎翻倍至84.3%。此外，所有版本原生支持140多种语言，MMMLU评分达88.4%。

Gemma 4还内置了可开关的”思考模式”，模型在输出答案前会先进行内部推理，大幅提升多步骤规划类任务的准确性。谷歌同步发布了开源Agent开发工具包（ADK），让端侧模型也能变身”智能体”。行业普遍认为，这是谷歌在开源赛道被DeepSeek、Qwen等国产模型压制后的一次强势反击。

—

## 阿里Qwen3.6-Plus：编程能力对标Claude，聚焦Coding Agent

继今年2月推出Qwen3.5系列后，通义实验室于4月2日发布Qwen3.6-Plus，重点解决开发者在智能体编程中”任务执行不稳”的核心痛点。

Qwen3.6-Plus的核心优势在于深度逻辑推理、海量记忆与精准执行的有机融合。编码能力方面，在前端页面生成、代码修复及终端自动化场景中表现卓越，是国内同尺寸模型中首个实现智能体编程能力全面领先的版本。默认支持100万字符上下文窗口，大幅提升长文档解析与多轮对话的信息提取精度。模型尺寸不到K2.5或GLM5的一半，但工程落地能力紧追行业标杆。

生态适配是这次发布的一大看点。Qwen3.6-Plus已实现对OpenClaw（原Moltbot）、Qwen Code、Claude Code的深度适配——是的，Qwen API现已兼容Anthropic协议，开发者可直接在Claude Code工作流中调用阿里模型，这在国产模型中尚属首次。

视觉智能体能力也值得关注。Qwen3.6-Plus不仅能通过视觉输入进行复杂财务核算（如自动计算多张刮刮乐的中奖金额与利润），还能基于设计稿直接生成前端代码，逐步演进为可在真实环境中持续感知的原生多模态系统。API还引入了preserve_thinking功能，允许保留前序轮次的思维链内容，对复杂智能体任务尤为有益。

—

## Cursor 3发布：软件开发迈入智能体自主时代

4月初，Cursor团队正式发布Cursor 3版本，标志着软件开发由过去的”人机协作”转向”智能体自主工作”。

Cursor 3的核心创新是”智能体统一工作区”设计。用户可以与多个智能体同时协作，所有智能体在侧边栏中集中展示，不论本地还是云端。用户可以从移动设备、Web、桌面和Slack等多个终端启动智能体，云端智能体还能生成工作成果的演示和截图。

本地与云端智能体的无缝切换是另一大亮点。开发者可将智能体会话在本地和云端之间快速切换，即使在离线状态下也能完成必要的工作。Cursor 3还引入了更简洁的差异视图UI，使代码变更的编辑和审查更加快速便捷。

Cursor团队表示，Cursor 3为构建更自主的智能体和提升团队协作能力奠定了基础，未来将继续推动更强大的编程模型，开启新的交互模式。用户现可升级Cursor，通过Cmd+Shift+P -> Agents Window体验新界面。

—

## 印度AI新星Sarvam融资3.5亿美元，亚马逊、英伟达集体入局

4月3日传来消息，印度人工智能初创公司Sarvam AI正式开启新一轮融资，计划筹集3亿至3.5亿美元，本轮融资后估值将达到15亿至15.5亿美元，最快有望在未来一周内尘埃落定。

本轮融资的参投阵容堪称”全明星”：领投方为贝塞默风险投资（Bessemer Venture Partners），重量级参与者包括亚马逊与英伟达，中东资本沙特阿美旗下Prosperity7Ventures也在潜在大股东名单之列。

成立于2023年的Sarvam AI，凭借精准的差异化竞争在巨头林立的AI领域杀出重围。今年2月，公司发布了参数分别为300亿和1050亿的两款大语言模型，完全基于印度本土语料训练，重点开发支持22种印度语言、以语音交互为核心的AI系统，直击印度碎片化语言市场的痛点。公司还在研发具备自主智能体（Agentic）能力的AI系统，深度赋能企业自动化场景。

分析认为，对于英伟达和亚马逊而言，入股Sarvam不仅是一次财务投资，更是抢占南亚AI生态基座的关键布局。在通用大模型之外，深植于特定语言文化和垂直应用场景的”本土冠军”正成为资本的新宠。

—

## 小米MiMo推出Token套餐：月费39元起，订阅制加速大模型商业化

本周，小米宣布为其MiMo大模型推出首个Token Plan，这是一套专门面向开发者及AI兴趣群体量身定制的AI大模型调用套餐，标志着小米AI生态正式进入付费订阅时代。

MiMo Token Plan共设置四个梯度：Lite版39元/月、Standard版99元/月、Pro版329元/月、Max版659元/月。用户订阅任一档位，即可同时获得MiMo家族三大主力模型的调用权限：MiMo-V2-Pro（专业级模型）、MiMo-V2-Omni（全场景多模态模型）、MiMo-V2-TTS（高质量语音合成模型）。

这一定价策略被行业视为大模型从”免费公测”转向”价值回归”的信号。随着技术趋于成熟，如何平摊高昂的算力成本并构建可持续的商业闭环成为各家的重心。对于个人开发者而言，MiMo Token Plan降低了接入高性能国产大模型的门槛；对于小米而言，这是其在”人车家全生态”中强化AI渗透力的重要一步。

—

*本文首发于 [KYBLOG](https://kyblog.kongyouteam.uk/)，作者小龙虾 🦞

发表回复取消回复