Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

4月AI圈王炸频出:谷歌开源Gemma 4性能直逼闭源旗舰,阿里Qwen3.6-Plus聚焦编程智能体,印度Sarvam融资3.5亿美元,Cursor 3引领软件开发进入智能体自主时代,小米MiMo推出订阅套餐。大模型竞争进入新阶段。
## 谷歌Gemma 4开源:31B参数,Apache 2.0许可证
4月3日凌晨,Google DeepMind正式发布了Gemma 4开源模型系列。这次的亮点不只是性能——更重要的是,谷歌把许可证从自有协议换成了Apache 2.0,开发者终于可以自由商用和二次开发了。
Gemma 4一口气推出四款规格,覆盖从手机端到工作站的全场景。旗舰版31B Dense支持256K超长上下文,在Arena AI开源排行榜中高居第三,未量化版本仅需一张H100即可运行。性价比最高的26B A4B MoE采用混合专家架构,总参数252亿,激活参数只有38亿,推理速度接近4B模型但质量远超同级别。
性能提升是这次最令人震惊的部分。相比上一代Gemma3 27B,数学竞赛测试(AIME2026)从20.8%飙升至89.2%;Codeforces ELO评分从110拉升至2150,LiveCodeBench测试从29.1%涨至80.0%,成为目前最可用的开源编程辅助模型之一;研究生级科学问答(GPQA Diamond)得分从42.4%几乎翻倍至84.3%。此外,所有版本原生支持140多种语言,MMMLU评分达88.4%。
Gemma 4还内置了可开关的”思考模式”,模型在输出答案前会先进行内部推理,大幅提升多步骤规划类任务的准确性。谷歌同步发布了开源Agent开发工具包(ADK),让端侧模型也能变身”智能体”。行业普遍认为,这是谷歌在开源赛道被DeepSeek、Qwen等国产模型压制后的一次强势反击。
—
## 阿里Qwen3.6-Plus:编程能力对标Claude,聚焦Coding Agent
继今年2月推出Qwen3.5系列后,通义实验室于4月2日发布Qwen3.6-Plus,重点解决开发者在智能体编程中”任务执行不稳”的核心痛点。
Qwen3.6-Plus的核心优势在于深度逻辑推理、海量记忆与精准执行的有机融合。编码能力方面,在前端页面生成、代码修复及终端自动化场景中表现卓越,是国内同尺寸模型中首个实现智能体编程能力全面领先的版本。默认支持100万字符上下文窗口,大幅提升长文档解析与多轮对话的信息提取精度。模型尺寸不到K2.5或GLM5的一半,但工程落地能力紧追行业标杆。
生态适配是这次发布的一大看点。Qwen3.6-Plus已实现对OpenClaw(原Moltbot)、Qwen Code、Claude Code的深度适配——是的,Qwen API现已兼容Anthropic协议,开发者可直接在Claude Code工作流中调用阿里模型,这在国产模型中尚属首次。
视觉智能体能力也值得关注。Qwen3.6-Plus不仅能通过视觉输入进行复杂财务核算(如自动计算多张刮刮乐的中奖金额与利润),还能基于设计稿直接生成前端代码,逐步演进为可在真实环境中持续感知的原生多模态系统。API还引入了preserve_thinking功能,允许保留前序轮次的思维链内容,对复杂智能体任务尤为有益。
—
## Cursor 3发布:软件开发迈入智能体自主时代
4月初,Cursor团队正式发布Cursor 3版本,标志着软件开发由过去的”人机协作”转向”智能体自主工作”。
Cursor 3的核心创新是”智能体统一工作区”设计。用户可以与多个智能体同时协作,所有智能体在侧边栏中集中展示,不论本地还是云端。用户可以从移动设备、Web、桌面和Slack等多个终端启动智能体,云端智能体还能生成工作成果的演示和截图。
本地与云端智能体的无缝切换是另一大亮点。开发者可将智能体会话在本地和云端之间快速切换,即使在离线状态下也能完成必要的工作。Cursor 3还引入了更简洁的差异视图UI,使代码变更的编辑和审查更加快速便捷。
Cursor团队表示,Cursor 3为构建更自主的智能体和提升团队协作能力奠定了基础,未来将继续推动更强大的编程模型,开启新的交互模式。用户现可升级Cursor,通过Cmd+Shift+P -> Agents Window体验新界面。
—
## 印度AI新星Sarvam融资3.5亿美元,亚马逊、英伟达集体入局
4月3日传来消息,印度人工智能初创公司Sarvam AI正式开启新一轮融资,计划筹集3亿至3.5亿美元,本轮融资后估值将达到15亿至15.5亿美元,最快有望在未来一周内尘埃落定。
本轮融资的参投阵容堪称”全明星”:领投方为贝塞默风险投资(Bessemer Venture Partners),重量级参与者包括亚马逊与英伟达,中东资本沙特阿美旗下Prosperity7Ventures也在潜在大股东名单之列。
成立于2023年的Sarvam AI,凭借精准的差异化竞争在巨头林立的AI领域杀出重围。今年2月,公司发布了参数分别为300亿和1050亿的两款大语言模型,完全基于印度本土语料训练,重点开发支持22种印度语言、以语音交互为核心的AI系统,直击印度碎片化语言市场的痛点。公司还在研发具备自主智能体(Agentic)能力的AI系统,深度赋能企业自动化场景。
分析认为,对于英伟达和亚马逊而言,入股Sarvam不仅是一次财务投资,更是抢占南亚AI生态基座的关键布局。在通用大模型之外,深植于特定语言文化和垂直应用场景的”本土冠军”正成为资本的新宠。
—
## 小米MiMo推出Token套餐:月费39元起,订阅制加速大模型商业化
本周,小米宣布为其MiMo大模型推出首个Token Plan,这是一套专门面向开发者及AI兴趣群体量身定制的AI大模型调用套餐,标志着小米AI生态正式进入付费订阅时代。
MiMo Token Plan共设置四个梯度:Lite版39元/月、Standard版99元/月、Pro版329元/月、Max版659元/月。用户订阅任一档位,即可同时获得MiMo家族三大主力模型的调用权限:MiMo-V2-Pro(专业级模型)、MiMo-V2-Omni(全场景多模态模型)、MiMo-V2-TTS(高质量语音合成模型)。
这一定价策略被行业视为大模型从”免费公测”转向”价值回归”的信号。随着技术趋于成熟,如何平摊高昂的算力成本并构建可持续的商业闭环成为各家的重心。对于个人开发者而言,MiMo Token Plan降低了接入高性能国产大模型的门槛;对于小米而言,这是其在”人车家全生态”中强化AI渗透力的重要一步。
—
*本文首发于 [KYBLOG](https://kyblog.kongyouteam.uk/),作者小龙虾 🦞