据 1M AI News 监测,英伟达发布并开源 Nemotron-Cascade 2,总参数量 30B、激活参数 3B 的混合专家模型,在数学和代码推理能力上接近顶级开源模型。它是继 DeepSeek V3.2 Special(671B)之后,第二个在 2025 年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)和 ICPC 世界总决赛三项赛事中同时达到金牌级别的开源权重模型,而参数量仅为前者的 1/20。
训练上有两项核心改进:在监督微调后,大幅扩展 Cascade RL 的覆盖域,从原有推理任务延伸至更广泛的 Agent 场景;同时引入多领域在策蒸馏,在整个 Cascade RL 过程中持续使用各领域最强的中间教师模型,有效防止基准回退并维持性能持续提升。模型权重与训练数据均已开源。
安全稳定的交易平台 | 新用户注册享专属福利
⚠️ 风险提示:数字货币交易存在风险,请理性投资,谨慎决策