英伟达于3月11日(当地时间)推出新一代开源大语言模型Nemotron 3 Super,该模型专为企业级多智能体系统设计,采用创新的混合专家架构,将推理吞吐量提升至上一代模型的五倍以上,性能表现接近顶
模型架构与性能突破
英伟达此次发布的Nemotron 3 Super大模型,采用了创新的Mamba-MoE混合专家架构。这一架构设计使其在保持强大性能的同时,显著提升了推理效率。根据官方信息,该模型的推理速度提升了3倍,吞吐量更是暴涨了5倍以上,使其在处理复杂任务时拥有极高的效率优势。
定位与市场影响
Nemotron 3 Super被明确定位为专为AI智能体(AI Agent)设计的开源模型。其卓越的推理效率和任务成功率,使其迅速成为开源社区的焦点。该模型支持超长上下文,性能表现已接近GPT-5.4等顶级闭源大模型,为开发者提供了强大的开源替代方案。
技术适配与生态整合
该模型支持NVFP4训练格式,并适配英伟达最新的Blackwell硬件平台。这一优化不仅降低了模型的训练成本,还大幅提升了算力利用率。目前,该模型已被多家科技巨头集成,有望进一步推动企业级多智能体应用的落地和发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。