12月16日,据VentureBeat报道,英伟达正式推出Nemotron 3开源AI模型家族,包含Nano、Super和Ultra三大规格。该系列凭借创新架构与卓越性能,被定位为构建AI智能体应用的“最高效开源模型家族”,在准确性、推理效率及多任务处理能力上树立新标杆。
技术突破:MoE架构赋能多智能体系统
Nemotron 3系列采用混合潜在专家(MoE)架构,支持开发者大规模构建和部署可靠的多智能体系统。其核心优势在于动态参数激活机制,可根据任务需求灵活调用模型资源,显著提升计算效率。具体来看:
Nemotron 3 Nano:作为300亿参数的小型模型,每次激活仅调用30亿参数,专为软件调试、内容摘要、AI助手工作流及低推理成本信息检索优化。相较于上一代Nemotron 2 Nano,其token处理吞吐量提升4倍,推理token生成效率提高60%,同时依托100万token的上下文窗口,具备更强的长文本处理能力与信息关联准确性,可高效应对多步骤复杂任务。
Nemotron 3 Super:中等规格模型,拥有约1000亿参数,每个token最多激活100亿参数,凭借高准确性优势,适用于各类多智能体应用场景,如实时决策支持与跨领域知识整合。
Nemotron 3 Ultra:高端型号,配备约5000亿参数,每token最多激活500亿参数,作为大型推理引擎,专为复杂AI应用(如自动驾驶模拟、工业流程优化)打造,可处理超大规模数据流与多模态输入。
行业认可:头部企业加速集成
目前,Nemotron 3系列已获安永、思科、甲骨文云基础设施、Palantir、Perplexity、ServiceNow、西门子、新思科技、Zoom、埃森哲、楷登电子、Cursor等众多知名企业采用。这些企业正将模型集成至AI工作流,推动制造业、网络安全、软件开发、媒体、通信等领域的技术创新。例如:
制造业:西门子利用Nemotron 3优化工业物联网设备预测性维护,减少停机时间。
网络安全:Palantir通过模型增强威胁检测,提升实时响应能力。
软件开发:Cursor集成模型加速代码生成与调试,提升研发效率。
初创企业福音:降低开发门槛,加速创新
对于初创企业而言,开放的Nemotron 3模型将显著降低AI智能体开发成本与时间。开发者无需从零训练模型,可直接调用预训练能力,快速构建原型并迭代。例如,一家专注于医疗AI的初创公司可通过Nemotron 3 Nano开发智能诊断助手,在数周内完成从概念验证到产品部署的全流程。
发布计划与生态布局
即时可用:Nemotron 3 Nano已于今日在Hugging Face平台上线,开发者可免费下载使用。
未来扩展:Nemotron 3 Super和Ultra预计将于2026年上半年推出,进一步满足企业级需求。
生态支持:英伟达同步推出配套工具链,包括模型优化库、部署指南及社区支持,助力开发者快速上手。
结语
英伟达Nemotron 3系列的发布,标志着开源AI模型在效率与性能上的双重突破。通过MoE架构的灵活性与行业应用的深度结合,该系列不仅为开发者提供了更强大的工具,更推动了AI智能体从实验室走向规模化落地的进程。随着更多企业加入生态,Nemotron 3有望成为智能体开发领域的“新标准”。
(编辑:黄风 来源:时事126)
-
英伟达发布Nemotron 3开源AI模型系列:重构智能体开发效率与性能边界
12月16日,据VentureBeat报道,英伟达正式推出Nemotron 3开源AI模型家族,包含Nano、Super和Ultr...
3小时前国际精选
-
2025年中央经济工作会议精神解读:内需驱动成明年经济工作核心
2025年12月10日至11日,中央经济工作会议在北京召开,会议部署的2026年经济工作重点受到海内外广泛关注。聚焦舆论关切,中央...
12小时前政策解读
-
罕见病用药保障再添新篇!新版医保药品目录扩容,覆盖病种与用药数量双突破
2025年5月,我国迎来针对朗格汉斯细胞组织细胞增生症的创新药物——芦沃美替尼片正式上市。然而,高昂的治疗费用成为患者难以承受之重...
10小时前国际精选
-
德国发展报告2025:默茨执政下的挑战与中德关系新动向
近日,同济大学德国研究中心联合社会科学文献出版社发布《德国蓝皮书:德国发展报告(2025)》,深入剖析德国在政治、经济及外交领域的...
4小时前国际精选

