Nemotron 3 – 英伟达推出的最新开源AI模型系列

AI项目 2025-12-16

Nemotron 3是什么

Nemotron 3 是英伟达推出的新型开源模型系列，包括 Nano、Super 和 Ultra 三种尺寸。模型采用突破性的混合专家混合（MoE）架构，专为构建高效、准确的多智能体 AI 应用设计。Nemotron 3 Nano 拥有 300 亿参数，通过优化推理成本，实现高达 4 倍于前代的吞吐量，适合软件调试、内容总结等任务。Super 和 Ultra 分别具备 1000 亿和 5000 亿参数，用于复杂推理和多智能体协作。Nemotron 3提供海量训练数据和开源工具，助力开发者快速构建和部署专业化的 AI 系统，推动多智能体 AI 的发展。

Nemotron 3的主要功能

高效推理：Nemotron 3 Nano 拥有 300 亿参数，通过混合专家混合（MoE）架构，实现高达 4 倍于前代的吞吐量，显著降低推理成本。
多智能体协作：Nemotron 3 Super 和 Ultra 分别具备 1000 亿和 5000 亿参数，支持复杂的多智能体应用，能处理需要深度推理和战略规划的任务。
长文本处理能力：Nemotron 3 Nano 支持 100 万字的上下文窗口，能更好地处理长文本任务，保持信息连贯性。
高精度推理：通过先进的强化学习技术和多环境并发训练，Nemotron 3 在准确性方面表现出色。

Nemotron 3的技术原理

混合专家混合（MoE）架构：Nemotron 3 Nano 采用独特的混合 MoE 架构，通过动态激活部分参数（如 Nano 模型每次激活最多 30 亿参数），在保持高效计算的同时，实现更高的吞吐量和更低的推理成本。
强化学习与多环境训练：模型通过先进的强化学习技术，在多个环境中进行并发训练，提升推理的准确性和适应性。
高效训练格式：Nemotron 3 Super 和 Ultra 使用 NVIDIA 的 4 位 NVFP4 训练格式，显著降低内存需求，加速训练过程，同时保持与高精度格式相当的准确性。
大规模预训练数据集：提供包含 3 万亿 token 的预训练、后训练和强化学习数据集，为模型提供丰富的推理、编码和多步骤工作流示例，支持领域专业化。

Nemotron 3的项目地址

项目官网：https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models
HuggingFace模型库：https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8