Nvidia представила Nemotron 3 Super 120B — открытую LLM с пятикратным приростом скорости для ИИ‑агентов.

Nvidia представила Nemotron 3 Super 120B — открытую LLM с пятикратным приростом скорости для ИИ‑агентов.

19 hardware

Новая модель от Nvidia – Nemotron 3 Super

Nvidia объявила о запуске Nemotron 3 Super, открытой ИИ‑модели типа Mixture‑of‑Experts (MoE).
* 120 млрд общих параметров, из них 12 млрд активных.
* Предназначена для агентного ИИ – систем, где несколько «агентов» взаимодействуют друг с другом и со внешним миром.

Архитектура

Модель использует гибридный подход Mamba‑Transformer (сочетание Mamba‑слоев и Transformer‑элементов).
В Nemotron 3 Super впервые применена парадигма LatentMoE, слои Multi‑Token Prediction и предварительное обучение по протоколу NVFP4. По словам Nvidia, этот стек повышает точность и ускоряет инференс.

Производительность

* Пропускная способность – до 5× быстрее предыдущей версии Nemotron Super.
* Точность – до 2× выше.
* Поддержка контекстного окна в 1 млн токенов позволяет агентам хранить полное состояние рабочего процесса, уменьшая риск отклонения от цели.

Практическое применение

Nemotron 3 Super хорошо подходит для сложных задач внутри многоагентных систем:

ЗадачаПример использования
Генерация и отладка кода без разбивки на документыАвтоматическое написание и проверка больших программ
Финансовый анализВключение тысяч страниц отчётов в память модели

Обучение

Модель обучалась на синтетических данных, созданных с помощью логических моделей мышления. Nvidia раскрывает полную методологию:

* более 10 триллионов токенов до и после обучения;
* 15 сред для обучения с подкреплением;
* рецепты оценки.

Исследователи могут использовать платформу Nvidia NeMo для дальнейшей настройки или создания своих собственных версий модели.

Технические детали

* Поддержка NVFP4 на архитектуре Nvidia Blackwell.
* Снижение требований к памяти и ускорение вывода в четыре раза по сравнению с FP8 на Nvidia Hopper без потери точности.

Доступность

Модель уже доступна:

* Через build.nvidia.com, Hugging Face, OpenRouter и Perplexity.
* Облачные партнёры: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* В виде микросервиса Nvidia NIM, позволяющего развернуть модель локально или в облаке.

Nemotron 3 Super открывает новые возможности для агентного ИИ, сочетая высокую точность, масштабируемость и гибкость настройки.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать