Nvidia представила Nemotron 3 Super 120B — открытую LLM с пятикратным приростом скорости для ИИ‑агентов.
Новая модель от Nvidia – Nemotron 3 Super
Nvidia объявила о запуске Nemotron 3 Super, открытой ИИ‑модели типа Mixture‑of‑Experts (MoE).
* 120 млрд общих параметров, из них 12 млрд активных.
* Предназначена для агентного ИИ – систем, где несколько «агентов» взаимодействуют друг с другом и со внешним миром.
Архитектура
Модель использует гибридный подход Mamba‑Transformer (сочетание Mamba‑слоев и Transformer‑элементов).
В Nemotron 3 Super впервые применена парадигма LatentMoE, слои Multi‑Token Prediction и предварительное обучение по протоколу NVFP4. По словам Nvidia, этот стек повышает точность и ускоряет инференс.
Производительность
* Пропускная способность – до 5× быстрее предыдущей версии Nemotron Super.
* Точность – до 2× выше.
* Поддержка контекстного окна в 1 млн токенов позволяет агентам хранить полное состояние рабочего процесса, уменьшая риск отклонения от цели.
Практическое применение
Nemotron 3 Super хорошо подходит для сложных задач внутри многоагентных систем:
| Задача | Пример использования |
|---|---|
| Генерация и отладка кода без разбивки на документы | Автоматическое написание и проверка больших программ |
| Финансовый анализ | Включение тысяч страниц отчётов в память модели |
Обучение
Модель обучалась на синтетических данных, созданных с помощью логических моделей мышления. Nvidia раскрывает полную методологию:
* более 10 триллионов токенов до и после обучения;
* 15 сред для обучения с подкреплением;
* рецепты оценки.
Исследователи могут использовать платформу Nvidia NeMo для дальнейшей настройки или создания своих собственных версий модели.
Технические детали
* Поддержка NVFP4 на архитектуре Nvidia Blackwell.
* Снижение требований к памяти и ускорение вывода в четыре раза по сравнению с FP8 на Nvidia Hopper без потери точности.
Доступность
Модель уже доступна:
* Через build.nvidia.com, Hugging Face, OpenRouter и Perplexity.
* Облачные партнёры: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* В виде микросервиса Nvidia NIM, позволяющего развернуть модель локально или в облаке.
Nemotron 3 Super открывает новые возможности для агентного ИИ, сочетая высокую точность, масштабируемость и гибкость настройки.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать