Nvidia готовится к битве за инференс, создавая чип на основе технологий Groq для OpenAI и ИИ‑агентов.
Новый чип Nvidia – шаг к более быстрым ИИ‑приложениям
Nvidia планирует представить в марте новый процессор, созданный специально для ускорения инференса (вычислений уже обученных моделей) и ориентированный на клиентов вроде OpenAI. Это изменение направления компании, которая ранее сосредоточена была преимущественно на обучении ИИ‑систем.
Что именно появится
- Новая платформа будет показана на конференции разработчиков GTC (Graphics Technology Conference).
- В ядро платформы войдёт чип от стартапа Groq – одного из самых быстрых решений для инференса.
- Платформа должна конкурировать с собственными ускорителями Google и Amazon, которые уже добились существенных успехов.
Почему это важно
С ростом популярности «вэйб‑кодинга» (генерация кода ИИ по тексту) спрос на быструю и энергоэффективную инфраструктуру возрастает.
Для OpenAI новый процессор становится ключевым фактором:
- В январе компания заключила соглашение с Cerebras о чипе, ориентированном на инференс, который, по их оценке, быстрее конкурентов.
- Накануне OpenAI объявила о крупной сделке с Nvidia, в рамках которой они получили «выделенные мощности для инференса» и инвестировали 30 млрд долларов от «зелёного» производителя.
Конкурентная среда
| Компания | Продукт | Ориентация |
|---|---|---|
| Nvidia | GPU семейства Hopper, Blackwell, Rubin | Обучение и инференс |
| TPU | Инференс | |
| Amazon | Trainium | Инференс |
| Cerebras | Специализированный чип | Инференс |
| Groq | Чипы с «блоками языковой обработки» | Инференс |
Nvidia удерживает более 90 % доли рынка GPU, но её чипы зачастую считаются дорогими и энергоёмкими для задач инференса. Это привлекает к ней внимание компаний, ищущих альтернативу.
Ключевые приложения
- Генерация кода: сервисы Claude Code (Anthropic) и Codex (OpenAI) используют облачные инфраструктуры Amazon и Google, но Codex планирует перейти на новую платформу Nvidia.
- Таргетинг рекламы: Meta сотрудничает с Nvidia для инференса ИИ‑систем, где центральные процессоры оказываются наиболее эффективными.
Вывод
Nvidia не только расширяет свою линейку продуктов, но и вступает в прямую конкуренцию с гигантами индустрии. Новый чип, интегрированный со стартапом Groq, может стать решающим фактором для компаний, стремящихся к более быстрой и экономичной обработке ИИ‑моделей.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать