DeepSeek V4 – новая модель ИИ, которую нужно настроить для китайских аппаратных ускорителей вычислений
DeepSeek готовится к релизу новой модели V4
На этой неделе, по данным *Financial Times*, китайская компания DeepSeek планирует представить долгожданную мультимодальную модель ИИ — V4. Особенностью будет оптимизация под ускорители Huawei и Cambricon, что позволит китайским фирмам продвигать собственные решения без сильной зависимости от импортных технологий.
Ключевые даты и контекст
- Анонс модели будет связан с парламентским заседанием в КНР, которое начинается 4 марта.
- Это станет самым крупным релизом DeepSeek с января прошлого года, когда компания запустила модель R1. В то время утверждалось, что новая система сопоставима по эффективности с западными аналогами при значительно меньших затратах.
Проблемы и противоречия
Ранее выяснилось, что DeepSeek использовала данные американских моделей для обучения своих систем и даже опиралась на ускорители Nvidia. Однако в КНР эти устройства находятся под санкциями. В связи с этим компания сознательно не оптимизировала V4 под Nvidia‑устройства.
Первые попытки обучать модель на ускорителях Huawei оказались не столь успешными, но теперь DeepSeek намерена улучшить совместимость с этими платформами.
Влияние на рынок
Оптимизация V4 под Huawei и Cambricon должна стимулировать спрос на эти аппаратные решения в Китае и уменьшить импортозависимость. По прогнозам экспертов, это укрепит позиции китайского ИИ‑рынка.
Дополнительная информация
Аннотация к модели V4 появится уже на этой неделе в сокращённом виде; полное описание ожидается примерно через месяц. В то же время американская компания Anthropic обвинила DeepSeek в «дистилляции» собственных ИИ‑моделей, что добавило напряжённости в международные отношения по поводу технологий искусственного интеллекта.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать