Alibaba запускает компактные модели Qwen 3.5, работающие прямо на ноутбуках и превосходящие аналоги от OpenAI.
Alibaba Qwen 3.5 — новая серия компактных ИИ‑моделей
В рамках своего подразделения по искусственному интеллекту Alibaba объявила о выпуске линейки моделей Qwen 3.5, которые обещают «маленький размер + высокая эффективность». По сравнению с американскими аналогами они демонстрируют лучшую точность при меньшем объёме памяти.
| Модель | Размер | Ключевые особенности |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 млрд параметров | «Миниатюрная» и «быстрая», предназначена для прототипов и мобильных устройств с ограниченной автономией |
| Qwen 3.5‑2B | 2 млрд | Аналогично 0.8B, но чуть мощнее |
| Qwen 3.5‑4B | 4 млрд | Мультимодальная, контекстное окно 262 144 токена; подходит для лёгких агентских решений |
| Qwen 3.5‑9B | 9 млрд | Способна рассуждать, превосходит OpenAI gpt‑oss‑120B (13,5× больше параметров) и демонстрирует уровень аспирантуры в логическом мышлении |
Все модели доступны под лицензией Apache 2.0, что позволяет использовать их в коммерческих проектах и дообучать при необходимости.
Что нового в архитектуре?
Alibaba отказалась от классических Transformer‑ов и применила гибридную схему:
* Gated Delta Networks (GDN) – обеспечивают высокую пропускную способность и низкую задержку.
* Mixture‑of‑Experts (MoE) – решают проблему ограниченной памяти, характерную для небольших моделей.
Благодаря этому Qwen 3.5 может работать с мультимодальными токенами сразу, а не «прикреплять» генераторы изображений к текстовым моделям, как это делали предыдущие поколения. В результате версии 4B и 9B умеют распознавать UI‑элементы и подсчитывать объекты в видео.
Тесты и результаты
| Бенчмарк | Qwen 3.5‑9B | Сравнение |
|---|---|---|
| MMMU‑Pro (визуальный) | 70,1 % | Превзошла Google Gemini 2.5 Flash‑Lite (59,7) и специализированную Qwen 3‑VL‑30B‑A3B (63,0) |
| Логическое мышление | 81,7 % | Больше OpenAI gpt‑oss‑120B (80,1), хотя у последней в 10× больше параметров |
| HMMT Feb 2025 (математика) | 83,2 % (9B), 74,0 % (4B) | Доказал, что для сложных задач точных наук не нужны гигантские облачные ресурсы |
| OmniDocBench v1.5 | 87,7 % | Лидер среди всех моделей |
| MMMLU (многоязычность) | 81,2 % | Превзошла gpt‑oss‑120B (78,2 %) |
Почему это важно?
Появление Qwen 3.5 совпало с ростом спроса на автономных ИИ‑агентов. Современный пользователь требует не только чат‑ботов, но и систем, которые:
1. Думают – рассуждают над задачами.
2. Видят – обрабатывают изображения, видео и UI‑элементы.
3. Действуют – умеют пользоваться инструментами (заполнять формы, сортировать файлы).
С учётом того, что крупные модели (три‑пятикратный миллиард параметров) стоят дорого в эксплуатации, Qwen 3.5 — более экономичное решение. Модели можно запускать локально без подключения к облаку и API, а обучение с подкреплением позволяет им принимать «человеческие решения» – например, организовать рабочий стол или разрабатывать код по видео‑записи.
Практическое применение
* Мобильные устройства – 0,8 млрд параметров легко помещаются в смартфон и обеспечивают автономную работу.
* Рабочие станции – 9 млрд параметров дают полный набор функций агентского ИИ без облака.
* Интерфейс‑агентство – благодаря «привязке на уровне пикселей» модели могут перемещаться по UI, заполнять формы и сортировать файлы, выполняя простые команды на естественном языке с точностью около 90 %.
Таким образом, Alibaba Qwen 3.5 открывает путь к более доступным, гибким и мощным ИИ‑агентам, которые могут работать как в облаке, так и локально, удовлетворяя растущие требования современного пользователя.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать