Alibaba запускает компактные модели Qwen 3.5, работающие прямо на ноутбуках и превосходящие аналоги от OpenAI.

Alibaba запускает компактные модели Qwen 3.5, работающие прямо на ноутбуках и превосходящие аналоги от OpenAI.

22 hardware

Alibaba Qwen 3.5 — новая серия компактных ИИ‑моделей

В рамках своего подразделения по искусственному интеллекту Alibaba объявила о выпуске линейки моделей Qwen 3.5, которые обещают «маленький размер + высокая эффективность». По сравнению с американскими аналогами они демонстрируют лучшую точность при меньшем объёме памяти.

МодельРазмерКлючевые особенности
Qwen 3.5‑0.8B0,8 млрд параметров«Миниатюрная» и «быстрая», предназначена для прототипов и мобильных устройств с ограниченной автономией
Qwen 3.5‑2B2 млрдАналогично 0.8B, но чуть мощнее
Qwen 3.5‑4B4 млрдМультимодальная, контекстное окно 262 144 токена; подходит для лёгких агентских решений
Qwen 3.5‑9B9 млрдСпособна рассуждать, превосходит OpenAI gpt‑oss‑120B (13,5× больше параметров) и демонстрирует уровень аспирантуры в логическом мышлении

Все модели доступны под лицензией Apache 2.0, что позволяет использовать их в коммерческих проектах и дообучать при необходимости.


Что нового в архитектуре?

Alibaba отказалась от классических Transformer‑ов и применила гибридную схему:

* Gated Delta Networks (GDN) – обеспечивают высокую пропускную способность и низкую задержку.
* Mixture‑of‑Experts (MoE) – решают проблему ограниченной памяти, характерную для небольших моделей.

Благодаря этому Qwen 3.5 может работать с мультимодальными токенами сразу, а не «прикреплять» генераторы изображений к текстовым моделям, как это делали предыдущие поколения. В результате версии 4B и 9B умеют распознавать UI‑элементы и подсчитывать объекты в видео.


Тесты и результаты

БенчмаркQwen 3.5‑9BСравнение
MMMU‑Pro (визуальный)70,1 %Превзошла Google Gemini 2.5 Flash‑Lite (59,7) и специализированную Qwen 3‑VL‑30B‑A3B (63,0)
Логическое мышление81,7 %Больше OpenAI gpt‑oss‑120B (80,1), хотя у последней в 10× больше параметров
HMMT Feb 2025 (математика)83,2 % (9B), 74,0 % (4B)Доказал, что для сложных задач точных наук не нужны гигантские облачные ресурсы
OmniDocBench v1.587,7 %Лидер среди всех моделей
MMMLU (многоязычность)81,2 %Превзошла gpt‑oss‑120B (78,2 %)

Почему это важно?

Появление Qwen 3.5 совпало с ростом спроса на автономных ИИ‑агентов. Современный пользователь требует не только чат‑ботов, но и систем, которые:

1. Думают – рассуждают над задачами.
2. Видят – обрабатывают изображения, видео и UI‑элементы.
3. Действуют – умеют пользоваться инструментами (заполнять формы, сортировать файлы).

С учётом того, что крупные модели (три‑пятикратный миллиард параметров) стоят дорого в эксплуатации, Qwen 3.5 — более экономичное решение. Модели можно запускать локально без подключения к облаку и API, а обучение с подкреплением позволяет им принимать «человеческие решения» – например, организовать рабочий стол или разрабатывать код по видео‑записи.


Практическое применение

* Мобильные устройства – 0,8 млрд параметров легко помещаются в смартфон и обеспечивают автономную работу.
* Рабочие станции – 9 млрд параметров дают полный набор функций агентского ИИ без облака.
* Интерфейс‑агентство – благодаря «привязке на уровне пикселей» модели могут перемещаться по UI, заполнять формы и сортировать файлы, выполняя простые команды на естественном языке с точностью около 90 %.

Таким образом, Alibaba Qwen 3.5 открывает путь к более доступным, гибким и мощным ИИ‑агентам, которые могут работать как в облаке, так и локально, удовлетворяя растущие требования современного пользователя.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать