Alibaba представила конкурента Nano Banana — мощный генератор изображений Qwen-Image-2.0 на основе искусственного интеллекта

Alibaba представила конкурента Nano Banana — мощный генератор изображений Qwen-Image-2.0 на основе искусственного интеллекта

20 software

Alibaba запускает новую модель генерации изображений – Qwen‑Image‑2.0

Компания Alibaba представила свою последнюю разработку в области искусственного интеллекта — Qwen‑Image‑2.0, предназначенную для создания и редактирования графических материалов. Модель демонстрирует несколько ключевых преимуществ, которые делают её конкурентоспособной на рынке ИИ.


Что умеет Qwen‑Image‑2.0

ВозможностьОписание
Точное воспроизведение текстаГенерируемые изображения содержат текст без ошибок и позволяют выбирать стиль написания.
Поддержка длинных запросовМодель обрабатывает до 1000 токенов, что открывает возможности для сложных композиций и детальных инструкций.
Разнообразие выходных форматовОт фотореалистичных снимков и презентационных слайдов до плакатов и комиксов.
Эстетика и композицияУмение гармонично размещать текст, выбирать начертание шрифта и выравнивать объекты на изображении.

Пример: при генерации изображения глянцевой доски модель корректно отражает окружающие предметы и интегрирует надписи без потери качества.


Как возникла модель

Qwen‑Image‑2.0 объединяет два направления исследований в Alibaba:

1. Генерация изображений – максимальная точность и детализация, включая корректное отображение текста.
2. Редактирование изображений – сохранение исходного контента без искажения, функциональность и согласованность.

Слияние этих подходов привело к созданию универсальной модели с упрощённой архитектурой: меньший размер, но более быстрая генерация.


Преимущества по сравнению с конкурентами

- Точность – наследует навыки редактирования изображений от предыдущих версий.
- Гибкость запросов – до 1000 токенов позволяют задавать сложные сцены и композиции.
- Эстетика – автоматическое размещение текста и выбор шрифта под контекст изображения.
- Композиция – выравнивание элементов позволяет создавать информативные комиксы и кинопостеры.


Тестирование на AI Arena

Alibaba провела слепое сравнение Qwen‑Image‑2.0 с ведущими моделями:

ЗадачаЛучшие конкуренты
Генерация изображенийGoogle Gemini‑3‑Pro‑Image‑Preview, OpenAI GPT Image 1.5
Редактирование изображенийТолько флагманская модель Gemini от Google превосходит Qwen‑Image‑2.0

Таким образом, в большинстве сценариев Qwen‑Image‑2.0 демонстрирует лидирующие показатели среди китайских и международных моделей.


Итог:
Alibaba представила мощную, гибкую и эстетически сбалансированную модель генерации изображений, способную удовлетворить потребности как профессионалов в дизайне, так и пользователей, ищущих быстрые решения для создания визуального контента.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать