Alibaba, ByteDance и Kuaishou запустили новые модели ИИ – от робототехники до генерации видеоконтента для кино.
Китайские IT‑гиганты демонстрируют новые ИИ‑алгоритмы
Контекст
На прошлой неделе американский рынок искусственного интеллекта был занят обсуждением возможностей моделей Anthropic и Altruist, которые влияют на программирование и финансовые сервисы. В то же время китайские технологические гиганты – Alibaba, ByteDance (владелец TikTok) и Kuaishou – представили собственные ИИ‑модели, продемонстрировав рост производительности в робототехнике и генерации видео. Эти разработки подтверждают, что Китай не отстает от западных конкурентов.
Фон
Объявления о новых алгоритмах пришли после недавнего заявления Демиса Хассабиса (основателя Google DeepMind), который отметил, что китайские ИИ‑модели отстают от западных на несколько месяцев. Тем не менее представленные в этом году инструменты способны выступать прямыми соперниками продуктам OpenAI (Sora), Nvidia и Google в области генерации видео и робототехники.
1. RynnBrain – «умный» роботизированный помощник от Alibaba
* Что это?
Исследовательское подразделение Alibaba DAMO анонсировало модель RynnBrain, предназначенную для того, чтобы роботы лучше распознавали окружающий мир и взаимодействовали с объектами.
* Демонстрация
В ролике показан робот с клешнями вместо рук, который собирает апельсины и складывает их в корзину. Также демонстрируется извлечение молока из холодильника.
* Технические особенности
- Обширное обучение необходимо для распознавания повседневных объектов.
- RynnBrain включает встроенное осознание времени и пространства: робот запоминает, где и когда происходят события, отслеживает прогресс задачи и может продолжать работу на нескольких этапах.
- Это повышает надёжность и последовательность в реальных условиях.
* Позиционирование
Alibaba ставит цель создать «базовый интеллектуальный уровень» для воплощённых систем, конкурируя с Nvidia и Google в робототехнике.
2. Seedance 2.0 – генерация видео от ByteDance
* Функционал
Модель позволяет создавать реалистичные видеоролики по простому текстовому описанию. Алгоритм также может обрабатывать существующие видео и изображения, объединяя их в новые композиции.
* Преимущества
- Улучшенная управляемость, скорость и эффективность по сравнению с предыдущими версиями.
- Положительный отзыв от исследовательницы Hugging Face Адины Якефу: модель «удивила своей сбалансированностью» и выдаёт качественные результаты уже при первом запуске.
* Технические детали
Seedance 2.0 сочетает визуализацию, звуковое сопровождение и операторскую работу в единый поток, создавая законченный продукт вместо экспериментального прототипа.
* Проблемы и ограничения
- В связи с вопросами конфиденциальности ByteDance временно отключила функцию генерации голоса человека на основе загруженного фото.
- Это решение было принято после того, как блогер высказал опасения относительно несанкционированной синтеза речи.
3. Kling 3.0 – конкурент от Kuaishou
* Общее описание
Модель Kling 3.0 предназначена для генерации видео и позиционируется как прямой соперник Seedance 2.0.
* Ключевые улучшения
- Улучшенная согласованность (детали не раскрыты в тексте, но подразумевается значительный прирост качества).
Итоги
- Китайские компании активно развивают ИИ‑алгоритмы для робототехники и генерации видео, демонстрируя конкурентоспособные решения.
- Alibaba сосредоточена на «умных» роботах с осознанием времени и пространства.
- ByteDance предлагает продвинутую модель создания видеоконтента, но сталкивается с вопросами этики синтеза голоса.
- Kuaishou продолжает расширять свой портфель генеративных моделей, конкурируя с ByteDance.
Эти разработки подтверждают, что Китай не только следует за западными инновациями, но и активно формирует собственный рынок ИИ‑продуктов.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать