ИИ продемонстрировал успехи в исследовании редких и малораспространённых языков

ИИ продемонстрировал успехи в исследовании редких и малораспространённых языков

3 hardware

Большие языковые модели сокращают языковой разрыв

Новые версии искусственного интеллекта (ИИ) демонстрируют заметный прогресс в работе с редкими и малоизвестными языками, что существенно уменьшает глобальный «языковой разрыв». Это подтверждает исследование компании RWS, опубликованное TechRadar.


1. Что показали исследования

- Google Gemini Pro получил оценку качества выше 4,5 из 5 баллов по знанию языка киньяруанда – на котором говорят около 12 млн человек в Руанде, Уганде и Демократической Республике Конго.
- Авторы объясняют успех тем, что современные модели опираются не только на огромные датасеты конкретного языка, но и используют общие статистические закономерности всех языков (механизм межъязыкового переноса).
- Улучшения в токенизаторах – системах разбиения текста на «токены» – также способствуют более точной работе с редкими языками.


2. Эффект «дрейфа бенчмарка»

Эксперты обнаружили, что при переходе от одной версии модели к следующей её возможности могут неожиданно меняться:

- Последняя версия OpenAI GPT уступает более старым моделям в некоторых задачах генерации контента, хотя предшественник была эффективнее.
- Эффективность токенизатора может различаться до 3,5‑раза между поколениями; это значит, что результаты предыдущих тестов не всегда применимы к новым версиям.


3. Что меняется в приоритетах разработчиков

- Ранее лаборатории ИИ ставили во главу угла производительность на английском и нескольких ключевых языках.
- Современные модели уже успешно справляются с этими задачами, поэтому внимание смещается к более широкой аудитории: поддержка редких языков становится всё важнее.
- Однако оценка 4,5/5 не гарантирует реального уровня владения языком; многоязычная поддержка пока не считается критической.


4. Итог

ИИ продолжает разрушать барьеры между культурами и языками. Несмотря на то, что «покрытие» редких языков ещё не стало обязательным требованием, тенденция к более широкому охвату аудитории уже видна и, как ожидают эксперты, будет усиливаться в ближайшие годы.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать