Google запустила Gemini 3 Deep Think – продвинутый ИИ‑сервис для научных задач, который продолжает «настраивать» ответы под запросы.

Google запустила Gemini 3 Deep Think – продвинутый ИИ‑сервис для научных задач, который продолжает «настраивать» ответы под запросы.

19 software

Google представил обновлённую версию Gemini 3 Deep Think

Компания Google анонсировала новое крупное обновление своей платформы Gemini 3 Deep Think – искусственный интеллект, способный к рассуждению и решению сложных научно‑инженерных задач.


Что изменилось

ПараметрНовоеКак это выглядит
ЦельПерейти от чистой теории к практическому применениюРешать задачи без чётких ограничений, с неполными данными
ДоступВстроен в приложение GeminiПодписчики Google AI Ultra могут пользоваться, а через API – инженеры и компании (необходима заявка)
Партнёры разработкиУчёные-исследователиСовместная работа над сложными задачами

Показатели работы

ТестРезультатКомментарий
Humanity’s Last Exam48,4 %Без сторонних инструментов
ARC‑AGI‑284,6 %Бенчмарк для AI‑ассистентов
Codeforces (Эло)3455Высокий рейтинг среди программных решений
IMO 2025Золотая медальЭквивалент уровня участников международной олимпиады
Химия/ФизикаТот же результатПоказал универсальность в разных дисциплинах
CMT‑Benchmark (теоретическая физика)50,5 %Хорошее владение сложными концепциями

ИИ‑агент «Aletheia»

В лаборатории DeepMind Google создали агента Aletheia на основе Gemini 3 Deep Think. Ключевые особенности:

1. Проверка гипотез – агент выявляет слабости в предложенных решениях и корректирует их итеративно.
2. Признание неуверенности – может сообщить, что не знает ответа.
3. Взаимодействие с внешними источниками – использует поисковую службу Google и веб‑навигацию, но избегает выдумывания ссылок.


Уровни достижения

Google разбил успехи Aletheia на пять ступеней:

СтупеньОписаниеПримеры
0 – «незначительная новизна»Полностью автономный режим, три задачи П. Эрдёша решены (первый уровень)Три задачи Эрдёша
1 – «минимальная новизна»Один дополнительный результат в автономном режимеЧетвёртая задача
2 – «пригодность для публикации»Результаты как автономно, так и в сотрудничестве с человеком, а также вспомогательные инструментыДанные задачи
3–4 – «значительный/знаменательный прорыв»Пока не достигнуты

Как Aletheia справляется с задачами Эрдёша

* Из 700 нерешённых до сих пор проблем агента удалось решить 13.
* Однако только 4 из них действительно новые – остальные уже известны в научном сообществе.
* Среди 212 представленных решений лишь 6,5 % оказались содержательно правильными; 68,5 % содержали фундаментальные ошибки, а 31,5 % — неверно интерпретировали задачу.

Разработчики отмечают, что AI склонен «переинтерпретировать вопрос так, чтобы ответить проще», и остаётся «крайне подверженным ошибкам по сравнению с людьми». В итоге пока нельзя заменить математиков искусственным интеллектом.


Итого: Gemini 3 Deep Think и его агент Aletheia демонстрируют впечатляющие результаты в различных областях науки, но при этом сохраняют существенные ограничения в точности и надёжности решений. Google продолжает работать над улучшением способности ИИ к глубокому рассуждению и проверке собственных выводов.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать