Работа
24 февраля, 2025
Новое

ИИ от Google побеждает золотых медалистов по геометрии

AlphaGeometry2 справляется с 84% задач, тогда как победители олимпиады решили только 81,8%

ИИ от Google побеждает золотых медалистов по геометрии

Photo by ThisisEngineering

Кажется, у учителей геометрии новый любимчик — и это не отличник с первого ряда, а искусственный интеллект. Система AlphaGeometry2 (AG2), разработанная Google DeepMind, показала лучшие результаты в решении геометрических задач с Международной математической олимпиады (IMO), чем средние показатели золотых медалистов. AG2 справляется с 84% задач, тогда как победители IMO решают около 81,8%.

Как это проверяли

Ученые протестировали AlphaGeometry2 на задачах Международной математической олимпиады, которые требуют не только стандартных вычислений, но и визуального мышления и логики. В отличие от простого сопоставления шаблонов, AG2 использует гибридную модель рассуждений, объединяющую нейронные языковые модели и символьные движки, — то есть логические системы для решения задач с помощью символов и параметров. 

Система работает поэтапно: языковая модель предлагает геометрические конструкции, а символьный движок проверяет их правильность. Если предложенное решение оказывается неверным, AG2 продолжает искать новые варианты, передавая информацию между компонентами системы до тех пор, пока не найдет правильное решение.

Что показали результаты

По результатам тестов AG2 демонстрирует значительное улучшение по сравнению с первой версией системы и конкурентами. 

  • 84% задач решены успешно. AlphaGeometry2 обошел золотых медалистов по результативности в решении геометрических задач.
  • 30% прирост производительности. Вторая версия AG2 показала значительный рост по сравнению с первой версией, выпущенной в январе 2024 года.
  • Мастерство в геометрии. В отличие от алгебры и анализа, геометрия требует сочетания визуального восприятия и логики, что AG2 продемонстрировал на высоком уровне.
  • Улучшенный движок. AG2 использует архитектуру Gemini и усовершенствованный символьный движок, что увеличило количество решенных задач IMO с 66% до 88%. 
  • Система знаний. Внедрена новая система обмена знаниями, которая объединяет несколько деревьев поиска, что ускоряет процесс нахождения решений. 
  • Недостатки AG2. Система медленно обрабатывает данные и пока не справляется с самыми сложными задачами по 3D-геометрии, нелинейным уравнениям и задачам с переменными или бесконечными точками.

Что будет дальше

AlphaGeometry2 может стать важным инструментом не только в математическом образовании, но и в инженерии, робототехнике, фармакологии и геномных исследованиях. Ученые планируют развивать систему, увеличивая скорость обработки данных и расширяя ее возможности по решению сложных задач с помощью, например, разбиения задач на более мелкие.

«AlphaGeometry2 представляет собой определенную форму интеллекта, но человеческий интеллект намного шире — он включает способность к самостоятельному изобретательству, а не только к применению знаний», — отметил доктор Джон Бейтс, генеральный директор AI-компании SER Group. 

Разработчики AG2 подчеркивают, что их цель — достичь полной автоматизации решения геометрических задач без ошибок и создать систему, которая сможет поддерживать более сложные геометрические концепции.

Что почитать по теме. Разбирались, чем хорош Grok-3 — новый ИИ от Илона Маска. А еще писали о плюсах и минусах самых нашумевших ИИ и решали, какой все-таки «умнее».

Вы уже оценили материал
Продолжайте читать

Рассылка Reminder «15 полезных ссылок»: выпуск 75

Парадокс усилий, тренировка «12-3-30» и час со смартфоном в постели
Сознание
1 апреля, 2025
Новое

Может ли ИИ заменить психотерапевта? Новое исследование дает ответ

Общение с искусственным интеллектом снижает проявления депрессии на 51%

Общение с искусственным интеллектом снижает проявления депрессии на 51%

Может ли ИИ заменить психотерапевта? Новое исследование дает ответ
SPECIAL
10 марта, 2025

Обучение для взрослых: как начать и не бросить

14 приемов, проверенных наукой и лабораторией Яндекс Практикума

14 приемов, проверенных наукой и лабораторией Яндекс Практикума

Обучение для взрослых: как начать и не бросить