Photo by ThisisEngineering
Кажется, у учителей геометрии новый любимчик — и это не отличник с первого ряда, а искусственный интеллект. Система AlphaGeometry2 (AG2), разработанная Google DeepMind, показала лучшие результаты в решении геометрических задач с Международной математической олимпиады (IMO), чем средние показатели золотых медалистов. AG2 справляется с 84% задач, тогда как победители IMO решают около 81,8%.
Ученые протестировали AlphaGeometry2 на задачах Международной математической олимпиады, которые требуют не только стандартных вычислений, но и визуального мышления и логики. В отличие от простого сопоставления шаблонов, AG2 использует гибридную модель рассуждений, объединяющую нейронные языковые модели и символьные движки, — то есть логические системы для решения задач с помощью символов и параметров.
Система работает поэтапно: языковая модель предлагает геометрические конструкции, а символьный движок проверяет их правильность. Если предложенное решение оказывается неверным, AG2 продолжает искать новые варианты, передавая информацию между компонентами системы до тех пор, пока не найдет правильное решение.
По результатам тестов AG2 демонстрирует значительное улучшение по сравнению с первой версией системы и конкурентами.
AlphaGeometry2 может стать важным инструментом не только в математическом образовании, но и в инженерии, робототехнике, фармакологии и геномных исследованиях. Ученые планируют развивать систему, увеличивая скорость обработки данных и расширяя ее возможности по решению сложных задач с помощью, например, разбиения задач на более мелкие.
«AlphaGeometry2 представляет собой определенную форму интеллекта, но человеческий интеллект намного шире — он включает способность к самостоятельному изобретательству, а не только к применению знаний», — отметил доктор Джон Бейтс, генеральный директор AI-компании SER Group.
Разработчики AG2 подчеркивают, что их цель — достичь полной автоматизации решения геометрических задач без ошибок и создать систему, которая сможет поддерживать более сложные геометрические концепции.
Что почитать по теме. Разбирались, чем хорош Grok-3 — новый ИИ от Илона Маска. А еще писали о плюсах и минусах самых нашумевших ИИ и решали, какой все-таки «умнее».
Рассылка Reminder «15 полезных ссылок»: выпуск 75
Общение с искусственным интеллектом снижает проявления депрессии на 51%
14 приемов, проверенных наукой и лабораторией Яндекс Практикума