Исследователи DeepMind сообщили, что их новая версия крупной языковой модели Alphageometry2 представилась на уровне золотых призеров из международной математической олимпиады (ИМО) В серии тестов, которые включали задачи за последние 25 лет, искусственный интеллект успешно решил 42 из 50 предложенных задач.
Alphageometry2 была разработана на основе первой версии Alphageometry, запущенной в начале 2023 года. Новая версия объединяет несколько ключевых элементов, в том числе модель языка Google Gemini и математическую систему Alpha Proof для доказательств. Конкретной особенностью решения задач из IMO является необходимость внедрения дополнительных математических структур, которые II должны генерировать самостоятельно. Alphageometry2 анализирует возможные движения, проверяет их логическую достоверность и выбирает лучшие шаги для доказательства.
Во время тестов система решает геометрически наклонные задачи, которые требуют не только высокого уровня рассуждений, но и возможность выбирать оптимальные пути к решению.
В июле 2023 года Alphageometry2 успешно решил 4 из 6 задач IMO, и в более широком тесте продемонстрировала показатели выше среднего среди олимпийских золотых призеров. Этот успех открывает новые перспективы для разработки систем искусственного интеллекта, способных решать сложные математические задачи, которые могут привести к более сложным математическим приложениям и инструментам.