Искусственный интеллект впервые справился с проблемами уровня реальных исследований.
GPT-5 впервые прошел так называемый тест Gödel и удалось доказать три основные гипотезы в области комбинаторной оптимизации. Более того, в одном случае модель не только справилась с проблемой, но и предложила неожиданное решение, которое отрицало исходную гипотезу. Этот результат стал настоящим сюрпризом для исследователей Openai.
Один из авторов научной работы, ученого Себастьян Бобек, отметил, что лучшим выпускникам обычно требуется несколько дней, чтобы решить такие задачи. Впервые эксперимент был задумано таким образом, что искусственный интеллект столкнулся не с задачами на уровне Олимпийских игр, а с открытыми математическими гипотезами. Проект был осуществлен совместно специалистами Университета Хайфы и Cisco.
Авторы статьи (полный текст доступны в ARXIV) подготовили пять задач в области комбинаторной оптимизации, причем каждый из них предоставляет только краткое описание и ссылки на один или два источника. Для трех относительно простых задач GPT-5 смог привлечь почти безупречные доказательства, демонстрируя твердые навыки логического мышления.
Второй пример был особенно показательнымS вместо ожидаемого решения GPT-5 создал новый алгоритм, который после проверки оказался работающим и более общим, чем первоначальное предположение. Таким образом, модель фактически отрицала исходную гипотезу и предложила альтернативный путь.
Исследователи отмечают, что в тех случаях, когда задача имел четкий путь рассуждения, GPT-5 показал высокую точность. В тех случаях, когда необходимо было объединить различные подходы или создать более сложные доказательства, модель была неправильной. В частности, две из пяти гипотез не могли быть разрешены, хотя в одном случае GPT-5 назначил алгоритм, но не проводил надлежащего анализа.
Тем не менее, результат определяется как исторический: впервые искусственный интеллект сделал шаг от «преподавания математики» до фактического «создания математики». Ученые считают, что это событие является началом глубокой трансформации научной парадигмы, которая может определить ход исследований уже в 2030 году.

