Разве наука официально больше не принадлежит людям?
Китайские исследователи представили искусственный интеллект, который может самостоятельно выводить физические законы и формулы на основе необработанных данных. Система, получившая название PhyE2E, была создана специалистами университетов Цинхуа и Пекина при поддержке ряда научных учреждений.
Основная идея разработки — превратить искусственный интеллект из инструмента упорядочивания кривых в средство обнаружения значимых закономерностей. ФиЕ2Е не просто строит статистические модели, но формулирует компактные математические выражения, согласованные по отношению к физическим единицам. Это означает, что в результате получается не абстрактная теория в виде общих выводов, а уравнение, которое можно проверить, интерпретировать и использовать в научной работе.
В ходе обучения система изучала реальные физические данные и известные уравнения. Алгоритм постепенно «разобрался», как выглядят правдоподобные формулы, уточнив их структуру и комбинируя разные варианты, чтобы сохранить размерность физических величин. В основе PhyE2E лежит архитектура преобразователя, которая преобразует данные непосредственно в символическое выражение и соответствующие единицы измерения.
Чтобы справиться со сложными проблемами, модель применяет стратегию разделения подзадач. Он анализирует две производные во вспомогательной нейронной сети и разлагает задачу на несколько простых уравнений. Затем он выполняет краткую оптимизацию с использованием методов поиска по дереву Монте-Карло и генетического программирования, которые уточняют числовые коэффициенты и структуру окончательной формулы. В результате система создает уравнение, которое не только описывает данные, но и имеет физический смысл.
Разработчики тестируют PhyE2E на синтетических наборах данных и на реальных проектах с расчетами НАСА. В 5 задачах, связанных с космической физикой, нейронная сеть выдавала уравнения, которые соответствуют формулам, полученным человеком, и в некоторых случаях более точно описывают определенные явления. Например, при анализе архивных данных НАСА за 1993 год PhyE2E предложил усовершенствованное математическое выражение для описания солнечных циклов, а также определил взаимосвязь между солнечной радиацией, температурой и магнитным полем.
Авторы проекта отмечают, что система учится не только сопоставлять значения, но и искать логические схемы, сохраняющие физический смысл. Он опирается на знания, накопленные в виде уже известных уравнений, и предлагает новые комбинации, не нарушающие законы размерности. По сути, PhyE2E сочетает в себе возможности больших языковых моделей и символьной математики, превращая машинное обучение в инструмент научного анализа.
В дальнейшем разработку планируется использовать для обработки экспериментальных и астрофизических данных, где нелинейности и шумы являются обычным явлением. Исследователи также расширят архитектуру модели, добавив поддержку операций дифференциации и интеграции, что позволит ей получать уравнения в частных производных – основа большинства физических теорий.
Создатели PhyE2E видят в этом шаг к «предсказывающему искусственному интеллекту», который может не только делать прогнозы, но и объяснять, как и почему они были получены. Такой подход, по их мнению, может изменить сам принцип научного поиска: вместо выбора формул — автоматическое открытие закономерностей, которые человек затем может проверить и не тратить время на пути к величайшим открытиям.

