Ученые из Университета Цинхуа и ByteDance представили новый метод обучения искусственного интеллекта, который позволяет моделям учиться на собственном опыте, не теряя ранее полученных знаний. Система FLEX («Forward Learning with Experience») создает «библиотеку опыта», в которой искусственный интеллект фиксирует свои действия, анализируя как успехи, так и ошибки. Такой подход дает возможность моделям разных производителей обмениваться опытом и учиться друг у друга.
Большие языковые модели остаются статичными: они не запоминают предыдущие ошибки и не могут самоадаптироваться после обучения. ФЛЕКС-метод меняет ситуацию, создавая динамическую «библиотеку опыта», в которой ИИ хранит стратегические принципы высокого уровня, рассуждения среднего уровня и фактические знания низкого уровня. В библиотеке есть «золотая зона» для успешных стратегий и «зона предупреждения» для неудачных подходов. Перед решением новой задачи модель обращается к этой библиотеке.
Принцип работы FLEX состоит из трех этапов. Сначала «актёр», агент ИИ, пытается решить проблему. Затем «критик» и «обновитель» оценивают опыт, записывая успешные и неудачные стратегии. Наконец, уроки преобразуются в структурированные записи в библиотеке опыта. Основной «мозг» модели остается неизменным — совершенствуется лишь справочник знаний, позволяющий ИИ постоянно развиваться без дорогостоящего переобучения.
Исследователи протестировали FLEX при решении научных задач. В сложном математическом тесте AIME25 точность Claude-Sonnet-4 выросла с 40% до 63,3%. Для задач по химии в USPTO50k результаты модели улучшились с 20% до 30%. Другими словами, обучение на собственном опыте действительно улучшает интеллект ИИ.
Одним из ключевых преимуществ FLEX является «наследование опыта». Библиотека создается отдельно от параметров модели, поэтому ее можно передавать между разными агентами. В одном из экспериментов библиотека опыта, созданная мощной моделью Claude-Sonnet-4.5, была перенесена в модель Gemini-2.5-Pro. В результате успеваемость Близнецов по химии улучшилась на 11 баллов. В то же время даже более слабые модели могут передать свои знания более сильным. В библиотеке собраны фундаментальные стратегии высокого уровня, а не конкретные ответы — по сути, она накапливает «мудрость».
Такой подход открывает путь к «коллективный разум» крупных языковых моделей. Исследователи предлагают создать универсальную библиотеку опыта, которая объединит знания нескольких моделей для повышения эффективности экосистемы искусственного интеллекта.
FLEX также решает проблему дорогостоящего и рискованного метода обратного распространения ошибок, который часто приводит к «катастрофическому забвению», когда новые знания вытесняют старые. Недавно Google также представила новый подход к машинному обучению, который позволяет моделям изучать новые задачи, не теряя ранее приобретенных навыков.

