Миллиардер и основатель стартапа по искусственному интеллекту xAI Илон Маск считает, что отрасль переживает кризис, поскольку данные для обучения моделей почти исчерпаны.
Илон Маск согласен с экспертами по искусственному интеллекту, которые говорят, что реальных данных для обучения моделей осталось мало.
«Мы уже исчерпали всю сумму человеческих знаний о обучении искусственного интеллекта. В основном это произошло в прошлом годуОб этом Маск заявил в ходе разговора с главой маркетинговой группы Stagwell Марком Пенном.
Маск предположил, что синтетические данные — данные, созданные самими моделями ИИ, — могут быть использованы для обучения моделей в будущем.
«Единственный способ дополнить это синтетические данные, которые создает ИИ (обучающие данные). Используя синтетические данные, ИИ проведет самооценку и пройдет процесс самообучения.Маск добавляет.
По данным TechCrunch, это соответствует недавним заявлениям одного из соучредителей OpenAI Ильи Суцкевера, который заявил на конференции NeurIPS, что отсутствие обучающих данных заставит производителей ИИ изменить способ разработки моделей.
Искусственный интеллект Microsoft Phi-4 обучался на синтетических данных наряду с реальными данными. То же самое касается моделей Gemma от Google и Claude 3.5 Sonnet от Anthropic. Компания Meta улучшила свою последнюю серию моделей Llama, используя данные, сгенерированные искусственным интеллектом.
Обучение на синтетических данных имеет свои преимущества, например, экономию средств. Но есть и недостатки. Некоторые исследования показывают, что синтетические данные могут привести к краху модели, когда ее станет меньше.творческийи более предвзятым в своих результатах.