Ученые из Калифорнийского университета в Беркли опубликовали две статьи в области научной робототехники, которые ставят под сомнение самые смелые прогнозы для предстоящего появления универсальных гуманоидов. Лидер исследования, роботист Кен Голдберг, считает, что роботы не смогут повторить путь языковых моделей, который, благодаря огромному набору текстов, в течение нескольких лет стало массовым использованием. Чтобы овладеть физическими навыками, им нужна непропорционально более богатая база данных, которой еще не существует. Он подсчитал, что разница составила 100 000 лет с точки зрения эквивалентных объемов информации.
Основным аргументом Голдберга является то, что именно физическое манипулирование объектами остается подавляющим барьером. Для человека поднимать стекло или смену луковицы — это вопрос секунды. Но для робота это цепочка точного распознавания положения сайта, правильное размещение кончиков пальцев, регулируя силу контакта и непрерывную обратную связь. Все это чрезвычайно сложно формализовать. Попытки обучать роботов из видео в Интернете не помогают многим: два измерения изображения не передают необходимые трехмерные траектории, силы и микро движения. Симуляции делают хорошую работу по бегу и акробатике, но они не превращаются в точную ручную работу — будь то слесаник, электрик или повар. Даже телеперза, в которой оператор непосредственно управляет машиной, генерирует только реальные данные: восемь часов работы дают ровно восемь часов материала, несравненного с текстовыми потоками LLM.
В сообществе робототехники ведутся споры о том, важнее ли просто накапливать больше данных или полагаться на классическую инженерную математику, физику и четкие модели мира. Goldberg предлагает компромисс: создать высокоспециализированных роботов, которые достаточно надежны для выполнения конкретных задач, а именно в процессе работы, для сбора необходимого количества информации. Такой подход уже осуществляется в Waymo, чьи автономные автомобили заполняются в ежедневных информационных базах данных и в Ambi Robotics, где сортировочные машины на складах уточняются в процессе их использования.
В перспективе исследователь скептически относится к прогнозам, что за пять лет роботы будут хирурги -хирургиПо его словам, в течение следующих двух, пяти или даже десяти лет мы не должны ожидать массового появления универсальных гуманоидов. В то же время он отмечает, что работники с голубыми воротниками останутся в безопасности в течение длительного времени из -за сложности тонких моториков и адаптивности, но обычные офисные процессы и завершение форм могут быть подвергнуты автоматизации на основе языковых моделей. Однако в медицине или в обслуживании клиентов важна эмпатия: пулемет не может убедительно сказать «я понимаю, как вы себя чувствуете», а тем более общаться с трагическими новостями для пациентов.
Ограничение связано не только с алгоритмами, но и с телом. Несмотря на впечатляющие демонстрации Бостонской динамики, фигуры и Теслы, многие гуманоиды движутся жесткими и тратят слишком много энергии. Sony недавно обратилась к вниманию к новым типам суставов и гибким структурам. British Explorer Hamed Rajabi также отмечает, что нынешние роботы сжигают слишком много энергии и требуют постоянных настроек, поскольку их оборудование не имеет механической адаптивности. Случаи перегрева или падения машин во время соревнований только подчеркивают эту проблему.
Послание Голдберга не в том, что прогресс невозможен, а требует трезвого суждения. Реальные прорывы рождаются на пересечении данных, управления и физического дизайна. Чтобы избежать введения отрасли в новый воздушный шар, нам необходимо поддерживать акцент на прозаическую инженерию, пошаговые эксперименты и постепенное принятие. Это единственный способ для роботов выходить за рамки лабораторных демонстраций и превратиться в устойчивые инструменты, которые пользуются реальной работой.