US Startup Figure опубликовал еще одно видео о том, как его гуманоидный робот освоил ежедневные домашние обязанности. Гуманоид с мощным процессором и мультимодальной нейронной сетью научился сложить корзину, сложенную в корзину, тщательно складывая каждую из них, используя голосовую команду. Этом предшествует 500 часов тренировки, но тогда больше не нужно объяснять ему, что и как делать.
Прорыв был сделан VLAX (видение-языковое действие) с интеграцией машинного зрения и крупных языковых моделей. Платформа изучает окружающую среду и воспринимает голосовые команды на естественном языке, после чего она применяет приобретенные знания.
Согласно цифру, это первое из многих достижений, которое является значительным шагом к созданию роботов, которые могут сделать безошибочно интерпретировать окружающую среду, понимать инструкции и выполнять сложные задачи с адаптивностью человека.
В марте 2025 года было опубликовано видео, демонстрирующее, как, используя обучение подкреплению, робот фигура научился ходить более плавно и естественно, заменяя типичную твердую механическую походку мягкими движениями. Видео с полотенцами показывает ту же плавность, но теперь при работе с объектами, что особенно заметно при обработке мягких объектов. Система контролирует наклон туловища и положением рук и запястий, но и даже пальцами отдельно — как типично для людей в таких ситуациях.
В целом, система Helix 2 (S2) и 7 миллиардов параметров нейронной сети анализируют ситуацию и распознают речь. Другой слой, Helix System 1 (S1), с 80 миллионами параметров, превращает решения в конкретные действия. Кроме того, платформа Helix может работать с двумя роботами, такими как один, оптимизируя действия машин для выполнения одной задачи.
Компания планирует начать массовое производство фигурных роботов в ближайшее время. Первая линия обещает производить до 12 000 машин в год, что позволит внедрить гуманоидных роботов в производство и даже в повседневной жизни — выполнять ежедневные домашние обязанности дома и квартир.