Исследовательский институт Toyota проделал невероятную работу, обучая роботов быстрому обучению и автономному выполнению задач – теперь в партнерстве с Boston Dynamics он внедряет свою технологию моделирования поведения для необычного гуманоида Atlas.
Хотите верьте, хотите нет, но аппаратура гуманоидных роботов, вероятно, уже достаточно хороша. Результатом более чем десятилетней работы Boston Dynamics стал не только невероятно спортивный и способный гидравлический робот Atlas, но и множество новых коммерческих конкурентов от Tesla, Figure, Agility, Sanctuary, Fourier и многих других. Эти замечательные тела роботов будут продолжать совершенствоваться, но они уже достаточно хороши для выполнения всевозможной полезной работы.
Проблема в программном обеспечении. Если вам нужна команда программистов, чтобы научить робота новому поведению, это вряд ли лучше, чем современные обычные производственные роботы. Но разработка человекоподобного робота общего назначения, который понимает окружающий мир и умеет гибко и адаптируемо взаимодействовать с ним, - это огромная задача.
Ответом, конечно, является искусственный интеллект, как скоро будет и на все остальное, но ИИ нужно обучать на большом количестве данных. Чатгпт, Грок, Лама и Клод - все они извлекают выгоду из безумного количества (в основном письменных) данных, накопленных человечеством за столетия. Большие языковые модели (LLM) развивались так быстро, потому что язык - это сильно сжатое представление реальности, сжатое до таких небольших размеров файлов, что их можно обрабатывать в огромных объемах.
Данных, которые помогли бы роботам освоить основы движения, гораздо меньше – за исключением видео, которое не рассказывает всей истории о том, почему кто-то совершил то или иное движение. И им действительно нужно учиться всему с нуля. Отсюда идея "Большой модели поведения", или LBM, – способа, с помощью которого роботы могут постепенно отрабатывать базовые движения, которые они могут использовать для взаимодействия с окружающим миром, и объединять их в более сложные движения для выполнения задачи или достижения цели, аналогично тому, как LLM разработали "понимал человеческий язык и научился взаимодействовать с нами.
По сути, команда TRI разработала систему телеприсутствия, позволяющую пилотам-людям "управлять" роботизированными манипуляторами, глядя через очки виртуальной реальности, подключенные к камерам робота, чтобы видеть именно то, что видит робот, и оснащенные тактильными перчатками, позволяющими им также чувствовать то, что могут чувствовать тактильные датчики робота.
Затем, когда пилот-человек ограничен точным набором "органов чувств", которыми обладает робот, они приступают к выполнению множества задач, многие из которых выполняются на кухне. Они тратили пару часов на выполнение одного и того же задания снова и снова с разных исходных точек, исправляя свои ошибки, если они их совершали, и отмечая каждую попытку как успешную или неудачную.
После этого роботы потратили бы некоторое время на "обдумывание" проблемы, эффективно проводя миллионы различных симуляций задачи, добавляя случайные величины и отправные точки, каждый раз оценивая свою производительность в соответствии с собственным пониманием способов достижения успеха и неудачи.
И это сработало. К сентябрю прошлого года, когда мы впервые увидели видео выше, команда TRI обучила своих роботов-манипуляторов более чем 60 сложным действиям. Исследователи сообщили, что они часто тратили вторую половину дня на пилотируемое обучение, а затем возвращались домой, так как система обучения поведению проводила моделирование всю ночь, а утром они возвращались и обнаруживали, что роботы теперь могут выполнять задачу самостоятельно, причем довольно гибко.
Это был замечательный материал, и мы с восхищением узнали, как далеко продвинулись разработки за последние 12 месяцев, учитывая, как поразительно быстро развиваются технологии во всех областях искусственного интеллекта. Но это было также довольно ограниченное исследование, проведенное с использованием пар рук робота, а не целых тел.
Что ж, это скоро изменится. Компания Boston Dynamics уже несколько десятилетий является абсолютным стандартом в исследованиях в области робототехники. Старый гидравлический гуманоид Atlas войдет в историю как одна из самых новаторских и значимых машин в истории робототехники.
А полностью электрический new Atlas, который вы, возможно, видели на сайте New Atlas, дебютировал на публике всего пять месяцев назад. В результате этой замечательной эволюции была утрачена часть взрывной мощи, которая делала оригинального Атласа таким выдающимся гимнастом, но она была компенсирована полностью подвижными суставами по всему телу, обеспечивающими свободное вращение бедер, плеч, талии, шеи, бицепсов и бедренной кости, так что любая часть его тела может смотрите в любом направлении.
Это действительно замечательный робот, уже поцарапанный, помятый и выглядящий как подержанный, в типичном стиле Boston Dynamics, но за последние пять месяцев мы на удивление мало видели новый Atlas, чтобы точно определить, на каком этапе он находится и каковы его текущие возможности. Ну, кроме этого: мы знаем, что это может сорвать серию отжиманий.
Итак, сегодняшняя новость очень интересна: бесспорные мастера в области аппаратного обеспечения для человекоподобных роботов объединились с ведущей командой разработчиков LBM с искусственным интеллектом, чтобы расширить полезные возможности человекоподобных роботов.
“Для индустрии робототехники еще никогда не было более захватывающего времени, и мы с нетерпением ожидаем совместной работы с TRI, чтобы ускорить разработку гуманоидов общего назначения”, - говорит Роберт Плейтер, генеральный директор Boston Dynamics, в пресс-релизе. - Это партнерство является примером того, как две компании с мощной научно-исследовательской базой объединяются для решения многих сложных задач и создания полезных роботов, которые решают реальные задачи”.
“Последние достижения в области искусственного интеллекта и машинного обучения обладают огромным потенциалом для развития физического интеллекта”, - добавляет Гилл Пратт, главный научный сотрудник Toyota и генеральный директор TRI. - Возможность внедрить самую современную технологию искусственного интеллекта TRI на оборудовании Boston Dynamics кардинально меняет ситуацию в каждой из наших организаций, поскольку мы работаем над расширением возможностей сотрудников и улучшением качества жизни”.
Партнерство направлено на быструю разработку моделей поведения всего тела для робота Atlas, а также для других гуманоидных платформ, с которыми TRI может продолжить работать. Будет интересно посмотреть, какие различные виды оборудования для обучения телеприсутствию используются для решения этой проблемы, поскольку Atlas намного сложнее, чем простые бимануальные настройки, с которыми TRI работала изначально.
Однако в конечном счете все еще неясно, намерена ли Boston превратить Atlas в коммерческий продукт. И масштаб здесь может иметь решающее значение; такие компании, как Tesla и Figure, разрабатывают своих гуманоидов с расчетом на массовое производство, стремясь развернуть сотни, а затем и тысячи таких устройств по всему миру для выполнения небольших, простых и полезных задач. Там они увидят невероятное разнообразие происходящих событий, соберут огромное количество реальных данных и будут использовать их для обучения на основе роя.
Именно такой подход, по утверждению Tesla, делает ее мировым лидером в области автономных автомобилей; на дорогах уже есть миллионы таких устройств, за которыми постоянно наблюдают и которые вносят свой вклад в познание целого. Искусственный интеллект - это игра с большими данными, и, согласно этой модели, победит тот, кто соберет больше всего данных и использует их наиболее эффективно. И приз, по мнению таких людей, как Илон Маск, - это, возможно, самый крупный продукт в истории, трансформирующая машина, заменяющая труд, которая в конечном итоге может взять на себя практически любую физическую работу.
В то время как Boston Dynamics уже как минимум десять лет опережает всех в области гуманоидов, Atlas была специально выделена в качестве исследовательской платформы. Компания ограничила свою коммерческую деятельность более компактными и практичными четвероногими, такими как платформа Spot и однорукий манипулятор для перевозки тяжестей.
Возможно, это говорит о том, что эта компания-новатор, похоже, считает, что гуманоиды еще не готовы приступить к работе, и им потребуется еще несколько лет в лаборатории, чтобы кропотливо собрать воедино строительные блоки физического поведения.
Перспективы создания универсальных гуманоидов настолько велики, а задачи настолько серьезны, что на пути к ним наверняка будет множество сюрпризов. Это действительно похоже на поле, где мы наблюдаем за развитием истории будущего в режиме реального времени.