Битва гигантов ИИ: сможет ли робот OpenAI превзойти Tesla Optimus?

Эпоха, когда искусственные интеллектуальные помощники заменят человеческий труд, вот-вот наступит.

Функция голосового вывода и рассуждений. Эта функция была полностью обновлена в Figure 02.

Figure 02 оснащен микрофоном и динамиком, и с помощью OpenAI реализует голосовой диалог и рассуждения.

В технической статье, опубликованной основателем Бреттом Адкоком, описывается процесс превращения ChatGPT в робота Figure 02:

Пользователь вводит голос, Figure 02 преобразует голос в текстовое сообщение, а ### 6 новых RGB-камер дают роботу сверхчеловеческое зрение, способное принимать визуальную информацию. Оба типа информации передаются ChatGPT для обработки.

Информация, обработанная ИИ, передается пользователю в виде голоса и направляет действия робота.

Недостаточно просто дать обратную связь, при фактическом выполнении необходимо работать в сочетании с визуальной моделью. В противном случае возникнет ситуация, когда робот, готовящий еду, разольет все содержимое сковороды на пол. Figure 02 немало поработал над этим.

Адкок объясняет, что ### Figure 02 имеет встроенную визуально-языковую модель (VLM), которая работает в сочетании с 6 камерами, позволяя роботу выполнять семантические основы и быстрые здравые визуальные рассуждения.

Эта функция в полной мере проявилась в сотрудничестве с BMW.

В январе этого года Figure AI объявила о подписании коммерческого соглашения с BMW Manufacturing Co., LLC о развертывании универсальных роботов в производственном процессе автомобилей. В рекламном ролике Figure 02 также уделяется много внимания демонстрации того, как Figure 02 использует визуально-языковую модель для выполнения точной работы по сборке деталей на заводе BMW.

Кроме того, по сравнению с предыдущим поколением, способность к рассуждениям ИИ увеличилась в 3 раза. В рекламном ролике Figure 02 даже дополнительно устанавливает детали, которые не были правильно установлены.

Помимо этого, больше всего людей интересует улучшение "рук" робота.

Мы можем легко считать от 1 до 10 на пальцах. Но такой простой жест для робота - непосильная задача. Когда был выпущен тизер, внимание всех привлекли руки четвертого поколения.

На этот раз ### руки четвертого поколения Figure 02 имеют 16 степеней свободы.

Число "16" означает, что на 5 пальцах есть 3 сустава на каждом пальце, всего 15 суставов, плюс 1 запястный сустав, всего 16 суставов, которые могут свободно двигаться. Эта технология на шаг приблизилась к человеческой руке с 22 степенями свободы.

Кроме того, руки Figure 02 обладают силой, сопоставимой с человеческой, и могут выдерживать вес до 25 кг, что делает их более подходящими для практических сценариев. Некоторые пользователи опубликовали сравнение между 01 и 02, и с увеличением степеней свободы движения рук выглядят намного точнее.

Есть и другие обновления, например, емкость аккумулятора увеличилась на 50% по сравнению с предыдущим поколением, теперь Figure 02 может работать 20 часов в день.

Проводка также была переработана, интегрированная проводка для питания и вычислений теперь использует скрытые провода, обеспечивая более плотную упаковку и повышенную надежность.

Экзоскелет робота был переработан для баланса между жесткостью конструкции и защитой от ударных нагрузок. Конечно, эти изменения также привели к тому, что вес Figure 02 достиг 70 кг, что на 10 кг больше, чем у 01.

"Самый мощный" робот на Земле?

Всего через 3 часа после выпуска Figure 02 привлек внимание 500 000 пользователей сети.

Многие пользователи выразили удивление: "Невозможно представить, что произойдет через 20 лет!" "2024 год определенно год роботов!"

Джим Фан, старший научный сотрудник NVIDIA и руководитель направления воплощенного интеллекта, также сразу же выразил похвалу, заявив: "Улучшение степеней свободы рук четвертого поколения определенно правильный выбор".

Как и Джим Фан, многие пользователи сети были поражены плавностью движений рук.

На самом деле, появление рук четвертого поколения является результатом настойчивости основателя Адкока.

"Мы выбрали создание человекоподобных роботов, потому что нынешний мир построен вокруг человеческой деятельности, все стандарты адаптированы к физиологическим условиям человека", - объяснил Адкок в интервью, почему он настаивает на создании хороших человекоподобных роботов.

Только приближаясь ко всему "человеческому", можно лучше служить людям и избавить их от ненужной работы.

Его мышление совпадает с мышлением большинства пользователей сети - "Цель ИИ не в том, чтобы писать стихи и рисовать картины, а в том, чтобы мыть за меня посуду и стирать одежду, чтобы у меня было время писать стихи и рисовать картины".

От определения направления ИИ до того, чтобы стать лидером отрасли, Адкоку потребовалось всего 2 года.

Эта компания по ИИ была основана только в 2022 году. Такое стремительное развитие стало возможным благодаря дальновидности Адкока.

До того, как собрать почти 700 миллионов для Figure AI, он основал компанию по разработке программного обеспечения и компанию по производству летательных аппаратов, продажа первой принесла Адкоку "первый горшок золота". Вторая также успешно вышла на биржу.

С наступлением эры ИИ Адкок, как и многие другие, решил "полностью погрузиться в ИИ". Но в отличие от других, имея опыт двух успешных предприятий, процесс создания Figure AI прошел гладко, как будто у него был золотой ключ.

Как неоспоримый "новый богач Кремниевой долины", за Figure AI стоят совместные инвестиции таких гигантов, как Безос (основатель Amazon), OpenAI, NVIDIA и других, и в настоящее время оценка Figure AI достигает 2,6 миллиарда долларов (около 18,6 миллиарда юаней).

Figure AI также оправдывает ожидания, его продукт Figure01 является первым в мире коммерчески жизнеспособным автономным человекоподобным роботом.

Спустя 18 месяцев Figure 02 официально выпущен сегодня. Официально его называют "самым передовым ИИ-оборудованием в мире".

Однако, где есть цветы, там обязательно будут и сомнения.

Некоторые пользователи сети опубликовали демонстрационное видео конкурента Tesla Optimus, заявляя, что эти улучшения Tesla делала 7 месяцев назад, как же Figure 02 стал "самым передовым"?

"Заклятый враг" Optimus

На самом деле, как два самых обсуждаемых проекта воплощенного интеллекта в технологическом мире, споры между Figure AI и Tesla Optimus продолжаются с самого начала.

Еще год назад, когда был выпущен тизер Figure01, некоторые пользователи сети шутили: "Робот Tesla называется Оптимус Прайм (Optimus), тогда твой должен называться Мегатрон".

При выпуске Figure 02 некоторые пользователи сети с нетерпением заявили: "Уже не могу дождаться, чтобы увидеть битву Figure 02 против Optimus Gen 2!"

Более того, в команде самого Адкока есть немало сотрудников, пришедших из Tesla.

Адкок не стал специально отвечать на тот комментарий с сомнениями, кажется, он никогда не беспокоился о конкуренции с Optimus.

Хотя за Optimus стоит "большое дерево" Tesla, которое обеспечивает широкие данные для обучения и обильные исследовательские фонды, Figure AI сама по себе также может считаться "не нуждающейся в пропитании".

Не только имея большие средства, но и в плане коммерческого сотрудничества Figure AI также "многообещающа". Сотрудничество с BMW в настоящее время находится на первом этапе, роботы Figure будут применяться на начальных этапах производства автомобилей. После завершения первого этапа BMW продолжит глубокое сотрудничество с ними, совместно исследуя передовые технологические темы, такие как искусственный интеллект, управление роботами, виртуализация производства и интеграция роботов.

Optimus в настоящее время также используется на заводах Tesla. Оба лидера в области воплощенного интеллекта мчатся по своим путям.

Что касается того, кто является "самым передовым ИИ-оборудованием в мире", этот вопрос не стоит обсуждать. Названия не исчезнут, но будут переходить. В быстро развивающейся индустрии ИИ следующий технологический лидер, возможно, уже ждет своего выхода на сцену.