Пространственные большие модели: ключевой двигатель универсальных роботов - анализ отчета Coatue

Тенденция воплощения ИИ набирает обороты, умные роботы вступают в новую эру.

Глобальный хедж-фонд высшего уровня Coatue недавно опубликовал важный отчет о "воплощенном интеллекте" под названием "Путь к роботам общего назначения".

Coatue считает, что ИИ-роботы являются разрушительной силой, которая может стать одной из крупнейших технологических волн в истории человечества и заслуживает пристального внимания.

Этот отчет содержит много интересных моментов, не только подробно анализируя проблемы, с которыми сталкиваются ИИ-роботы на текущем этапе, но также дает разумный прогноз развития отрасли и профессиональные советы с инвестиционной точки зрения. Независимо от того, являетесь ли вы технологическим инвестором, специалистом по ИИ или просто интересуетесь роботами, этот отчет стоит прочитать.

Ниже я расскажу вам об этом большом отчете. Ссылка на отчет находится в конце статьи, приглашаю заинтересованных друзей прочитать оригинал.

(1) Идеал пышный, реальность скудна

Робототехника, возможно, является одной из отраслей с наибольшим разрывом между демонстрацией и реальностью.

В 1961 году первый промышленный робот был создан в GM для использования на автомобильной производственной линии.

После более чем 50 лет развития форма роботов стала более разнообразной, а функциональные сценарии обогатились, появились роботы-пылесосы, четвероногие роботы, человекоподобные роботы и т.д.

Исторически сложилось так, что проникновение роботов на самом деле увеличивалось линейно.

Например, в промышленной робототехнике количество роботов на 10 000 производственных рабочих увеличилось с 53 в 2013 году до 151 в 2022 году, при среднегодовом темпе роста 12%.

Хотя развитие робототехнической отрасли в целом стабильно и позитивно, показатели конкретных компаний не оправдали ожиданий.

Компании, занимающиеся робототехникой, обычно сталкиваются с трудностями в коммерциализации, а также с огромными капитальными затратами на ранних этапах, в результате чего в 2022-2023 годах обанкротилось большое количество робототехнических компаний.

(2) Пространственный интеллект делает возможным создание универсальных роботов

Роботы предыдущего поколения в основном выполняли определенные одиночные задачи, например, роботы-пылесосы отвечали только за уборку, сельскохозяйственные беспилотники - только за орошение полей, промышленные роботы - только за механическую сварку и т.д.

Однако с появлением обобщенного ИИ следующее поколение роботов может стать "универсальными роботами", способными справляться с различными задачами и средами.

Подобно тому, как большие языковые модели сделали возможным языковое рассуждение, большие пространственные модели могут прорвать четвертую стену, позволяя ИИ по-настоящему понимать физический мир и взаимодействовать с ним.

(3) Ключевая проблема, стоящая перед роботами: отсутствие обучающих данных

Задачи, которые кажутся простыми для людей, могут быть не такими легкими для роботов.

Coatue привел три конкретных примера.

Ловкость:

Способность пространственного восприятия:

Способность восстанавливать равновесие:

Чтобы преодолеть эти проблемы, необходимо обучение на огромных объемах данных, чтобы сделать роботов более умными.

Однако робототехника - это очень новая область, в которой серьезно не хватает накопленных обучающих данных.

Сравнивая крупнейшие наборы данных в разных модальностях, текстовая модальность имеет около 15T токенов, модальность изображений имеет 6B пар изображение-текст, видео модальность имеет 2.6B аудиовизуальных характеристик.

Однако в робототехнической модальности есть только 2.4 миллиона фрагментов данных, что намного меньше по сравнению с другими модальностями.

(4) Четыре способа сбора обучающих данных для роботов

Поскольку данные являются ключевым узким местом в развитии робототехники, какие методы можно использовать для быстрого накопления обучающих данных для роботов?

В последние годы исследования в этой области процветают, постепенно формируя четыре школы мысли.

Метод сбора данных для роботов 1: Телеоперация

Как следует из названия, экспериментаторы управляют механическими рукоятками для дистанционного управления роботами, чтобы выполнять те же действия, тем самым накапливая данные.

Метод сбора данных для роботов 2: AR

В исследовании под названием "Объяснимое обучение и сотрудничество человека и робота с дополненной реальностью" исследователи использовали технологию AR (дополненной реальности), чтобы сделать процесс взаимодействия человека и машины более объяснимым, тем самым накапливая данные.

Метод сбора данных для роботов 3: Симуляция

Используя огромные вычислительные мощности для моделирования, можно вычислить огромные наборы обучающих данных для роботов.

Симуляция может быть наиболее вероятным путем для масштабной генерации данных в настоящее время, что требует огромной вычислительной поддержки.

В настоящее время команда Джима Фана из Nvidia следует этому технологическому пути.

Метод сбора данных для роботов 4: Обучение по видео

С помощью мультимодальных больших моделей роботы могут напрямую учиться человеческим действиям через видео, тем самым накапливая обучающие данные.

(5) Золотое пересечение стоимости роботов и заработной платы людей

По мере снижения стоимости GPU стоимость обучения больших моделей значительно снизилась.

За последний год стоимость аренды графического процессора A100 на облачной платформе Azure снизилась с 6 долларов в час до 1,5 долларов в час, что составляет снижение на 75%.