Глобальный хедж-фонд высшего уровня Coatue недавно опубликовал важный отчет о "воплощенном интеллекте" под названием "Путь к роботам общего назначения".
Coatue считает, что ИИ-роботы являются разрушительной силой, которая может стать одной из крупнейших технологических волн в истории человечества и заслуживает пристального внимания.
Этот отчет содержит много интересных моментов, не только подробно анализируя проблемы, с которыми сталкиваются ИИ-роботы на текущем этапе, но также дает разумный прогноз развития отрасли и профессиональные советы с инвестиционной точки зрения. Независимо от того, являетесь ли вы технологическим инвестором, специалистом по ИИ или просто интересуетесь роботами, этот отчет стоит прочитать.
Ниже я расскажу вам об этом большом отчете. Ссылка на отчет находится в конце статьи, приглашаю заинтересованных друзей прочитать оригинал.
(1) Идеал пышный, реальность скудна
Робототехника, возможно, является одной из отраслей с наибольшим разрывом между демонстрацией и реальностью.
В 1961 году первый промышленный робот был создан в GM для использования на автомобильной производственной линии.
После более чем 50 лет развития форма роботов стала более разнообразной, а функциональные сценарии обогатились, появились роботы-пылесосы, четвероногие роботы, человекоподобные роботы и т.д.
Исторически сложилось так, что проникновение роботов на самом деле увеличивалось линейно.
Например, в промышленной робототехнике количество роботов на 10 000 производственных рабочих увеличилось с 53 в 2013 году до 151 в 2022 году, при среднегодовом темпе роста 12%.
Хотя развитие робототехнической отрасли в целом стабильно и позитивно, показатели конкретных компаний не оправдали ожиданий.
Компании, занимающиеся робототехникой, обычно сталкиваются с трудностями в коммерциализации, а также с огромными капитальными затратами на ранних этапах, в результате чего в 2022-2023 годах обанкротилось большое количество робототехнических компаний.
(2) Пространственный интеллект делает возможным создание универсальных роботов
Роботы предыдущего поколения в основном выполняли определенные одиночные задачи, например, роботы-пылесосы отвечали только за уборку, сельскохозяйственные беспилотники - только за орошение полей, промышленные роботы - только за механическую сварку и т.д.
Однако с появлением обобщенного ИИ следующее поколение роботов может стать "универсальными роботами", способными справляться с различными задачами и средами.
Подобно тому, как большие языковые модели сделали возможным языковое рассуждение, большие пространственные модели могут прорвать четвертую стену, позволяя ИИ по-настоящему понимать физический мир и взаимодействовать с ним.
(3) Ключевая проблема, стоящая перед роботами: отсутствие обучающих данных
Задачи, которые кажутся простыми для людей, могут быть не такими легкими для роботов.
Coatue привел три конкретных примера.
Ловкость:
Способность пространственного восприятия:
Способность восстанавливать равновесие:
Чтобы преодолеть эти проблемы, необходимо обучение на огромных объемах данных, чтобы сделать роботов более умными.
Однако робототехника - это очень новая область, в которой серьезно не хватает накопленных обучающих данных.
Сравнивая крупнейшие наборы данных в разных модальностях, текстовая модальность имеет около 15T токенов, модальность изображений имеет 6B пар изображение-текст, видео модальность имеет 2.6B аудиовизуальных характеристик.
Однако в робототехнической модальности есть только 2.4 миллиона фрагментов данных, что намного меньше по сравнению с другими модальностями.
(4) Четыре способа сбора обучающих данных для роботов
Поскольку данные являются ключевым узким местом в развитии робототехники, какие методы можно использовать для быстрого накопления обучающих данных для роботов?
В последние годы исследования в этой области процветают, постепенно формируя четыре школы мысли.
Метод сбора данных для роботов 1: Телеоперация
Как следует из названия, экспериментаторы управляют механическими рукоятками для дистанционного управления роботами, чтобы выполнять те же действия, тем самым накапливая данные.
Метод сбора данных для роботов 2: AR
В исследовании под названием "Объяснимое обучение и сотрудничество человека и робота с дополненной реальностью" исследователи использовали технологию AR (дополненной реальности), чтобы сделать процесс взаимодействия человека и машины более объяснимым, тем самым накапливая данные.
Метод сбора данных для роботов 3: Симуляция
Используя огромные вычислительные мощности для моделирования, можно вычислить огромные наборы обучающих данных для роботов.
Симуляция может быть наиболее вероятным путем для масштабной генерации данных в настоящее время, что требует огромной вычислительной поддержки.
В настоящее время команда Джима Фана из Nvidia следует этому технологическому пути.
Метод сбора данных для роботов 4: Обучение по видео
С помощью мультимодальных больших моделей роботы могут напрямую учиться человеческим действиям через видео, тем самым накапливая обучающие данные.
(5) Золотое пересечение стоимости роботов и заработной платы людей
По мере снижения стоимости GPU стоимость обучения больших моделей значительно снизилась.
За последний год стоимость аренды графического процессора A100 на облачной платформе Azure снизилась с 6 долларов в час до 1,5 долларов в час, что составляет снижение на 75%.