Разделение направлений крупных моделей ИИ
В настоящее время большинство компаний используют ИИ, применяя универсальные языковые модели, которые после обучения на отраслевых данных называются дифференцированными приложениями. Однако это может быть уловкой. Майк Кнооп, соучредитель Zapier, считает, что расширение языковых моделей по сути может способствовать развитию только такой формы интеллекта, как "память", что отличается от интеллекта. Она не может понять сценарии и потребности бизнеса, и поэтому не может полностью реализовать ценность ИИ.
Кроме того, кривая увеличения вычислительной мощности GPU и улучшения возможностей языковых моделей может иметь убывающую предельную отдачу. Когда открытые простые данные будут исчерпаны, мечта о прорыве в области ИИ с помощью универсальных языковых моделей станет иллюзией.
Это еще более невыгодно для предприятий. Компании часто ставят телегу впереди лошади в погоне за новыми технологиями, изначально стремясь решить конкретные проблемы, но в итоге превращая это в погоню за концепциями, забывая о самых фундаментальных вопросах.
Решение этой проблемы находится в руках ИИ-компаний. Сара Тавель, партнер Benchmark, считает, что лучшее направление развития - это создание крупных моделей на основе конкретных потребностей клиентов. Алекс Ванг, соучредитель Scale AI, считает, что узким местом в производительности моделей ИИ являются данные, а не алгоритмы или вычисления. Данные в конечном итоге поступают из нескольких вертикальных отраслей, что означает, что ИИ-компании должны углубиться в отраслевые области и разработать отраслевые крупные модели, отвечающие потребностям предприятий.
В этом процессе есть два ключевых момента:
-
Проблема данных: ИИ-компаниям необходимо "понять" пользователей и отрасль. Многие компании обладают большим количеством недостаточно используемых данных.
-
Проблема управления и итерации: из-за разнообразия отраслей и сценариев в настоящее время трудно поддерживать одну компанию, охватывающую все области для создания крупных моделей.
Fourth Paradigm и Майк Кнооп из Zapier указывают на автоматизацию как на ключевой фактор. С технической точки зрения, AutoML, программный синтез и поиск нейронной архитектуры - все это включает процессы автоматизации и оптимизации для уменьшения человеческого вмешательства и повышения эффективности и результативности. Майк Кнооп считает, что исследование AGI должно основываться на программном синтезе и поиске нейронной архитектуры, в то время как Дай Вэньюань, основатель Fourth Paradigm, упоминает, что базовой технологией для создания бесчисленных отраслевых крупных моделей является AutoML.
Дай Вэньюань называет AutoML "искусством неудачи", которое может принести большую пользу, потому что Fourth Paradigm прошла через множество сценариев и знает, как приблизить данные и модели к потребностям конкретных сценариев. Успехи превращаются в достижения, а неудачи - в питательную среду, ускоряя итерации на основе автоматизации. Как говорит Алекс Ванг: "Машинное обучение - это структура мусор на входе, мусор на выходе". Но с высококачественными отраслевыми данными и постоянной способностью исправлять ошибки в конечном итоге будет достигнуто надежное внедрение отраслевых крупных моделей.
Создание различных моделей ИИ: идеи, подходы и перспективы
Некоторые компании, такие как OpenAI, которые фокусируются на универсальных крупных моделях, развиваются горизонтально, где крупная модель - это все. С точки зрения бизнес-модели, они просто продают возможности крупных моделей. В отличие от них, такие компании, как Fourth Paradigm и Glean, идут по другому пути, используя технологии ИИ для помощи предприятиям в принятии решений в определенных областях для повышения общей эффективности работы. Их бизнес-модели также отличаются.
Glean предоставляет платформу для корпоративного поиска и управления знаниями на основе технологий ИИ, интегрируя функции нескольких сторонних приложений и становясь частью рабочего процесса. Она также может помочь предприятиям обучать собственные модели ИИ на основе своих данных, основываясь на "модели доверенных знаний", разработанной Glean.
Fourth Paradigm идет еще дальше в прогнозировании и управлении ключевыми бизнес-вопросами в отрасли. Их платформа отраслевых крупных моделей AIOS 5.0 строит базовые отраслевые модели на основе мультимодальных данных из различных отраслевых сценариев. На уровне возможностей она фокусируется на "Predict the Next X", где X представляет логику и результаты различных крупных отраслей. На уровне использования она предоставляет инструменты моделирования с низким порогом входа, систему инновационных услуг для ученых и другие возможности, реализуя сквозное построение, развертывание и управление отраслевыми крупными моделями.
Это типичный пример развития китайской ИИ-компании на основе промышленного фона. Дай Вэньюань считает, что у Китая есть преимущество в большом количестве сценариев и данных, и после охвата достаточного количества сценариев объединение этих моделей может также привести к реализации AGI. В отличие от этого, многие популярные отраслевые крупные модели все еще являются отраслевыми языковыми моделями, большими, но не точными. После разделения на более точные сценарии, хотя на поверхности кажется, что нужно создать много крупных моделей, объем данных для каждого точного сценария ограничен, и с помощью технологий автоматизации это фактически открывает новый путь для развития AGI на уровне приложений.
Майк Кнооп считает, что AGI столкнулся с препятствиями после стремительного прогресса из-за чрезмерной зависимости от языковых моделей, определяя AGI как систему, способную выполнять большинство задач. Но на самом деле AGI должен больше фокусироваться на эффективном приобретении новых способностей и решении открытых проблем в различных сценариях.
Дженсен Хуанг, генеральный директор NVIDIA, упомянул, что с развитием крупных моделей компьютеры переходят от управления инструкциями к управлению намерениями, "будущие приложения будут делать и выполнять вещи так же, как мы это делаем, собирая команды экспертов, используя инструменты, рассуждая, планируя и выполняя наши задачи". Эта логика сама по себе подразумевает универсальность, крупные модели входят в физический мир, потому что принятие решений в физическом мире также имеет свои закономерности.
Подобный пример - Palantir, изначально компания по работе с большими данными для государственного сектора, основанная на анализе данных и моделировании для поддержки принятия решений. Технология генеративного ИИ изменила способ обработки данных, значительно улучшив автоматизацию и принятие решений на основе данных, ускорив развитие бизнеса ИИ для предприятий. Fourth Paradigm, в свою очередь, создает отраслевые крупные модели в каждом определенном сценарии, помогая предприятиям овладеть своими приложениями и принимать эффективные решения.