OpenAI "клубничный" информатор подозревается в использовании ИИ: стартап AgentQ из Стэнфорда вызывает споры

*"Проект под кодовым названием "Клубника" в последнее время привлек широкое внимание. Аккаунт под названием "Клубничный брат" постоянно продвигал соответствующую информацию, вызывая ожидания и разочарования.

Недавно основатель стартапа AI-агентов MultiOn заявил, что они выпустили нового интеллектуального агента Agent Q, который управляет аккаунтом "Клубничный брат", и пригласил пользователей попробовать его онлайн. Этот маркетинговый ход смутил многих людей, так как многие ждали важных новостей от OpenAI.

MultiOn утверждает, что Agent Q - это революционный AI-агент, сочетающий такие технологии, как поиск по методу Монте-Карло (MCTS) и самокритику. Утверждается, что его производительность в 3,4 раза превышает базовую производительность LLama 3 с нулевым выстрелом, а успешность в оценке реальных сценариев достигает 95,4%.

Agent Q может выполнять такие задачи, как бронирование столиков в ресторанах и авиабилетов. Однако интернет-пользователи не купились на это и больше беспокоились о том, не использует ли MultiOn аккаунт "Клубничный брат" для хайпа.

Статья об Agent Q была опубликована, и основные компоненты включают:

Использование MCTS для управляемого поиска
AI самокритика
Прямая оптимизация предпочтений (DPO)

Исследователи изучили, как наделить агента дополнительными поисковыми возможностями с помощью MCTS, формулируя выполнение веб-агента как поиск по веб-дереву.

Результаты экспериментов показали, что после применения MCTS успешность базовой модели увеличилась с 28,6% до 48,4%. После дальнейшей настройки производительность Agent Q достигла 50,5%, немного превысив средний показатель человека.

Несмотря на то, что технические детали привлекают внимание, маркетинговые методы MultiOn вызвали споры, и некоторые интернет-пользователи назвали их "бесстыжими мошенниками".

OpenAI "клубничный" информатор подозревается в использовании ИИ: стартап AgentQ из Стэнфорда вызывает споры

*"Эволюционировал в агента искусственного интеллекта Agent Q.