*"Проект под кодовым названием "Клубника" в последнее время привлек широкое внимание. Аккаунт под названием "Клубничный брат" постоянно продвигал соответствующую информацию, вызывая ожидания и разочарования.
Недавно основатель стартапа AI-агентов MultiOn заявил, что они выпустили нового интеллектуального агента Agent Q, который управляет аккаунтом "Клубничный брат", и пригласил пользователей попробовать его онлайн. Этот маркетинговый ход смутил многих людей, так как многие ждали важных новостей от OpenAI.
MultiOn утверждает, что Agent Q - это революционный AI-агент, сочетающий такие технологии, как поиск по методу Монте-Карло (MCTS) и самокритику. Утверждается, что его производительность в 3,4 раза превышает базовую производительность LLama 3 с нулевым выстрелом, а успешность в оценке реальных сценариев достигает 95,4%.
Agent Q может выполнять такие задачи, как бронирование столиков в ресторанах и авиабилетов. Однако интернет-пользователи не купились на это и больше беспокоились о том, не использует ли MultiOn аккаунт "Клубничный брат" для хайпа.
Статья об Agent Q была опубликована, и основные компоненты включают:
- Использование MCTS для управляемого поиска
- AI самокритика
- Прямая оптимизация предпочтений (DPO)
Исследователи изучили, как наделить агента дополнительными поисковыми возможностями с помощью MCTS, формулируя выполнение веб-агента как поиск по веб-дереву.
Результаты экспериментов показали, что после применения MCTS успешность базовой модели увеличилась с 28,6% до 48,4%. После дальнейшей настройки производительность Agent Q достигла 50,5%, немного превысив средний показатель человека.
Несмотря на то, что технические детали привлекают внимание, маркетинговые методы MultiOn вызвали споры, и некоторые интернет-пользователи назвали их "бесстыжими мошенниками".