*"草莓"代号项目近期受到广泛关注。一个名为"草莓哥"的账号不断宣传相关信息,引发期待和失望。
最近,AI智能体初创公司MultiOn的创始人声称他们发布了操控"草莓哥"账号的全新智能体Agent Q,邀请用户在线体验。这一营销操作让许多人感到困惑,因为很多人一直在等待OpenAI的重大消息。
MultiOn宣称Agent Q是一款突破性的AI智能体,结合了蒙特卡洛树搜索(MCTS)和自我批评等技术。据称其性能是LLama 3基线零样本性能的3.4倍,在真实场景任务评估中成功率达95.4%。
Agent Q可以执行预订餐厅座位、预订航班等任务。然而,网友对此并不买账,更关心MultiOn是否借"草莓哥"账号炒作。
Agent Q的相关论文已发布,主要组件包括:
- 使用MCTS进行引导式搜索
- AI自我批评
- 直接偏好优化(DPO)
研究者探索了如何通过MCTS赋予智能体额外的搜索能力,将网页智能体执行公式化为网页树搜索。
实验结果显示,应用MCTS后,基础模型的成功率从28.6%提升到48.4%。进一步微调后,Agent Q的性能达到50.5%,略微超过人类平均表现。
尽管技术细节引人关注,但MultiOn的营销手法引发争议,部分网友称其为"无耻的骗子"。