*"El proyecto con nombre en clave "Fresa" ha recibido recientemente una amplia atención. Una cuenta llamada "Hermano Fresa" ha estado promocionando constantemente información relacionada, generando expectativas y decepciones.
Recientemente, el fundador de la startup de agentes de IA MultiOn afirmó que habían lanzado un nuevo agente llamado Agent Q que controlaba la cuenta "Hermano Fresa", invitando a los usuarios a experimentarlo en línea. Esta maniobra de marketing confundió a muchas personas, ya que muchos habían estado esperando noticias importantes de OpenAI.
MultiOn afirma que Agent Q es un agente de IA revolucionario que combina tecnologías como la búsqueda de árbol de Monte Carlo (MCTS) y la autocrítica. Supuestamente, su rendimiento es 3.4 veces superior al rendimiento de cero disparos de la línea base LLama 3, con una tasa de éxito del 95.4% en evaluaciones de tareas en escenarios reales.
Agent Q puede realizar tareas como reservar mesas en restaurantes y vuelos. Sin embargo, los internautas no están convencidos y están más preocupados por si MultiOn está utilizando la cuenta "Hermano Fresa" para generar publicidad.
Se ha publicado un artículo relacionado con Agent Q, cuyos principales componentes incluyen:
- Búsqueda guiada utilizando MCTS
- Autocrítica de IA
- Optimización directa de preferencias (DPO)
Los investigadores exploraron cómo dotar a los agentes de capacidades de búsqueda adicionales a través de MCTS, formulando la ejecución de agentes web como una búsqueda de árbol web.
Los resultados experimentales muestran que después de aplicar MCTS, la tasa de éxito del modelo base aumentó del 28.6% al 48.4%. Después de un ajuste fino adicional, el rendimiento de Agent Q alcanzó el 50.5%, ligeramente superior al rendimiento humano promedio.
Aunque los detalles técnicos son intrigantes, las tácticas de marketing de MultiOn han generado controversia, con algunos internautas llamándolos "estafadores descarados".