Un modelo anónimo con el código sus-column-r ha mostrado recientemente un rendimiento sobresaliente en la arena de los grandes modelos, generando muchas especulaciones. Ayer, Musk finalmente reveló el misterio: este es el nuevo modelo Grok2 que xAI lanzará próximamente.
Grok2 ha mostrado un buen desempeño en los datos de competencia oficialmente publicados, logrando altas tasas de victoria contra otros modelos principales como GPT-4o y Claude 3.5 Sonnet, excepto contra Gemini 1.5 Pro de Google. En varias pruebas de referencia, las capacidades de Grok2 también son comparables a las de los modelos de IA de primer nivel.
Una gran mejora de Grok2 es la adición de funcionalidades de imagen, implementadas en colaboración con FLUX.1. Las pruebas han revelado que Grok2 es más audaz en la generación de imágenes, pudiendo producir contenido controvertido como parodias de figuras públicas. Esto podría conllevar algunos riesgos legales.
En el uso práctico, Grok2 se desempeña bien en algunas preguntas básicas, como comparaciones de decimales y conteo, que son problemas comunes en los que la IA suele equivocarse. Sus respuestas suelen ser bastante detalladas. Sin embargo, en preguntas que requieren una comprensión más profunda, GPT-4o aún tiene ventaja.
En general, Grok2 ha demostrado una mejora significativa en sus capacidades, especialmente en áreas como las matemáticas. Sin embargo, todavía tiene brechas en comparación con otros modelos de IA de primer nivel y necesita más mejoras. Este lanzamiento muestra la ambición y el progreso de xAI en el campo de la IA.