"El progreso de Grok es como un cohete". Así anunció Musk emocionado la llegada de Grok-2 en X.
El 14 de agosto, hora local, xAI lanzó versiones beta de dos modelos de IA: Grok-2 y Grok-2mini. Grok-2 es el modelo de lenguaje más potente de la compañía en términos de capacidad de razonamiento, mientras que Grok-2mini, un modelo ligero, es el "hermano" de Grok-2, que intenta lograr una funcionalidad potente con un tamaño de parámetros reducido.
xAI afirmó en una publicación de blog que la versión preliminar de Grok-2 representa un avance significativo respecto a Grok-1.5, con capacidades de vanguardia en chat, codificación y razonamiento.
La compañía afirma que una versión temprana de Grok-2, probada bajo el nombre "sus-column-r", superó a Claude 3.5 Sonnet de Anthropic y GPT-4-Turbo de OpenAI en el ranking LMSYS. Este ranking se basa en "batallas" uno a uno anónimas y aleatorias entre modelos de lenguaje grandes, utilizando el sistema de calificación ELO.
sus-column-r (versión temprana de Grok 2) está ahora disponible públicamente y, con más de 12,000 votos de la comunidad, ocupa el tercer lugar en el ranking general, empatando con GPT-4o. Ocupa el segundo lugar en codificación, el cuarto en indicaciones difíciles y el segundo en matemáticas.
xAI también probó la interacción de Grok con nuevos modelos a través de un sistema de tutoría de IA, evaluando las capacidades de Grok-2 en dos áreas clave: seguir instrucciones y proporcionar información precisa y veraz. Grok-2 mostró mejoras significativas en el razonamiento sobre contenido recuperado y el uso de herramientas, como identificar correctamente información faltante, razonar a través de secuencias de eventos y descartar publicaciones irrelevantes.
Además, xAI evaluó el modelo Grok-2 utilizando una serie de puntos de referencia académicos que incluyen razonamiento, comprensión lectora, matemáticas, ciencias y codificación. La compañía afirma que "su desempeño es comparable al de otros modelos de vanguardia en áreas como conocimiento científico de nivel de posgrado, sentido común y problemas de concursos matemáticos".
Musk está vinculando profundamente xAI con la plataforma de redes sociales "X" que adquirió: Grok-2 y Grok-2mini apoyarán las funciones de búsqueda mejorada de X, la comprensión profunda de las publicaciones y las mejoras en las respuestas, aunque xAI ha enfrentado oposición por usar datos de usuarios de X para el entrenamiento.
Un punto destacado de esta actualización es que el modelo Grok-2 puede generar imágenes en X, utilizando el popular modelo Flux.1, aunque actualmente está limitado a usuarios Premium y Premium+ en X.
Dado que la función de generación de imágenes de Grok no tiene restricciones, varios usuarios la han utilizado para crear imágenes de figuras políticas. Por ejemplo, un usuario generó una imagen del primer presidente de Estados Unidos, George Washington, que Musk compartió. Sin embargo, ChatGPT de OpenAI se negaría a generar tales imágenes para evitar riesgos políticos.
Es importante señalar que Grok-2 y Grok-2mini aún están en fase de prueba. La compañía espera poner estos dos modelos a disposición de los desarrolladores a través de su API empresarial a finales de este mes. La próxima API se basa en una nueva pila tecnológica personalizada que permite el despliegue de inferencia en múltiples regiones para un acceso global de baja latencia, al tiempo que ofrece características de seguridad mejoradas como autenticación multifactor obligatoria, estadísticas de tráfico y análisis de facturación avanzados.
Después de separarse de OpenAI, Musk predijo que la inteligencia artificial general se lograría en 2029, y el objetivo final de xAI, que fundó, es hacer que los productos de IA estén disponibles para consumidores, empresas e incluso todos, convirtiéndose en herramientas útiles. Espera usar la IA para ayudar a las personas a resolver problemas científicos y matemáticos complejos y "comprender" el universo.
Los movimientos de xAI se están acelerando constantemente. La compañía realizó su primera ronda de financiación en enero de 2024, recaudando $135 millones; en mayo completó una ronda de financiación Serie B de $6 mil millones, elevando la valoración de la compañía de $18 mil millones a $25 mil millones, convirtiéndola en otro unicornio de IA en los Estados Unidos.
En julio, Musk afirmó que el equipo de xAI había comenzado a entrenar en el "superclúster Memphis". Este clúster consta de 100,000 GPUs H100 enfriadas por líquido, con el objetivo de entrenar "la IA más poderosa del mundo según cada métrica" antes de diciembre de este año.
Sus ambiciones van más allá, habiendo revelado planes de xAI para construir una "superfábrica de potencia computacional", que se espera sea cuatro veces más grande que la del competidor más poderoso del mercado.
Como "recién llegado" en modelos grandes, Musk cree que xAI puede aportar nuevos avances e innovaciones en el campo de la inteligencia artificial, al tiempo que enfatiza que la competencia es beneficiosa para impulsar el progreso de toda la industria, evitando un mundo unipolar donde una sola compañía domine el campo de la IA.
Sin embargo, a juzgar por los dos modelos recién lanzados, no han mostrado innovación que supere a la industria y siguen siendo perseguidores. Para que Grok-2 se destaque en la competencia con OpenAI, Google y otras compañías tecnológicas, necesitará presentar productos más poderosos.