Musk xAI lance un nouveau modèle : progrès significatifs mais pas encore en position de leader

"Les progrès de Grok sont fulgurants." Musk a annoncé avec enthousiasme l'arrivée de Grok-2 sur X.

Le 14 août, heure locale, xAI a lancé les versions bêta de deux modèles d'IA, Grok-2 et Grok-2mini. Grok-2 est le modèle de langage le plus puissant de l'entreprise en termes de capacité de raisonnement, tandis que Grok-2mini, un modèle allégé, est le "produit frère" de Grok-2, visant à offrir des fonctionnalités puissantes avec un nombre réduit de paramètres.

xAI a déclaré dans un article de blog que la version préliminaire de Grok-2 représente une avancée majeure par rapport à Grok-1.5, avec des capacités de pointe en matière de conversation, de codage et de raisonnement.

L'entreprise affirme qu'une version précoce de Grok-2, testée sous le nom "sus-column-r", a surpassé Claude 3.5 Sonnet d'Anthropic et GPT-4-Turbo d'OpenAI sur le classement LMSYS. Ce classement est établi en organisant des "duels" aléatoires et anonymes entre grands modèles de langage, basés sur le système de notation ELO.

sus-column-r (version précoce de Grok 2) est désormais public et, avec plus de 12000 votes de la communauté, a obtenu la 3e place au classement général, à égalité avec GPT-4o. Il s'est classé 2e en codage, 4e pour les prompts difficiles, et 2e en mathématiques.

xAI a également testé les performances de Grok en interaction avec de nouveaux modèles via un système de tutorat IA. Grok-2 a été évalué sur deux domaines clés : le respect des instructions et la fourniture d'informations précises et véridiques. Grok-2 a montré des progrès significatifs dans le raisonnement sur les contenus récupérés et l'utilisation d'outils, comme l'identification correcte d'informations manquantes, le raisonnement à travers des séquences d'événements et l'élimination de posts non pertinents.

De plus, xAI a évalué le modèle Grok-2 sur une série de références académiques, incluant le raisonnement, la compréhension de lecture, les mathématiques, les sciences et le codage. L'entreprise affirme que "ses performances sont comparables à celles d'autres modèles de pointe dans des domaines tels que les connaissances scientifiques de niveau universitaire, le sens commun et les problèmes de concours mathématiques."

Musk lie étroitement xAI à "X", le réseau social qu'il a acquis - Grok-2 et Grok-2mini soutiendront les fonctionnalités de recherche améliorée, l'approfondissement des posts et l'amélioration des réponses sur X, bien que xAI ait précédemment fait l'objet de critiques pour avoir utilisé les données des utilisateurs de X pour l'entraînement.

Un point fort de cette mise à jour est que le modèle Grok-2 peut générer des images sur X, utilisant le modèle Flux.1 récemment populaire, mais actuellement limité aux utilisateurs Premium et Premium+ sur X.

Comme la fonction de génération d'images de Grok n'a aucune restriction, de nombreux utilisateurs l'ont utilisée pour créer des images de personnalités politiques. Par exemple, un utilisateur a généré une image de George Washington, le premier président américain, et ce post a été partagé par Musk. Cependant, ChatGPT d'OpenAI refuserait de générer ce type d'images pour éviter les risques politiques.

Il est à noter que Grok-2 et Grok-2mini sont encore en phase de test. L'entreprise prévoit de rendre ces deux modèles disponibles aux développeurs via son API d'entreprise plus tard ce mois-ci. L'API à venir est construite sur une nouvelle pile technologique personnalisée, permettant un déploiement d'inférence multi-régions pour un accès mondial à faible latence, tout en offrant des fonctionnalités de sécurité améliorées telles que l'authentification multifactorielle obligatoire, les statistiques de trafic et l'analyse avancée de la facturation.

Après s'être séparé d'OpenAI, Musk a prédit que l'intelligence artificielle générale serait réalisée d'ici 2029, et xAI, qu'il a fondé, a pour objectif ultime de rendre les produits d'IA accessibles aux consommateurs, aux entreprises et même à tous, devenant ainsi des outils utiles. Il espère utiliser l'IA pour aider les gens à résoudre des problèmes scientifiques et mathématiques complexes et à "comprendre" l'univers.

Les mouvements de xAI s'accélèrent constamment. L'entreprise a réalisé sa première levée de fonds de 135 millions de dollars en janvier 2024 ; en mai, elle a complété un tour de financement de série B de 6 milliards de dollars, faisant passer sa valorisation de 18 milliards à 25 milliards de dollars, devenant ainsi une autre licorne de l'IA aux États-Unis.

En juillet, Musk a déclaré que l'équipe de xAI avait commencé l'entraînement sur le "supercluster Memphis". Ce cluster est composé de 100 000 GPU H100 refroidis par liquide, avec l'objectif d'entraîner "l'IA la plus puissante au monde selon chaque métrique" avant décembre de cette année.

Son ambition ne s'arrête pas là, il a révélé que xAI prévoit de construire une "super-usine de puissance de calcul", un superordinateur dont la taille devrait être quatre fois supérieure à celle de son concurrent le plus puissant sur le marché.

En tant que "nouveau venu" dans le domaine des grands modèles, Musk pense que xAI peut apporter de nouvelles percées et innovations dans le domaine de l'intelligence artificielle, tout en soulignant que la concurrence est bénéfique pour faire progresser l'ensemble de l'industrie et éviter un monde unipolaire où une seule entreprise dominerait le domaine de l'IA.

Cependant, à en juger par les deux derniers modèles publiés, ils n'ont pas démontré d'innovation dépassant l'industrie et restent dans un rôle de rattrapage. Pour que Grok-2 se démarque dans la compétition avec OpenAI, Google et d'autres géants technologiques, il faudra présenter des produits plus puissants.

Musk xAI lance un nouveau modèle : progrès significatifs mais pas encore en position de leader

La fonction de génération d'images de Grok n'a pas de restrictions, ce qui permet aux utilisateurs de créer librement des images de personnalités politiques, tandis que ChatGPT refuse de générer ce type de contenu.