Duel des géants de l'IA : Le robot d'OpenAI peut-il surpasser l'Optimus de Tesla ?

L'ère où les assistants d'intelligence artificielle remplaceront le travail humain est sur le point d'arriver.

Fonction d'inférence de la parole à la parole. Cette fonctionnalité a été entièrement améliorée sur Figure 02.

Figure 02 est équipé d'un microphone et d'un haut-parleur, et grâce à la puissance d'OpenAI, il réalise des conversations vocales et des inférences.

Dans l'article technique publié par le fondateur Brett Adcock, il explique comment Figure 02 transforme ChatGPT en un robot :

L'utilisateur entre une voix, Figure 02 convertit la voix en texte, tandis que ### les 6 nouvelles caméras RGB donnent au robot une vision surhumaine, capable de recevoir des informations visuelles. Les deux types d'informations sont transmis à ChatGPT pour traitement.

Les informations traitées par l'IA sont renvoyées à l'utilisateur sous forme vocale et guident le robot pour qu'il réagisse.

La simple rétroaction ne suffit pas, lors de l'exécution concrète, il faut encore collaborer avec le modèle visuel. Sinon, on assisterait à des scènes où le robot renverse toute la nourriture de la poêle sur le sol en cuisinant. Figure 02 a beaucoup travaillé sur ce point.

Adcock explique que ### Figure 02 est équipé d'un modèle de langage visuel (VLM) qui fonctionne avec 6 caméras, permettant au robot d'effectuer des inférences visuelles sémantiques de base et rapides.

Cette fonctionnalité s'est pleinement manifestée dans la collaboration avec BMW.

En janvier de cette année, Figure AI a annoncé avoir signé un accord commercial avec BMW Manufacturing Co., LLC pour déployer des robots polyvalents dans le processus de fabrication automobile. Dans la vidéo promotionnelle de Figure 02, une grande partie est consacrée à montrer comment Figure 02 utilise le modèle de langage visuel pour effectuer des travaux d'assemblage précis de pièces dans l'usine BMW.

De plus, par rapport à la génération précédente, la capacité d'inférence de l'IA a été multipliée par trois. Dans la vidéo promotionnelle, on voit Figure 02 ajouter une pièce supplémentaire s'il constate qu'elle n'a pas été correctement installée.

Outre ces aspects, ce qui intéresse le plus les gens est l'amélioration de la "main" du robot.

Nos mains peuvent facilement compter de 1 à 10. Mais un geste aussi simple est extrêmement difficile pour un robot. Lorsque la bande-annonce a été publiée, l'attention de tous a été attirée par la main de quatrième génération.

Cette fois, ### la main de quatrième génération de Figure 02 est équipée de 16 degrés de liberté.

Le chiffre "16" signifie que les 5 doigts ont chacun 3 articulations, soit 15 articulations au total, plus 1 articulation du poignet, soit un total de 16 articulations qui peuvent bouger librement. Cette technologie se rapproche d'un grand pas de la main humaine qui a 22 degrés de liberté.

De plus, la main de Figure 02 est équipée d'une force comparable à celle de l'homme, capable de supporter 25 kg, ce qui la rend plus adaptée aux scénarios pratiques. Un internaute a publié une comparaison entre 01 et 02, montrant que l'augmentation des degrés de liberté rend les mouvements de la main beaucoup plus précis.

Il y a aussi d'autres mises à jour, comme la capacité de la batterie qui a augmenté de 50% par rapport à la génération précédente, permettant maintenant à Figure 02 de travailler 20 heures par jour.

Le câblage a également été repensé, avec un câblage intégré pour l'alimentation et le calcul utilisant désormais des fils électriques dissimulés, offrant un emballage plus serré et une plus grande fiabilité.

La structure exosquelettique du corps a été repensée, équilibrant la rigidité structurelle et la prévention des charges de collision. Bien sûr, ces changements ont également porté le poids de Figure 02 à 70 kg, soit 10 kg de plus que 01.

Le robot "le plus puissant au monde" ?

Trois heures après sa sortie, Figure 02 a attiré l'attention de 500 000 internautes.

De nombreux internautes ont exprimé leur étonnement : "Je n'ose pas imaginer ce qui se passera dans 20 ans !" "2024 sera définitivement l'année des robots !"

Jim Fan, scientifique principal chez NVIDIA et responsable de l'intelligence incarnée, a également immédiatement félicité, déclarant : "L'amélioration des degrés de liberté de la main de quatrième génération est absolument le bon choix".

Comme Jim Fan, de nombreux internautes ont été impressionnés par la fluidité des mouvements de la main.

En fait, la naissance de la main de quatrième génération est due à la persévérance du fondateur Adcock.

"Nous avons choisi de faire des robots humanoïdes parce que le monde actuel est construit autour des activités humaines, tous les standards sont adaptés aux conditions physiologiques humaines", a expliqué Adcock dans une interview pour expliquer pourquoi il insiste pour faire de bons robots humanoïdes.

Ce n'est qu'en se rapprochant de l'"humain" dans tous les aspects qu'on peut mieux servir les gens et leur épargner des travaux inutiles.

Il partage la même pensée que la plupart des internautes - "Le rôle de l'IA n'est pas d'écrire des poèmes ou de peindre, mais de faire la vaisselle et la lessive à ma place, pour que j'aie le temps d'écrire des poèmes et de peindre".

Il n'a fallu que 2 ans à Adcock pour passer de la définition de l'approche de l'IA à devenir un leader de l'industrie.

Cette entreprise d'IA n'a été fondée qu'en 2022. Un développement aussi rapide est dû à la vision d'Adcock.

Avant de lever près de 700 millions de dollars pour Figure AI, il avait déjà fondé une entreprise de logiciels et une entreprise d'aéronefs, la vente de la première lui ayant rapporté son "premier pot d'or". La seconde est également entrée en bourse avec succès.

Avec l'arrivée de l'ère de l'IA, Adcock a décidé, comme beaucoup d'autres, de "tout miser sur l'IA". Mais contrairement aux autres, avec l'expérience de ses deux précédentes réussites entrepreneuriales, le processus de création de Figure AI s'est déroulé aussi facilement que s'il avait eu un doigt d'or.

En tant que véritable "nouveau riche de la Silicon Valley", Figure AI est soutenu par un investissement conjoint de géants tels que Bezos (fondateur d'Amazon), OpenAI et NVIDIA, et la valorisation actuelle de Figure AI s'élève à 2,6 milliards de dollars (environ 18,6 milliards de yuans).

Figure AI n'a pas déçu les attentes, son produit Figure 01 étant le premier robot humanoïde autonome commercialement viable au monde.

Après 18 mois, Figure 02 est officiellement lancé aujourd'hui. Il est décrit officiellement comme "le matériel d'IA le plus avancé au monde".

Cependant, là où il y a des fleurs, il y a aussi des doutes.

Certains internautes ont publié une vidéo de démonstration d'Optimus de Tesla, le concurrent, affirmant que ces améliorations étaient déjà réalisées par Tesla il y a 7 mois, alors comment Figure 02 peut-il être "le plus avancé" ?

Le "rival" Optimus

En fait, en tant que deux projets d'intelligence incarnée les plus suivis dans le monde de la technologie, la controverse entre Figure AI et Tesla Optimus a toujours existé.

Il y a un an déjà, lorsque Figure 01 a publié sa bande-annonce, des internautes plaisantaient en disant : "Le robot de Tesla s'appelle Optimus, alors le vôtre devrait s'appeler Megatron."

Lors de la sortie de Figure 02 cette fois-ci, certains internautes ont également exprimé avec impatience : "J'ai hâte de voir Figure 02 affronter Optimus Gen 2 !"

De plus, l'équipe d'Adcock elle-même compte de nombreux employés issus de Tesla.

Adcock n'a pas spécifiquement répondu à ce commentaire critique, il semble n'avoir jamais été préoccupé par la concurrence avec Optimus.

Bien qu'Optimus ait le soutien du "grand arbre" qu'est Tesla, avec un large accès aux données pour l'entraînement et des fonds de recherche importants, Figure AI peut également être considéré comme "sans souci financier".

Non seulement il dispose de beaucoup de fonds, mais en termes de coopération commerciale, Figure AI est également "prometteur". La collaboration avec BMW en est actuellement à sa première phase, où les robots Figure seront appliqués dans les étapes initiales de la production automobile. Après la première phase, BMW poursuivra une coopération approfondie avec eux pour explorer conjointement des thèmes technologiques avancés tels que l'intelligence artificielle, le contrôle robotique, la virtualisation de la fabrication et l'intégration robotique.

Optimus est également déjà utilisé dans les usines Tesla. Les deux leaders de l'intelligence incarnée courent sur leurs propres voies.

Quant à savoir qui est "le matériel d'IA le plus avancé au monde", cette question ne mérite pas qu'on s'y attarde. Le titre ne disparaîtra pas, mais il changera de mains. Dans l'industrie de l'IA en rapide évolution, le prochain leader technologique attend peut-être déjà son entrée en scène.