Confronto dos gigantes da IA: O robô da OpenAI pode superar o Optimus da Tesla?

A era em que os assistentes de inteligência artificial substituirão o trabalho humano está chegando.

Funcionalidade de inferência de voz para voz. Esta funcionalidade foi totalmente atualizada no Figure 02.

O Figure 02 está equipado com microfone e alto-falante, utilizando o poder da OpenAI para realizar diálogos de voz e inferências.

No artigo técnico publicado pelo fundador Brett Adcock, ele explica como o Figure 02 transforma o ChatGPT em um robô:

O usuário insere a voz, o Figure 02 converte a voz em texto, enquanto ### as 6 novas câmeras RGB dão ao robô uma visão sobre-humana, capaz de receber informações de imagem. Ambos os tipos de informação são processados pelo ChatGPT.

As informações processadas pela IA são retornadas ao usuário em forma de voz e orientam o robô a realizar ações de resposta.

Apenas o feedback não é suficiente, na execução concreta, é necessário trabalhar em conjunto com o modelo visual. Caso contrário, ocorreriam cenas de desastre como o robô derramando toda a comida da panela no chão ao cozinhar. O Figure 02 dedicou muito esforço nisso.

Adcock explica que ### o Figure 02 possui um modelo de linguagem visual (VLM) interno, trabalhando em conjunto com 6 câmeras, permitindo que o robô realize inferências visuais semânticas básicas e rápidas de senso comum.

Esta funcionalidade foi demonstrada de forma impressionante na colaboração com a BMW.

Em janeiro deste ano, a Figure AI anunciou um acordo comercial com a BMW Manufacturing Co., LLC para implantar robôs de uso geral no processo de fabricação de automóveis. No vídeo promocional do Figure 02, também foi dedicado um espaço considerável para mostrar como o Figure 02 utiliza o modelo de linguagem visual para realizar trabalhos delicados de montagem de peças na fábrica da BMW.

Além disso, em comparação com a geração anterior, a capacidade de inferência de IA aumentou 3 vezes. No vídeo promocional, o Figure 02 é capaz de identificar peças não instaladas corretamente e corrigi-las.

Além disso, o que mais preocupa a todos é a melhoria da "mão" do robô.

Nossas mãos podem facilmente contar de 1 a 10. Mas um gesto tão simples é extremamente difícil para um robô. Quando o trailer foi lançado, a atenção de todos foi atraída para a mão de quarta geração.

Desta vez, ### a mão de quarta geração do Figure 02 está equipada com 16 graus de liberdade.

O número "16" significa que há 5 dedos, cada dedo tem 3 articulações, totalizando 15 articulações, mais 1 articulação do pulso, totalizando 16 articulações que podem se mover livremente. Esta tecnologia está um grande passo mais próxima da mão humana com 22 graus de liberdade.

Além disso, a mão do Figure 02 também está equipada com força comparável à humana, podendo suportar 25 kg, tornando-a mais adequada para cenários práticos. Alguns usuários da internet postaram comparações entre o 01 e o 02, mostrando que com o aumento dos graus de liberdade, os movimentos da mão parecem muito mais refinados.

Há também algumas outras atualizações, como a capacidade da bateria, que aumentou 50% em relação à geração anterior, permitindo que o Figure 02 agora trabalhe 20 horas por dia.

A fiação também foi redesenhada, com fiação integrada para energia e computação agora usando fios ocultos, resultando em um empacotamento mais compacto e maior confiabilidade.

A estrutura do exoesqueleto do corpo foi redesenhada, equilibrando a rigidez estrutural e a prevenção de cargas de colisão. Claro, essas mudanças também fizeram com que o Figure 02 pesasse 70 kg, 10 kg a mais que o 01.

O robô "mais poderoso do mundo"?

Apenas 3 horas após o lançamento do Figure 02, ele atraiu a atenção de 500 mil internautas.

Muitos expressaram admiração: "Não consigo imaginar o que acontecerá nos próximos 20 anos!" "2024 é definitivamente o ano dos robôs!"

Jim Fan, cientista sênior da NVIDIA e responsável pela inteligência incorporada, também elogiou imediatamente, afirmando: "A melhoria nos graus de liberdade da mão de quarta geração é definitivamente a escolha certa".

Assim como Jim Fan, muitos internautas ficaram impressionados com a suavidade dos movimentos da mão.

Na verdade, o nascimento da mão de quarta geração vem da persistência do fundador Adcock.

"Escolhemos fazer robôs humanoides porque o mundo atual é construído em torno das atividades humanas, todos os padrões são adaptados às condições fisiológicas humanas", explicou Adcock em uma entrevista sobre por que insiste em fazer bons robôs humanoides.

Apenas aproximando-se do "humano" em todos os aspectos é possível servir melhor as pessoas e ajudá-las a evitar trabalhos desnecessários.

Ele pensa como a maioria dos internautas - "O propósito da IA não é escrever poesia ou pintar, mas sim lavar pratos e roupas por mim, para que eu tenha tempo de escrever poesia e pintar".

Desde decidir a abordagem da IA até se tornar um líder da indústria, Adcock levou apenas 2 anos.

Esta empresa de IA foi fundada apenas em 2022. Um desenvolvimento tão rápido se deve à visão de Adcock.

Antes de arrecadar quase 700 milhões para a Figure AI, ele já havia fundado uma empresa de software e uma empresa de aeronaves. A venda da primeira rendeu a Adcock seu "primeiro balde de ouro". A última também já abriu capital com sucesso.

Com a chegada da era da IA, Adcock, como muitas pessoas, decidiu "apostar tudo na IA". Mas diferentemente, com a experiência de dois empreendimentos bem-sucedidos anteriores, o processo de fundação da Figure AI foi tão suave quanto se tivesse uma chave de ouro.

Como indiscutível "novo rico do Vale do Silício", a Figure AI é apoiada por investimentos conjuntos de gigantes como Bezos (fundador da Amazon), OpenAI e NVIDIA, e atualmente a Figure AI é avaliada em 2,6 bilhões de dólares (aproximadamente 18,6 bilhões de yuans).

A Figure AI também não decepcionou, com seu produto Figure 01 sendo o primeiro robô humanoide autônomo comercialmente viável do mundo.

Após 18 meses, o Figure 02 foi oficialmente lançado hoje. A empresa o chama de "o hardware de IA mais avançado do mundo".

No entanto, onde há elogios, certamente haverá dúvidas.

Alguns internautas postaram vídeos de demonstração do Optimus da Tesla, concorrente, afirmando que essas melhorias já estavam sendo feitas pela Tesla há 7 meses, então como o Figure 02 se tornou o "mais avançado"?

O "rival" Optimus

Na verdade, como dois dos projetos de inteligência incorporada mais observados no mundo da tecnologia, a controvérsia entre a Figure AI e o Optimus da Tesla tem sido constante desde o início.

Há um ano, quando o Figure 01 lançou seu trailer, alguns internautas brincaram: "O robô da Tesla se chama Optimus, então o seu deveria se chamar Megatron".

Neste lançamento do Figure 02, também houve internautas ansiosos dizendo: "Mal posso esperar para ver a batalha entre o Figure 02 e o Optimus Gen 2!"

Além disso, na própria equipe de Adcock, há muitos funcionários vindos da Tesla.

Adcock não respondeu especificamente àquele comentário questionador, ele parece nunca se importar com a competição com o Optimus.

Embora o Optimus tenha a Tesla como uma "grande árvore" por trás, com amplo fornecimento de dados para treinamento e fundos de pesquisa substanciais, a própria Figure AI também pode ser considerada "sem preocupações financeiras".

Não apenas tem muito capital em mãos, mas em termos de cooperação comercial, a Figure AI também tem um "futuro promissor". A cooperação com a BMW está atualmente na primeira fase, onde os robôs Figure serão aplicados nos estágios iniciais da produção de automóveis. Após a conclusão da primeira fase, a BMW continuará a cooperação aprofundada, explorando conjuntamente temas tecnológicos avançados como inteligência artificial, controle de robôs, virtualização de manufatura e integração robótica.

O Optimus também já está sendo usado nas fábricas da Tesla. Os dois principais players de inteligência incorporada estão correndo em seus próprios caminhos.

Quanto a quem é o "hardware de IA mais avançado do mundo", essa questão não precisa ser debatida. Os nomes não desaparecem, mas se transferem. Na indústria de IA em rápido desenvolvimento, o próximo líder tecnológico pode já estar esperando para entrar em cena.