Duelo de gigantes de IA: ¿Podrá el robot de OpenAI superar al Optimus de Tesla?

La era en la que los asistentes de inteligencia artificial reemplazarán el trabajo humano está a punto de llegar.

Función de inferencia de voz a voz. Esta función ha sido completamente mejorada en Figure 02.

Figure 02 está equipado con micrófono y altavoces, y utiliza el poder de OpenAI para lograr diálogo e inferencia de voz.

En el artículo técnico publicado por el fundador Brett Adcock, se explica cómo Figure 02 convierte ChatGPT en un robot:

El usuario ingresa voz, Figure 02 convierte la voz en texto, mientras que ### las 6 nuevas cámaras RGB le dan al robot una visión sobrehumana, capaz de recibir información de imágenes. Ambos tipos de información se entregan a ChatGPT para su procesamiento.

La información procesada por la IA se devuelve al usuario en forma de voz y guía al robot para que realice acciones de respuesta.

La retroalimentación por sí sola no es suficiente, durante la ejecución real, es necesario trabajar en conjunto con el modelo visual. De lo contrario, ocurrirían escenarios como que el robot derrame toda la comida en el suelo al cocinar. Figure 02 ha trabajado mucho en esto.

Adcock explica que ### Figure 02 tiene incorporado un modelo de lenguaje visual (VLM) que trabaja junto con 6 cámaras, permitiendo al robot realizar inferencias visuales semánticas básicas y de sentido común rápidas.

Esta función se demostró plenamente en la colaboración con BMW.

En enero de este año, Figure AI anunció un acuerdo comercial con BMW Manufacturing Co., LLC para implementar robots de propósito general en el proceso de fabricación de automóviles. En el video promocional de Figure 02, también se dedica mucho espacio a mostrar cómo Figure 02 utiliza el modelo de lenguaje visual para realizar trabajos detallados de ensamblaje de componentes en la fábrica de BMW.

Además, en comparación con la generación anterior, la capacidad de inferencia de IA ha mejorado 3 veces. En el video promocional, Figure 02 incluso añade componentes faltantes cuando los detecta.

Aparte de esto, lo que más preocupa a todos es la mejora de la "mano" del robot.

Nuestras manos pueden contar fácilmente del 1 al 10. Pero un gesto tan simple es extremadamente difícil para un robot. Cuando se lanzó el avance, la atención de todos fue atraída por la mano de cuarta generación.

Esta vez, ### la mano de cuarta generación de Figure 02 está equipada con 16 grados de libertad.

El número "16" significa que hay 5 dedos, cada dedo tiene 3 articulaciones, un total de 15 articulaciones, más 1 articulación de muñeca, lo que suma 16 articulaciones que pueden moverse libremente. Esta tecnología está un gran paso más cerca de la mano humana con 22 grados de libertad.

Además, la mano de Figure 02 también está equipada con una fuerza comparable a la humana, pudiendo soportar 25 kg, lo que la hace más adecuada para escenarios prácticos. Algunos usuarios han publicado comparaciones entre 01 y 02, mostrando que con el aumento de los grados de libertad, los movimientos de la mano parecen mucho más precisos.

Hay algunas otras actualizaciones, como la capacidad de la batería que ha aumentado un 50% en comparación con la generación anterior, ahora Figure 02 puede trabajar 20 horas al día.

El cableado también se ha rediseñado, el cableado integrado para energía y cómputo ahora utiliza cables ocultos, con un empaquetado más ajustado y mayor confiabilidad.

Se rediseñó la estructura del exoesqueleto del cuerpo, equilibrando la rigidez estructural y la prevención de cargas de colisión. Por supuesto, estos cambios también han aumentado el peso de Figure 02 a 70 kg, 10 kg más que el 01.

¿El robot "más poderoso del mundo"?

Solo 3 horas después de su lanzamiento, Figure 02 atrajo la atención de 500,000 usuarios en línea.

Muchos expresaron su asombro: "¡No puedo imaginar qué pasará en 20 años!" "¡2024 es definitivamente el año de los robots!"

Jim Fan, científico senior de NVIDIA y responsable de inteligencia encarnada, también elogió inmediatamente, diciendo: "La mejora en los grados de libertad de la mano de cuarta generación es definitivamente la elección correcta".

Al igual que Jim Fan, muchos usuarios quedaron impresionados por la suavidad de los movimientos de la mano.

De hecho, el nacimiento de la mano de cuarta generación proviene de la persistencia del fundador Adcock.

"Elegimos hacer robots humanoides porque el mundo actual está construido alrededor de las actividades humanas, todos los estándares se adaptan a las condiciones fisiológicas humanas", explicó Adcock en una entrevista sobre por qué insiste en hacer buenos robots humanoides.

Solo acercándose a lo "humano" en todo, se puede servir mejor a las personas y ayudarlas a ahorrar trabajo innecesario.

Él piensa como la mayoría de los usuarios: "El propósito de la IA no es escribir poesía o pintar, sino reemplazarme para lavar platos y ropa, para que yo tenga tiempo de escribir poesía y pintar".

Desde decidir el enfoque de la IA hasta convertirse en un líder de la industria, Adcock solo tardó 2 años.

Esta compañía de IA se fundó apenas en 2022. Un desarrollo tan rápido se debe a la visión de Adcock.

Antes de recaudar casi 700 millones para Figure AI, fundó una compañía de software y una de vehículos aéreos, la venta de la primera le dio a Adcock su "primer balde de oro". La segunda ya cotiza en bolsa.

Con la llegada de la era de la IA, Adcock, como muchos otros, decidió "apostar todo a la IA". Pero a diferencia de otros, con la experiencia de dos emprendimientos exitosos anteriores, el proceso de fundar Figure AI fue tan fluido como si tuviera una llave dorada.

Como indiscutible "nuevo rico de Silicon Valley", detrás de Figure AI está la inversión conjunta de gigantes como Bezos (fundador de Amazon), OpenAI, NVIDIA, etc. Actualmente, Figure AI está valorada en 2,600 millones de dólares (aproximadamente 18,600 millones de yuanes).

Figure AI no ha defraudado las expectativas, su producto Figure 01 es el primer robot humanoide autónomo comercialmente viable del mundo.

Después de 18 meses, Figure 02 se lanzó oficialmente hoy. La compañía lo describe como "el hardware de IA más avanzado del mundo".

Sin embargo, donde hay elogios, seguramente habrá dudas.

Algunos usuarios publicaron videos de demostración del competidor Optimus de Tesla, diciendo que estas mejoras ya las estaba haciendo Tesla hace 7 meses, ¿cómo se convirtió Figure 02 en el "más avanzado"?

El "rival" Optimus

De hecho, como dos de los proyectos de inteligencia encarnada más observados en el mundo tecnológico, la controversia entre Figure AI y Tesla Optimus ha estado presente desde el principio.

Hace un año, cuando se lanzó el avance de Figure 01, algunos usuarios bromearon diciendo: "El robot de Tesla se llama Optimus, entonces el tuyo debería llamarse Megatron".

En este lanzamiento de Figure 02, también hubo usuarios que comentaron emocionados: "¡Ya estoy ansioso por ver la batalla entre Figure 02 y Optimus Gen 2!"

Además, en el propio equipo de Adcock hay varios empleados que vienen de Tesla.

Adcock no respondió específicamente a ese comentario de duda, parece que nunca le ha importado la competencia con Optimus.

Aunque Optimus tiene detrás el "gran árbol" de Tesla, con amplio suministro de datos para entrenamiento y abundantes fondos de investigación, Figure AI tampoco se puede considerar "preocupado por la comida y la ropa".

No solo tiene una gran cantidad de fondos, sino que en términos de cooperación comercial, Figure AI también tiene un "futuro prometedor". La cooperación con BMW está actualmente en la primera etapa, donde los robots Figure se aplicarán en la etapa inicial de producción de automóviles. Después de completar la primera etapa, BMW continuará colaborando profundamente con ellos, explorando conjuntamente temas tecnológicos avanzados como inteligencia artificial, control robótico, virtualización de fabricación e integración robótica.

Optimus ya se está utilizando en las fábricas de Tesla. Los dos jugadores líderes en inteligencia encarnada están corriendo en sus propios caminos.

En cuanto a quién es realmente "el hardware de IA más avanzado del mundo", no es necesario obsesionarse con esta cuestión. Los nombres no desaparecerán, pero se transferirán. En la industria de la IA que se desarrolla rápidamente, el próximo líder tecnológico quizás ya esté esperando para hacer su aparición.