AI-Giganten im Wettstreit: Kann der OpenAI-Roboter Teslas Optimus übertreffen?

Die Ära, in der künstliche Intelligenz menschliche Arbeit ersetzt, steht kurz bevor.

Sprache-zu-Sprache-Inferenzfunktion. Diese Funktion wurde bei Figure 02 umfassend verbessert.

Figure 02 ist mit Mikrofon und Lautsprecher ausgestattet und nutzt die Kraft von OpenAI, um Sprachdialoge und Inferenz zu ermöglichen.

In einem technischen Artikel des Gründers Brett Adcock wird beschrieben, wie Figure 02 ChatGPT in einen Roboter verwandelt:

Der Benutzer gibt Sprache ein, Figure 02 wandelt die Sprache in Textinformationen um, während ### die neu hinzugefügten 6 RGB-Kameras dem Roboter übermenschliches Sehen ermöglichen und Bildinformationen empfangen können. Beide Arten von Informationen werden an ChatGPT zur Verarbeitung übergeben.

Die von der KI verarbeiteten Informationen werden dem Benutzer als Sprache zurückgegeben und leiten den Roboter zu entsprechenden Reaktionen an.

Nur Feedback reicht nicht aus, bei der konkreten Ausführung muss es mit visuellen Modellen kombiniert werden. Andernfalls könnte es zu Pannen kommen, bei denen der Roboter beim Kochen das gesamte Essen aus der Pfanne auf den Boden verschüttet. Figure 02 hat daran viel gearbeitet.

Adcock erklärt, dass ### Figure 02 ein integriertes visuell-sprachliches Modell (VLM) hat, das mit 6 Kameras arbeitet, sodass der Roboter semantische Grundlagen und schnelle allgemeine visuelle Schlussfolgerungen ziehen kann.

Diese Funktion zeigt sich in der Zusammenarbeit mit BMW in vollem Umfang.

Im Januar dieses Jahres gab Figure AI bekannt, dass es eine kommerzielle Vereinbarung mit BMW Manufacturing Co., LLC unterzeichnet hat, um universelle Roboter in Fertigungsprozesse in der Automobilindustrie einzusetzen. Im Werbevideo von Figure 02 wird auch ausführlich gezeigt, wie Figure 02 in BMW-Fabriken das visuell-sprachliche Modell für präzise Montagearbeiten von Teilen nutzt.

Außerdem hat sich die KI-Inferenzfähigkeit im Vergleich zur vorherigen Generation verdreifacht. Im Werbevideo sieht man, wie Figure 02 nicht richtig montierte Teile erkennt und nachbessert.

Abgesehen davon interessieren sich die meisten Leute am meisten für die Verbesserungen an der "Hand" des Roboters.

Unsere menschlichen Hände können mühelos von 1 bis 10 zählen. Aber solch einfache Gesten sind für Roboter extrem schwierig. Als der Teaser veröffentlicht wurde, wurde die Aufmerksamkeit sofort von der vierten Generation der Hand angezogen.

Diesmal ist ### die vierte Generation der Hand von Figure 02 mit 16 Freiheitsgraden ausgestattet.

Die Zahl "16" bedeutet, dass 5 Finger mit jeweils 3 Gelenken, insgesamt 15 Gelenke, plus 1 Handgelenk, also insgesamt 16 Gelenke frei beweglich sind. Diese Technologie ist der menschlichen Hand mit 22 Freiheitsgraden einen großen Schritt nähergekommen.

Außerdem verfügt die Hand von Figure 02 über eine mit dem Menschen vergleichbare Kraft und kann 25 kg tragen, was sie für praktische Anwendungen geeigneter macht. Ein Nutzer hat einen Vergleich zwischen 01 und 02 gepostet, und mit der Erhöhung der Freiheitsgrade sehen die Handbewegungen deutlich feiner aus.

Es gibt noch einige andere Updates, zum Beispiel wurde die Batteriekapazität im Vergleich zur vorherigen Generation um 50% erhöht, sodass Figure 02 jetzt 20 Stunden am Tag arbeiten kann.

Die Verkabelung wurde ebenfalls neu gestaltet. Die integrierte Verkabelung für Stromversorgung und Datenverarbeitung verwendet jetzt versteckte Kabel für eine kompaktere Verpackung und höhere Zuverlässigkeit.

Das Exoskelett des Roboters wurde neu gestaltet, um die Steifigkeit der Struktur und den Schutz vor Aufpralllasten auszubalancieren. Natürlich haben diese Änderungen auch dazu geführt, dass Figure 02 mit 70 kg 10 kg schwerer ist als 01.

Der "stärkste" Roboter der Welt?

Innerhalb von 3 Stunden nach der Veröffentlichung von Figure 02 zog er die Aufmerksamkeit von 500.000 Internetnutzern auf sich.

Viele Nutzer zeigten sich erstaunt: "Ich kann mir nicht vorstellen, was in 20 Jahren passieren wird!" "2024 ist definitiv das Jahr der Roboter!"

Jim Fan, leitender Wissenschaftler bei NVIDIA und Leiter der Embodied Intelligence, gratulierte sofort und sagte: "Die Verbesserung der Freiheitsgrade der vierten Generation der Hand ist definitiv die richtige Wahl".

Wie Jim Fan waren viele Nutzer von den geschmeidigen Handbewegungen beeindruckt.

Tatsächlich ist die Entstehung der vierten Generation der Hand auf die Beharrlichkeit des Gründers Adcock zurückzuführen.

"Wir haben uns für humanoide Roboter entschieden, weil die heutige Welt um menschliche Aktivitäten herum gebaut ist und alle Standards an die menschliche Physiologie angepasst sind", erklärte Adcock in einem Interview, warum er darauf besteht, gute humanoide Roboter zu entwickeln.

Nur wenn sich alles dem "Menschen" annähert, kann es den Menschen besser dienen und ihnen unnötige Arbeit abnehmen.

Er denkt wie die meisten Internetnutzer - "Der Zweck von KI ist nicht, Gedichte zu schreiben oder zu malen, sondern für mich abzuwaschen und Wäsche zu waschen, damit ich Zeit habe, Gedichte zu schreiben und zu malen".

Von der Entscheidung für die KI-Strategie bis zum heutigen Status als Branchenführer brauchte Adcock nur 2 Jahre.

Dieses KI-Unternehmen wurde erst 2022 gegründet. Eine so rasante Entwicklung verdankt sich Adcocks Weitsicht.

Bevor er fast 700 Millionen für Figure AI einsammelte, hatte er bereits ein Softwareunternehmen und ein Flugzeugbauunternehmen gegründet. Der Verkauf des ersteren brachte Adcock sein "erstes Vermögen" ein. Letzteres ist bereits erfolgreich an die Börse gegangen.

Mit dem Aufkommen des KI-Zeitalters beschloss Adcock wie viele andere, "All in AI" zu gehen. Der Unterschied ist, dass der Prozess der Gründung von Figure AI dank seiner beiden vorherigen erfolgreichen Unternehmensgründungen so reibungslos verlief, als hätte er einen goldenen Schlüssel.

Als unbestrittener "Neureicher des Silicon Valley" wird Figure AI von Giganten wie Bezos (Amazon-Gründer), OpenAI und NVIDIA gemeinsam finanziert. Derzeit wird Figure AI mit 2,6 Milliarden US-Dollar (etwa 18,6 Milliarden RMB) bewertet.

Figure AI hat die Erwartungen nicht enttäuscht. Sein Produkt Figure01 ist der weltweit erste kommerziell realisierbare autonome humanoide Roboter.

Nach 18 Monaten wurde Figure 02 heute offiziell vorgestellt. Offiziell wird er als "die fortschrittlichste KI-Hardware der Welt" bezeichnet.

Wo es Lob gibt, gibt es jedoch auch Zweifel.

Ein Nutzer postete ein Demonstrationsvideo von Teslas Konkurrenten Optimus und behauptete, dass Tesla diese Verbesserungen bereits vor 7 Monaten gemacht habe. Wie könne Figure 02 also "der fortschrittlichste" sein?

Der "Erzfeind" Optimus

Tatsächlich hat die Kontroverse zwischen Figure AI und Teslas Optimus, zwei der meistbeachteten Projekte für verkörperte Intelligenz in der Technologiebranche, von Anfang an bestanden.

Schon vor einem Jahr, als Figure01 seinen Teaser veröffentlichte, scherzten Nutzer: "Teslas Roboter heißt Optimus, deiner sollte also Megatron heißen."

Als Figure 02 diesmal veröffentlicht wurde, kommentierten einige Nutzer schadenfroh: "Ich kann es kaum erwarten, Figure 02 gegen Optimus Gen 2 kämpfen zu sehen!"

Außerdem gibt es in Adcocks eigenem Team viele ehemalige Tesla-Mitarbeiter.

Adcock hat nicht speziell auf diesen kritischen Kommentar geantwortet. Er scheint sich auch nie um den Wettbewerb mit Optimus zu kümmern.

Obwohl Optimus den "großen Baum" Tesla im Rücken hat, der sowohl umfangreiche Daten für das Training als auch reichlich Forschungsgelder bietet, kann Figure AI selbst als "sorgenfrei" bezeichnet werden.

Es verfügt nicht nur über reichlich Kapital, sondern hat auch in Bezug auf kommerzielle Zusammenarbeit eine "vielversprechende Zukunft". Die Zusammenarbeit mit BMW befindet sich derzeit in der ersten Phase, in der Figure-Roboter in den Anfangsstadien der Automobilproduktion eingesetzt werden. Nach Abschluss der ersten Phase wird BMW die Zusammenarbeit vertiefen und gemeinsam fortschrittliche technologische Themen wie künstliche Intelligenz, Robotersteuerung, Fertigungsvirtualisierung und Roboterintegration erforschen.

Optimus wird derzeit auch in Tesla-Fabriken eingesetzt. Beide führenden Akteure im Bereich der verkörperten Intelligenz rasen auf ihren eigenen Wegen voran.

Wer wirklich "die fortschrittlichste KI-Hardware der Welt" ist, muss nicht diskutiert werden. Titel verschwinden nicht, aber sie wechseln. In der sich schnell entwickelnden KI-Branche wartet der nächste technologische Vorreiter vielleicht schon auf seinen Auftritt.