In der jüngsten Finanzierungsrunde sammelte World Labs rund 100 Millionen Dollar ein und wurde dabei mit über 1 Milliarde Dollar bewertet.
World Labs rückte schnell in den Fokus der Branche. Li reagierte nicht auf Medienanfragen, und sowohl Andreessen Horowitz als auch Radical Ventures lehnten eine Stellungnahme ab.
Bezüglich der Entwicklungsrichtung des Startups zitierte ausländische Medien einen Risikokapitalgeber, der es konkret beschrieb: ### World Labs entwickelt ein Modell, das die dreidimensionale physische Welt verstehen kann, im Wesentlichen die physikalischen Eigenschaften, räumlichen Positionen und Funktionen von Objekten versteht und simuliert. Vereinfacht ausgedrückt ist dies die von Li vorgeschlagene "räumliche Intelligenz". Sie glaubt, dass "räumliche Intelligenz" ein Schlüsselelement des KI-Puzzles ist.
Bewertung übersteigt 1 Milliarde Dollar, World Labs konzentriert sich auf "räumliche Intelligenz"
Berichten zufolge wurde World Labs im April dieses Jahres während Lis Sabbatical von der Stanford University gegründet. Li hat sich zu diesem Unternehmen recht zurückhaltend geäußert; ihre LinkedIn-Seite zeigt immer noch ihren neuesten Status als "Neuling". Trotz des bescheidenen Ansatzes der Gründerin hat das Unternehmen Berühmtheit erlangt, weil es in nur drei Monaten eine Bewertung von über 1 Milliarde Dollar erreicht hat.
Ausländische Medien zitierten im Mai Quellen, die besagten, dass die Ausrichtung von World Labs mit der von Li zuvor vorgeschlagenen "räumlichen Intelligenz" zusammenhängt, die sich auf den Aufbau von Weltmodellen bezieht, die es Computern ermöglichen, eine dreidimensionale Welt wahrzunehmen und in ihr zu agieren.
Li erklärte auf X (ehemals Twitter), dass "räumliche Intelligenz" ein Schlüsselelement des KI-Puzzles ist. In Anlehnung an ihren TED-Vortrag im April dieses Jahres sagte sie: ### "Sehen wird zu Einsicht; Einsicht wird zu Verständnis; Verständnis treibt Handeln an. All dies erzeugt Intelligenz."
In ihrem TED-Vortrag verwendete Li ein Bild von "einer Katze, die ihre Pfote ausstreckt, um eine Tasse Milch vom Tisch zu stoßen", um zu veranschaulichen, was räumliche Intelligenz ist. Sie erklärte, dass das menschliche Gehirn beim Betrachten dieses Bildes beginnt, die Form des Glases, seine Position im Raum und seine Beziehung zu umgebenden Objekten zu analysieren und einen "Handlungsimpuls" zu erzeugen. Dieser Impuls ist der Instinkt räumlich intelligenter Wesen, der Wahrnehmung und Handlung verbindet.
Li erklärte, dass ihr Team in den Laboren der Stanford University auch Computer und Roboter trainiert, um in der dreidimensionalen Welt zu handeln. Sie zeigte Demonstrationsvideos von mechanischen Armen, die verschiedene Aufgaben basierend auf verbalen Befehlen ausführen, einschließlich ### des Öffnens von Schubladen, des Aussteckens vollständig geladener Telefone und des Herstellens von Sandwiches mit Brot und anderen Materialien.
"Der Tugendkreis des 'Sehens' und 'Handelns' beschleunigt das Lernen von Robotern, was eine Schlüsselkomponente jedes verkörperten intelligenten Systems ist, das die dreidimensionale Welt verstehen und mit ihr interagieren muss. Mit der Beschleunigung der räumlichen Intelligenz entfaltet sich vor unseren Augen in diesem Tugendkreis eine neue Ära", sagte Li.
Lis Vision für räumliche Intelligenz besteht darin, eine Maschine zu trainieren, die die komplexe physische Welt und die Wechselbeziehungen von Objekten darin verstehen kann.
Fei-Fei Li: Wahrnehmung bleibt eine Herausforderung für KI-Systeme
Lis Bezeichnung als "KI-Patin" ist untrennbar mit ihrer legendären Erfahrung verbunden: ### Sie wurde mit 33 Jahren Professorin auf Lebenszeit in Stanfords Informatik-Abteilung, mit 44 Jahren Mitglied der National Academy of Engineering und ist derzeit Co-Direktorin von Stanfords Human-Centered AI Institute (HAI).
Die großangelegte ImageNet-Datenbank, ein Meilenstein auf dem Gebiet des maschinellen Sehens, wurde ebenfalls von Li vorangetrieben. Diese Errungenschaft legte den Grundstein für die Schaffung der ersten Generation von Computervisionstechnologie, die zuverlässig Objekte identifizieren kann. Darüber hinaus hat Li einen großen Einfluss auf die Bildung ausgeübt, wobei viele einflussreiche Persönlichkeiten im KI-Bereich, wie der Informatiker Andrej Karpathy, der bei OpenAI und Tesla arbeitete, und Jim Fan, derzeit leitender Forschungswissenschaftler bei NVIDIA, bei ihr studiert haben.
Li wurde 1976 in Peking geboren und wuchs in Chengdu, Sichuan, auf. Mit 16 Jahren wanderte sie in die Vereinigten Staaten aus. Später wurde sie eine weltweit renommierte KI-Wissenschaftlerin an der Stanford University, leitete das KI-Geschäft von Google Cloud, trat dem Vorstand von Twitter bei und beriet politische Entscheidungsträger im Weißen Haus. Derzeit ist Li immer noch Co-Direktorin und Professorin am KI-Labor der Stanford University. Ihr persönliches Profil listet Forschungsinteressen auf, darunter "kognitiv inspirierte künstliche Intelligenz", maschinelles Sehen und robotisches Lernen.
Bemerkenswert ist, dass Li in ihrem neuesten Artikel, den sie gemeinsam mit dem Stanford-Logiker und Philosophen John Etchemendy verfasst hat, erwähnte, dass großen Modellen die Verkörperung fehlt und sie daher keine subjektiven Erfahrungen generieren können, die aus physiologischen Zuständen resultieren: ### "Wir haben noch keine perzeptuelle KI erreicht, und größere Sprachmodelle können uns nicht helfen, dieses Ziel zu erreichen. Wenn wir Wahrnehmung in KI-Systemen erreichen wollen, müssen wir besser verstehen, wie Wahrnehmung tatsächlich in biologischen Systemen erzeugt wird."
Zusätzlich erinnerte sich Li laut ausländischen Medienberichten daran, dass 2007 "ein Wendepunkt in der Business-Intelligence-Branche" war und sich die Rolle der Daten seitdem dramatisch verändert hat. "Die eigentliche Frage ist jetzt, wie man diese Technologie sowohl im Klassenzimmer als auch in der Industrie durchdacht entwickelt und einsetzt."