KI-Selbstevolution: Produktexplosion könnte Realität werden

KI-Agenten-Technologie erlebt 2024 ein explosionsartiges Wachstum und wird zum Brennpunkt in der Technologiebranche.

Automatisierte Kreislogik

Am 19. August veröffentlichten drei Forscher der University of British Columbia ein Papier mit dem Titel "Automatisiertes Design von Agentensystemen". In diesem Papier entwarfen sie ein System, das KI ermöglicht, Agenten selbst zu entdecken und aufzubauen und sich selbst zu iterieren.

Erinnern wir uns an OpenAIs klassische Definition eines Agenten: Ein Agent ist ein Produkt, das Wissen speichern, planen und Werkzeuge anwenden kann.

Wenn wir Agenten mit Workflows aufbauen, nutzen wir auch vorhandenes Wissen (Wissen über Agentenformen), planen selbst (Aufbau von Prozessen) und nutzen Werkzeuge (API-Integration), um schließlich zu produzieren und auszuführen, ohne die Fähigkeiten des Agenten selbst zu überschreiten.

Warum also nicht einen Agenten aufbauen, der automatisch Agenten entdecken und entwerfen kann?

Die Autoren des Papiers folgten diesem Gedankengang und bezeichneten den Designer als Meta-Agent, der neue Agenten entwirft. Die entworfenen Agenten werden als Material in eine Datenbank aufgenommen und ständig zu neuen, stärkeren Versionen von Agenten iteriert.

Diese gesamte Methode nennen sie ADAS (Automated Design of Agentensysteme).

Die Kette in Gang setzen

Der Prozess der Generierung neuer Agenten im ADAS-System kann in drei Teile unterteilt werden:

Der erste Teil etabliert den Suchraum, was als Möglichkeit verstanden werden kann, potenzielle neue Agenten durch einige grundlegende Werkzeuge und Regeln zu entwerfen.

Der zweite Teil ist die Ausführung des Suchalgorithmus, der vorschreibt, wie der Meta-Agent den Suchraum nutzt und dessen Elemente verwendet, um konkret neue Agenten aufzubauen.

Der letzte Teil ist die Ausführung der Bewertungsfunktion, die die aufgebauten Agenten nach Leistung und anderen Zielen bewertet.

Die Forscher erklären im Papier schrittweise, wie diese drei Kernteile aufgebaut werden.

Zunächst müssen die grundlegenden Elemente zur Konstruktion des Suchraums festgelegt werden. Die Forscher glauben, dass Code die beste Methode ist.

Dies liegt daran, dass Code Turing-vollständig ist und alle Möglichkeiten ausdrücken kann. Theoretisch kann der Meta-Agent also jede mögliche Baueinheit (wie Prompts, Werkzeugnutzung, Kontrollfluss) entdecken und Agentensysteme auf jede mögliche Weise kombinieren.

Noch wichtiger ist, dass die verschiedenen Workflows in Websites wie Langchain, die zum Aufbau von Agenten verwendet werden, bereits codiert sind. Daher sind die relevanten Daten leicht verfügbar und müssen nicht konvertiert werden. Auch für Werkzeugaufrufe wie RAG (Retrieval Augmented Generation) gibt es bereits eine sehr umfangreiche Codebasis.

Die Verwendung von Code zur Konstruktion des Suchraums bedeutet auch, dass die von ADAS generierten Agenten direkt ausgeführt werden können, um Fehler zu korrigieren und Punkte zu erzielen, ohne menschliches Eingreifen.

Nachdem der Suchraum definiert wurde, begannen die Forscher mit dem Design des Suchalgorithmus, d.h. wie der Meta-Agent mögliche Methoden zur Aufgabenlösung erkundet. Dieser Prozess basiert hauptsächlich auf Prompt Engineering.

Zunächst wird ihm eine Reihe von System-Prompts gegeben.

Dann werden dem Meta-Agenten die im Basis-Prompt erwähnten Materialien zur Verfügung gestellt, einschließlich:

  1. Grundlegende Beschreibung der Aufgabe.

  2. Grundlegender Rahmencode, wie formatierte Prompts, Kapselungsnamen und die Fähigkeit, andere Basismodelle (FM) und APIs aufzurufen.

  3. Format und Beispiele für Aufgabeneingaben und -ausgaben.

  4. Eine Beispielbibliothek einiger in früheren Iterationen generierter Agenten, einschließlich ihrer Baseline-Testergebnisse.

Basierend auf diesen grundlegenden Prompts kann ADAS beginnen zu arbeiten und einen Agenten generieren, der ein spezifisches Problem löst.

In diesem Prozess führt der Meta-Agent zwei Runden der Reflexion durch, um sicherzustellen, dass der generierte Agent neuartig und korrekt ist. Er überprüft, ob der neu generierte Code-Rahmen Fehler enthält und ob er im Vergleich zu früheren Ergebnissen in der Agenten-Beispielbibliothek ausreichend innovativ ist.

Der Meta-Agent muss auch eine vorläufige Bewertung des generierten Agenten basierend auf seinem "Verständnis" der praktischen Leistungsfähigkeit vornehmen und beurteilen, ob er besser ist als frühere Agenten.

Wenn einige dieser Bedingungen nicht erfüllt sind, muss der Meta-Agent den generierten Agenten entweder modifizieren oder komplett neu erstellen.

Nach zwei Runden der Reflexion und Modifikation sendet der Meta-Agent den neu generierten Agenten, den er für neu und gut hält, an das Bewertungssystem im dritten Schritt.

Das Bewertungssystem vergibt basierend auf Baseline-Tests eine objektive Punktzahl für die Fähigkeiten dieses Agenten und gibt ihn dann zurück in die Agenten-Beispielbibliothek.

Der Meta-Agent wird dann basierend auf den vorherigen Bewertungsergebnissen und früheren Beispielen in der Beispielbibliothek die nächste Iterationsoptimierung durchführen, um eine höhere Aufgabenleistungspunktzahl zu erreichen.

Eine vollständig automatisierte Kette entsteht in diesem Prozess. Um einen äußerst effektiven Agenten zu generieren, können zweistellige Iterationen erforderlich sein.

Handgefertigte Agenten übertreffen

Wie komplex können die durch die ADAS-Methode automatisch generierten Agenten sein? Die folgende Abbildung zeigt den Rahmen eines Agenten, der nach 14 Iterationen generiert wurde.

In der Struktur dieses Agenten geben fünf Gedankenketten vorläufige Antworten. Drei Expertenmodelle und ein Modell, das menschliches Feedback imitiert, geben Rückmeldung zu diesen Antworten, die dann in der Optimierungsphase dreimal modifiziert und verstärkt werden. Schließlich werden drei Ergebnisse durch Bewertung und Auswahl herausgefiltert und zu einer endgültigen Antwort zusammengeführt.