Interview: Die Zukunft künstlicher Intelligenz sind Produkte und Services, die auf lebenslangem Lernen beruhen

Pankaj Gupta und Korbinian Spann sprechen über die Zukunft von Natural Language Processing

Dr. Korbinian Spann
Dr. Korbinian Spann
28. Oktober 2020

Dr. Pankaj Gupta hat seinen Doktortitel in Informatik mit einem Schwerpunkt auf Deep Learning und NLP (Natural Language Processing) erworben. Er war sechs Jahre lang bei Siemens als leitender Wissenschaftler und veröffentlichte mehr als 15 Patente und 20 Publikationen. Mit der DRIMCo GmbH in München hat er sein eigenes Startup gegründet. Für Insaas arbeitet Pankaj als “Technology und Science Advisor”. 

Insaas bietet eine Softwareplattform für die Entwicklung von kundenorientierten Services und Produkten auf der Grundlage von Daten. Unsere Vision ist, mit Unternehmen den Übergang von standardisierten Massenprodukten zu personalisierten Produkte und Dienstleistungen zu gestalten: umweltfreundlich, effizient und automatisch produziert, sinnstiftend für Mitarbeiter. Um alle Kundenstimmen in verschiedenen Sprachen und Themen zusammenzufassen, arbeiten wir mit Insaas mit einer künstliche Intelligenz, die “lebenslang” lernt (lifelong learning). Diese Lösung wird im Laufe der Zeit in der Lage sein, menschliche Empfindungen und Präferenzen immer besser zu verstehen. 

Korbinian: Warum glaubst Du, dass lebenslanges Lernen für künstliche Intelligenz ein entscheidender Schritt sein wird?

Pankaj: Lebenslanges Lernen ist im Zeitalter der künstlichen Intelligenz von entscheidender Bedeutung. Und es ist eines der Themen, mit denen ich mich sehr beschäftige. Wie wir Menschen sammelt dieses System ständig neues Wissen, verwendet das vergangene Wissen für zukünftiges Lernen und minimiert das “Vergessen” des vergangenen Lernens.  

Die klassischen Systeme des maschinellen Lernens sind isoliert aufgebaut, dass heißt sie laufen auf einem bestimmten Datensatz für eine bestimmte Aufgabe und speichern und akkumulieren daher das gelernten Wissen nicht über Zeit. Und aufgrund dieses Vergessens (catastrophic forgetting) können diese Systeme Aufgaben nicht nacheinander modellieren. 

Im Vergleich dazu sind Systeme für lebenslanges Lernen so konzipiert, dass sie miteinander verbundenes Wissen über die gesamte Lebenszeit bewahren und wiederverwenden. Ein Beispiel wäre: Wenn ich gelernt habe, einen Satz auf Englisch zu formulieren, bedeutet das nicht, dass ich die Buchstaben des Alphabets vergesse. Ich würde sie mir trotzdem merken, und in der Tat nutze ich das vorherige alphabetische Wissen, um einen Satz zu formulieren. Der Mensch lernt ganz selbstverständlich lebenslang, aber für Maschinen ist es nicht trivial, deshalb sind die Systeme für lebenslanges maschinelles Lernen entscheidend für eine allgemeine künstliche Intelligenz.

Korbinian: Wie könnte in dieser Hinsicht ein Produkt aussehen? 

Pankaj: Ein KI-Produkt mit lebenslangen Lernfähigkeiten würde kontinuierliches Lernen beinhalten, zum Beispiel mit “Human-in-the-Loop” oder aktivem Lernen, bei dem Menschen KI-Systeme anleiten. 

Das Ziel ist, ständig Feedback zu geben, und die KI lernt mit diesen kontinuierlichen Rückmeldungen weiter. Und im Wesentlichen setzen Systeme des lebenslangen Lernens Techniken des Transfer-Lernens und der “Domain Adaptation” ein, um den Nutzern eine bessere KI-Erfahrung zu bieten, ohne das Gelernte zu vergessen. 

Wenn wir bei Insaas eine Analyse der Kundenrezensionen durchführen, wird das KI-Produkt für lebenslanges Lernen kontinuierlich über Ströme von Kundenfeedback von Social-Media-Plattformen lernen. Und das bedeutet, dass das System im Laufe der Zeit über Ströme von Kundenrezensionen aus verschiedenen Domänen lernt und auch vergangene Lernerfahrungen domänenübergreifend wiederverwendet und aufbewahrt.  

Korbinian: Wo siehst Du heute die größten Chancen in der Verarbeitung natürlicher Sprache?

Pankaj: Da sich NLP ständig weiterentwickelt, glaube ich, dass es endlose Möglichkeiten gibt. Aktuell gibt es jede Menge an Grundlagen- und Spitzenforschung in enormer Geschwindigkeit. Demgegenüber gibt es bei den praktischen Anwendungen ein großes Vakuum, insbesondere im industriellen Bereich der Analyse von Texten. 

Deshalb sehe ich eine große Chance darin, die Spitzenforschung im Bereich der KI für den Aufbau hochwertiger produktionsreifer NLP-Anwendungen zu verwenden. Vor allem für verschiedene Industriezweige birgt sie einige Herausforderungen, zum Beispiel den Mangel an Trainings Sets, Domain Shifts oder eine erschwingliche Infrastruktur wie GPUs. 

Ein Beispiel sind die BERT-Modelle. Sie werden erfolgreich in der wissenschaftlichen Community verwendet, doch ihre Anwendung in Produktionsumgebungen ist noch immer eine Herausforderung, da ihre Inferenz noch immer sehr langsam und rechenintensiv ist. Und es ist eine Herausforderung, große NLP-Modelle in der Infrastruktur der Kunden einzusetzen. 

Ich sehe eine weitere gute Gelegenheit im Aufbau von verknüpften NLP-Anwendungen für das lebenslange Lernen. Bei DRIMCo richten wir das für jede KI-Funktionalität ein, weil wir das Eigentum und die Privatsphäre der Kundendaten respektieren. Das Ziel besteht darin, ein dezentralisiertes KI-System für lebenslanges Lernen aufzubauen, bei dem die Kundendaten bleiben und die Algorithmen und Vorhersagemodelle zwischen den Clients und dem Server ausgetauscht werden. Der Zweck ist der mandantenübergreifende Transfer, der aus einem „Phantom“-Pool von Daten aus der realen Welt für ein besseres Kunden AIX (AI Experience) lernt, ohne die Kundendaten tatsächlich zu bewegen.