Künstliche Intelligenz

Wofür ist Quantum Computing gut?

Beim Thema Quantum Computing (QC) hat sich nach den durchaus realen Durchbrüchen in der Hardware und einigen spektakulären Ankündigungen unter Titeln wie „Quantum Supremacy“ der übliche Hype Cycle entwickelt mit einer Phase von vagen und überzogenen Erwartungen. Ich möchte hier versuchen, kurz einzuordnen, warum der enorme Aufwand in diesem Bereich überhaupt getrieben wird und welche realistischen Erwartungen dahinter stecken.

Um die fundamentalen Unterschiede zwischen QC und Classical Computing (CC) zu verstehen, muss man zunächst einen Schritt zurücktreten und sich fragen, auf welcher Basis beide Computing-Paradigmen operieren. Für das CC ist die Basis die universelle Turing-Maschine ausgedrückt in der allgegenwärtigen von-Neumann-Architektur. Das mag ein wenig abgehoben klingen, ist aber im Grunde einfach zu verstehen: Eine universelle Turing-Maschine abstrahiert den Sachverhalt, dass man in einen klassischen Computer jeden Algorithmus einprogrammieren kann (universell), der irgendwie (klassisch) algorithmisch ausdrückbar ist (Turing-Maschine).

Die weitaus meisten „Algorithmen“, die praktisch implementiert werden, sind dabei schlichte Sequenzen von Aktionen, die auf äußere Ereignisse reagieren wie Mausklicks auf einer Webseite, Transaktionen im Web-Shop oder Meldungen von anderen Computern im Netzwerk. Ein sehr sehr geringer, wenn auch wichtiger Anteil von Programmen macht das, was man im Allgemeinen mit dem Wort Algorithmus assoziiert, nämlich das Durchführen von Rechenoperationen zur Lösung eines mathematischen Problems. Die Turing-Maschine ist das angepasste Denkmodell zur Programmierung dieser Probleme und führt dazu, dass Programmiersprachen die Konstrukte aufweisen, die man gewohnt ist: Schleifen, Verzweigungen, elementare Rechenoperationen etc.

Was ist das Computing-Paradigma für einen Quantencomputer?

Ein Quantencomputer ist aufgebaut aus Quantenzuständen, die miteinander verschränkt werden können und über Quantengatter evolviert werden. Ist auch ein bisschen abgehoben, heißt aber einfach ausgedrückt, dass ein Quantencomputer so eingestellt wird, dass er einen (Quanten)Anfangszustand hat, der sich in der Zeit entwickelt und zum Schluss gemessen wird. Das Paradigma für einen Quantencomputer ist deshalb die Schrödingergleichung, die fundamentale Gleichung der Quantenmechanik. Ohne die Details zu verstehen, dürfte klar sein, dass sich Allerweltsprobleme schwer in den Formalismus der Quantenmechanik pressen lassen und dieser Aufwand wahrscheinlich auch keinen Gewinn bringt: Die Quantenmechanik ist eben nicht das angepasste Denkmodell für die meisten (Allerwelts-)Probleme und bei der Lösung auch nicht effizienter.

Was kann man dann damit?

Die Antwort ist sehr einfach: QC ist im Wesentlichen eine Methode zum Quantum Computing. Das klingt jetzt redundant, heißt aber, dass ein Quantencomputer eine universelle Maschine ist, um Quantensysteme zu berechnen. Dieser Vision, die Richard Feynman schon 1981 formuliert hat, folgt die Logik der Forschung bis heute. So ist es wenig überraschend, dass die Veröffentlichungen zum Thema, die sich mit Anwendungen befassen, entweder in der Quantenchemie oder der Grundlagenforschung der Physik angesiedelt sind [5][6].

Warum ist das wichtig?

Weil der klassische Computer sehr ineffizient darin ist, Quantensysteme zu berechnen oder zu simulieren. Diese Ineffizienz ist prinzipiell begründet in der mathematischen Struktur der Quantenmechanik und wird sich durch noch so gute klassische Algorithmen nicht beheben lassen. Neben Fragen der Grundlagenforschung wird QC wahrscheinlich auch wichtig werden im Bereich der Hardware klassischer Computer, wo man im Zuge der Miniaturisierung an Grenzen der Auslegung von Transistoren auf den Chips mit Hilfe der klassischen Theorien zur Elektrizität stößt.

Daneben gibt es eine Reihe interessanter Verbindungen zur Zahlentheorie und anderen diversen Problemen, die man bisher als interessante Kuriosa einstufen kann. Allein die Verbindung zur Zahlentheorie könnte nach jetzigem Wissensstand eine erhebliche Auswirkung haben, da sich aus historischen Gründen fast alle praktischen asymmetrischen Verschlüsselungsverfahren auf Algorithmen stützen, die im Wesentlichen annehmen (einen Beweis dafür gibt es nicht), dass die Primzahlfaktorisierung mit klassischen Algorithmen nicht effizient zu lösen ist. Quantencomputer können das im Prinzip, sind jedoch hardware-technisch weit davon entfernt, das zu realisieren.

Developer Experience – von intuitiv bis komplex

Es klingt nach einer spannenden Zukunftsvision: Anwender:innen jedes Fachbereichs nutzen vorgefertigte Programmbausteine, um schnell und einfach Simulationen, Optimierungsaufgaben oder Analysen mittels Künstlicher Intelligenz (KI) zu erstellen. Das können dann auch Fachabteilungen umsetzen, deren Mitarbeiter:innen nicht über Kenntnisse in einer höheren Programmiersprache verfügen. Soweit die Idee. Vorab müssen Entwickler:innen diese Programmbausteine natürlich erstellen, damit Fachanwender:innen daraus eine für ihre Anforderung passende Lösung zusammensetzen können.

KI-gestützte Analysen für die Fachabteilung

Gemeinsam mit unseren Partnern forschen wir im Projekt KI-Marktplatz daran, dieser Vision ein Stück näher zu kommen. Namensgebendes Ziel ist es, KI-Anwendungen auf dem Gebiet des Produktentstehungsprozess zu entwickeln und auf einer zentralen Handelsplattform anzubieten. Das Angebot soll zudem Services, wie zum Beispiel Seminare zu ausgewählten KI-Themen oder Auftragsentwicklungen sowie fertige KI-gestützte Apps und Programmblöcke für ganz spezielle Aufgaben umfassen. Die Entwicklung und Wiederverwendung der Apps befinden sich aktuell in der Erprobung. Parallel dazu evaluiert das Projektteam Nutzen und Qualität der Resultate.

Verschiedene Programmierebenen für eine breitere Anwendung

Soweit der Stand der Forschung, aber wie genau unterstützen wir bei CONTACT die Entwicklung wiederverwendbarer Programmbausteine, die Integration von Simulationsmodellen oder KI-gestützter Analysemethoden? Ein Beispiel für den Einsatz in der Praxis findet sich im Bereich der vorausschauenden Wartung (englisch: predictive maintenance). Vorausschauend heißt, dass Wartungszeiträume nicht wie bisher in festen Abständen stattfinden, sondern in Abhängigkeit von Betriebsdaten und Ereignissen an der Maschine oder Anlage berechnet werden. Unsere Plattform Elements for IoT stellt für solche Anwendungsfälle eine Lösung bereit, Betriebsdaten direkt zu analysieren. Dabei speichert der Digitale Zwilling die Daten der jeweiligen Maschine oder Anlage in einem eindeutigen Kontext. Diese lassen sich anhand einer blockbasierten Programmierung direkt abrufen und einfach auswerten. Mit der No-Code-Funktionalität der IoT-Plattform können Fachabteilungen Digitale Zwillinge intuitiv erstellen, automatische Regeln definieren und Ereignisse überwachen sowie Diagramme und Dashboards anlegen – ohne eine Zeile Code zu schreiben.

Darüber hinaus gibt es Anwendungen rund um den Digitalen Zwilling, die mehr Programmier-Know-how erfordern. Hierfür bietet die Plattform Analysten die Möglichkeit, mit einem Jupyter Notebook oder anderen Analysewerkzeug ihre Modelle in einer höheren Programmiersprache selbst zu entwickeln. Vor allem im Bereich des Prototyping ist Python die Sprache der Wahl. Es ist aber auch möglich, mit einer Compiler-basierten Programmiersprache wie C++ zu arbeiten. Eine kontinuierliche Berechnung der Prognosen erfolgt dann über eine Automatisierung der Modelle, die in einer Laufzeitumgebung zur Verfügung stehen. Die Ausführung des Codes erfolgt entweder in der eigenen IT-Infrastruktur oder direkt an der Anlage oder Maschine im Feld (Edge).

Dieses Vorgehen fassen wir unter dem Begriff Low-Code-Entwicklung zusammen, da nur noch der Code für die Entwicklung der Modelle geschrieben wird. Die Datenanbindung erfolgt über den Digitalen Zwilling und geschieht konfigurativ. Das Stück Programm-Code kann dann für verschiedene Anwendungen, wie beispielsweise Digitale Zwillinge innerhalb einer Flotte, als Programmblock wiederverwendet werden.

CONTACT Elements for IoT ist somit offen für Interaktionen auf unterschiedlichen Levels: Von der Verwendung vordefinierter Bausteine (No-Code), über die Möglichkeit, mit selbstgeschriebenem Programm-Code zu interagieren (Low-Code), bis zur Definition eigener Geschäftsobjekte und der Erweiterung der Plattform auf der Basis von Python.

KI – Wo wir im Hype Cycle stehen und wie es weiter geht

Während sich der Anstieg der Forschungsartikel und Konferenzen im Bereich KI laut artificial intelligence index weiter fortsetzt, lässt sich in den Medien langsam eine gewisse Ermüdung angesichts des Hypes erkennen. Zeit also, Bilanz zu ziehen: Was ist erreicht worden? Was ist praktisch möglich? Und wie geht es weiter?

Was ist erreicht worden?

In den Jahren 2018 und 2019 wurden die vorher entwickelten Methoden zur Anwendung von neuronalen Netzwerken (so definiere ich hier KI) weiter verfeinert und perfektioniert. Standen zunächst (2012-2016, Imagenet-Wettbewerb) Verfahren zur Bildklassifizierung und -verarbeitung und danach Audio-Verfahren (2015-2017, Start von Alexa und anderen Sprachassistenten) im Mittelpunkt, wurden 2019 große Fortschritte in der Textverarbeitung und -generierung gemacht (NLP = natural language processing). Insgesamt sind die zur Verfügung stehenden Techniken mit hohem Aufwand vor allem der großen Player (Google, Facebook, OpenAI, Microsoft) weiter verbessert und kombiniert worden.

Was ist praktisch möglich?

Die Anwendung von KI ist im Wesentlichen immer noch begrenzt auf vier Anwendungsbereiche:

Bilder: Bilderkennung, -segmentierung
Audio: Umwandlung von Sprache in Text und umgekehrt
NLP: Textverarbeitung und -generierung
Labeled Data: Vorhersage des Labels (z.B. Preis) aus einer Menge von Featuren

Diese Liste ist überraschend kurz, gemessen an der Aufmerksamkeit, die KI in den Medien erhält. Die beeindruckendsten Erfolge von KI ergeben sich allerdings aus einer Kombination der Techniken wie z.B. Sprachassistenten durch Kombination von Audio, NLP und Labeled Data zur Umwandlung der Eingabe in Text, Erkennung der Textintention mit NLP und Vorhersage des Sprecherwunsches durch Anwendung von riesigen Mengen von Labeled Data, also vorherigen Auswertungen ähnlicher Äußerungen.

Entscheidend für die Entwicklung gerade dieser KI-Anwendungsfelder waren:

Das Vorliegen großer Mengen frei verfügbarer Benchmark-Datensätze (Datensätze für Machine Learning), an denen Algorithmen entwickelt und verglichen wurden
Eine große Forschergemeinde, die sich gemeinsam auf die Benchmark-Datensätze verständigt hat, und ihre Algorithmen in öffentlichen Wettbewerben vergleicht (GLUE, Benchmarks AI, Machine Translation u.a.)
Eine freie Verfügbarkeit der entwickelten Modelle, die als Ausgangspunkt für den praktischen Einsatz dienen (beispielhaft Tensorflow Hub)

An Hand dieser Voraussetzungen kann man schnell einschätzen, wie realistisch manche Marketing-Fantasien sind. Z.B. gibt es für das oft plakativ vorgebrachte Einsatzgebiet Predictive Maintenance weder Benchmarkdatensätze noch eine Forschergemeinde und entsprechend auch keine Modelle.

Wie geht es weiter?

Es ist zum einen abzusehen, dass die weitere Entwicklung im KI-Bereich sicherlich zunächst in den vorgenannten Anwendungsfeldern weitergeht und sich an den Randbereichen weiterentwickelt. Zum anderen zeichnen sich Bereiche ab, die ähnlich wie die vorgenannten Einsatzgebiete unter Aufwendung großer öffentlicher und privater Mittel (z.B. werden OpenAI und Deepmind mit Milliardensummen von Elon Musk bzw. Google bezuschusst) vorangetrieben werden. Exemplarisch für große Investitionen in diesem Bereich steht sicher das autonome Fahren aber auch der Bereich IoT. Insgesamt sehe ich folgende Bereiche, die sich 2020-2022 stark weiterentwickeln:

Die Verbindung von Reinforcement Learning mit KI-Gebieten zum schnelleren Anlernen von Modellen
Eine weitere Verstärkung im Bereich autonomes Fahren, die sich aus der Anwendung und Kombination von KI und Reinforcement Learning ergibt
Durchbrüche in der Verallgemeinerung der Erkenntnisse aus der Bildverarbeitung auf 3D (Geometric Deep Learning und Graph Networks)
Eine Verschmelzung von traditionellen Methoden aus der Statistik mit neuronalen Netzwerken
IoT-Zeitreihen (s.u.)

Einen großen Wandel sehe ich durch das Aufkommen von IoT und der damit einhergehenden Sensorik und Daten auf uns zukommen. IoT-Daten sind ihrer Natur nach Zeitreihen, die zur Auswertung gefiltert, kombiniert, geglättet und angereichert werden müssen. Zu diesem Zweck ist bisher relativ wenig Spezifisches passiert. Es könnte sein, das ab 2020 – 2022 dieses Thema einige überraschende Wendungen und Durchbrüche für uns bereithält. Insbesondere die deutsche Industrie, die von den ersten Entwicklungen im Bereich KI eher wenig profitiert hat, dürfte hier ein vielversprechendes Einsatzgebiet finden.