Aufbau einer semantischen Suche: Was für den Beginn unserer Reise wichtig war

Forschung auf dem Gebiet der Künstlichen Intelligenz (KI) ist anspruchsvoll, aber auch voller Potenzial – insbesondere für ein neues Team. Mit der Gründung im Jahr 2022 stand für CONTACT Research von Anfang an KI als einer von vier zentralen Forschungsbereichen fest. Wir haben uns hierbei zunächst auf kleinere Projekte – unter anderem im Bereich der klassischen Datenanalyse – konzentriert. Mit der wachsenden Popularität von ChatGPT fokussierten wir uns verstärkt auf Large Language Models (LLM) und haben die Chance ergriffen, mit den neusten Werkzeugen und Technologien dieses zukunftsweisenden Feldes zu arbeiten. Die zentrale Frage für uns als Forschungsteam war dabei: Wie starten wir?

Wir möchten hier einige unserer Erfahrungen teilen, die als Orientierung für den erfolgreichen Weg in die Welt der KI dienen können.

Der Start: Warum Ähnlichkeitssuche unser Ausgangspunkt wurde

Von Anfang an war klar: Wir wollen kein reines Forschungsprojekt, sondern einen echten Anwendungsfall, bestenfalls um ihn direkt in unsere Software zu integrieren. Um den Start zu erleichtern, haben wir bewusst auf kleine Experimente gesetzt und nach einem spezifischen Problem gesucht, das sich schrittweise lösen lässt.

Innerhalb unserer Software liegen viele Informationen ab, von Produktinformationen bis hin zu Projektdetails. Eine leistungsfähige Suche macht dort einen entscheidenden Unterschied. Unsere bestehende Suchfunktion erkennt keine Synonyme, keine natürliche Sprache – und damit manchmal nicht das, was man wirklich sucht. Zusammen mit wertvollem Feedback ergab sich daraus schnell, dass die Ähnlichkeitssuche ein idealer Startpunkt ist und daher unser erstes Forschungsthema sein sollte. Ein LLM kann die Suchfunktion auf ein neues Level heben.

Die Auswahl der Daten macht den Unterschied

Unsere Vision war es, Wissen aus verschiedenen Quellen, wie Handbüchern, Tutorials und Spezifikationen, leicht zugänglich zu machen – durch eine einfache Frage. Im ersten und wichtigsten Schritt mussten wir eine geeignete Datenquelle finden: groß genug, um aussagekräftige Ergebnisse zu liefern, aber nicht so umfangreich, dass Ressourcenprobleme den Fortschritt behindern. Außerdem musste der Datensatz qualitativ hochwertig und leicht verfügbar sein.

Für die Experimente wählten wir die webbasierte Dokumentation unserer Software. Sie enthält keine vertraulichen Informationen und ist für Kunden und Partner zugänglich. Erste Experimente erzielten schnell vielversprechende Ergebnisse, also vertieften wir die Entwicklung einer semantischen Suchanwendung.

Was ist die semantische Suche?

Kurz gesagt, im Gegensatz zur klassischen Stichwortsuche erkennt die semantische Suche auch verwandte Begriffe und erweitert die Anfrage um inhaltlich verwandte Ergebnisse, auch wenn diese anders formuliert sind. Wie funktioniert das? In unserem ersten Versuch mit der semantischen Indizierung wandelt das LLM die Inhalte der Quelltexte in Vektoren um und speichert sie in einer Datenbank. Suchanfragen werden ebenfalls zu Vektoren und per „Nearest-Neighbor“-Suche mit gespeicherten Vektoren verglichen. Die Ergebnisse gibt das LLM als sortierte Liste mit Links zur Dokumentation aus.

Plant die Infrastruktur sorgfältig!

Um unser Projekt umzusetzen, mussten viele technische und strategische Entscheidungen getroffen werden: Für die Pipeline, die die Daten verarbeitet, erfüllte LangChain am besten unsere Anforderungen. Und auch die Hardware bringt Herausforderungen mit sich: Für Textmengen in dem Ausmaß reichen Laptops nicht aus, sodass Server oder Cloudanbieter erforderlich sind. Eine gut durchdachte Struktur der Datenbank ist daher ein wichtiger Schlüssel zur erfolgreichen Umsetzung.

Erfolg durch Teamwork: Daten, Scope und Vision im Fokus

Für den Erfolg zählt nicht nur die Technik, sondern auch wie sich das KI-Team zusammensetzt. Essenziell sind Dateningenieur*innen, die technisches Wissen und strategische Ziele verbinden; Data Scientists, die große Datenmengen analysieren; und KI-Architekt*innen, die die Vision der KI-Nutzung definieren und die Abstimmung im Team koordinieren. KI-Tools halfen uns zwar mit „einfachen“ Routineaufgaben und kreativen Anstößen, sie ersetzen aber trotzdem nicht den konstruktiven Austausch und die enge Zusammenarbeit im Team.

Feedback einholen und besser werden

Zum Abschluss dieser ersten Phase haben wir eine interne Beta-Version der semantischen Suche mit unseren Kolleg*innen geteilt. So konnten wir wertvolles Feedback sammeln, um die nächsten Schritte zu planen. Die Begeisterung für die Weiterentwicklung ist groß, und damit auch unsere Motivation, weiterzumachen.

Was kommt als nächstes?

Unsere Reise in der KI-Forschung hat gerade erst begonnen, aber wir haben bereits wichtige Wegweiser gefunden. Viele spannende Fragen liegen noch vor uns: Welches Modell passt langfristig am besten? Wie machen wir die Ergebnisse für Nutzer*innen zugänglich?

Unser Team wächst weiter – an Expertise, an Mitgliedern und Visionen. Mit jedem Meilenstein kommen wir dem Ziel näher: das volle Potenzial von KI in unsere Arbeit zu integrieren.

Ausführliche Beiträge zur Gründung unseres KI-Teams sowie zur semantischen Suche finden Sie auf dem CONTACT Research Blog.

Die Verwaltungsschale in der Praxis

Was ist eine Verwaltungsschale?

Industrie 4.0 verspricht effizientere und nachhaltigere Fertigungsprozesse via Digitalisierung. Die Grundlage hierfür entsteht durch den reibungslosen, automatischen Austausch von Informationen zwischen Anlagen und Produkten. Hier kommt die Verwaltungsschale (VWS; englisch: Asset Administration Shell) ins Spiel.

Eine Verwaltungsschale ist ein anbieterunabhängiger Standard für die Beschreibung Digitaler Zwillinge. Im Grunde ist sie das digitale Abbild eines Assets; entweder eines physischen Produkts oder eines virtuellen Gegenstands (z. B. Dokumente oder Software).

Die VWS definiert das Erscheinungsbild des Assets in der digitalen Welt. Sie beschreibt, welche Informationen eines Gerätes für die Kommunikation relevant sind und wie diese Informationen dargestellt werden. Die VWS eines Gegenstands kann damit alle wichtigen Daten über das Asset standardisiert und automatisiert bereitstellen.

Um zu verstehen, welchen Mehrwert eine VWS der Industrie bietet, hilft ein Blick in die Praxis.

Praxisbeispiel: VWS als Basis für neue Dienstleistungen

Im Rahmen des Forschungsprojekts ESCOM arbeitet CONTACT Software mit der GMN Paul Müller Industrie GmbH & Co. KG an der Umsetzung VWS-basierter Komponenten-Services. Das familiengeführte Unternehmen produziert Motorspindeln, die von seinen Kunden als Komponenten in Werkzeugmaschinen für die Metallbearbeitung eingebaut und anschließend weiterverkauft werden.

Bereits vor Beginn des Projektes hatte GMN eine neue Sensortechnologie entwickelt. Sie ermöglicht tiefe Einblicke in das Verhalten der Spindel und gewährt Aussagen zum ganzheitlichen Betrieb des Spindelsystems. Diese Informationen will die Firma nutzen, um neue, produktbegleitende Dienstleistungen anzubieten:

  • Zertifizierte Inbetriebnahme: Bevor GMN seine Spindeln ausliefert, werden die Komponenten auf dem hauseigenen Prüfstand einem festgelegten Prüfzyklus unterzogen. Mit den Daten aus diesem Referenzzyklus will das Unternehmen sicherstellen, dass Motorspindeln im Kundenunternehmen korrekt verbaut und in Betrieb genommen werden.
  • Prediktive Services: Einsatzdaten, die Rückschlüsse zur Verfügbarkeit und zum Betrieb der Spindeln erlauben, sollen Kunden mit der sensorischen Mikroelektronik IDEA-4S kontinuierlich erfassen und analysieren können. Im Bedarfsfall können die Daten gemeinsam mit GMN genutzt werden, zum Beispiel für Problemanalysen. Dies spart wertvolle Zeit bis zur Wiederinbetriebnahme der Bearbeitungsmaschine. Perspektivisch kann das Unternehmen vorausschauende Service-Angebote wie Predictive Maintenance realisieren.

Über die GMN Paul Müller Industrie GmbH

Die GMN Paul Müller Industrie GmbH ist ein familiengeführtes Maschinenbauunternehmen mit Sitz in Nürnberg. Es produziert Hochpräzisionskugellager, Maschinenspindeln, Freiläufe, berührungslose Dichtungen sowie elektrische Antriebe, die in zahlreichen Industrien zum Einsatz kommen. Einen Großteil dieser Komponenten fertigt die Firma individuell für ihre Kunden am Standort und vertreibt seine Produkte über ein weltweites Vertriebsnetzwerk.

Wie werden die neuen Angebote umgesetzt?

Für solche Services müssen Unternehmen auf die Sensordaten ihrer Maschinen zugreifen und diese analysieren können. Zugleich gilt es, Maschinen (bzw. deren Komponenten) zu befähigen, selbstständig mit anderen Assets und Systemen rund um den Shopfloor zu kommunizieren. Für beide Aufgaben nutzt GMN die Plattform CONTACT Elements for IoT. Die modular aufgebaute Software hilft dem Unternehmen nicht nur, die Referenz- und Einsatzdaten der Spindeln zu erfassen, zu dokumentieren und auszuwerten. Sie enthält auch Funktionen, mit denen User die VWS für ein Asset anlegen, befüllen und verwalten können.

Hintergrund

Bei der Realisierung der Services, die auf Betriebsdaten der Spindel basieren, profitiert GMN von der Zusammenarbeit mit einem Kunden. Dieser verbaut die Spindeln in Bearbeitungsmaschinen, die GMN zur Herstellung eigener Produkte einsetzt. Daher kann GMN die Betriebsdaten in-house gewinnen und zur Verbesserung der nächsten Spindelgeneration verwenden.

Welche Rolle spielt die Verwaltungsschale?

Damit die Komponenten Informationen in standardisierter Form austauschen können, muss für die Spindel auf Artikel- und Seriennummernebene eine AAS angelegt werden. Auch dies geschieht in CONTACT Elements for IoT. Die neuen Services werden darin in einem sogenannten VWS-Metamodell abgebildet. Es dient als „Absprungpunkt“ zu den Service-Angeboten.

VWS und Teilmodelle

Die VWS einer Industrie 4.0-Komponente besteht aus einem oder mehreren Teilmodellen, die jeweils eine strukturierte Menge an Merkmalen enthalten. Sie werden von der Industrial Digital Twin Association (IDTA) festgelegt, einem Verein, in dem 113 Organisationen aus den Bereichen Forschung, Industrie und Software (u. a. CONTACT Software) an der Definition von VWS zusammenarbeiten. Eine Liste mit allen derzeit verfügbaren Teilmodellen finden Sie unter https://industrialdigitaltwin.org/content-hub/teilmodelle.

Die Teilmodelle der VWS kann GMN in CONTACT Elements for IoT mit wenig Aufwand selbst befüllen. Die Plattform beinhaltet ein Widget, das im Rahmen des Forschungsprojekts als Prototyp entwickelt wurde. Es zeigt Usern an, welche Teilmodelle derzeit beim Asset vorhanden und welche verfügbar, aber noch nicht angelegt sind. Über das Frontend können User direkt auf den REST-Knoten springen und Teilmodelle hoch- bzw. herunterladen (im VWS-/JSON-Format).

Bei der Umsetzung der datenbasierten Service-Angebote konzentriert sich GMN auf die Teilmodelle

  • Time Series Data (u. a. semantische Informationen über Zeitreihendaten)
  • Typenschild (u. a. Informationen zum Produkt, dem Namen des Herstellers sowie der Produktbezeichnung und -familie),
  • Kontaktinformationen (standardisierte Metadaten einer Maschine/Anlage) sowie
  • Carbon Footprint (Informationen zum Carbon Footprint einer Maschine/Anlage)

Die Befüllung der Teilmodelle ist simpel. Das zeigt sich im Kontext von GMN am Modul Time Series Data. Während der Referenzfahrt einer Motorspindel auf dem internen Prüfstand werden die Zeitreihendaten von CONTACT Elements for IoT aufgezeichnet und automatisch in das Teilmodell der VWS der gerade geprüften Motorspindel übertragen. Zugleich legt die Plattform ein Dokument zur Referenzfahrt an. Dadurch kann GMN deren Gültigkeit jederzeit tracken und für externe Stakeholder bereitstellen.

Neue Services nehmen Gestalt an

Der Einsatz von Verwaltungsschalen erlaubt es GMN, seine Service-Ideen zu realisieren. Das betrifft aktuell den Inbetriebnahme-Service und die automatisierten Services zur Qualitätssicherung.

Durch die Analyse der Spindeldaten kann das Unternehmen Ausreißer in den Einsatzdaten erkennen und darauf aufbauend Handlungsempfehlungen geben. Unterschiedliche Schwinggeschwindigkeiten deuten beispielsweise darauf hin, dass die Spindel in der Maschine falsch verbaut wurde oder zeitlich veränderliche Vorgänge stattfinden. Genauso lassen sich anhand der Analyse Aussagen über Anomalien im Betriebsverhalten treffen.

Die Transparenz, die auf diesem Weg entsteht, wird in CONTACT Elements for IoT mithilfe von Dashboards erhöht. GMN sieht darin alle relevanten Informationen zu den auf dem Prüfstand befindlichen Spindeln, von 3D-Modellen bis hin zu Zustandsdaten. Diese Übersicht ist nicht zuletzt für das Qualitätsmanagement von hohem Wert.

Die Verwaltungsschale einer Spindel in CONTACT Elements.

Zusammengefasst

Verwaltungsschalen sind anbieterunabhängige Standards, mit denen Unternehmen Digitale Zwillinge beschreiben. Sie zählen zu den wichtigsten Hebeln für die Umsetzung neuer Industrie-4.0-Geschäftsmodelle, denn sie ermöglichen die Kommunikation zwischen Assets, Systemen und Organisationen.

Wie der Einsatz von Verwaltungsschalen in der Praxis funktioniert, zeigt das Beispiel GMN. Die Firma konzipiert damit neue, produktbegleitende Dienstleistungen, die auf den Informationen der VWS ihrer Produkte basieren. Diese Angebote kann GMN durch die fortwährende Analyse von Einsatzdaten in CONTACT Elements for IoT sukzessive verbessern.

Wegbereiter für die Nachhaltigkeit: Der Digitale Produktpass

Haben Sie sich schon einmal gefragt, welche Informationen sich hinter den Produkten verbergen, die unseren Alltag bestimmen? Vom Smartphone bis zur Verpackung von Lebensmitteln – der Digitale Produktpass (DPP) soll auf einen Blick zu zeigen, woher ein Produkt stammt, wie es hergestellt wurde sowie ob und wie es sich reparieren lässt. Daher hat der DPP das Potential, unsere Konsumgewohnheiten positiv zu beeinflussen und ist somit auch zukünftig für Unternehmen relevant.

Hinter den Kulissen: Der Digitale Produktpass erklärt

Der DPP ist als Konzept im Rahmen des europäischen Green Deal und des EU-Aktionsplans für die Förderung der Kreislaufwirtschaft entstanden. Die Idee mag zunächst abstrakt klingen, aber sie wird bereits zu einem zentralen Element des nachhaltigen Konsums. Analog zu dem Bild eines „Reisepasses“ vermerkt er alle wichtigen Stationen im Lebenszyklus eines Produktes und gibt so detaillierte Einblicke in Produktion, Reparatur und Entsorgung.

Warum ist das wichtig?

Stellen Sie sich vor, Sie könnten beim Kauf eines Produkts genau nachvollziehen, ob es nachhaltig hergestellt wurde und wie umweltfreundlich es sich am Ende seines Lebens verhält – der DPP gibt diese Einblicke. Es handelt sich dabei nicht mehr um ein reines Konzept: Die Europäische Union hat seine Einführung vorgeschrieben und bis 2030 sollen alle Branchen einbezogen werden. Die ESG-Reporting-Pflicht und das Lieferkettengesetz fordern von Unternehmen mit über 500 Mitarbeiter*innen bereits, ihre Daten zu erheben. In Deutschland betrifft der Pass als Erstes ressourcenintensive Branchen wie Elektronik, Elektrofahrzeuge, Industriebatterien, Textilien, Baugewerbe, Verpackungen und Kunststoffe.

Was beinhaltet der Digitale Produktpass?

Das Deutsche Institut für Normung (DIN) und die Deutsche Kommission Elektrotechnik Elektronik Informationstechnik (DKE) haben einen Ausschuss zum Digitalen Produktpass gegründet, mit dem Ziel, Anforderungen an die technische Gestaltung des DPP zu definieren. Dazu gehören beispielweise Informationsträger mit einheitlichen Identifikatoren für das Produkt, Informationen über die Umweltauswirkungen sowie Langlebigkeit, Materialien, Zulieferer und mehr. Um eine Anpassung an die unterschiedlichen Produktgruppen und -branchen mit einer Vielzahl von unterschiedlichen Daten zu ermöglichen, benötigt der DPP jedoch eine entsprechende modulare Architektur.

Wie der Digitale Produktpass das Konsumverhalten beeinflussen wird

Verbraucher*innen eröffnet der DPP einen klaren Blick auf die gesamte Reise eines Produkts, von der Entstehung bis zur Entsorgung oder Wiederverwertung. So könnte er durch seine Förderung der Transparenz einen erheblichen Einfluss auf unser Konsumverhalten haben. Mit Hilfe des unkomplizierten Einblickes in die Umweltauswirkungen ermutigt er Konsumenten beispielweise dazu, langlebige Produkte auszuwählen. Mithilfe von mehreren Detailstufen können die Informationen auf unterschiedliche Zielgruppen zugeschnitten werden.

Der DPP als Treiber der nachhaltigen Kreislaufwirtschaft

Dabei ist der DPP mehr als nur ein Reisepass für Produkte: er treibt das nachhaltige Wachstum in der Kreislaufwirtschaft an. Der Produktpass optimiert den Produktlebenszyklus, fördert Standardisierung und nachhaltiges Design, verbessert Ressourcen- und Recyclingeffizienz und hilft bei der umweltfreundlichen Beschaffung.

Der DPP im Unternehmen

Für Unternehmen ist es wichtig, sich frühzeitig auf die Einführung des DPP vorzubereiten. PLM-Systeme wie CIM Database PLM und hochentwickelte IT-Lösungen nehmen dabei viel Arbeit ab. Zum Beispiel können sie LCA-Daten (Life Cycle Assessment) direkt anhand der Stücklisten und Arbeitspläne berechnen und mit Material Compliance-Methoden eine sichere Materialauswahl gewährleisten. IoT-Systeme wie CONTACT Elements for IoT liefern zusätzlich Daten aus der Produktion, die zu effektivem Energiemanagement beitragen können.

Ein strategischer Schritt für die nachhaltige Zukunft?

Der DPP ist also nicht nur eine reine Informationsquelle, sondern bietet Verbraucher*innen fundierte Informationen, um verantwortungsbewusste Kaufentscheidungen zu treffen. Unternehmen können sich erfolgreich auf DPP-Standards vorzubereiten, indem sie ihre PLM-Systeme und IT-Lösungen ausbauen. Der Digitale Produktpass ist somit ein strategischer Schritt und wegweisende Notwendigkeit für eine nachhaltige Zukunft.

Einen umfassenderen Beitrag zum Digitalen Produktpass finden Sie hier auf dem CONTACT Research Blog.