Sind Data Science Plattformen eine gute Idee?

Frei nach Karl Valentin gilt: Plattformen sind schön und schaffen einem jede Menge Arbeit vom Hals. Da kommt die Idee von Plattformen für die automatische Datenanalyse gerade recht. Passend dazu hat Gartner nun einen „Magic Quadrant for Data Science and Machine Learning Platforms“ veröffentlicht. Das Dokument selbst ist nur hinter einer Paywall einsehbar, aber im Netz bieten einige der im Report erwähnten Unternehmen den Zugriff auf das Dokument gegen Angabe der eigenen Adresse an.

Besonders hebt Gartner hervor, dass so eine Plattform alles was man braucht, aus einem Guss bereitstellen sollte; im Unterschied also zu diversen einzelnen Bausteinen, die nicht unmittelbar aufeinander abgestimmt sind.

Hört sich gut an! Allerdings: Data Science ist kein Bereich, in dem man mit einem Tool oder selbst  einer Plattform wie von Zauberhand weiterkommt. Die Entwicklung von Lösungen – etwa für Predictive Maintenance der Maschinen, die ein Unternehmen anbietet – durchläuft verschiedene Phasen, wobei Cleansing/Wrangling und Preprocessing den größten Teil der Arbeit ausmachen. In diesem Bereich sind ETL(Extract, Transform, Load )- und Visualisierungstools wie Tableau einzuordnen. Und jenseits der gedachten Komfortzone von Plattformen, die sich Manager so vorstellen, sind Datenbankabfragen und Skripte für die Transformation und Aggregation etwa in Python oder R schlicht das Mittel der Wahl. Ein Blick auf Data Science Online-Tutorials der top-Anbieter wie Coursera unterstreicht die Bedeutung dieser – nun ja – bodenständigen Werkzeuge. „Statistical analysis, Python programming with NumPy, pandas, matplotlib, and Seaborn, Advanced statistical analysis, Tableau, Machine Learning with stats models and scikit-learn, Deep learning with TensorFlow“ lautet ein Kursprogramm von Udemy.

Hinzu kommt: Oft bleiben die Projekte in diesem Vorfeld stecken oder werden abgebrochen. Das hat viele Gründe:

  • man findet keinen analytischen/statistischen Ansatz
  • die ursprüngliche Idee erweist sich als nicht durchführbar
  • die Daten sind nicht in der Menge oder Qualität, die man braucht, vorhanden
  • einfache Analysen und Visualisierungen reichen schon aus und alles weiter wäre „oversized“

Das ist nicht schlimm, bedeutet es doch nur, dass der automatisierte Einsatz von Machine Learning und KI nicht aus jedem Datensatz gleich einen Datenschatz macht. Zeichnet sich allerdings der produktive Nutzen ab, gilt es, sich für die Production-Pipeline und Zeit- oder Ressourcen-Constraints  zu rüsten. Meist fängt man dafür neu an und bildet alles nochmals z.B. in Tensorflow für Neuronale Netzwerke oder in Custom-Libraries ab.

Das Missverständnis ist, dass man a) ansatzlos Data Science bis zum produktiven Einsatz treiben kann und b) einen one-stop-shop for Data Science (hier „Plattform“) sucht, der alles in einem Aufwasch macht. Das wird es nie geben.

Das ist tatsächlich auch eine gute Nachricht, bedeutet es doch, dass Organisationen – ohne gleich zu großen Plattformen greifen zu müssen – ihre ersten Ziele erreichen können. Die einigermaßen sorgfältige Auswahl passender Werkzeuge (viele davon Open Source) hilft dabei.

Auch interessant:
In meinem Video „KI braucht Strategie“ erläutere ich, welche Schritte Unternehmen konkret gehen können, um KI-Technologie zielführend einzusetzen.

Design Thinking – Hype oder Hilfe?

Ende Januar veranstaltet  CONTACT gemeinsam mit The Dark Horse, eine der führenden und bekanntesten Design Thinking Agenturen, einen exklusiven Design Thinking  Workshop.

Der Hintergrund: Neue Technologien wie IoT, 3D-Druck und Virtual Reality,  serviceorientierte Geschäftsmodelle und die Digitale Transformation überhaupt stellen herkömmliche Angebote infrage. Das Hasso-Plattner Institut schreibt dazu: „Design Thinking … avanciert heute zu einer ganz neuen Art, den Menschen in Bezug zur Arbeit zu sehen, das Konzept der Arbeit zu denken und zu fragen, wie wir im 21. Jahrhundert leben, lernen und arbeiten wollen. Die Strahlkraft von Design Thinking besteht darin, neue und überraschende Formen der kreativen Zusammenarbeit zu ermöglichen. Wir-Intelligenz ist das neue Schlagwort, Kollaboration wird die Grundlage für ein neues Arbeitsbewusstsein.“

„Ganz neue Art zu denken“, „21.Jahrhundert“, „Wir-Intelligenz“. Bei solchem Drang ins Esoterische gibt brand eins so richtig Contra. Individualistisch geprägte Gesellschaften sind weniger erfolgreich als  kollektivistische? Kreativität gedeiht am besten in Gruppen? Nicht unbedingt, und da kann man schnell mal was falsch verstehen. Und dann noch: Der Erfolg hängt von der Exzellenz in unterschiedlichen Disziplinen ab, also holt man diese Disziplinen mit ins Boot? Produkte mache ich für Kunden und – Revolution! – frage sie also nach ihren Bedürfnissen? Als wenn es Ideen wie Human Centered Design nie gegeben hätte.

Ignorieren wir lieber die Marketingstrategen und betrachten Design Thinking ganz pragmatisch:

  • Der Ausgangspunkt: komplexe Produkte und Systeme in einem eher unbekannten Terrain
  • Die unbedingte Ausrichtung an meine Kunden untere Berücksichtigung technischer und wirtschaftlicher Zielvorgaben
  • Die enge Zusammenarbeit der unterschiedlichen Disziplinen, die einen Beitrag leisten
  • Iteratives, auch spielerisch/experimentelles Vorgehen und lernen aus Feedback und Fehlern.

Design Thinking ist also wie gemacht für die Herausforderungen der Digitalen Transformation. Deswegen sind wir mit dabei.

 

Der digitale Zwilling erschließt neue Geschäftsfelder

Immer mehr Maschinen und Anlagen werden mit Sensorik ausgestattet und gehen online. Hersteller und Betreiber entwickeln vielseitige Ideen, um die Echtzeitdaten aus der Fabrik und dem Feld zu nutzen. Der digitale Zwilling des realen Produkts gibt ihnen die Möglichkeit, innovative digitale Angebote aufzubauen.

Das Internet der Dinge (IoT) eröffnet neue Kommunikationsszenarien für Produkte und Produktionsanlagen, die untereinander und mit zentralen Diensten vernetzt sind. Analog zu den bimodalen Ansätzen im PLM-Umfeld setzen Unternehmen auch für den Betrieb ihrer Produkte und Anlagen auf eine flexiblere, offene IT-Architektur, um kontinuierlich Produktdaten erfassen und auswerten zu können. Das Sammeln der teils großen Datenmengen wird zielführend, wenn dadurch noch bessere Dienstleistungs- und Produktangebote entstehen.

Intelligent genutzt, verbindet der Digitale Zwilling den Lebenszyklus smarter Produkte von der ersten Idee über die Entwicklung und Fertigung mit der Nutzungsphase und macht so erst neue, digitale Geschäftsmodelle möglich

Daten aus der Entwicklung wie Teilestämme, Stücklisten, Modelldaten und Änderungsinformationen werden üblicherweise über eine PLM/ERP-Schnittstelle in die Produktion übergeben, während die Fertigungsprozesse mit den gängigen Simulationsverfahren der Digitalen Fabrik gestaltet werden. Dies reicht jedoch nicht, um die dynamischen Lebenszyklusinformationen einzelner Produktexemplare in der Fertigung oder später auch im Feld sinnvoll mit den Produktdaten in Zusammenhang zu bringen.

Der digitale Zwilling verknüpft die für das physische Produkt relevanten Daten aus dem digitalen Master im PLM-System (Geometriemodelle, Stücklisten, Variantenkonfigurationen) mit den Felddaten (technischer Zustand, Messdaten, Bauzustände) und Software-Konfigurationen. Über eine eigene Anwendungsoberfläche bietet er Zugang zu standardisierten Ingenieurfachprozessen und gleichzeitig einen Ansatzpunkt für Data-Analytics-Methoden.

Möglich wird dies durch das Zusammenspiel aufeinander abgestimmter Software-Bausteine und einer bimodalen IT-Architektur, bei welcher der digitale Zwilling die zentrale Rolle einnimmt. Er führt alle wichtigen Informationen über eine Produktinstanz zusammen, wie beispielsweise aus den Felddaten ermittelte Kennzahlen, virtuelle Produkt- und Prozessmodelle der Produktvariante, produktbeschreibende Dokumente, CAD-Modelle oder Software-Stände und Parametersätze. Nicht nur das Produkt selbst, sondern auch einzelne Bauteile können je nach Informationsrelevanz einen eigenen digitalen Zwilling bereitgestellt bekommen.

Interesse geweckt? Erfahren Sie mehr über Data Analytics, Anwendungsfälle, Praxisszenarien, Digitalisierung und Prozessverbesserung in einem knackigen, zweiseitigem Beitrag – unserer Kollegen Dr. Patrick Müller und Andreas Saum – für IT & Production, Sonderheft Produktentwicklung Wissen kompakt: Der digitale Zwilling – Mit Felddaten Mehrwert im Produktlebenszyklus schaffen