Are data science platforms a good idea?

According to Karl Valentin: Platforms are beautiful and take a lot of work off your neck. The idea of platforms for automatic data analysis comes at just the right time. In line with this, Gartner has now published a “Magic Quadrant for Data Science and Machine Learning Platforms”. The document itself can only be viewed behind a paywall, but on the net some of the companies mentioned in the report offer access to the document by entering the address.

Gartner particularly emphasizes that such a platform should provide everything you need from a single source, unlike various individual components that are not directly coordinated with each other.

Sounds good to me! However, data science is not an area where you can magically get ahead with a tool or even a platform. The development of solutions – for example, for predictive maintenance of the machines offered by a company – goes through various phases, with cleaning/wrangling and preprocessing accounting for most of the work. In this area, ETL (Extract, Transform, Load) and visualization tools such as Tableau can be ranked. And beyond the imaginary comfort zone of platforms that managers imagine, database queries and scripts for transformation and aggregation in Python or R are simply the means of choice. A look at data science online tutorials from top providers like Coursera underlines the importance of these – well – down-to-earth tools. “Statistical analysis, Python programming with NumPy, pandas, matplotlib, and Seaborn, Advanced statistical analysis, Tableau, machine learning with stats models and scikit-learn, deep learning with TensorFlow” is one of Udemy’s course programs.

In addition, the projects often get stuck in this preliminary stage or are cancelled. There are many reasons for this:

  • no analytical/statistical approach can be found
  • the original idea proves to be unfeasible
  • the data is not available in the quantity or quality you need
  • simple analyses and visualizations are enough and everything else would be “oversized”.

This is no big deal, as it only means that the automated use of Machine Learning and AI does not make a data treasure out of every data set. If, however, the productive benefit becomes apparent, it is necessary to prepare for the production pipeline and time or resource constraints. Usually you start from scratch and reproduce everything again, e.g. in Tensorflow for neural networks or in custom libraries.

The misunderstanding is that a) Data Science can be driven up to productive use without a trace and b) a one-stop-shop for Data Science (here “platform”) is needed that does everything in one go. That will never happen.

This is really good news, because it means that organizations can achieve their first goals without having to resort to large platforms. The reasonably careful selection of suitable tools (many of them open source) helps to achieve this.



Design Thinking – Hype oder Hilfe?

Ende Januar veranstaltet  CONTACT gemeinsam mit The Dark Horse, eine der führenden und bekanntesten Design Thinking Agenturen, einen exklusiven Design Thinking  Workshop.

Der Hintergrund: Neue Technologien wie IoT, 3D-Druck und Virtual Reality,  serviceorientierte Geschäftsmodelle und die Digitale Transformation überhaupt stellen herkömmliche Angebote infrage. Das Hasso-Plattner Institut schreibt dazu: „Design Thinking … avanciert heute zu einer ganz neuen Art, den Menschen in Bezug zur Arbeit zu sehen, das Konzept der Arbeit zu denken und zu fragen, wie wir im 21. Jahrhundert leben, lernen und arbeiten wollen. Die Strahlkraft von Design Thinking besteht darin, neue und überraschende Formen der kreativen Zusammenarbeit zu ermöglichen. Wir-Intelligenz ist das neue Schlagwort, Kollaboration wird die Grundlage für ein neues Arbeitsbewusstsein.“

„Ganz neue Art zu denken“, „21.Jahrhundert“, „Wir-Intelligenz“. Bei solchem Drang ins Esoterische gibt brand eins so richtig Contra. Individualistisch geprägte Gesellschaften sind weniger erfolgreich als  kollektivistische? Kreativität gedeiht am besten in Gruppen? Nicht unbedingt, und da kann man schnell mal was falsch verstehen. Und dann noch: Der Erfolg hängt von der Exzellenz in unterschiedlichen Disziplinen ab, also holt man diese Disziplinen mit ins Boot? Produkte mache ich für Kunden und – Revolution! – frage sie also nach ihren Bedürfnissen? Als wenn es Ideen wie Human Centered Design nie gegeben hätte.

Ignorieren wir lieber die Marketingstrategen und betrachten Design Thinking ganz pragmatisch:

  • Der Ausgangspunkt: komplexe Produkte und Systeme in einem eher unbekannten Terrain
  • Die unbedingte Ausrichtung an meine Kunden untere Berücksichtigung technischer und wirtschaftlicher Zielvorgaben
  • Die enge Zusammenarbeit der unterschiedlichen Disziplinen, die einen Beitrag leisten
  • Iteratives, auch spielerisch/experimentelles Vorgehen und lernen aus Feedback und Fehlern.

Design Thinking ist also wie gemacht für die Herausforderungen der Digitalen Transformation. Deswegen sind wir mit dabei.