STRABAG Data Science Hub

Dr. Marco Xaver Bornschlegl, bei STRABAG Innovation & Digitalisation (SID) verantwortlich für die Direktion Application Services & Data Science, spricht über Daten-Badewannen, den Data Science Hub und warum Daten eines der zentralen Elemente der Digitalstrategie von STRABAG ist.
Dr. Marco Xaver Bornschlegl
Dr. Marco Xaver Bornschlegl
Direktionsleitung Application Service & Data Science

Was ist ein Data Science Hub?
Es ist unser Ansatz, Daten anders und besser zu nutzen. Wir machen aus dieser Ressource noch viel zu wenig, dabei entstehen überall im Konzern jeden Tag Unmengen an Daten. Im Data Science Hub sollen Analyse-Daten standardisiert für alle und für jede denkbare Analyse-Ideen gesammelt und aufbereitet werden.

Können Sie diesen Datenbegriff etwas konkretisieren?
Ich rede über Analysedaten, nicht über Dateien im eigentlichen Sinn, die beispielsweise beim Einsatz unserer Maschinen entstehen, bei der Terminplanung unserer Bauprojekte oder in unseren Projektkalkulationen enthalten sind. Die Krane, die Baumaschinen, aber auch die kaufmännischen Daten auf der administrativen Seite.

Und das Ziel ist es, alle diese Daten zusammenzubringen und auszuwerten?
Nur dadurch entsteht der Wert bei Daten. Wir müssen relevante Daten zusammenfügen, erst wenn uns dann gelingt, können wir über alles andere nachdenken. Datengetriebene Risikoanalysen auf Basis einer künstlichen Intelligenz, Optimierung der Arbeitsabläufe – was auch immer wir vorhaben, wir brauchen Daten von den Baustellen, unseren Maschinen, den Kunden, aus dem Bereich Finanzen.

Im Konzern wurde vor einiger Zeit der Begriff Daten-Badewanne kreiert, ich selbst verwende lieber die Daten-Drehscheibe, da nicht alles zwingend dort abgelegt werden muss.

Oftmals reicht auch eine Schnittstelle, um Systeme miteinander zu verbinden und einen Mehrwert zu schaffen.

Gemeint ist ein imaginäres Behältnis, in das erst einmal relevante Analysedaten und auch externe Daten wie beispielsweise Wetterdaten hineinfließen – und dann kann sich jeder für seine Anwendung bedienen…
… ungefähr so, es ist ein Platz in der Cloud, wer die Daten hierher hinbringt, weiß nicht unbedingt, was anderen dafür für spannende Anwendungen einfallen. Das kann ein sehr kreativer Prozess werden.

Das klingt ziemlich abstrakt. An welchen konkreten datengetriebenen Anwendungen arbeitet der Konzern?
Naheliegende Anwendungen, bei denen wir auch schon sehr weit sind, zielen beispielsweise auf die Auslastung der Krane auf unseren Hochbau Baustellen. Mit der automatisierten Krandatenerfassung werden Kenngrößen zur Verfügung gestellt, die für Baustellen ein wichtiges Steuerungselement sind. Krane sind bauablaufbedingt unterschiedlich stark ausgelastet. Es kommt immer wieder zu Auslastungsspitzen, die durch die Komplexität von Baustellen nicht vorhergesehen werden können. Eine automatisierte Auswertung der Auslastung kann dazu beitragen, diese Spitzen zu erkennen und dem entgegenzuwirken. Dazu gehört die Ressourcen wirtschaftlicher als bisher einzusetzen, sodass in allen Bereichen der Kran ausgelastet aber nicht überlastet ist.

Und wenn man das alles auch noch mit anderen Daten verbinden, zum Beispiel dem Wetterbericht …
… dann könnte man angesichts eines aufziehenden Tiefs die Bauprozesse optimieren. Darauf zielt ja beispielsweise das Projekt der digitalen Taktsteuerungstafel. Dort werden die Wetterdaten bereits integriert, um so einen noch besseren Blick zu bekommen. Durch eine konsequente Bau-Datenerfassung in Echtzeit können Anwendungsfälle wie digitales Maßnahmenmanagement bei Störungen sowie eine projektübergreifende Vergleichbarkeit zukünftig umgesetzt werden. 

Und die Systeme lernen auch mit?
Richtig, dann schlägt uns eine künstliche Intelligenz vielleicht vor, dass wir gar nicht so viele Geräte oder Ressourcen brauchen auf der Baustelle X, weil das in Hunderten oder Tausenden Fällen in der Vergangenheit auch schon so war.

Warum macht man es dann nicht einfach?
Es gibt noch viele Hürden, einige Barrieren basieren schlicht und einfach auf kulturellen Themen, etwa dem Denken, dass meine Daten nur mich etwas angehen. Andere Barrieren sind die vielen Daten-Silos, die noch existieren. Technologisch wäre bereits so viel möglich, wir können es aber noch nicht abrufen, da der Zugriff oftmals nicht möglich ist oder aber auch die Datenpflege nicht so fortgeschritten ist, dass man ohne weiteres eine Analyse durchführen könnte. Mit der SID haben wir nun aber einen großen Treiber, der das Thema Daten im Konzern nach ganz oben auf die Agenda gesetzt hat.

Dennoch ist die SID nur der Enabler dieser Themen, die Identifikation geeigneter Anwendungsfälle und die Bereitschaft diese neuen Wege zu beschreiten, kann nur mithilfe unserer Kolleginnen und Kollegen der einzelnen Unternehmens- und Zentralbereiche funktionieren. 

Haben Sie ein Beispiel?
Derzeit erheben und analysieren wir beispielsweise nur wenige Daten in unseren eigenen Immobilien. Wenn wir aber in naher Zukunft eine grüne, klimaneutrale Verwaltung haben wollen – oder sollte ich sagen, haben müssen –, dann sollten wir zumindest solche Dinge wie Stromverbrauch präzise und in Echtzeit abrufen und – im Schritt zwei – auch steuern können. Was oft fehlt, ist der Blick aufs große Ganze, unsere Sicht ist oftmals zu klein, es bleibt meist beim engen Horizont der Beteiligten auf ihren Bereich, ihre Aufgaben. Das Erfassen und zusammenführen der Daten, also des Ist-Standes – in diesem Beispiel mittels IoT Sensoren – ist der notwendige erste Schritt. Ist dieser Schritt getan, kann man auch über eine intelligente Steuerung der Heizung, des Lichts oder weiterer Dinge wie beispielsweise einer bedarfsgerechten Reinigung nachdenken. Wir können dann auch unsere Projektkalkulationen intelligent auswerten, inkl. Mustererkennung und Anomalien-Identifikation, um Projektrisiken anhand trainierter Modelle vorherzusehen. Das zahlt dann direkt auf die beiden zentralen Ziele Effizienzsteigerung und Nachhaltigkeit ein. Erst Schritt zwei bringt den eigentlichen Nutzen.

Eine datengetrieben Risikoanalyse mittels künstlicher Intelligenz beispielsweise bringt nur etwas, wenn die Datengrundlage zumindest den ganzen Konzern abdeckt.
Natürlich, denn um Daten mittels modernster Verfahren zu analysieren, ist die Menge an Trainingsdaten entscheidend. Wer glaubt, die digitale Taktsteuerungstafel diene nur dazu den Takt zu steuern, hat die Datenwelt nicht verstanden. Zukünftig hilft sie uns, besser zu werden, weil wir die dort erzeugten Prozess-Daten auch auswerten können. Eine Frage, die wir uns immer wieder stellen sollten: was könnten andere mit unseren Daten machen.

Oder umgekehrt, was man selbst mit den Daten anderer Bereiche anfangen könnte?
Nicht nur anderer Bereiche, unsere vielen Subunternehmen sind bisher aus der Perspektive der Daten ebenfalls noch nicht ausreichend berücksichtigt.

Allerdings hat es bisher aber auch immer ganz gut ohne funktioniert.
Darauf sollten wir in Zukunft nicht vertrauen. Wir erreichen in der Bauindustrie Margen zwischen drei und fünf Prozent, wenn es gut läuft. Das bedeutet, dass wir unser Ergebnis mit nur sehr wenigen Flops schnell arg strapazieren. Daten sind somit die Grundlage und eines der zentralen Elemente unserer gesamten Digitalstrategie.

STRABAG ist aber nicht die Einzige, die mit Daten neue Geschäfte machen will. Entsteht auf den Baustellen nun ein neuer Wettbewerb um die Daten?
Natürlich wollen andere auch Daten bereitstellen und Verkaufen. Gerätehersteller wollen uns ihre Geräte künftig am liebsten „as-a-service“ verkaufen. Das bedeutet, wir bekommen fertige Analysen, die Rohdaten bleiben hingegen beim Hersteller. Wir dagegen wollen mit den Geräten natürlich auch selbst Daten sammeln und auswerten und interessieren uns oftmals gerade für die Rohdaten. Dienstleister benötigen unserer Daten, um deren Algorithmen zu trainieren. Da wird man perspektivisch eine Lösung finden müssen, die entscheidende Frage ist: Wem gehören künftig die Daten?