the factlights Artikel
Data Literacy - eine Schlüsselkompetenz für Entscheider
Die Fähigkeit, planvoll mit Daten umzugehen und sie im jeweiligen Kontext bewusst einzusetzen und zu hinterfragen, bezeichnet man als Data Literacy, was mit Datenkompetenz übersetzt werden könnte. Auch wenn der operative Umgang mit Daten, deren Analyse und Interpretation maßgeblich Controllern und Data Scientists vorbehalten ist, sollten Führungskräfte, die für die Steuerung des Unternehmens verantwortlich sind, zumindest verstehen, auf welcher Informationsgrundlage sie unternehmerische Entscheidungen treffen.
Mensch und Maschine müssen „eng zusammenarbeiten“
Viele Unternehmen erhoffen sich durch die vermehrte Nutzung von Daten und die Anwendung von Advanced Analytics verbesserte Entscheidungen und valide Predicts. Den Entscheidern im Management ist oft nicht bewusst, dass die reine Datensammlung und der Einsatz von Algorithmen bei weitem nicht ausreichend sind.
Mensch und Maschine müssen „eng zusammenarbeiten“. Denn die Informationen, die schließlich zur Entscheidungsfindung herangezogen werden, hängen in ihrer Entstehung von vielfältigen Annahmen ab. Diese sollten vom Management mit beeinflusst werden oder diesem zumindest bekannt sein.
Den Prozess zur Erarbeitung eines Predicts, den man als Aufgabe der Data Science zuordnen würde, beschreiben wir beispielhaft anhand der Vorhersage des Fußball Weltmeisters 2018. Der Vorteil dieses Beispiels ist, dass in der Rückschau mögliche Ursachen für eine falsche Prognose gut nachvollziehbar herausgearbeitet werden können. Der Weltmeister in unserem Predict lautete nämlich Brasilien und nicht Frankreich. Die Prognose wurde Anfang des Jahres 2018 im Rahmen der Vorbereitung des CA Seminars Predictive und Advanced Analytics erstellt.
Um zum gewünschten Ergebnis zu kommen, musste der Ausgang jedes einzelnen WM-Spiels vorhergesagt werden. Da in der Vorrunde der Weltmeisterschaft in Gruppen mit jeweils vier Mannschaften die Teilnehmer des Achtelfinals ausgespielt werden und die Tordifferenz unter anderem als Kriterium für die Reihenfolge in der Tabelle der Vorrundengruppe herangezogen wird, mussten nicht nur Sieg, Unentschieden oder Niederlage, sondern auch die Tordifferenz prognostiziert werden. Dabei stellte sich die Frage, ob ein prognostiziertes Spielergebnis, das eine der beiden Mannschaften zum Beispiel 0,26 Tore mehr schießen ließ als die andere, als Unentschieden oder knapper Sieg gewertet werden sollte. Schließlich wurde für die Vorrunde die Berechnungsregel definiert, die Punkte und Tordifferenz zu sogenannten Rankpoints zu aggregieren und für die K.O.-Spiele ab dem Achtelfinale allein die berechnete Tordifferenz als Kriterium für das Vorrücken in die nächste Turnierrunde zu verwenden, auch wenn diese noch so knapp ausgefallen sein sollte.
Im nächsten Schritt war zu klären, welche Daten verfügbar sind und welche davon sinnvoll genutzt werden können. Der verwendete Datensatz mit 38.685 Ergebnissen internationaler Fußball Länderspiele von 1872 bis Ende 2017 (kaggle.com) beinhaltet die Kriterien Freundschaftsspiele, offizielle Turniere, Datum, Austragungsort, Spielergebnis sowie Heim- und die Auswärtsmannschaft. Da das Ergebnis eines offiziellen Turniers prognostiziert werden sollte, das nur innerhalb eines Landes stattfand, trafen wir die Entscheidung, keine Freundschaftsspiele einzubeziehen und auch den Austragungsort sowie das Heimrecht unberücksichtigt zu lassen.
Nach dieser Vorarbeit wurden mittels eines Testdatensets verschiedene Machine Learning Modelle getestet. Das ausgewählte und trainierte Modell wurde jetzt für die Vorhersage aller Spielergebnisse eingesetzt. In unserem Vorhersagemodell kam es tatsächlich zu der Begegnung zwischen Frankreich und Kroatien, dem späteren Finale der WM 2018, allerdings schon im Achtelfinale, das Frankreich mit einer prognostizierten Tordifferenz von 0,4297 gewann. Was könnte jetzt dazu geführt haben, dass das Modell den Weltmeister nicht treffsicher vorhergesagt hat?
- Die Mannschaften haben sich nicht konform zu ihrer eigenen Historie verhalten
- Die zur Auswahl der Daten getroffenen Annahmen waren unpassend
- Die Nichtberücksichtigung von Freundschaftsspielen führte dazu, dass die aktuelle Form der Mannschaften unmittelbar vor dem Turnier keinen Einfluss fand
Überträgt man diese Erkenntnisse auf Fragestellungen, die im Unternehmen mit Predictive Analytics gelöst werden sollen, wird deutlich, dass hier ganz ähnliche Fehlerquellen auftreten wie in unserem Predict. Sowohl im Beispiel als auch in der Unternehmenspraxis besteht die wesentliche Leistung bereits heute in der Definition des Untersuchungsbereichs sowie in der Datenauswahl und -aufbereitung, denn es gibt eine Reihe von so genannten „Auto-Machine-Learning-Tools“ die den jeweils leistungsfähigsten Algorithmus oder statistische Verfahren automatisch und treffsicher ermitteln.
Wenn das Management das Unternehmen allerdings nicht auf Basis einer Black Box steuern will, ist die Kenntnis der Annahmen hinter den Berechnungsmodellen und der für die Berechnung ausgewählten Daten von entscheidender Bedeutung. Für das Reporting bedeutet das, neben Analyseresultaten und KPI’s auch Hintergrundinformationen zu transportieren (Data Storytelling), um die richtige Einordnung der Informationen und daraus resultierende Entscheidungen durch das Management zu ermöglichen.
Eine gute Entscheidungsvorlage beinhaltet auch Data Storytelling, also relevante Hintergrundinformationen zusätzlich zu Analyseresultaten und KPI’s.
Zum Verständnis dieser Data Stories und um unternehmerische Fragestellungen als nachvollziehbare Aufgabenstellung für die Analyse formulieren zu können ist es erforderlich, Datenkompetenz bei den Entscheidern im Unternehmen aufzubauen. Diese als Data Literacy bezeichnete Datenkompetenz wird in Zukunft eine ähnliche Bedeutung haben wie lesen und schreiben können. Bis Data Literacy allerdings Eingang in die schulische und universitäre Ausbildung gehalten hat, wird noch einige Zeit vergehen. Aus diesem Grund tun Unternehmen gut daran, diese Kompetenz bereits heute möglichst breit aufzubauen.
Data Literacy wird in Zukunft so wichtig wie lesen und schreiben können.
News von CA Controller Akademie
the factlights Top-Thema
the factlights bringt Einblicke und Learnings:
- Am Puls der Zeit
the factlights 2020 hat über 1.000 Unternehmen im deutschsprachigen Raum zu ihrer Realität von Digitalisierung, Analytics und Datenarbeit befragt. Highlights, Updates und die kompletten Studienergebnisse gibt's hier. - Experten analysieren und empfehlen
Namhafte Vertreter führender Unternehmen nehmen Stellung zu aktuellen Trends, stellen Checklisten, Use Cases, Whitepaper bereit und stehen Ihnen gerne mit Empfehlungen, Tipps und Best Practices rund um die Themen der Digitalisierung und Datenarbeit zur Seite. - Studien-Ergebnisse holen
Sichern Sie sich Ihr persönliches Exemplar mit allen Ergebnissen, Einschätzungen, Branchenspecials, Extra Notes, Expert Quotes und profitieren Sie von Empfehlungen und Learnings.