Von Jennifer Münch
Abstract
Auf einer klassischen Landkarte werden geografisch relevante Daten in unterschiedlichen Farben und Formen visuell dargestellt. Dies ist eine einfache Beschreibung einer klassischen Map in der Datenvisualisierung. Notwendig hierfür sind Geopositionen wie Längengrad und Breitengrad, GPS-Positionen oder je nach Visualisierungstool auch einfache Ländernamen oder -kürzel. Jedoch wird das System der Map nicht nur für die klassische Darstellung von Länderinformationen genutzt, sondern auch um Bilder einzubinden und diese als Visualisierungsgrundlage zu verwenden.Die Herausforderung hierbei besteht jedoch in der Verwendbarkeit der Visualisierungsform und deren Umsetzung. Denn je nach Use Case kann die Bearbeitung einer solchen Visualisierungsform viel Zeit und damit auch Geld kosten, was wiederum das Verhältnis zwischen Aufwand und Nutzen in Frage stellt. Um genau diese und andere Fragen zu beantworten, hat die Firma doubleSlash ein Vorgehensmodell entwickelt, welches bei der Planung und Umsetzung von Visualisierungen und Dashboards unterstützen soll.
On a classic map, geographically relevant data is visually represented in different colors and shapes. This is a simple description of a classic map in data visualization. Necessary for this are geopositions such as longitude and latitude, GPS positions or, depending on the visualization tool, simple country names or abbreviations. However, the map system is not only used for the classic display of country information, but also to integrate images and use them as a basis for visualization.The challenge here, however, is the usability of the visualization form and its implementation. Depending on the use case, the processing of such a visualization form can cost a lot of time and thus also money, which in turn calls into question the relationship between effort and benefit. In order to answer precisely these and other questions, the company doubleSlash has developed a process model that is intended to support the planning and implementation of visualizations and dashboards.
Einleitung
Seit Jahrtausenden existieren bereits topografische Karten und helfen den Menschen sich zu orientieren. Durch deren Erweiterungen zu thematischen Karten in den letzten beiden Jahrhunderten, wie zum Beispiel Radwander- oder wissenschaftlichen Karten, kam der klassischen Karte eine neue Bedeutung zu. Sie wurde gezielt dazu eingesetzt Informationen zu bestimmten Regionen wieder zu geben.
In den letzten Jahrzehnten hat sich, durch den technologischen Fortschritt, die klassische Karte zu einer digitalen und interaktiven Informationsquelle entwickelt. Unternehmen haben festgestellt, welchen Mehrwert sie mit Kartenvisualisierungen haben, welche aus dem Arbeitsalltag nicht mehr wegzudenken sind. Sei es, um den Umsatz pro Land anzuzeigen oder auch einzelne Punkte auf der Karte zu markieren. Informationen können somit einem breiteren Publikum zugänglich gemacht werden als auch neuen Kontext schaffen.
Der Vorteil der Map gegenüber anderen Visualisierungsformen ist, dass man die Verteilung oder den Anteil der Daten in jeder Region visuell darstellen kann. Hierbei stehen einem sämtliche Formen zur Verfügung: Von der klassischen Heatmap bis hin zur 3D Visualisierung.
Abbildung 1: Anzahl Bewegungen pro Person, Eigene Darstellung aus Tableau
Abbildung 2: Pendleraktivität in Manhattan, Justin Fung, http://manpopex.us/
Map ist nicht gleich Map
Um das zu verstehen muss man sich anschauen wie eine Map aufgebaut ist. Eine klassische Map in der Datenvisualisierung besteht aus einem Koordinatensystem (X-Achse und Y-Achse) der Erdoberfläche, also z. B. Längengrad (Longitude) und Breitengrad (Latitude).
Abbildung 3: Darstellung Längen- und Breitengrad, Djexplo, Wikimedia 2011, https://commons.wikimedia.org/wiki/File:Latitude_and_Longitude_of_the_Earth.svg (16.01. 2023)
Anhand dieser Daten und den Länderinformationen sind Visualisierungstools wie Tableau oder Power BI in der Lage eine Karte abzubilden.
Abbildung 4: Darstellung Weltkarte, Eigene Darstellung in Tableau
Diesen einzelnen Koordinaten lassen sich dann wiederum weitere Kennzahlen zuordnen, sodass man neue bzw. erweiterte Information pro Region erhält.
Abbildung 5: Umsatz pro Land, Tableau Beispieldatensatz, Tableau, Beispieldatensatz
Abbildung 6: Umsatz pro Land, Eigene Darstellung in Tableau
Abbildung 7: Umsatz & Gewinn pro Land, Eigene Darstellung in Tableau
Dies ist das klassische System der Map. Jedoch kann man dieses System auch auf Bilder anwenden.
Ein Bild besteht aus einer unterschiedlichen Anzahl an Pixeln auf der X- und Y-Achse. Diese Pixel nutzt das System, um ein unsichtbares Netz über das Bild zu legen. Auf dieses Netz werden dann wiederum weitere Informationen gelegt.
Abbildung 8: Bild mit Pixelangabe auf X- und Y-Achse, Eigene Darstellung in Tableau
Anhand der Größe des Bildes wird die mögliche Koordinaten-Spannweite definiert, in diesem Fall 6960 x 4640. Damit auch Informationen an bestimmten Positionen hinzugefügt werden können, wird eine Datentabelle mit den jeweiligen Punkten benötigt.
Abbildung 9: Eigener Beispieldatensatz für Bild aus Abbildung 8, Eigene Darstellung
Abbildung 10: Bild mit Infowerten aus Beispieldatensatz, Eigene Darstellung in Tableau
Durch diese Art der Verwendung von Bildern werden komplett neue Möglichkeiten der Datenvisualisierung ermöglicht. So können Daten noch besser für ihren Zweck analysiert werden. Wie zum Beispiel die kommerziell erfolgreichsten Weihnachtslieder in Deutschland 2020.
Abbildung 11: Die kommerziell erfolgreichsten Weihnachtslieder in Deutschland 2020, Eigene Darstellung in Tableau
Jeder Gegenstand auf dem Weihnachtskranz stellt eine Koordinate dar. Dieser Koordinate wiederum werden dann ein weiteres Bild und weitere Informationen, wie Titel und Interpret, hinzugefügt.
Die Map im Businessumfeld
Es ist davon auszugehen, dass solch ein Dashboard mit solch einer Map eher nicht im Businessumfeld Verwendbarkeit finden wird. Dies liegt natürlich nicht nur an dem Inhalt des Dashboards, sondern auch an dem zeitlichen und finanziellen Aufwand der für solch ein Dashboard investiert werden muss.
Überwiegend wird im Businessumfeld die klassische Map verwendet, um zum Beispiel Umsätze pro Land zu analysieren. Das Hinzufügen von Bildern, um diese in einer Visualisierung zu nutzen, ist hingegen je nach Branche noch eher gering verbreitet. Grund hierfür ist unter anderem die Verwendung eines Bildes, in einem Kontext, der dem Unternehmen einen Mehrwert bringt.
Je nach Use Case gäbe es sicherlich in jeder Branche eine Möglichkeit solch eine Map zu verwenden. Zum Beispiel im Bereich des Monitorings bei technischen Anlagen. Hier fällt es einem Mitarbeiter leichter auf einem Bild zu sehen, welche Komponente gerade ausgefallen ist, als eine Liste mit verschiedenen Statusinformationen zu haben. Dadurch lässt sich die Komponente schneller und einfacher reparieren.
Ein weiterer einflussreicher Faktor, wie bereits erwähnt, ist der zeitliche und damit auch der finanzielle Aufwand, der in solch eine Visualisierung investiert werden muss. Je nach Menge der ausgewählten Punkte kann dies schon mal mehrere Tage in Anspruch nehmen. Denn es muss ein komplett neuer Datensatz geschaffen werden.
Als Beispiel dient hier das Weihnachtsdashboard, bestehend aus 100 Songs inklusive Interpreten, Rang und Veröffentlichungsdatum. Diese Informationen müssen 100 Koordinatenpunkte auf dem Bild händisch zugewiesen werden. Bedeutet im ersten Schritt muss festgelegt werden, wo diese Informationen auf dem Bild angezeigt werden sollen. Im zweiten Schritt müssen die Koordinaten dieses ausgewählten Punktes einer Information zugeordnet werden. Natürlich sollen die Lieder nicht in Reihenfolge auf dem Kranz angezeigt werden, bedeutet man muss die Daten vorher mischen. Natürlich kann das Ganze auch etwas vereinfacht werden, indem man mit algorithmischen Formeln arbeitet, aber auch diese müssen erstmal definiert werden.
Da dieser Aufwand oft in keinem Verhältnis zum Nutzen steht, verzichten viele Unternehmen auf solch eine Visualisierungsart mit Bildern. Denn das Ziel eines Dashboards oder einer Visualisierung wie die einer Map, ist es schnell und einfach Informationen zu erhalten. Der optische Faktor spielt dabei natürlich auch eine Rolle, hat aber einen niedrigeren Stellenwert als der zeitliche und finanzielle Faktor.
Wir leben in einer schnelllebigen Zeit, Informationen müssen sofort erkennbar sein, ohne dass man vorher einen langen Infotext lesen muss, um die Visualisierung zu verstehen. Das ist das Gefährliche an solchen komplexen Visualisierungen. Je komplexer sie sind, umso aufwändiger kann deren Interpretation sein.
Die Herausforderung von Businessvisualisierungen ist zum einem die Vorstellung des Kunden umzusetzen, als auch die erforderliche Information schnell zur Verfügung zu stellen, ohne noch viel Text zu lesen.
Vorgehensmodell
Die Firma doubleSlash hat hierzu ein Vorgehensmodell entwickelt, welches bei dem Entwurf und der Entwicklung einer Datenvisualisierung oder Dashboards unterstützen soll (doubleSlash Net-Business GmbH 2022).
Abbildung 12: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash, Firma doubleSlash
Bei dem Vorgehensmodell handelt es sich um ein iteratives Modell, welches aus 6 Phasen besteht, welche wiederum teilweise parallel verlaufen können. Das Vorgehensmodell ist an das CRISP-DM (Cross-industry standard process for data mining) angelehnt.
Im Folgenden werden die einzelnen Phasen kurz erläutert, welche sowohl auf einem Dashboard als auch nur auf einer Map angewendet werden können.
Jede Phase enthält Punkte die zu beachten sind, jedoch wird in diesem Beitrag nicht auf alle Punkte eingegangen. Eine gesamte Übersicht der Phasen und dessen Merkmale finden Sie im Whitepaper der Firma doubleSlash (doubleSlash Net-Business GmbH 2022)
Anforderungsanalyse mit Fragestellung
Abbildung 13: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash, Firma doubleSlash
Bevor eine Anforderungsanalyse gestartet werden kann, sollte überlegt werden welche Fragen mit der Datenvisualisierung beantwortet werden sollen. Zum Beispiel: Wie hängen die Umsätze verschiedener Länder voneinander ab?
Diese Fragen entstehen aus dem Geschäftsprozess und dienen dazu das Ziel nicht aus den Augen zu verlieren. Aus den Fragestellungen werden dann Anforderungen an die Visualisierung abgeleitet. Hier empfiehlt sich die Anforderungen als User Storys zu dokumentieren.
In der Anforderungsanalyse sind unter anderem folgende Punkte zu beachten:
- Datenauswahl und -zugriff: Welche Daten werden benötigt und wo sind diese abgelegt? Handelt es bei der Datenspeicherung um eine Datenbank oder um eine einfache Excel-Liste? Welche Berechtigungen werden benötigt, um auf die Daten zu zugreifen?
- Stakeholder: Wer nutzt am Ende die Visualisierung? Welche Einschränkungen gibt es je Nutzergruppe?
Aufgrund von Rückkopplung anderer Phasen können sich hier nachträglich Änderungen ergeben.
Datenanalyse
Abbildung 14: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash – Fragestellung/Anforderungsanalyse, Firma doubleSlash
Stehen die Anforderungen fest, kann mit der Datenanalyse gestartet werden. Hierbei wird das erste Mal eine Verbindung zu den Daten aufgebaut. Ziel ist es die Datenqualität der vorliegenden Daten in Bezug auf die Fragestellungen bewerten zu können. Folgende Punkte sind zu berücksichtigen:
Attribute: Welche relevanten Daten stehen zur Verfügung? Liegen Geodaten vor und wenn ja in welchem Format?
- Datenqualität: Unterscheidung in fachlicher und technischer Datenqualität
- Datenquelle: Gibt es noch weitere Quellen die notwendig sind, um die Umsatz Daten interpretieren zu können? Zum Beispiel eine Datenbank mit Einwohnerzahlen pro Region.
- Detailgenauigkeit: Auf welchem Detaillevel liegen die Daten vor? Gibt es Daten nur auf Länderebene oder auch auf Bundesland oder Gemeindeebene?
Sollten bereits hier Fragen offenbleiben oder verneint werden, müssen
eventuell die Anforderungen in der Anforderungsanalyse angepasst werden.
Dashboard Design
Abbildung 15: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash – Datenanalyse, Firma doubleSlash
Bei dem Dashboard Design sollten alle Stakeholder mit einbezogen werden. Denn diese haben bereits ihre Vorstellungen der Visualisierung und müssen gegebenenfalls etwas eingebremst werden. Grund hierfür kann sein, dass die gewünschte Darstellung eventuell nicht umsetzbar ist mit den gegebenen Daten.
Empfohlen wird mit einer Checkliste zu arbeiten, die unter anderem folgende Punkte beinhalten kann:
- Farbauswahl: Beachtung von Corporate Colors
- Art des Diagramms: Welche Darstellung eignet sich zur Beantwortung der Fragen? Zum Beispiel eine Headmap zur Darstellung der Bestellhäufigkeit pro Region.
- Aktualitätsstand: Information für den Nutzer, wann die Daten das letzte Mal aktualisiert wurden.
Abbildung 16: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash – Dashboard Design, Firma doubleSlash
Das Design kann jederzeit angepasst werden. Jedoch sollte es in den Grundzügen stabil bleiben und sich auch über den Lebenszyklus nicht sehr verändern, um den Nutzenden ein gleichmäßiges Nutzungserlebnis zu ermöglichen.
Sind die ersten, bereits erwähnten, Phasen soweit abgeschlossen, kann sowohl mit der Entwicklung der Datenquelle, als auch mit der Entwicklung der Datenvisualisierung begonnen werden. Ab diesen Punkt verlaufen beide Ringe des Modells parallel, da es immer wieder zu Anpassungen kommen kann.
Entwicklung Datenquelle
Abbildung 17: Bestellhäufigkeit pro Region in Deutschland, Eigene Darstellung in Tableau
In dieser Phase geht es um die dauerhafte Versorgung der Visualisierung mit Daten. Hierzu müssen die Daten in einem, für das ausgewählte Visualisierungstool, lesbaren Format abgespeichert werden.
Als wichtige Aspekte werden hier unter anderem folgende Punkte gesehen:
- Datenabruf: Wie soll auf das Quellsystem zugegriffen werden? Direkt oder durch eine Replikation?
- Datenmenge: Je mehr Daten es gibt, umso schlechter kann die Performance des Diagrammes sein. Wie ist die Detailgenauigkeit definiert?
- Data Governance: Müssen Datenschutzmaßnahmen beachtet werden und wo in der Data Lineage müssen diese umgesetzt werden?
Kommt es während dieser Phase zu Unstimmigkeiten, müssen eventuell noch mal die Phasen Anforderungsanalyse oder Datenanalyse überarbeitet werden.
Dashboard Entwicklung
Abbildung 18: Vorgehensmodell zur Datenvisualisierung der Firma doubleSlash – Entwicklung Datenquelle,Firma doubleSlash
Liegen die Daten in einem lesbaren Format vor und gibt es auch keine weiteren Einschränkungen, können sie im Visualisierungstool eingebunden werden.
Hierbei ist zu beachten, je mehr Datenquellen genutzt werden, umso instabiler und weniger performant kann ein Dashboard oder eine Visualisierung werden. In diesem Fall sollte überlegt werden, bestimmte Quellen, wo möglich und sinnvoll, bereits bei der Entwicklung der Datenquelle zu verknüpfen. Dadurch wird die Anzahl der Datenquellen im Visualisierungstool verringert
Während und nach erfolgreicher Entwicklung des Dashboards bzw. der Visualisierung sollten folgende Punkte überprüft werden:
- Sind alle Anforderungen erfüllt und werden alle Fragen beantwortet?
- Gibt es spezielle und detaillierte Visualisierungsanforderungen, welche noch einmal überprüft oder gegebenenfalls angepasst werden müssen?
- Wurden die Visualisierungen durch eine Person geprüft, die mit den Geschäftsprozessen vertraut ist?
Die Verlässlichkeit der Daten sollte die oberste Prämisse haben. Umso wichtiger ist der letzte Punkt in dieser Aufzählung. Am Ende müssen die Stakeholder die Visualisierungen abnehmen.
Der Prozess der Entwicklung eines Dashboards oder einzelner Visualisierungen kann mehrere Runden in Anspruch nehmen, da es immer wieder entweder zu neuen Anforderungen kommt oder bestehende Anforderungen angepasst werden müssen.
Fazit
Datenvisualisierung, inklusive Datenintegration und Datenanalyse, ist in unserer heutigen Zeit wichtiger denn je. Umso essenzieller ist es, dass Dashboards benötigte Informationen verständlich und übersichtlich bereitstellen.
Durch die Datenvisualisierung lassen sich Daten einfacher und schneller analysieren, was wiederum ein Wettbewerbsvorteil sein kann. Verschiedenste Informationen aus verschiedenen Quellen können auf Dashboards zusammengefasst werden. Nicht nur dass Visualisierungen wie Maps angenehmer zu lesen sind für das menschliche Auge, sie zeigen auch viel schneller Verknüpfungen, Abweichungen und Trends auf.
Jedoch ist nicht jede Map gleich eine Map. Wenn man von Koordinaten spricht, spricht man nicht unbedingt immer von Längen- und Breitengrad, sondern vielleicht auch von eigen kreierten Koordinaten oder auch einfach von Pixeldaten eines Bildes. Je nach Form der Visulisierung einer Map kann der zeitliche und finanzielle Aufwand variieren. Mit der Map hat man viele verschiedene Möglichkeiten seine Daten auf eine besondere und kreative Art und Weise darzustellen.
Aber auch der Weg dorthin ist wichtig. Blindes „draufloslegen“ führt zu unerwünschten Dauerschleifen. Ein effizientes Vorgehensmodel ist notwendig, um am Ende ein Dashboard zu erhalten, welches allen Anforderungen der Stakeholder gerecht wird.
Alle Phasen des Vorgehensmodel stehen in enger Abhängigkeit zueinander und werden in einem planbaren Iterationsprozess durchlaufen. Es muss immer wieder kritisch geprüft werden, ob die Fragestellungen noch passend sind, verworfen werden müssen oder neue Fragestellungen und Anforderungen entstehen.
Einer der wichtigsten Punkte über alle Phasen hinweg ist die Datenqualität, welche systematisch durch die richtigen Personen überprüft werden sollte. Da die darauf bezogenen Entscheidungen unter Umständen sehr weitreichende Auswirkungen haben.
Literaturverzeichnis
DOUBLESLASH NET-BUSINESS GMBH (Hrsg.): In: doubleslash.de, 2022. https://www.doubleslash.de/leistungen/leitfaden-zur-erfolgreichen-datenvisualisierung/ (14.05.23)
About this article
Copyright
This article is distributed under Creative Commons Atrribution 4.0 International (CC BY 4.0). You are free to share and redistribute the material in any medium or format. The licensor cannot revoke these freedoms as long as you follow the license terms. You must however give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use. You may not apply legal terms or technological measures that legally restrict others from doing anything the license permits. More Information under https://creativecommons.org/licenses/by/4.0/deed.en.
Citation
Jennifer Münch: Map ist nicht gleich Map. Die Möglichkeiten der Map und deren Herausforderungen bei der Erstellung. In: IMAGE. Zeitschrift für interdisziplinäre Bildwissenschaft, Band 38, 19. Jg., (2)2023, S. 49-64
ISSN
1614-0885
DOI
10.1453/1614-0885-2-2023-15732
First published online
Oktober/2023