Blog
Datenvisualisierung im Unternehmen
Von Rohdaten zum aussagekräftigen Dashboard
Daten sind heutzutage in jedem Unternehmen vorhanden, doch erst Visualisierung macht daraus Entscheidungsgrundlagen. Dennoch ziehen nicht alle Firmen den gleichen Nutzen daraus.
Durch Datenvisualisierung können komplexe Rohdaten in übersichtliche Reporting-Portale, Dashboards und sonstige Auswertungen überführt werden. Sie schaffen Transparenz, unterstützen die Entscheidungsfindung und helfen bei der Optimierung von Geschäftsprozessen.
In diesem Blogbeitrag zeigen wir anhand eines konkreten Beispiels auf, welche Schritte erforderlich sind, um die Grundlagen für aussagekräftige Visualisierungen zu schaffen und wie diese in der Praxis aussehen können.
Was ist Datenvisualisierung?
Datenvisualisierung bezeichnet die grafische Aufbereitung von Daten und Informationen, damit diese in geeigneter Form präsentiert und interpretiert werden können. Gängige Visualisierungsformen sind z.B. Pie Charts, Balkendiagramme oder Trendlinien. Die Anwendung solcher Methoden ermöglicht es, Daten zu gruppieren und diese ausgelegt auf spezifische Zielgruppen zur Interpretation vorzubereiten. Daten, die visualisiert werden sollen, sind im Normalfall strukturierte Daten, die im Tabellenformat abgespeichert werden. Ein gutes Beispiel dafür sind normale Excel-Tabellen mit Daten aus einem CRM oder ERP-System.
Wieso Daten visualisieren?
Ein wesentlicher Nutzen von Visualisierungen liegt darin, dass Menschen Informationen über Bilder und Muster häufig schneller erfassen als über Texte, Datenbanken oder Tabellen. Darüber hinaus ermöglichen geeignete Tools, Datenvisualisierungen gezielt auf konkrete Fragestellungen und Anforderungen eines Unternehmens auszurichten.
So können Diagramme und Graphen auf einen Blick aufzeigen, ob steigende, sinkende oder ungewöhnliche Tendenzen vorhanden sind. Zusammenhänge zwischen vereinzelten Werten lassen sich durch Datenvisualisierung schneller erkennen und wesentliche Elemente von Datensätzen können gezielt hervorgehoben werden. Diese Punkte unterstützen sowohl bei der Entscheidungsfindung als auch bei der Förderung des gemeinsamen Verständnisses.
Datenvisualisierungsbeispiel – Gartner Data “Magic Quadrant”
Ein bekanntes Beispiel für eine Datenvisualisierung ist der Gartner «Magic Quadrant» für Analytics- und Business-Intelligence-Plattformen. Er zeigt die Marktposition verschiedener Anbieter in diesem Bereich auf. Visualisierungen wie diese ermöglichen es, Marktführer, Herausforderer, Visionäre und Nischenanbieter auf einen Blick einzuordnen.

Der Weg zur Datenvisualisierung

Ab wann reicht Excel nicht mehr?
Kleinere Datensätze lassen sich im Rahmen von gängigen Business-Tools wie Microsoft 365 PowerPoint oder Excel durch Diagramme ohne grösseren Zusatzaufwand darstellen. Bei grösseren Datenmengen (100’000 Zeilen und mehr) kann sich dies jedoch als schwieriger erweisen. Besonders beim Einsatz von mehreren Datenquellen kann sehr schnell die Übersicht verloren gehen. Dementsprechend ist es wichtig, dass Unternehmen einschätzen können, ab welchem Zeitpunkt Excel-Diagramme die Anforderungen an eine Datenvisualisierung nicht mehr ausreichend erfüllen. Eine solche Einschätzung ist nicht immer einfach und erfordert Expertise.
Spezifikation – Business Use Cases zur Visualisierung erkennen
Um mit grösseren Visualisierungsvorhaben zu starten, ist es notwendig, sich mit den Anforderungen des Unternehmens auseinanderzusetzen. Aus diesen Anforderungen lassen sich anschliessend sinnvolle Anwendungsfälle (Business Use Cases) ableiten.
Um solche Anwendungsfälle zu identifizieren, sollten unter anderem die folgenden Fragen beantwortet werden:
- Welche Daten sind relevant?
- Von wo kommen die Daten her?
- Welche Zielgruppen werden von der Visualisierung Gebrauch machen?
- Welche Entscheidungen oder Prozesse soll die Visualisierung unterstützen?
Diese Fragen bilden eine erste Grundlage für die weitere Spezifikation und können je nach Use Case ergänzt werden.
Der Detaillierungsgrad der Spezifikation kann je nach Use Case variieren. Je mehr relevante Fragen gestellt und beantwortet werden, desto präziser fällt die Spezifikation aus.
Nachdem die Anforderungen und die dazugehörigen Business Use Cases definiert wurden, muss die technische Umsetzung vorbereitet werden. Bei der technischen Umsetzung geht es vor allem darum, zu klären, welche Datenquellen gebraucht werden und wie diese sinnvoll strukturiert und aufbereitet werden können.
Datenquellen identifizieren
Für die in der Spezifikation definierten Business Use Cases müssen zunächst die jeweils relevanten Datenquellen identifiziert werden. Dabei ist es notwendig, zwischen verschiedenen Arten von Datenquellen zu unterscheiden, da diese sich hinsichtlich Herkunft, Struktur und Verfügbarkeit unterscheiden können.
Die Anzahl der Datenquellen, die es zu berücksichtigen gibt, hängt direkt vom Umfang und der Komplexität der Spezifikation ab. In diesem Prozessschritt ist es wichtig, die passende Datenquellenart für den jeweiligen Use Case auszuwählen, um eine aussagekräftige Datenbasis sicherzustellen.
Grundsätzlich lassen sich folgende Arten von Datenquellen unterscheiden:
| Datenquellenart | Beispiele |
| Interne Datenquellen | Unternehmensdaten, Verkaufsdaten, Log-Dateien |
| Externe, öffentliche Datenquellen | Destatis, Eurostat |
| Externe, kommerzielle Datenquellen | Marktforschungsdaten, Finanzdatenanbieter |
| Open-Data-Plattformen | GovData, Kaggle |
| Echtzeit- & Sensordaten | IoT-Daten, Wetter- oder Verkehrsdaten |
| Umfrage – & Primärdaten | Online-Umfragen, Interviews |
| Web- & Social-Media-Daten | Website-Tracking, Social-Media-Daten |
In diesem Blogbeitrag liegt der Fokus auf internen Datenquellen, da diese in vielen Unternehmen direkt verfügbar sind und einen praxisnahen Einstieg in den Datenvisualisierungsprozess bieten.
Zur Veranschaulichung des gesamten Prozesses anhand eines Beispiels werden wir den folgenden Business Use Case verwenden:
“Als CRM-Manager möchte ich wissen, für welche Kunden wir als Firma die meisten Projekte abgeschlossen haben.“
Eine unternehmensweite Sales-Pipeline basiert in der Regel auf Daten aus einem CRM-System. Zur Identifikation relevanter Datenquellen ist es jedoch erforderlich zu prüfen, ob Abhängigkeiten zu angebundenen Umsystemen bestehen.
Solche Umsysteme können z.B. ERP-Systeme, separate Finanz- / Abrechnungssysteme oder Monitoring und Marketing Tools sein, welche ergänzende Informationen beinhalten.
Diese Abhängigkeiten müssen berücksichtigt werden, um ein vollständiges Verständnis der Datenbasis zu schaffen und spätere Inkonsistenzen im Visualisierungsprozess zu vermeiden.
Data Staging

Nach der Evaluation aller relevanten Datenquellen und dem Sicherstellen des Zugriffs kann mit dem Data Staging begonnen werden. Das Data Staging beinhaltet alle Extract-, Transform- und Load- Tätigkeiten, die notwendig sind, um eine geeignete Datenbasis für die spätere Visualisierung bereitzustellen.
Diese Schritte werden unter dem Begriff ETL zusammengefasst und sind für die moderne Datenverarbeitung zentral.
Extract
(Roh)Daten werden aus einer identifizierten Datenquelle extrahiert (Sales Daten aus einem CRM-System)
Transform
Die extrahierten Daten werden bereinigt, vereinheitlicht und aufbereitet. Die Komplexität dieses Schritts hängt dabei vom Zustand der Rohdaten und von der Struktur des Zielsystems ab.
Load
Die aufbereiteten Daten werden in ein Zielsystem geladen, beispielsweise ein Data Warehouse, eine Datenbank oder andere Datenstrukturen, welche die Grundlage für eine Datenvisualisierung bilden.
Neben dem ETL-Ansatz existiert auch der ELT-Ansatz, bei dem die Daten nach der Extrahierung zuerst in das Zielsystem geladen und darin direkt weiterverarbeitet werden.
Dieser Ansatz wird besonders in Cloud-Datenarchitekturen verwendet.
Die Wahl zwischen ETL- und ELT-Ansatz hängt von den jeweiligen Business Use Cases sowie der zugrunde liegenden Architektur ab. In vielen Fällen erfolgt die Umsetzung in einer DevOps-orientierten Infrastruktur, in der automatisierte Daten-Pipelines Rohdaten aus den identifizierten Datenquellen extrahieren und weiterverarbeiten.
Daten-Pipelines sind ein zentrales Element im Bereich DevOps und stehen in engem Zusammenhang mit Continuous-Integration- und Continuous-Delivery-Ansätzen (CI/CD), die wir in einem weiteren Blogbeitrag genauer erläutert haben:

CI/CD und IaC
von Thomas Somogyi
Auswahl des Datenspeichers
Innerhalb des “Load”-Schrittes werden die aufbereiteten Daten in ein Datenmanagementsystem geladen. Wie auch bei den vorherigen Schritten im Datenvisualisierungsprozess ist auch hier die Auswahl dieses Systems stark vom zu implementierenden Business Use Case abhängig.
Neben dem Business Use Case sind auch die Anforderungen an die Verwaltbarkeit, Kosten und Performance zentrale Punkte, die es zu berücksichtigen gibt.
Für kleinere Analysen können gängige Collaboration Tools wie Excel, SharePoint oder Access-Datenbanken Verwendung finden. Bei grösseren und komplexeren Vorhaben kommen hingegen relationale Datenbanken oder Data Warehouses zum Einsatz.
Während flexible Tools eine schnelle und kostengünstige Implementierung ermöglichen, bieten strukturierte Datenspeicher eine einheitliche Datenbasis, bessere Nachvollziehbarkeit sowie Skalierbarkeit, die zur Nachhaltigkeit zukünftiger Vorhaben beiträgt.
Datenvisualisierung – Implementierung
Nachdem alle bisherigen Prozessschritte wie Datenaufbereitung, Datenmodellierung und die Wahl der geeigneten Datenplattform abgeschlossen sind, kann mit der Implementierung der Datenvisualisierung begonnen werden.
Wie auch bei der Auswahl des Datenspeichers ist die Art und Form der Datenvisualisierung abhängig von den Business Use Cases der Spezifikation. Unterschiedliche Anwendungsfälle erfordern unterschiedliche Visualisierungstypen, beispielsweise operative Dashboards für das tägliche Monitoring, analytische Auswertungen für Fachabteilungen oder Management-Cockpits für strategische Entscheidungen.
Ein weiterer zentraler Aspekt ist die Definition der Zielgruppen. Je nach Nutzerkreis (Management, Data Analysts, Laien) unterscheiden sich die Anforderungen an die Benutzerfreundlichkeit, Interaktivität und Detailtiefe. Während Personen auf Management-Ebene meist aggregierte Kennzahlen und übersichtliche Visualisierungen benötigen, erfordern fachliche Anwender mehr Hands-on-Funktionalitäten wie Filtering, tabellarische Ansichten, etc.
Aufgrund der unterschiedlichen Anforderungen der Zielgruppen kommen je nach Use Case und Komplexitätsgrad verschiedene Tools zur Datenvisualisierung zum Einsatz. Diese unterscheiden sich hinsichtlich Funktionsumfang, Bedienbarkeit, Flexibilität sowie dem erforderlichen technischen Know-how.
Die nachfolgende Tabelle gibt einen Überblick über gängige Visualisierungstools und deren typische Anwendungsbeispiele:
| Tool | Anwendungsbeispiele |
| Tableau | Interaktive Dashboards für Fachabteilungen und Management, explorative Analysen, Self-Service BI mit Fokus auf visuelle Datenexploration |
| Power BI | Unternehmensweite Dashboards, Management-Reports, Integration in Microsoft-Ökosystem (Excel, Azure, Teams), rollenbasierter Zugriff |
| Microsoft Excel | Einfache Auswertungen, Kurzanalysen, Tabellen- und Pivot basierte Visualisierungen, Prototyping |
| Sigma | Cloudbasierte Analysen auf Data Warehouses, tabellarische und visuelle Auswertungen |
| Python | Individuelle und hochflexible Visualisierungen, explorative Datenanalysen, automatisierte Reports, komplexe Auswertungen durch Libraries |
Im nachfolgenden Beispiel wird Power BI als Visualisierungstool verwendet.
Business Use Case: Implementierung mit Power BI
Das Vorgehen zur Implementierung des Blog Use Cases richtet sich den bisher besprochenen Inhalten:
Als CRM-Manager möchte ich wissen, für welche Kunden wir als Firma die meisten Projekte abgeschlossen haben.
Um diesen Inhalt kurz zu halten, wird der Detaillierungsgrad der Spezifikation klein gehalten.
Die nachfolgende Tabelle zeigt in Kurzform die Fragen auf, die für diese Visualisierung in Form einer “Mini-Spezifikation” beantwortet worden sind:
| Was | Inhalt |
| Datenquelle | CRM-System |
| Datenmenge | Klein |
| Datenqualität | Gut |
| Datenformat | Semi-strukturiert (XML-Export) |
| Zielgruppe | CRM-Manager (fiktive Rolle) |
| ETL/ELT? | ELT |
| EL-Tool | Azure Data Factory |
| Datenspeicher (+ Transform) | SQL-Datenbank (Basis Azure) |
| KPI | Anzahl Kundenprojekte pro Kunde |
| Visualisierungstool | Power BI |
| Visualisierungsform | Balkendiagramm |
| Filter | x-Achse: Kunde, y-Achse: Anzahl Kundenprojekte |

Als Datenquelle dient in diesem Beispiel das CRM-System eines Beratungsunternehmens. Über ein Skript wird ein definierter Ausschnitt der relevanten Daten in Form einer XML-Datei exportiert. Diese XML-Datei wird anschliessend über eine Daten-Pipeline in eine Azure SQL-Datenbank geladen. Die SQL-Datenbank dient als zentrale Datenbasis für die Umsetzung des beschriebenen Use Case sowie als Quelle für die Datenvisualisierung. Innerhalb der Datenbank erfolgt die Transformation der Rohdaten über SQL-Views: Die Kundennamen werden anonymisiert und die Projektanzahl pro Kunde aggregiert.
Über eine integrierte Schnittstelle wird die Azure SQL-Datenbank in Power BI angebunden. Nach der Anbindung können die Daten innerhalb von Power BI bei Bedarf weiter modelliert, transformiert und mit Berechnungen angereichert werden. Auf dieser Basis werden die Kennzahlen berechnet und in der Visualisierung für die CRM-Manager dargestellt.
Das Schlussresultat dieses Prozesses ist ein aussagekräftiges Diagramm:

Fazite
Der Weg zur Datenvisualisierung umfasst weitaus mehr als nur das Erstellen von Diagrammen. Er folgt einem situationsabhängigen Prozess, der bei der Definition der Business Use Cases beginnt, die Datenaufbereitung adressiert und bis zur Wahl des richtigen Tools reicht. Wie der beschriebene Weg zeigt, bildet eine sorgfältige Spezifikation die Grundlage für jede erfolgreiche Visualisierung.
Wer die richtigen Fragen stellt, die passenden Datenquellen identifiziert und den ETL- bzw. ELT-Prozess konsequent durchläuft, schafft eine verlässliche Datenbasis und damit die Voraussetzung für aussagekräftige und entscheidungsrelevante Visualisierungen.
Der vorgestellte Business Use Case mit Power BI zeigt auf, dass selbst einfachere Use Cases trotzdem strukturierte Vorgehen erfordern. Das Ergebnis verdeutlicht, wie aufbereitete Daten zielgruppengerecht dargestellt werden können, sofern die Infrastruktur und der dazugehörige Prozess von Anfang an passend aufgesetzt werden. Gleichzeitig zeigt die Umsetzung des Use Cases mögliche Verbesserungspotenziale auf. So könnte der XML-Export aus dem CRM-System automatisiert und die Azure-Infrastruktur hinsichtlich Kosten weiter optimiert werden.
Möchten Sie aus Ihren Daten verständliche und entscheidungsrelevante Visualisierungen machen?
Wir unterstützen Sie von der ersten Use-Case-Idee bis zum aussagekräftigen Dashboard.