Was versteht man unter Datenvisualisierung?
3 Dinge, die Sie wissen sollten
Die Datenvisualisierung übersetzt Daten in grafische Darstellungen wie Diagramme, Karten und 3D-Visualisierungen, mit denen sich Muster, Trends und Abweichungen in den Daten leicht erkennen lassen.
Mit diesen Datenvisualisierungen lassen sich Zusammenhänge erkennen, die bei einer reinen Betrachtung der Rohdaten nur schwer oder gar nicht zu beobachten wären, insbesondere bei großen Datensätzen aus Quellen wie Sensoren, Datenloggern, medizinischen Aufzeichnungen sowie Internetsuch- und Kaufmustern. Bei der Umwandlung von Daten in verwertbare Informationen spielt die Datenvisualisierung eine zentrale Rolle.
Die Visualisierungsmethoden für Daten unterscheiden sich nach Fachgebiet.
Computational Finance
Frühere oder aktuelle Marktdaten werden zur schnelleren Erkennung von Mustern und Trends, der Identifizierung von Unregelmäßigkeiten und der Gewinnung aussagekräftiger Erkenntnisse visualisiert. Die Datenvisualisierung trägt dazu bei, Analysen durchzuführen, prädiktive Modelle zu entwickeln, Risiken zu bewerten und Handelsstrategien zu formalisieren.
Das nachstehende Diagramm simuliert das künftige Verhalten der Strompreise am Spotmarkt anhand eines Zeitreihenmodells, das an die historischen Daten angepasst wurde.
Signalverarbeitung
Die Signalverarbeitung wird in Anwendungen wie der Sprachanalyse, der Überwachung der Herzfrequenz, der drahtlosen Kommunikation, der Fernerkundung, der Klimaüberwachung und der GPS-Technik eingesetzt. Zu den typischen Aufgaben gehören die Vorverarbeitung und der Vergleich von Signalen, die Entwicklung digitaler Filter, die Umwandlung von Signalen, die Durchführung von Messungen und die Erkennung von Mustern und Ereignissen. Anhand von Datenvisualisierungen werden hierbei relevante Signale im Zeit- und Frequenzbereich sowie im Zeit-Frequenz-Bereich analysiert.
Das folgende Diagramm zeigt die Audiodaten eines pazifischen Blauwals. Die Visualisierung erfolgt in MATLAB® mithilfe der Signal Analyzer App, mit der man Signale im Zeit- und Frequenzbereich visualisieren kann.
Bildverarbeitung und Computer Vision
Die Bild- und Videoverarbeitung erleichtert das Erkennen von Formen, Zählen von Objekten, Identifizieren von Farben, Messen von Objekteigenschaften und das Auffinden weiterer nützlicher Informationen. Bildverarbeitungstechniken werden häufig als Vorverarbeitungsschritt im Computer-Vision-Workflow herangezogen. Zu den Anwendungen in diesem Bereich gehören unter anderem die Gesichtserkennung für Smartphones, die Fußgänger- und Fahrzeugvermeidung in selbstfahrenden Fahrzeugen, die Videoüberwachung, die Tumorerkennung in MRT-Geräten und andere Bildabfragesysteme.
Beispielsweise verwendet BMW Computer-Vision-Funktionen in Assisted Driving View (ADV) zur Darstellung von Fahrzeugen in der Umgebung und zur Erkennung der Fahrzeugtypen.
Künstliche Intelligenz (KI)
Bei der Entwicklung von KI-Modellen – sei es mithilfe von Machine Learning oder Deep Learning – spielt die Datenvisualisierung eine wichtige Rolle, da die Modelle auf umfangreichen Datensätzen beruhen, die schwer zu interpretieren sind. Für das Machine Learning erleichtert die Clusteranalyse die Erkennung von Unregelmäßigkeiten und die Vorverarbeitung von Daten beim Supervised Learning. Die Hauptkomponentenanalyse (PCA) und t-distributed Stochastic Neighbor Embedding (t-SNE) sind die beiden am häufigsten verwendeten Datenvisualisierungstechniken. Diese tragen dazu bei, die Datendimensionen zu reduzieren, wodurch Sie sich in erster Linie auf die wichtigsten differenzierenden Dimensionen konzentrieren können.
Beim Deep Learning können Sie den Trainingsfortschritt mithilfe von Datenvisualisierungen wie Diagrammen der Netzwerkgenauigkeit und des -verlusts überwachen und trainierte Netzwerke mithilfe von Visualisierungstechniken wie Gradient-weighted Class Activation Mapping (Grad-CAM), Okklusionsempfindlichkeit, lokal interpretierbaren modellagnostischen Erklärungen (LIME) und Deep Dream untersuchen.
Softwarepakete bieten verschiedene Möglichkeiten zur Umwandlung von Rohdaten in aussagekräftige Visualisierungen, wie z. B. Grafiken, Schaubilder und Diagramme. Nachfolgend sehen Sie ein anschauliches Beispiel für Daten zur Radverkehrsdichte. Allein durch die visuelle Betrachtung der Rohdaten ist es schwierig, eine Beziehung zwischen den Datenpunkten herzustellen.
Zeitstempel | Tag | Gesamt | Nach Westen | Nach Osten | Uhrzeit |
‚24-06-2015 07:00:00’ | ‚Mittwoch’ | 141 | 13 | 128 | 7. |
‚24-06-2015 08:00:00’ | ‚Mittwoch’ | 327 | 44 | 283 | 8 |
‚24-06-2015 09:00:00’ | ‚Mittwoch’ | 184 | 32 | 152 | 9 |
‚24-06-2015 10:00:00’ | ‚Mittwoch’ | 94 | 30 | 64 | 10 |
‚24-06-2015 11:00:00’ | ‚Mittwoch’ | 67 | 24 | 43 | 11. |
‚24-06-2015 12:00:00’ | ‚Mittwoch’ | 66 | 32 | 34 | 12. |
‚24-06-2015 13:00:00’ | ‚Mittwoch’ | 67 | 32 | 35 | 13 |
Das nachstehende Balkendiagramm zeigt, dass die Radverkehrsdichte an den einzelnen Wochentagen steigt und fällt. Es steht nun fest, dass die Zahl der Radfahrer an Werktagen höher ist als an Wochenenden. Diese Visualisierung lässt den Schluss zu, dass die Radfahrer auf dieser Strecke überwiegend zur Arbeit und zurück pendeln.
Ein Streudiagramm kann verwendet werden, um mehr Erkenntnisse aus denselben Daten zu gewinnen. Das folgende Diagramm zeigt die Gesamtzahl der Fahrräder in Richtung Osten bzw. Westen zu bestimmten Tageszeiten. Aus diesem Diagramm können wir schließen, dass die Strecken in östlicher Richtung zu den Geschäftsvierteln und die Strecken in westlicher Richtung zu Wohngegenden führen. Außerdem können wir feststellen, dass der Berufsverkehr von 8:00-10:00 Uhr auf der ostwärts gerichteten Strecke und von 16:00-18:00 Uhr auf der westwärts gerichteten Strecke stattfindet.
Ein Schwarmdiagramm ist eine spezielle Art von Streudiagramm, das die Dichte des Radverkehrs zu verschiedenen Tageszeiten, Wochentagen und in verschiedenen Richtungen aufzeigen kann.
In unserem Beispiel zum Fahrradverkehr ermöglicht uns die Visualisierung der Daten mit verschiedenen Diagrammtypen wie Balken-, Streu- und Schwarmdiagrammen, nützliche Informationen aus dem Datensatz zu extrahieren, wie beispielsweise die Tage mit dem höchsten Verkehrsaufkommen, die Richtung des Pendlerverkehrs und die verkehrsreichste Zeit des Tages.
MATLAB ist eine Plattform zur Programmierung und für numerische Berechnungen, die zur Analyse von Daten, Entwicklung von Algorithmen und Erstellung von Modellen genutzt wird. Sie unterstützt den gesamten Workflow der Datenanalyse, einschließlich der Erfassung der Daten direkt in MATLAB, ihrer Analyse und Visualisierung sowie des Exports der Ergebnisse. Sie können interaktive Apps verwenden, um Ihre Daten zu visualisieren, ohne dafür Code schreiben zu müssen. Die Apps generieren dabei automatisch den entsprechenden MATLAB Programmcode für Sie, sodass Sie Ihre Arbeit automatisieren und wiederverwenden können.
Erstellung von Datenvisualisierungen
MATLAB bietet eine breite Palette an integrierten Diagrammtypen wie Linien-, Streu-, Verteilungs- und geografische Diagramme zur Visualisierung von Datensätzen aus einer Vielzahl von Anwendungen. Die Visualisierungen können sowohl interaktiv als auch programmgesteuert mithilfe der MATLAB-Sprache erstellt werden.
Entdecken von Datenvisualisierungen
Sie können Ihre Visualisierung auch interaktiv untersuchen:
- Vergrößern und Verkleinern eines bestimmten Ausschnitts des Datensatzes
- Interaktives Schwenken und Drehen von Visualisierungen
- Anzeige von Trendlinien oder Datenwerten direkt auf der Visualisierung
- Schattierung und Hervorhebung von Datenpunkten
- Wechsel zwischen verschiedenen Domänen (z. B. Zeit-, Frequenz-, S- und Z-Domäne)
Kommentierung und individuelle Anpassung von Datenvisualisierungen
Sie können Ihre Visualisierungen interaktiv mit Kommentaren versehen, indem Sie wichtige Informationen hervorheben, die Sie vermitteln möchten. Zum Beispiel:
MATLAB generiert automatisch Code aus Ihren interaktiven Diagrammmodifikationen. Diesen Code können Sie wiederverwenden, indem Sie ihn in Ihr Skript einfügen.
Komplexe Datensätze können mithilfe einfacher Diagramme nur schwer zu visualisieren sein. Mit MATLAB können Sie individuelle Diagramme erstellen, um Ihre Visualisierungsanforderungen zu erfüllen, und sie mit eigenen Interaktionen versehen.
Beispiele:
- Sparklines-Komponente – Erstellen Sie kleine Liniendiagramme, die den allgemeinen Trend jedes Vektors in einem Multi-Vektor-Datensatz, wie einer Tabelle, zeigen. Beobachten und vergleichen Sie die Datentrends für jede Zeile/Spalte.
- Dichte-Punktediagramm – Verwenden Sie eine Farbe (oder Transparenz), um die Dichte der Punkte zu ermitteln.
Weitere Beispiele für individuell erstellte Diagrammcontainer finden Sie unter File Exchange auf MATLAB Central.
Exportieren von Datenvisualisierungen
Sie können Ihre individuell erstellten und mit Kennzeichnungen versehenen Visualisierungen direkt exportieren und im Internet, in Präsentationen und Berichten verwenden.
Integration von Datenvisualisierungen mit Datenanalysen
Oftmals wird die Datenvisualisierung mit der Datenanalyse und -vorverarbeitung kombiniert. MATLAB-Apps wie Data Cleaner und Signal Analyzer kombinieren diese Schritte.
Mit interaktiven Reglern können Sie Aktionen festlegen, ohne Code schreiben zu müssen – und die entsprechenden Datenvisualisierungen werden dabei direkt in die App integriert. So können Sie die Ergebnisse einer bestimmten Aufgabe sofort sehen. Sobald die Analyse und die Vorverarbeitung abgeschlossen sind, können die Apps automatisch den entsprechenden MATLAB Programmcode generieren, sodass Sie die Schritte auch bei unterschiedlichen Daten automatisieren können.
Anwendungsspezifische Visualisierungen
Die Toolboxen von MATLAB ermöglichen anwendungsspezifische Visualisierungen sowie interaktive Anwendungen, die die Visualisierung mit der Vorverarbeitung sowie Analyse von Daten kombinieren.
Die Econometric Modeller App ermöglicht die Visualisierung und Analyse von univariaten oder multivariaten Zeitreihen (in der Econometrics Toolbox™).
Frequenzgang der einzelnen Stufen eines mehrstufigen digitalen Down-Umwandlers (in der DSP System Toolbox™)
Bluetooth LE-Blockierungs-, Intermodulations- und Träger-Interferenz-Leistungstest (in der Bluetooth® Toolbox).
Beamforming für ein Phased Array-System (in der Phased Array System Toolbox™).
Interessante Datenvisualisierungsanwendungen
Anhand der Datenvisualisierungsfunktionen in MATLAB können Unternehmen ihre Forschungsziele effektiv erreichen.
Ford entwickelt Analysetool für Fahrzyklus-Testergebnisse
Das Vehicle Energy Management Engineering Team von Ford entwickelte mithilfe von MATLAB das CycleTool, um die Emissionen, den Kraftstoffverbrauch und die Leistung seiner Fahrzeuge zu evaluieren. Das Tool ermöglicht es ihnen, die Systemleistung zu bewerten, indem sie die Ergebnisse ihrer Hardwaretests mit den Modellvorhersagen und Simulationen visuell vergleichen.
Bericht lesen
Entschlüsselung des Schmetterlingsflugs mit Hochgeschwindigkeitskameras und einem Windkanal
Wissenschaftler der Universität Lund fanden heraus, was den Schmetterlingen ihr charakteristisches, flatterhaftes Muster verleiht, und nutzten MATLAB hierfür zur Bildverarbeitung, Datenanalyse, Modellierung und Visualisierung. Durch das Studieren des Flugverhaltens von Schmetterlingen können Ingenieure effizientere und dynamischere Flug- oder sogar Schwimmdrohnen entwickeln. Mithilfe der Datenvisualisierungsfunktionen von MATLAB analysierten und verglichen die Wissenschaftler die Leistung ihrer Flügelkonzepte, die auf der Analyse des Flugverhaltens von Schmetterlingen basieren.
Bericht lesen
State Street Global Advisors entwickelt Scoring-Modell zur Verbesserung der Transparenz bei ESG-Investitionen
Das Entwicklerteam von State Street Global Advisors erstellte Histogramme, Streudiagramme, Kastengrafiken und andere Visualisierungen, um ihre Algorithmen im Rahmen der Entwicklung von R-Factor™ zu optimieren, einem System, das Anlegern dabei helfen soll, fundierte Entscheidungen zu treffen und ihre Umwelt-, Sozial- und Governance-Bewertungen (ESG) zu verbessern.
Bericht lesen
Bosch entwickelt eine zentrale Plattform für die Analyse und Visualisierung von Testdaten für die Automobilindustrie
Bosch nutzte MATLAB zur Entwicklung seines ENValyzer (Engineering Test Data Visualizer and Analyzer), einem Tool zur Visualisierung, Verarbeitung, Analyse und Berichterstellung von Testdaten, die von Messgeräten, Prüfständen und Fahrzeugen erfasst wurden. Die Bosch-Ingenieure konnten so die Daten in Einzel-, Sekundär-, Matrixplot- und Mehrachsenansichten darstellen.
Bericht lesen