Was sind Zeitreihendaten? - MATLAB & Simulink

Zeitreihendaten

Umgang mit Zeitreihendaten

Als Zeitreihendaten bezeichnet man eine Abfolge von Datenpunkten, die zu aufeinanderfolgenden Zeitpunkten gesammelt oder aufgezeichnet werden. Zeitreihendaten sind weitverbreitet, insbesondere in Bereichen wie der Automobilindustrie, wo Sensordaten schon per se Zeitreihen sind, sowie in der Wissenschaft, wo sie in Daten wie Ozeanmessungen und Klimaanalysen vorkommen, als auch im Finanzwesen, wo sie für Aktienkurse und andere Indikatoren genutzt werden. Auch wenn der Zeitstempel für die Analyse nicht unbedingt erforderlich ist, benötigen die Daten oft einen Zeitreihenansatz. Daher ist er ein wichtiger Bestandteil dessen, womit sich die Benutzer regelmäßig beschäftigen.

Die Arbeit mit Zeitreihendaten kann mitunter komplex sein, ist jedoch eine entscheidende Grundkompetenz für alle, die sich mit Datenanalyse befassen. Dieser Guide bietet Antworten auf häufig gestellte Fragen und enthält nützliche Ressourcen, die Ihnen bei der erfolgreichen Durchführung Ihres nächsten Zeitreihenprojekts helfen.

2D-Diagramm von Zeitreihendaten über 65 Jahre.

In MATLAB visualisierte Zeitreihendaten. Eine Zeitreihe ist eine Sammlung von Datenpunkten, die nacheinander über einen bestimmten Zeitraum aufgezeichnet werden. (Siehe Code.)

Haupteigenschaften von Zeitreihendaten

Drei Liniengrafiken von Zeitreihendaten, wobei ein Abschnitt der Grafik hervorgehoben ist, um die Bedeutung der Klassifizierung anzuzeigen.

Für ein besseres Verständnis der Klassifizierung von Zeitreihendaten können Sie Grad-CAM und andere Visualisierungen in MATLAB erstellen. (Siehe Code.)

Zeitreihendaten beinhalten eine zeitliche Komponente – das heißt, dass Zeit eine Rolle spielt. Der entscheidende Aspekt ist, dass es sich um eine Reihe handelt, bei der Datenpunkte im Laufe der Zeit nacheinander gesammelt oder aufgezeichnet werden. Dies impliziert oft regelmäßige Intervalle, z. B. jede Minute, Sekunde oder jeden Tag, allerdings ist eine Regelmäßigkeit nicht unbedingt erforderlich. Entscheidend ist, dass es Zeitstempel gibt. Wenn Ihr Datensatz Zeitstempel enthält und eine Sortierung oder Analyse in Bezug auf die Zeit erforderlich ist, handelt es sich wahrscheinlich um Zeitreihendaten. Sie sind weitverbreitet, z. B. für Wettervorhersagen oder Finanzanalysen, bei denen die zeitliche Abfolge von Datenpunkten für Erkenntnisse oder Vorhersagen wichtig ist.

Zeitreihendaten sind dadurch gekennzeichnet, dass eine der Spalten in der Regel geordnet ist und die Zeit angibt. Sie stellt Messungen je nach spezifischen Zeitwerten dar, die von Millisekunden bis zu Tagen reichen können. Die Daten können innerhalb derselben Serie unterschiedliche Abtastraten aufweisen. Bei Zeitreihendaten geht es nicht nur um spezifische Datenpunkte zu einem bestimmten Zeitpunkt, sondern sie können auch Messungen über einen Zeitraum darstellen, z. B. tägliche oder wöchentliche Zusammenfassungen.

Die Analyse von Zeitreihendaten

MATLAB® verfügt über zahlreiche integrierte Apps und Funktionen, die Sie zur Vorverarbeitung von Zeitreihendaten heranziehen können. Die Wahl der Technik hängt davon ab, wie vertraut Sie mit den Daten und dem Bereinigungsprozess sind. Wenn diese Datensätze für Sie Neuland sind, ist ein guter erster Schritt, mit einer interaktiven App wie der Data Cleaner-App zu beginnen, da sie eine intuitive Benutzeroberfläche für die erste Erkundung und Bereinigung bietet. Für bestimmte Zwecke, wie z. B. zur Synchronisierung und zum Resampling, können Live-Editor-Tasks hilfreich sein. Wenn Sie lieber programmieren und mit den Funktionen vertraut sind, können Sie direkt Befehlszeilenfunktionen verwenden.

Vier Visualisierungen von Signalen in der Zeit- und Zeit-Frequenz-Domäne.

Signal Analyzer-App in MATLAB. (Siehe Dokumentation.)

Zwei Schlüsselkomponenten bei der Arbeit mit Zeitreihendaten sind die Synchronisierung und das Resampling. Bei der Synchronisierung werden Datenpunkte anhand ihrer Zeitstempel ausgerichtet, um sicherzustellen, dass Datensätze vergleichbar und Analysen genau sind. Für die Anpassung der Häufigkeit von Datenpunkten an bestimmte Analyseziele ist dabei das Resampling unerlässlich. Hierfür verfügt MATLAB über die Befehle synchronize und retime, mit denen sich Datensätze zu bestimmten Zeitpunkten kombinieren lassen. Wenn Sie sich bei der Verwendung dieser Funktionen unsicher sind, bieten Live-Editor-Tasks eine interaktive Möglichkeit, sich mit ihnen vertraut zu machen und verschiedene Varianten auszuprobieren.

Zwar gibt es viele Techniken für die Zeitreihenanalyse, aber zwei wesentliche Ansätze sind die Trendanalyse und die Saisonalität:

  • Bei der Trendanalyse werden langfristige Bewegungen in den Daten identifiziert und analysiert, um die allgemeine Richtung zu ermitteln, und so fundierte Vorhersagen oder Entscheidungen zu treffen.
  • Unter Saisonalität versteht man das Erkennen und Modellieren regelmäßiger Muster, die sich über bestimmte Zeiträume wiederholen, z. B. jährliche, monatliche oder tägliche Zyklen. Diese Zeiträume können noch detaillierter sein, wenn es um Sensoren geht: Ingenieure in der Automobilindustrie müssen in der Größenordnung von Nano- oder Mikrosekundenzyklen denken, damit genaue Vorhersagen überhaupt möglich sind.

MATLAB bietet Tools und Funktionen, um diese Techniken effizient auszuführen, darunter integrierte Funktionen zur Datenbereinigung, Visualisierung und erweiterten Modellierung. Der timetable-Tabellentyp ist besonders nützlich für die Organisation und Verwaltung von Zeitreihendaten, während die Signal Analyzer-App eine leistungsstarke Plattform für die interaktive Visualisierung und Analyse von Signalen bietet.

Herausforderungen für Ingenieure bei Zeitreihendaten

Bei ihrer Arbeit stehen Ingenieure oft vor Herausforderungen wie dem Umgang mit fehlenden Daten aufgrund von Sensorausfällen, der Handhabung von Ausreißern und der Verarbeitung von Rauschen in den Daten. Vor der effektiven Nutzung von Zeitreihendaten für die Modellierung müssen diese in der Regel zunächst bereinigt und aufbereitet werden.

Eine große Herausforderung besteht darin, sicherzustellen, dass Zeitreihendaten richtig sequenziert und angeordnet sind. Selbst wenn die Daten keine umfangreiche Verarbeitung erfordern, müssen sie für die Analyse oder Machine-Learning-Modelle logisch strukturiert werden. Dabei ist es wichtig, Saisonalität und Trends zu verstehen, da diese Muster manchmal eher Artefakte als echte Merkmale sein können. Wenn diese Artefakte nicht berücksichtigt werden, können sie Modelle fehlleiten, insbesondere beim Deep Learning, wo sie falsche Muster verstetigen könnten. Darüber hinaus benötigen Ingenieure ein fundiertes Grundwissen über Zeitreihen, wie z. B. Saisonalität und Stationarität, bevor sie sich in komplexe Analysen vertiefen. Dieses Basiswissen fehlt manchmal bei Personen, die in erster Linie mit Machine Learning arbeiten, aber keinen entsprechenden ingenieurwissenschaftlichen Hintergrund haben.

Eine weitere Herausforderung speziell für MATLAB-Benutzer ist die Verwechslung des Begriffs „Zeitreihen“ (engl.: time series) mit dem MATLAB-Objekt timeseries. Benutzer suchen oft nach „Zeitreihen“, kennen aber möglicherweise nicht die Funktion timetable, die erweiterte Funktionen für die Verarbeitung zeitbasierter Daten bietet. Mithilfe von timetable in MATLAB können Sie Visualisierungen erstellen, Daten vorbereiten und andere Aufgaben ausführen. Damit werden die Synchronisierung und andere komplexe Vorgänge unterstützt, die für eine effektive Verwaltung von Zeitreihendaten unerlässlich sind.

Animation, die die Synchronisierung von Multiraten-Daten in einem Datensatz veranschaulicht. Die Zeiten werden abgeglichen und die Daten entsprechend einem Resampling unterzogen.

In Zukunft wird sich die MATLAB-Entwicklung auf die Funktionalität timetable konzentrieren. Das klassische Objekt timeseries befindet sich nun im Wartungsmodus. Dieser Ansatz wird erweiterte Funktionen und Einsatzmöglichkeiten bieten und MATLAB-Benutzer, die mit Zeitreihendaten arbeiten, besser bei ihrer Arbeit unterstützen.

Nächste Schritte: Was Ingenieure weiter erkunden können

Screenshot mit zwei Liniendiagrammen mit Zeitstempel und einer Reihe von Schaltflächen für die nächsten Schritte.

Vorverarbeitung und Organisation von Zeitreihendaten mit der Data Cleaner-App in MATLAB. (Siehe Dokumentation.)

MATLAB bietet eine Reihe von Tools und Funktionen zur Bereinigung von Zeitreihendaten. Sie können Befehlszeilenfunktionen verwenden, wenn Sie lieber codieren, oder aber auf Low-Code-Funktionen wie die Data Cleaner-App oder Live-Editor-Tasks zurückgreifen. Diese Tools erleichtern Ihnen die Synchronisierung von Daten, das Ergänzen fehlender Werte mithilfe von Methoden wie der linearen Interpolation und vieles mehr.

Die nächsten Schritte hängen von Ihrem Vorhaben ab, aber hier sind vier Möglichkeiten, die Sie in Betracht ziehen können:

  • Beispiele: Sehen Sie sich Beispiele zur Signalverarbeitung und dem Frequenzbereich an. Diese können Ihnen möglicherweise nützliche, komplexere Techniken näherbringen.
  • Onramp zur Signalverarbeitung: Das Signal Processing Onramp ist ein hervorragender Ausgangspunkt für alle, die bisher noch keine Berührungspunkte mit diesen Konzepten und der Arbeit mit Signaldaten hatten.
  • Beispiele für Deep Learning und Machine Learning: Sehen Sie sich Beispiele speziell für Zeitreihenprognosen im Kontext von Deep Learning und Machine Learning an. Diese Beispiele können relevante Techniken und Anwendungen hervorheben.
  • Echtzeitanwendungen: Wenn Sie an einer Echtzeitverarbeitung oder Modellaktualisierungen interessiert sind, sollten Sie sich mit Streaming-Anwendungen befassen. Zunächst ist es jedoch sinnvoll, sich mit den grundlegenden Konzepten vertraut zu machen, bevor man sich mit Echtzeitanwendungen befasst.

Siehe auch: Zeitreihenanalyse