Predictive Analytics verwendet historische Daten, um zukünftige Ereignisse vorherzusagen. Im Allgemeinen werden historische Daten verwendet, um ein mathematisches Modell zu erstellen, das wichtige Trends erfasst. Dieses prädiktive Modell wird dann auf aktuelle Daten angewendet, um vorherzusagen, was als Nächstes passieren wird, oder um Aktionen vorzuschlagen, mit denen optimale Ergebnisse erreicht werden können.
Predictive Analytics hat in den letzten Jahren viel Aufmerksamkeit erhalten, da bei unterstützenden Technologien große Fortschritte zu verzeichnen waren, vor allem in den Bereichen von Big Data und Machine Learning.
Predictive Analytics wird häufig im Kontext von Big Data diskutiert. Beispielsweise stammen technische Daten von Sensoren, Messinstrumenten und vernetzten Systemen in der Praxis. Zu den Daten von Business-Systemen eines Unternehmens können beispielsweise Transaktionsdaten, Vertriebsergebnisse, Kundenbeschwerden und Marketing-Informationen gehören. Unternehmen treffen zunehmend datengestützte Entscheidungen auf der Grundlage dieses wertvollen Informationen.
Wenn der Wettbewerb zunimmt, bemühen sich Unternehmen, ihre Produkte und Services für die umkämpften Märkte besonders hervorzuheben. Datengestützte prädiktive Modelle können Unternehmen helfen, seit Langem bestehende Probleme auf neue Weisen zu lösen.
Beispielsweise können Gerätehersteller feststellen, dass es schwierig ist, nur bei der Hardware innovativ zu sein. Produktentwickler können vorhandenen Lösungen prädiktive Funktionen hinzufügen, um den Kundennutzen zu erhöhen. Mit Predictive Analytics für die Instandhaltung von Geräten, oder vorausschauende Instandhaltung, können Geräteausfälle und Energiebedarf vorhergesagt sowie Betriebskosten gesenkt werden. Beispielsweise können Sensoren, die Vibrationen in Fahrzeugteilen messen, einen Instandhaltungsbedarf signalisieren, bevor das Fahrzeug im Straßenverkehr eine Panne hat.
Außerdem verwenden Unternehmen Predictive Analytics, um genauere Vorhersagen zu erzeugen, etwa für Energiebedarf im Stromnetz. Mit diesen Vorhersagen ist eine effektivere Ressourcenplanung möglich (beispielsweise eine Zeitplanung für den Einsatz mehrerer Kraftwerke).
Um Big Data nutzbringend einzusetzen, wenden Unternehmen Algorithmen mithilfe von Tools wie Hadoop und Spark auf große Datenmengen an. Bei den Datenquellen kann es sich um transaktionale Datenbanken, Protokolldateien von Geräten, Bilder, Video-, Audio-, Sensor-Daten oder sonstige Datentypen handeln. Innovationen entstehen häufig durch Kombination von Daten aus mehreren Quellen.
Bei all diesen Daten sind Tools erforderlich, um Einblicke und Trends zu extrahieren. Machine-Learning-Techniken werden verwendet, um Muster in Daten zu finden und Modelle zu erstellen, die zukünftige Ergebnisse vorhersagen. Eine Reihe von Machine-Learning-Algorithmen stehen zur Verfügung, darunter die lineare und die nicht lineare Regression, neuronale Netze, Support Vector Machines, Entscheidungsbäume und andere Algorithmen.
Predictive Analytics ist nützlich für Teams in so unterschiedlichen Branchen wie Finanzen, Gesundheitswesen, Pharmazie, Automobilbranche, Luft- und/Raumfahrt und Fertigung.
Predictive Analytics ist ein Verfahren, in dem Datenanalysen verwendet werden, um Vorhersagen anhand von Daten zu treffen. Dieser Prozess verwendet Daten zusammen mit Analysen, Statistiken und Machine Learning-Techniken, um ein prädiktives Modell für die Vorhersage zukünftiger Ereignisse zu erstellen.
Der Begriff „Predictive Analytics“ beschreibt die Anwendung einer Statistik- oder Machine-Learning-Technik zur Erstellung einer quantitativen Zukunftsvorhersage. Häufig werden Techniken des überwachten Machine Learning verwendet, um einen zukünftigen Wert vorherzusagen (Wie lange kann dieses Gerät genutzt werden, bevor es eine Wartung benötigt?) oder eine Wahrscheinlichkeit zu schätzen (Wie wahrscheinlich ist es, dass dieser Kunde einen Kredit nicht zurückzahlt?).
Predictive Analytics beginnt mit einem Geschäftsziel: Daten sollen verwendet werden, um Verschwendung zu reduzieren, Zeit zu sparen oder Kosten zu senken. Der Prozess bindet heterogene, häufig sehr große Datenmengen in Modelle ein, die klare, handlungsrelevante Ergebnisse erzeugen könne, um die Erreichung dieses Ziels zu unterstützen, wie z. B. weniger Materialverschwendung, weniger Lagerbestand und ein hergestelltes Produkt, das die Spezifikationen erfüllt.
Wir alle kennen prädiktive Modelle für die Wettervorhersage. Eine wichtige Anwendung prädiktiver Modelle in der Industrie dient der Vorhersage der Stromlasten, mit der die Nachfrage nach Energie vorhergesagt wird. In diesem Fall benötigen Energieerzeuger, Netzbetreiber und Händler genaue Vorhersagen der Stromlasten, um Entscheidungen zur Verwaltung von Lasten im Stromnetz zu treffen. Riesige Datenmengen stehen zur Verfügung, und mit prädiktiven Analysen können Netzbetreiber diese Informationen in handlungsrelevante Einblicke verwandeln.
Abbildung 1: Workflow der prädiktiven Analyse.
Im Allgemeinen folgt der Workflow für eine Anwendung der prädiktiven Analyse diesen grundlegenden Schritten:
Abbildung 2: Anwendung prädiktiver Analysen für die Vorhersage der Stromlasten im Bundesstaat New York.
Ihre aggregierten Daten erzählen eine komplexe Geschichte. Um ihr Potenzial für Einblicke zu nutzen, benötigen Sie ein genaues prädiktives Modell.
Prädiktive Modellierung verwendet Methoden der Mathematik und der Informatik, um ein Ereignis oder Ergebnis vorherzusagen. Diese Modelle sagen anhand von Veränderungen an den Modelleingaben ein Ergebnis in einem zukünftigen Zustand oder zu einem zukünftigen Zeitpunkt voraus. Sie entwickeln das Modell in einem iterativen Prozess mit einer Trainings-Datenmenge und testen und prüfen es dann, um die Genauigkeit seiner Vorhersagen zu ermitteln. Sie können unterschiedliche Machine-Learning-Ansätze ausprobieren, um das effektivste Modell zu finden.
Beispiele sind Modelle mit Zeitreihen-Regression zur Vorhersage von Verkehrsaufkommen einer Fluggesellschaft oder die Vorhersage der Kraftstoffeffizienz mit einem linearen Regressionsmodell für Motordrehzahl gegenüber Last.
Organisationen, die Predictive Analytics erfolgreich implementiert haben, sehen Prescriptive Analytics als ihr nächstes Ziel. Prescriptive Analytics erstellt eine Schätzung dafür, was als Nächstes passieren wird; präskriptive Analysen sagen Ihnen, wie Sie auf die Vorhersage am besten reagieren.
Prescriptive Analytics ist ein Zweig der Datenanalysen, der prädiktive Modelle verwendet, um Aktionen vorzuschlagen, die im Interesse optimaler Ergebnisse durchgeführt werden sollten. Präskriptive Analysen beruhen auf Optimierung und regelbasierten Entscheidungsfindungstechniken. Lastvorhersagen für das Stromnetz in den nächsten 24 Stunden sind ein Beispiel für Predictive Analytics. Hierauf basierende Entscheidungen dazu, wie Kraftwerke betrieben werden sollen, stellen hingegen Presctiptive Analytics dar.
Unternehmen finden innovative Möglichkeiten, Predictive Analytics mit MATLAB® anzuwenden, um neue Produkte und Services zu erstellen und um seit Langem bestehende Probleme auf neue Weisen zu lösen.
Die folgenden Beispiele zeigen Predictive Analytics im Einsatz:
Fahrzeuge von Baker Hughes sind mit Druckpumpen ausgerüstet, die eine Mischung aus Wasser und Sand tief in gebohrte Brunnen einspeisen. Da die Pumpen einen Anteil von ca. 100.000 USD der Gesamtkosten von 1,5 Mio. USD für ein Fahrzeug ausmachen, suchte Baker Hughes nach einer Möglichkeit, bevorstehende Pumpenausfälle zu ermitteln. Das Unternehmen verarbeitete und analysierte bis zu ein Terabyte Daten. Diese wurden mit einer Rate von 50.000 Abtastungen pro Sekunde von Sensoren erfasst, die auf 10 Fahrzeugen im Einsatz montiert waren. Sie wurden verwendet, um ein neuronales Netz zu trainieren, sodass es mit Sensordaten Pumpenausfälle vorhersagen konnte. Es wird erwartet, dass die Software die Wartungskosten um 30 bis 40 % senken wird, also über 10 Mio. USD.
Heizungs-, Lüftungs-, Klimaanlagensysteme (HLK) in Bürogebäuden, Krankenhäusern und anderen großen Gewerbebauten sind oft ineffizient, da Wetterveränderungen, schwankende Energiekosten oder die thermischen Eigenschaften des Gebäudes nicht berücksichtigt werden. Die cloud-basierte Softwareplattform von BuildingIQ verwendet fortschrittliche Algorithmen, die ununterbrochen Gigabytes an Informationen von Stromzählern, Thermometern und HLK-Drucksensoren verarbeiten. Machine Learning wird verwendet, um die Daten zu segmentieren und den relativen Beitrag von Gas, elektrischem Strom, Dampf- und Solarenergie zu Aufheiz- und Abkühlprozessen zu ermitteln. Optimierung wird verwendet, um den besten Zeitplan für das Heizen und Kühlen jedes Gebäudes im Tagesverlauf zu ermitteln. Die Plattform von BuildingIQ verringert bei Normalbetrieb den HLK-Energieverbrauch in großen Gewerbebauten um 10 bis 25 %.
Fehlalarme von Elektrokardiographen und anderen Patientenüberwachungsgeräten stellen ein schwerwiegendes Problem auf Intensivstationen dar. Geräusche von Fehlalarmen stören den Schlaf der Patienten, und häufige Fehlalarme führen dazu, dass das Pflegepersonal echte Warnungen weniger aufmerksam wahrnimmt. Die Teilnehmer der entsprechenden „PhysioNet/Computing in Cardiology Challenge“ erhielten die Aufgabe, Algorithmen zu entwickeln, die zwischen echten Alarmen und Fehlalarmen in Signalen unterscheiden konnten, die von Überwachungsgeräten auf Intensivstationen aufgezeichnet worden waren. Forscher von der Czech Academy of Sciences erhielten den ersten Preis in der Kategorie „Echtzeit“ der Challenge. Ihre Einreichung waren MATLAB-Algorithmen, die QRS-Komplexe erkennen, zwischen normalen und ventrikulären Herzschlägen unterscheiden sowie falsche QRS-Komplexe herausfiltern können, die durch Stimuli von Herzschrittmachern entstehen. Die Algorithmen erreichten eine Richtig-positiv-Rate von 92 % und eine Richtig-negativ-Rate von 88 %.
MATLAB wird zunehmend von Teams verwendet, die Anwendungen für Predictive Analytics entwickeln, um geschäftliche und technische Daten als Grundlage für fundierte Entscheidungen zu nutzen.
Mithilfe der Tools und Funktionen von MATLAB können Sie Predictive Analytics anhand von technischen, wissenschaftlichen und geschäftlichen Daten sowie Transaktions- und Felddaten durchführen. Mit MATLAB können Sie prädiktive Anwendungen auf großen Produktionssystemen und Embedded Systems bereitstellen.
Abbildung 3: MATLAB für Predictive Analytics.
In dieser vereinfachten Betrachtungsweise stammen technische Daten von Sensoren, Messinstrumenten und vernetzten Systemen in der Praxis. Die Daten werden gesammelt und in einem Dateisystem gespeichert, das sich vor Ort oder in der Cloud befindet.
Abbildung 4: Architektur von Analysefunktionen, die auf Technik basieren.
„Ganz gleich, in welcher Branche unser Kunde arbeitet und welche Daten wir für ihn analysieren sollen – Text, Audio, Bilder oder Video – mit MATLAB-Code können wir schneller klare Ergebnisse bereitstellen.“
Dr. G. Subrahamanya VRK Roo, Cognizant
Diese Daten werden mit Daten von herkömmlichen Business-Systemen kombiniert, wie Kostendaten, Vertriebsergebnissen, Kundenbeschwerden und Marketing-Informationen.
Danach werden die Analysefunktionen mithilfe von MATLAB von einem Techniker oder Fachexperten entwickelt. Fast immer ist eine Vorverarbeitung erforderlich, um mit fehlenden Daten, Ausreißern oder anderen unvorhergesehenen Problemen der Datenqualität umzugehen. Danach werden Analysemethoden wie Statistik und Machine Learning verwendet, um eine „Analytik“ zu erstellen: ein prädiktives Modell Ihres Systems.
Um praktischen Nutzen zu erzielen, wird das prädiktive Modell nun bereitgestellt. Dies kann in einer IT-Produktionsumgebung erfolgen, die die Grundlage für ein transaktionsbasiertes oder IT-bezogenes Echtzeit-System wie eine eCommerce-Website bildet. Alternativ kann es auf einem Embedded-Gerät erfolgen, wie einem Sensor, einem Controller oder einem intelligenten System in der Praxis, etwa einem autonomen Fahrzeug.
Eine Nutzung von MATLAB und Simulink® als Teil dieser Architektur ist ideal, da die Tools einfache Bereitstellungspfade für Embedded Systems mit Model-Based Design ermöglichen – oder für IT-Systeme mit Anwendungsbereitstellungs-Produkten.
Abbildung 5: Bereitstellung prädiktiver Modelle auf Embedded Systems und IT-Systemen.
„MATLAB hat bei der Beschleunigung unserer F&E sowie der Implementierung geholfen. Dies war durch robuste numerischen Algorithmen, umfangreiche Visualisierungen und Analysetools, zuverlässige Optimierungsroutinen, Unterstützung für objektorientiertes Programmieren und die Fähigkeit, unsere Java-Produktionsanwendungen in der Cloud zu betreiben, möglich.“
Borislav Savkovic, leitender Datenwissenschaftler, BuildingIQ