Text Analytics Toolbox

Analysieren und Modellieren von Textdaten

Haben Sie noch Fragen? Kontaktieren Sie den Vertrieb.

Die Text Analytics Toolbox umfasst Algorithmen und Visualisierungen zur Vorverarbeitung, Analyse und Modellierung von Textdaten. Mit der Toolbox erstellte Modelle können in Anwendungen wie Sentiment-Analyse, vorausschauender Instandhaltung und Themenmodellierung verwendet werden.

Die Text Analytics Toolbox beinhaltet Tools zur Verarbeitung von Rohtext aus Quellen wie Geräteprotokollen, Nachrichten-Feeds, Umfragen, Bedienerberichten und sozialen Medien. Sie können Text aus gängigen Dateiformaten extrahieren, Rohtext vorverarbeiten, Einzelwörter extrahieren, Text in numerische Darstellungen konvertieren und Statistikmodelle erstellen.

Mithilfe von Machine-Learning-Techniken wie LSA, LDA und Worteinbettungen lassen sich Cluster finden und Merkmale aus hochdimensionalen Textdatenmengen erarbeiten. Mit der Text Analytics Toolbox erstellte Merkmale können mit Merkmalen aus anderen Datenquellen kombiniert werden, um Machine-Learning-Modelle zu entwickeln, die von textbasierten, numerischen und anderen Arten von Daten profitieren.

MATLAB Programmcode, der Textdaten aus Microsoft Word-Dokumenten in einen Datenspeicher extrahiert.

Importieren und Visualisieren von Text

Importieren Sie Textdaten in MATLAB aus Einzeldateien oder großen Datei-Sammlungen, darunter PDF, HTML und Microsoft^® Word. Erkunden Sie Textdatenmengen auf visuelle Weise mithilfe von Schlagwort- oder Punktwolken.

Extrahieren Sie Textdaten aus PDF, HTML, Microsoft Word, Microsoft Excel und CSV.

Dokumentation | Beispiele

Screenshot des Live Editor Task „Preprocess Text Data“ und seiner als Wortwolke dargestellten Ergebnisse.

Bereinigen und Vorverarbeiten von Text

Wenden Sie allgemeine Filterfunktionen an, um irrelevante Inhalte wie URLs, HTML-Tags und Satzzeichen zu entfernen. Korrigieren Sie die Rechtschreibung, filtern Sie nach Stoppwörtern und normalisieren Sie Wörter in die nicht flektierte Form.

Bereinigen und Vorverarbeiten von Textdaten in Live Editor

Dokumentation | Beispiele

MATLAB Programmcode zur Erstellung einer Punktwolke und das erstellte t-SNE-Diagramm zur Worteinbettung.

Konvertieren von Text in ein strukturiertes Format

Extrahieren Sie linguistische Merkmale mithilfe eines Tokenisierungsalgorithmus, berechnen Sie die Worthäufigkeitsstatistik, um Textdaten numerisch darzustellen, und trainieren Sie Worteinbettungsmodelle wie word2vec und skip-gram.

Erkundung und Visualisierung von Worteinbettungen

Dokumentation | Beispiele

Workflow für das Transfer Learning mit dem Transformer-Modell FinBERT auf Textdaten, um positive und negative Einstellungen zu ermitteln.

Anwenden von KI auf Textanalysen

Passen Sie ein Machine-Learning- oder Deep-Learning-Modell wie LSA, LDA und LSTM an Textdaten an. Setzen Sie Transformer-Modelle wie BERT, FinBERT und GPT-2 ein, um Transfer Learning mit Textdaten durchzuführen.

Training des BERT-Dokumentenklassifikators

Dokumentation | Beispiele

Große Sprachmodelle (LLM)

Verbinden von MATLAB mit der Chat Completions-API von OpenAI™ Setzen Sie die Funktionen von GPT-Modellen in Ihrer MATLAB Umgebung zur Verarbeitung natürlicher Sprache bei Aufgaben wie Textzusammenfassung und Chats ein.

Große Sprachmodelle (LLMs) mit MATLAB

Dokumentation | Beispiele

Abbildung zur Bereinigung von Textdaten zur Verarbeitung natürlicher Sprache. Links: Wortwolke aus Rohdaten. Rechts: Wortwolke aus bereinigten Daten.

Textanalysen für Ingenieure

Entwickeln Sie Pläne für die vorausschauende Instandhaltung auf Basis von Sensoren und Textprotokolldaten. Automatisieren Sie die Formalisierung von Anforderungen und die Überprüfung ihrer Einhaltung.

Informationsabruf mit Arbeitsauftragsdaten

Dokumentation | Beispiele

Verwenden Sie Textanalysen zur Zusammenfassung mehrerer Dokumente in ein einziges.

Dokumentenanalyse

Analysieren Sie Text mit Themenmodellierung, um zugrunde liegende Muster, Trends und komplexe Beziehungen zu entdecken und zu visualisieren. Fassen Sie Dokumente zusammen, extrahieren Sie Schlüsselwörter und bewerten Sie Wichtigkeit und Ähnlichkeit von Dokumenten.

Klassifizierung von Textdaten mithilfe eines Convolutional Neural Network

Dokumentation | Beispiele

In positive und negative Wörter getrennte Wortwolken.

Sentiment-Analyse

Ermitteln Sie die in Textdaten ausgedrückten Haltungen und Meinungen, um Aussagen als positiv, neutral oder negativ zu kategorisieren. Erstellen Sie Modelle, mit denen Sie eine Stimmung in Echtzeit vorhersagen können.

Sentiment-Analyse in MATLAB

Dokumentation | Beispiele

Wortwolke eines aus dem Roman „Stolz und Vorurteil“ generierten Texts.

Textgenerierung und -klassifizierung

Nutzen Sie Deep Learning, um neuen Text auf Basis von beobachtetem Text zu generieren und um Textbeschreibungen mit Worteinbettungen zu klassifizieren, die Kategorien identifizieren können.

Generierung von Text mithilfe von Autoencodern

Dokumentation | Beispiele