Text Analytics Toolbox

 

Text Analytics Toolbox

Analysieren und Modellieren von Textdaten

MATLAB Programmcode, der Textdaten aus Microsoft Word-Dokumenten in einen Datenspeicher extrahiert.

Importieren und Visualisieren von Text

Importieren Sie Textdaten in MATLAB aus Einzeldateien oder großen Datei-Sammlungen, darunter PDF, HTML und Microsoft® Word. Erkunden Sie Textdatenmengen auf visuelle Weise mithilfe von Schlagwort- oder Punktwolken.

Screenshot des Live Editor Task „Preprocess Text Data“ und seiner als Wortwolke dargestellten Ergebnisse.

Bereinigen und Vorverarbeiten von Text

Wenden Sie allgemeine Filterfunktionen an, um irrelevante Inhalte wie URLs, HTML-Tags und Satzzeichen zu entfernen. Korrigieren Sie die Rechtschreibung, filtern Sie nach Stoppwörtern und normalisieren Sie Wörter in die nicht flektierte Form.

MATLAB Programmcode zur Erstellung einer Punktwolke und das erstellte t-SNE-Diagramm zur Worteinbettung.

Konvertieren von Text in ein strukturiertes Format

Extrahieren Sie linguistische Merkmale mithilfe eines Tokenisierungsalgorithmus, berechnen Sie die Worthäufigkeitsstatistik, um Textdaten numerisch darzustellen, und trainieren Sie Worteinbettungsmodelle wie word2vec und skip-gram.

Workflow für das Transfer Learning mit dem Transformer-Modell FinBERT auf Textdaten, um positive und negative Einstellungen zu ermitteln.

Anwenden von KI auf Textanalysen

Passen Sie ein Machine-Learning- oder Deep-Learning-Modell wie LSA, LDA und LSTM an Textdaten an. Setzen Sie Transformer-Modelle wie BERT, FinBERT und GPT-2 ein, um Transfer Learning mit Textdaten durchzuführen.

Große Sprachmodelle (LLM)

Verbinden von MATLAB mit der Chat Completions-API von OpenAI™ Setzen Sie die Funktionen von GPT-Modellen in Ihrer MATLAB Umgebung zur Verarbeitung natürlicher Sprache bei Aufgaben wie Textzusammenfassung und Chats ein.

Abbildung zur Bereinigung von Textdaten zur Verarbeitung natürlicher Sprache. Links: Wortwolke aus Rohdaten. Rechts: Wortwolke aus bereinigten Daten.

Textanalysen für Ingenieure

Entwickeln Sie Pläne für die vorausschauende Instandhaltung auf Basis von Sensoren und Textprotokolldaten. Automatisieren Sie die Formalisierung von Anforderungen und die Überprüfung ihrer Einhaltung.

Verwenden Sie Textanalysen zur Zusammenfassung mehrerer Dokumente in ein einziges.

Dokumentenanalyse

Analysieren Sie Text mit Themenmodellierung, um zugrunde liegende Muster, Trends und komplexe Beziehungen zu entdecken und zu visualisieren. Fassen Sie Dokumente zusammen, extrahieren Sie Schlüsselwörter und bewerten Sie Wichtigkeit und Ähnlichkeit von Dokumenten.

In positive und negative Wörter getrennte Wortwolken.

Sentiment-Analyse

Ermitteln Sie die in Textdaten ausgedrückten Haltungen und Meinungen, um Aussagen als positiv, neutral oder negativ zu kategorisieren. Erstellen Sie Modelle, mit denen Sie eine Stimmung in Echtzeit vorhersagen können.

Wortwolke eines aus dem Roman „Stolz und Vorurteil“ generierten Texts.

Textgenerierung und -klassifizierung

Nutzen Sie Deep Learning, um neuen Text auf Basis von beobachtetem Text zu generieren und um Textbeschreibungen mit Worteinbettungen zu klassifizieren, die Kategorien identifizieren können.

Kostenlose Testversion anfordern

30 Tage kostenlos ausprobieren.


Bereit zum Kauf?

Angebot anfordern und Erweiterungsprodukte entdecken.

Studieren Sie?

Ihre Hochschule bietet möglicherweise bereits Zugang zu MATLAB, Simulink und Add-on-Produkten über eine Campus-Wide License.