Main Content

Diese Seite wurde mithilfe maschineller Übersetzung übersetzt. Klicken Sie hier, um die neueste Version auf Englisch zu sehen.

Visualisieren Sie die Worthäufigkeit in einer Wortwolke

Dieses Beispiel zeigt, wie die Verteilung von Text mithilfe der Text Analytics Toolbox™ in einer Wortwolke visualisiert wird. Verwenden Sie ThingSpeak™ , um den Text zu sortieren und zu sehen, welche Parameter die Verteilung oder Stimmung beeinflussen.

CheerLights ermöglicht es Menschen auf der ganzen Welt, sich mit einer von Twitter festgelegten Farbe zu synchronisieren. ThingSpeak Channel 1417 speichert den Verlauf der CheerLights-Farben. Lesen Sie Wörter aus dem ThingSpeak Kanal und vergleichen Sie die Verteilung für frühe und späte Zeitstempel.

Lesen Sie Textdaten und berechnen Sie die Worthäufigkeit

Lesen Sie die letzten 500 Datenpunkte aus dem CheerLights ThingSpeak Kanal. Ermitteln Sie die Häufigkeit von Wörtern in jedem Dokument einer Sammlung mithilfe der Funktion bagofwords in der Text Analytics Toolbox.

colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]);
bagOfWords(colorData.LastCheerLightsCommand')
ans = 

  bagOfWords with properties:

          Counts: [61 68 40 59 23 42 52 59 40 46 10]
      Vocabulary: [1×11 string]
        NumWords: 11
    NumDocuments: 1

Ergebnisse nach Zeit sortieren

Suchen Sie den Index jedes Datenpunkts mit einem Zeitstempel vor der Mittagszeit und suchen Sie dann alle Indizes für Datenpunkte nach der Mittagszeit. Verwenden Sie die Indizes, um für jeden Fall ein Array aller Wörter zu erstellen.

lateTimeIndex = (hour(colorData.Timestamps) > 12);
earlyTimeIndex = (hour(colorData.Timestamps) < 12);

lateColors = colorData.LastCheerLightsCommand(lateTimeIndex);
earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);

Vergleichen Sie die Worthäufigkeit in Word Cloud

Verwenden Sie die sortierten Daten, um die Wortwolken zu generieren. Mit der Funktion subplot können Sie sie nebeneinander vergleichen.

subplot(1,2,1);
earlyWordCloud = wordcloud(earlyColors,'Color','blue')
title('Early Morning CheerLights');

subplot(1,2,2);
lateWordCloud = wordcloud(lateColors,'color','green')
title('Late Night CheerLights');
earlyWordCloud = 

  WordCloudChart with properties:

           WordData: [1×11 string]
           SizeData: [67 60 58 58 49 46 42 40 40 22 10]
    MaxDisplayWords: 100

  Use GET to show all properties


lateWordCloud = 

  WordCloudChart with properties:

           WordData: ["cyan"    "magenta"    "red"    "white"]
           SizeData: [1 1 1 1]
    MaxDisplayWords: 100

  Use GET to show all properties

Die Verteilung der an CheerLights gesendeten Farben scheint nur geringfügig von der Tageszeit der Veröffentlichung abzuhängen. Manche Farben sind nur am Nachmittag kräftig, andere bleiben den ganzen Tag über konstant kräftig.

Siehe auch

(Text Analytics Toolbox) | (Text Analytics Toolbox)

Externe Websites