Visualisieren Sie die Worthäufigkeit in einer Wortwolke
Dieses Beispiel zeigt, wie die Verteilung von Text mithilfe der Text Analytics Toolbox™ in einer Wortwolke visualisiert wird. Verwenden Sie ThingSpeak™ , um den Text zu sortieren und zu sehen, welche Parameter die Verteilung oder Stimmung beeinflussen.
CheerLights ermöglicht es Menschen auf der ganzen Welt, sich mit einer von Twitter festgelegten Farbe zu synchronisieren. ThingSpeak Channel 1417 speichert den Verlauf der CheerLights-Farben. Lesen Sie Wörter aus dem ThingSpeak Kanal und vergleichen Sie die Verteilung für frühe und späte Zeitstempel.
Lesen Sie Textdaten und berechnen Sie die Worthäufigkeit
Lesen Sie die letzten 500 Datenpunkte aus dem CheerLights ThingSpeak Kanal. Ermitteln Sie die Häufigkeit von Wörtern in jedem Dokument einer Sammlung mithilfe der Funktion bagofwords
in der Text Analytics Toolbox.
colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]); bagOfWords(colorData.LastCheerLightsCommand')
ans = bagOfWords with properties: Counts: [61 68 40 59 23 42 52 59 40 46 10] Vocabulary: [1×11 string] NumWords: 11 NumDocuments: 1
Ergebnisse nach Zeit sortieren
Suchen Sie den Index jedes Datenpunkts mit einem Zeitstempel vor der Mittagszeit und suchen Sie dann alle Indizes für Datenpunkte nach der Mittagszeit. Verwenden Sie die Indizes, um für jeden Fall ein Array aller Wörter zu erstellen.
lateTimeIndex = (hour(colorData.Timestamps) > 12); earlyTimeIndex = (hour(colorData.Timestamps) < 12); lateColors = colorData.LastCheerLightsCommand(lateTimeIndex); earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);
Vergleichen Sie die Worthäufigkeit in Word Cloud
Verwenden Sie die sortierten Daten, um die Wortwolken zu generieren. Mit der Funktion subplot
können Sie sie nebeneinander vergleichen.
subplot(1,2,1); earlyWordCloud = wordcloud(earlyColors,'Color','blue') title('Early Morning CheerLights'); subplot(1,2,2); lateWordCloud = wordcloud(lateColors,'color','green') title('Late Night CheerLights');
earlyWordCloud = WordCloudChart with properties: WordData: [1×11 string] SizeData: [67 60 58 58 49 46 42 40 40 22 10] MaxDisplayWords: 100 Use GET to show all properties lateWordCloud = WordCloudChart with properties: WordData: ["cyan" "magenta" "red" "white"] SizeData: [1 1 1 1] MaxDisplayWords: 100 Use GET to show all properties
Die Verteilung der an CheerLights gesendeten Farben scheint nur geringfügig von der Tageszeit der Veröffentlichung abzuhängen. Manche Farben sind nur am Nachmittag kräftig, andere bleiben den ganzen Tag über konstant kräftig.
Siehe auch
Get Started with Text Analytics Toolbox (Text Analytics Toolbox) | wordcloud
(Text Analytics Toolbox)