Text Analytics Toolbox の分かち書きで、カスタム辞書を追加できますか?

Text Analytics Toolbox では、日本語の辞書として MeCab を使用しているようですが、既存の辞書にカスタム辞書を追加させる方法を教えてください。
例えば、現代文ではなく、古文の解析を行うための辞書や医療系用語の辞書を追加したいです。
 

 Akzeptierte Antwort

MathWorks Support Team
MathWorks Support Team am 13 Apr. 2023
Bearbeitet: MathWorks Support Team am 13 Apr. 2023

0 Stimmen

カスタム辞書を追加させたい場合、mecabOptions 関数を使用することが可能です。
・mecabOptions
以下は、中古和文Unidic を用いた例です。辞書の保存先を、"C:\temp\dict\UniDic-wabun_1603" としています。
str = "いづれの御時にか、女御、更衣あまたさぶらひたまひけるなかに、いとやむごとなき際にはあらぬが、すぐれて時めきたまふありけり。"
options = mecabOptions('Model','C:\temp\dict\UniDic-wabun_1603'); % カスタム辞書のフォルダ指定
documents = tokenizedDocument(str,'TokenizeMethod',options)
tkns = tokenDetails(documents)

Weitere Antworten (0)

Kategorien

Produkte

Version

R2020a

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!