Text Analytics Toolbox の分かち書きで、カスタム辞書を追加できますか?

1 次查看(过去 30 天)
Text Analytics Toolbox では、日本語の辞書として MeCab を使用しているようですが、既存の辞書にカスタム辞書を追加させる方法を教えてください。
例えば、現代文ではなく、古文の解析を行うための辞書や医療系用語の辞書を追加したいです。
 

采纳的回答

MathWorks Support Team
编辑:MathWorks Support Team 2023-4-13
カスタム辞書を追加させたい場合、mecabOptions 関数を使用することが可能です。
・mecabOptions
以下は、中古和文Unidic を用いた例です。辞書の保存先を、"C:\temp\dict\UniDic-wabun_1603" としています。
str = "いづれの御時にか、女御、更衣あまたさぶらひたまひけるなかに、いとやむごとなき際にはあらぬが、すぐれて時めきたまふありけり。"
options = mecabOptions('Model','C:\temp\dict\UniDic-wabun_1603'); % カスタム辞書のフォルダ指定
documents = tokenizedDocument(str,'TokenizeMethod',options)
tkns = tokenDetails(documents)

更多回答(0 个)

类别

Help CenterFile Exchange 中查找有关 Convert Image Type 的更多信息

产品


版本

R2020a

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!