「テキストデータ解析のワークフローとその応用例」のビデオでは,テキスト解析の二つの例を紹介しています.
1. 車の故障原因の抽出 (1_VehicleRepairAnalysis)
対象データ: 英語テキスト
車の修理ログからメンテナンスを実施した理由を分析するために,テキストデータの数値化や不要な文字を取り除く前処理を行い,潜在的ディリクレ配分法 (Latent Dirichlet Allocation; LDA) を使用して修理ログのトピックモデリングを行う例です.
vehicleRepairAnalysis_jp.mlx がメインファイルです.
2. 観光地の類似度判定 (2_SightSimilarity)
対象データ: 日本語テキスト
観光地の説明文書から,それぞれの観光地の類似度を計算し,潜在意味解析 (Latent Semantic Analysis; LSA) を使用してある観光地に類似した観光地を見つけ出したり,単語の分散表現 (word2vec) を使用して特定の状況に関連する単語を発見する例です.
sight_analysis_live.mlx がメインファイルです.
MeCab の設定については,ref フォルダにあります mecab_x64_build_procedure_for_MATLAB.pdf に従ってください.
引用格式
mizuki (2024). テキストデータ解析のワークフローとその応用例 (Text Analytics Workflow and Applications) (https://www.mathworks.com/matlabcentral/fileexchange/66559-text-analytics-workflow-and-applications), MATLAB Central File Exchange. 检索时间: .
MATLAB 版本兼容性
平台兼容性
Windows macOS Linux类别
- MATLAB > Mathematics > Linear Algebra >
标签
致谢
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!TextAnalytics_FEX/1_VehicleRepairAnalysis/
TextAnalytics_FEX/2_SightSimilarity/
TextAnalytics_FEX/1_VehicleRepairAnalysis/
TextAnalytics_FEX/1_VehicleRepairAnalysis/ref/
TextAnalytics_FEX/2_SightSimilarity/
版本 | 已发布 | 发行说明 | |
---|---|---|---|
1.0.0.0 | Added copywrite |