Text Analytics Toolbox

 

Text Analytics Toolbox

分析文本数据并建模

导入和可视化文本

将文本数据从 PDF、HTML 和 Microsoft® Word 格式的单个文件或大量文件导入 MATLAB。使用文字云和文本散点图直观地探索文本数据集。

清洗和预处理文本

应用高级过滤功能来删除多余内容,如 URL、HTML 标记和标点符号。更正拼写,过滤停用词,并将单词规范化为词根形式。

将文本转换为结构化格式

使用分词算法提取语言特征,计算词频统计量以以数值样式表示文本数据,并训练词嵌入模型,例如 word2vec 和 skip-gram。

将人工智能应用于文本分析

对文本数据进行机器学习或深度学习模型(如 LSA、LDA 和 LSTM)拟合。使用变换器模型(如 BERT、FinBERT 和 GPT-2)执行文本数据的迁移学习。

大型语言模型

将 MATLAB 连接到 OpenAI™ Chat Completions API。在 MATLAB 环境中利用 GPT 模型的自然语言处理能力来处理文本提要和聊天等任务。

面向工程师的文本分析

根据传感器和文本日志数据制定预测性维护调度。自动执行需求形式化和合规性检查。

文档分析

使用主题建模分析文本,以发现并可视化背后的模式、趋势和复杂关系。生成文档摘要,提取关键字,并计算文档的重要性和相似性。

情绪分析

识别文本数据代表的态度和观点,将各个表述归类为正面、中立或负面。构建模型用于实时预测情绪。

文本生成和分类

使用深度学习基于观测到的文本生成新文本,并使用可以识别类别的词嵌入对文本描述进行分类。

获取免费试用版

30 天探索触手可及。


准备购买?

获取报价并了解相关产品。

您是学生吗?

您的学校可能已拥有 Campus-Wide License 并允许您直接使用 MATLAB、Simulink 和其他附加产品。