Text Analytics Toolbox

 

Text Analytics Toolbox

分析文本数据并建模

MATLAB 代码,用于将 Microsoft Word 文档中的文本数据提取到数据存储中。

导入和可视化文本

将文本数据从 PDF、HTML 和 Microsoft® Word 格式的单个文件或大量文件导入 MATLAB。使用文字云和文本散点图直观地探索文本数据集。

截图:“预处理文本数据”实时编辑器任务,结果显示为文字云。

清洗和预处理文本

应用高级过滤功能来删除多余内容,如 URL、HTML 标记和标点符号。更正拼写,过滤停用词,并将单词规范化为词根形式。

用于创建散点图的 MATLAB 代码以及其生成的词嵌入 t-SNE 图。

将文本转换为结构化格式

使用分词算法提取语言特征,计算词频统计量以以数值样式表示文本数据,并训练词嵌入模型,例如 word2vec 和 skip-gram。

使用 FinBERT 变换器模型对文本数据执行迁移学习以识别积极和消极态度的工作流。

将人工智能应用于文本分析

对文本数据进行机器学习或深度学习模型(如 LSA、LDA 和 LSTM)拟合。使用变换器模型(如 BERT、FinBERT 和 GPT-2)执行文本数据的迁移学习。

大型语言模型

将 MATLAB 连接到 OpenAI™ Chat Completions API。在 MATLAB 环境中利用 GPT 模型的自然语言处理能力来处理文本提要和聊天等任务。

示意图:清洗文本数据以用于自然语言处理。左边:原始数据的文字云。右边:清洗后的数据的文字云。

面向工程师的文本分析

根据传感器和文本日志数据制定预测性维护调度。自动执行需求形式化和合规性检查。

使用文本分析将多篇文档的摘要合并为一篇文档。

文档分析

使用主题建模分析文本,以发现并可视化背后的模式、趋势和复杂关系。生成文档摘要,提取关键字,并计算文档的重要性和相似性。

积极词语文字云和消极词语文字云。

情绪分析

识别文本数据代表的态度和观点,将各个表述归类为正面、中立或负面。构建模型用于实时预测情绪。

基于《傲慢与偏见》的生成文本的文字云。

文本生成和分类

使用深度学习基于观测到的文本生成新文本,并使用可以识别类别的词嵌入对文本描述进行分类。

获取免费试用版

30 天探索触手可及。


准备购买?

获取报价并了解相关产品。

您是学生吗?

您的学校可能已拥有 Campus-Wide License 并允许您直接使用 MATLAB、Simulink 和其他附加产品。