lettersPattern

匹配字母字符

全页折叠

语法

pat = lettersPattern

pat = lettersPattern(N)

pat = lettersPattern(minCharacters,maxCharacters)

说明

pat = lettersPattern 创建一个模式，该模式匹配由一个或多个字母组成的文本。lettersPattern 接受由 Unicode 标准定义的字母字符。

示例

pat = lettersPattern(N) 精确匹配由 N 个字母组成的文本。

示例

pat = lettersPattern(minCharacters,maxCharacters) 匹配由大于或等于 minCharacters 个且小于或等于 maxCharacters 个字母组成的文本。inf 是 maxLetter 的有效值。lettersPattern 是贪婪模式，匹配的字母数量尽可能接近 maxCharacters 个。

示例

全部折叠

从文本中提取单词

打开实时脚本

使用 lettersPattern 从包含字母、数字、空白和标点符号的字符串中提取单词。

创建字符串 txt 变量。使用 lettersPattern 将 pat 创建为匹配字母的 pattern 对象。从 txt 中提取该模式。

txt = "The 2 parties agreed. The meeting would occur at 1 PM.";
pat = lettersPattern;
words = extract(txt,pat)

words = 9×1 string
    "The"
    "parties"
    "agreed"
    "The"
    "meeting"
    "would"
    "occur"
    "at"
    "PM"

对文本中的字母进行计数

打开实时脚本

使用 lettersPattern 对一行文本中出现的单个字母进行计数。

创建字符串 txt 变量。使用 lettersPattern 将 pat 创建为与单个字母匹配的 pattern 对象。提取该模式。显示每个字母出现次数的直方图。

txt = "What are the letters in this sentence?";
pat = lettersPattern(1);
letters = extract(txt,pat);
letters = categorical(letters);
histogram(letters)

Figure contains an axes object. The axes object contains an object of type categoricalhistogram.

基于长度匹配单词

打开实时脚本

使用 lettersPattern 排除超过五个字母的单词。

使用 lettersPattern 将 pat 创建为 pattern，该模式匹配包含五个或更多字母的组。提取该模式。

txt = "Some of these words are longer than others.";
pat = lettersPattern(5,inf);
extract(txt,pat)

ans = 4×1 string
    "these"
    "words"
    "longer"
    "others"

输入参数

全部折叠

`N` — 要匹配的精确字符数
非负整数标量

要匹配的字符数，指定为非负整数标量。

`minCharacters` — 要匹配的最小字符数。
非负整数标量

要匹配的最小字符数，指定为非负整数标量。

`maxCharacters` — 要匹配的最大字符数
非负整数标量

要匹配的最大字符数，指定为非负整数标量。

输出参量

全部折叠

`pat` — 模式表达式
模式对象

模式表达式，以 pattern 对象形式返回。

扩展功能

全部展开

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

版本历史记录

在 R2020b 中推出

另请参阅

lettersPattern

语法

说明

示例

从文本中提取单词

对文本中的字母进行计数

基于长度匹配单词

输入参数

N — 要匹配的精确字符数 非负整数标量

minCharacters — 要匹配的最小字符数。 非负整数标量

maxCharacters — 要匹配的最大字符数 非负整数标量

输出参量

pat — 模式表达式 模式对象

扩展功能

基于线程的环境 使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

版本历史记录

另请参阅

主题

`N` — 要匹配的精确字符数
非负整数标量

`minCharacters` — 要匹配的最小字符数。
非负整数标量

`maxCharacters` — 要匹配的最大字符数
非负整数标量

`pat` — 模式表达式
模式对象

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。