Main Content

lettersPattern

匹配字母字符

自 R2020b 起

说明

pat = lettersPattern 创建一个模式,该模式匹配由一个或多个字母组成的文本。lettersPattern 接受由 Unicode 标准定义的字母字符。

示例

pat = lettersPattern(N) 精确匹配由 N 个字母组成的文本。

示例

pat = lettersPattern(minCharacters,maxCharacters) 匹配由大于或等于 minCharacters 个且小于或等于 maxCharacters 个字母组成的文本。infmaxLetter 的有效值。lettersPattern贪婪模式,匹配的字母数量尽可能接近 maxCharacters 个。

示例

示例

全部折叠

使用 lettersPattern 从包含字母、数字、空白和标点符号的字符串中提取单词。

创建字符串 txt 变量。使用 lettersPatternpat 创建为匹配字母的 pattern 对象。从 txt 中提取该模式。

txt = "The 2 parties agreed. The meeting would occur at 1 PM.";
pat = lettersPattern;
words = extract(txt,pat)
words = 9x1 string
    "The"
    "parties"
    "agreed"
    "The"
    "meeting"
    "would"
    "occur"
    "at"
    "PM"

使用 lettersPattern 对一行文本中出现的单个字母进行计数。

创建字符串 txt 变量。使用 lettersPatternpat 创建为与单个字母匹配的 pattern 对象。提取该模式。显示每个字母出现次数的直方图。

txt = "What are the letters in this sentence?";
pat = lettersPattern(1);
letters = extract(txt,pat);
letters = categorical(letters);
histogram(letters)

Figure contains an axes object. The axes object contains an object of type categoricalhistogram.

使用 lettersPattern 排除超过五个字母的单词。

使用 lettersPatternpat 创建为 pattern,该模式匹配包含五个或更多字母的组。提取该模式。

txt = "Some of these words are longer than others.";
pat = lettersPattern(5,inf);
extract(txt,pat)
ans = 4x1 string
    "these"
    "words"
    "longer"
    "others"

输入参数

全部折叠

要匹配的字符数,指定为非负整数标量。

数据类型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

要匹配的最小字符数,指定为非负整数标量。

数据类型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

要匹配的最大字符数,指定为非负整数标量。

数据类型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

输出参量

全部折叠

模式表达式,以 pattern 对象形式返回。

扩展功能

基于线程的环境
使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

版本历史记录

在 R2020b 中推出