regexpi

匹配正则表达式（不区分大小写）

全页折叠

语法

startIndex = regexpi(str,expression)

[startIndex,endIndex] = regexpi(str,expression)

out = regexpi(str,expression,outkey)

[out1,...,outN] = regexpi(str,expression,outkey1,...,outkeyN)

___ = regexpi(___,option1,...,optionM)

___ = regexpi(___,'forceCellOutput')

说明

startIndex = regexpi(str,expression) 返回 str 的每个子字符串（与该正则表达式指定的字符模式匹配）的起始索引，而不考虑字母大小写。如果没有匹配项，则 startIndex 为空数组。

示例

[startIndex,endIndex] = regexpi(str,expression) 返回所有匹配项的开始和结束索引。

out = regexpi(str,expression,outkey) 返回 outkey 指定的输出。例如，如果 outkey 为 'match'，则 regexpi 返回与该表达式匹配的子字符串而非其开始索引。

[out1,...,outN] = regexpi(str,expression,outkey1,...,outkeyN) 按指定的顺序返回多个输出关键字指定的输出。例如，如果您指定 'match'、'tokens'，则 regexpi 返回与整个表达式匹配的子字符串以及与部分表达式匹配的词元。

___ = regexpi(___,option1,...,optionM) 使用指定的选项标志修改搜索。例如，指定 'matchcase' 以执行区分大小写的匹配。您可以包括任何输入并请求之前语法中的任何输出。

示例

___ = regexpi(___,'forceCellOutput') 以标量元胞的形式返回每个输出参量。元胞包含被描述为上述语法输出的数值数组或子字符串。您可以包括任何输入并请求之前语法中的任何输出。

示例

全部折叠

模式匹配

打开实时脚本

查找以 c 开头并以 t 结尾且其中包含一个或多个元音的单词。

str = 'bat cat can car COAT court cut ct CAT-scan';
expression = 'c[aeiou]+t';
startIndex = regexpi(str,expression)

startIndex = 1×4

     5    17    28    35

startIndex 中的值指示与正则表达式匹配的每个单词的第一个字符的索引。

正则表达式 'c[aeiou]+t' 指定以下模式：

c 必须为第一个字符。
c 必须后跟方括号内的一个字符 [aeiou]。
括起的模式必须出现一次或多次，如 + 运算符所指示。
t 必须为最后一个字符，括起的模式和 t 之间没有任何字符。

区分大小写的匹配

打开实时脚本

在整个或部分表达式中匹配字母大小写。

默认情况下，regexpi 执行不区分大小写的匹配。

str = 'A character vector with UPPERCASE and lowercase text.';
expression = '\w*case';
matchStr = regexpi(str,expression,'match')

matchStr = 1×2 cell
    {'UPPERCASE'}    {'lowercase'}

使用与 regexpi 具有相同语法的 regexp 函数执行区分大小写的匹配。

matchWithRegexp = regexp(str,expression,'match')

matchWithRegexp = 1×1 cell array
    {'lowercase'}

使用 'ignorecase' 选项可对 regexp 禁用区分大小写的匹配。

matchWithIgnorecase = regexp(str,expression,'match','ignorecase')

matchWithIgnorecase = 1×2 cell
    {'UPPERCASE'}    {'lowercase'}

对于多个表达式，使用 (?i) 和 (?-i) 搜索标志对选定表达式启用和禁用不区分大小写的匹配。

expression = {'(?-i)\w*case';...
              '(?i)\w*case'};
matchStr = regexp(str,expression,'match');
celldisp(matchStr)

 
matchStr{1}{1} =
 
lowercase
 
 
matchStr{2}{1} =
 
UPPERCASE
 
 
matchStr{2}{2} =
 
lowercase

输入参数

全部折叠

`str` — 输入文本
字符向量 | 字符向量元胞数组 | 字符串数组

输入文本，指定为字符向量、字符向量元胞数组或字符串数组。元胞数组中的每个字符向量或字符串数组中的每个字符串可以为任意长度并包含任意字符。

如果 str 和 expression 均为字符串数组或元胞数组，则它们的维度必须相同。

数据类型: string | char | cell

`expression` — 正则表达式
字符向量 | 字符向量元胞数组 | 字符串数组

正则表达式，指定为字符向量、字符向量元胞数组或字符串数组。每个表达式可包含字符、元字符、运算符、词元和用于指定在 str 中匹配的模式的标志。

下表描述了正则表达式的各元素。

元字符

元字符表示字母、字母范围、数字和空格字符。使用它们来构造广义的字符模式。

元字符	描述	示例
`.`	任何单个字符，包括空白	`'..ain'` 与以 `'ain'` 结尾的五个连续字符序列匹配。
`[c₁c₂c₃]`	包含在方括号中的任意字符。下列字符将按字面意义进行处理：`$ \| . * + ?` 和 `-`（不用于指示范围时）。	`'[rp.]ain'` 与 `'rain'`、`'pain'` 或 `'.ain'` 匹配。
`[^c₁c₂c₃]`	未包含在方括号中的任意字符。下列字符将按字面意义进行处理：`$ \| . * + ?` 和 `-`（不用于指示范围时）。	`'[^rp]ain'` 与以 `'ain'` 结尾的所有由四个字母组成的序列（`'rain'`、`'pain'` 和 `'ain'` 除外）匹配。例如，它与 `'gain'`、`'lain'` 或 `'vain'` 匹配。
`[c`₁`-c`₂`]`	`c`₁ 到 `c`₂ 范围中的任意字符	`'[A-G]'` 与 `A` 到 `G` 范围中的单个字符匹配。
`\w`	任意字母、数字或下划线字符。对于英语字符集，`\w` 等同于 `[a-zA-Z_0-9]`	`'\w*'` 识别由字母、数字或下划线字符组成的词。
`\W`	字母、数字或下划线之外的任意字符。对于英语字符集，`\W` 等同于 `[^a-zA-Z_0-9]`	`'\W*'` 标识不是由任意字母、数字或下划线字符组合而成的词。
`\s`	任意空白字符；等同于 `[ \f\n\r\t\v]`	`'\w*n\s'` 与以字母 `n` 结尾且后跟空白字符的单词匹配。
`\S`	任意非空白字符；等同于 `[^ \f\n\r\t\v]`	`'\d\S'` 与数字（后跟任意非空白字符）匹配。
`\d`	任意数字；等同于 `[0-9]`	`'\d*'` 与任意数量的连续数字匹配。
`\D`	任意非数字字符；等同于 `[^0-9]`	`'\w*\D\>'` 与不以数字结尾的单词匹配。
`\oN` 或 `\o{N}`	八进制值 `N` 的字符	`'\o{40}'` 与八进制 `40` 定义的空格字符匹配。
`\xN` 或 `\x{N}`	十六进制值 `N` 的字符	`'\x2C'` 与十六进制 `2C` 定义的逗号字符匹配。

字符表示

运算符	描述
`\a`	警报（蜂鸣）
`\b`	退格符
`\f`	换页符
`\n`	换行符
`\r`	回车符
`\t`	水平制表符
`\v`	垂直制表符
`\char`	正则表达式中您要从字面上匹配（例如，使用 `\\` 匹配单个反斜杠）的具有特殊含义的任意字符。

限定符

限定符指定某个模式必须出现在匹配文本中的次数。

限定符	表达式出现的次数	示例
`expr*`	0 次或连续多次。	`'\w*'` 与任意长度的单词匹配。
`expr?`	0 次或 1 次。	`'\w*(\.m)?'` 与单词或以扩展名 `.m` 结尾（此条件为可选条件）的单词匹配。
`expr+`	1 次或连续多次。	`'<img src="\w+\.gif">'` 与 `<img>` HTML 标记匹配（当文件名包含一个或多个字符时）。
`expr{m,n}`	至少 `m` 次，但不超过连续 `n` 次。 `{0,1}` 等效于 `?`。	`'\S{4,8}'` 与四到八个非空白字符匹配。
`expr{m,}`	至少连续 `m` 次。 `{0,}` 和 `{1,}` 分别等效于 `*` 和 `+`。	`'<a href="\w{1,}\.html">'` 与 `<a>` HTML 标记匹配（当文件名包含一个或多个字符时）。
`expr{n}`	恰好连续 `n` 次。等效于 `{n,n}`。	`'\d{4}'` 与四个连续数字匹配。

限定符可以以三种模式显示，如下表所述。q 表示上表中的任意限定符。

模式	描述	示例
`expr`q	积极表达式：与尽可能多的字符匹配。	给定文本 `'<tr><td><p>text</p></td>'`，表达式 `'</?t.*>'` 与介于 `<tr` 和 `/td>` 之间的所有字符匹配： `'<tr><td><p>text</p></td>'`
`expr`q`?`	消极表达式：与所需的尽可能少的字符匹配。	给定文本 `'<tr><td><p>text</p></td>'`，表达式 `'</?t.*?>'` 在第一次出现右尖括号 (`>`) 时结束每个匹配项： `'<tr>' '<td>' '</td>'`
`expr`q+	主动表达式：最大程度地匹配，但不重新扫描文本的任何部分。	给定文本 `'<tr><td><p>text</p></td>'`，表达式 `'</?t.+>'` 不返回任何匹配项，这是因为右尖括号是使用 `.` 捕获的且不进行重新扫描。

模式

描述

示例

exprq

积极表达式：与尽可能多的字符匹配。

给定文本 '<tr><td>text</td>'，表达式 '</?t.*>' 与介于 <tr 和 /td> 之间的所有字符匹配：

'<tr><td><p>text</p></td>'

exprq?

消极表达式：与所需的尽可能少的字符匹配。

给定文本 '<tr><td>text</td>'，表达式 '</?t.*?>' 在第一次出现右尖括号 (>) 时结束每个匹配项：

'<tr>'   '<td>'   '</td>'

exprq+

主动表达式：最大程度地匹配，但不重新扫描文本的任何部分。

给定文本 '<tr><td>text</td>'，表达式 '</?t.*+>' 不返回任何匹配项，这是因为右尖括号是使用 .* 捕获的且不进行重新扫描。

分组运算符

分组运算符允许您捕获词元，将一个运算符应用于多个元素或在特定组中禁止追溯。

分组运算符	描述	示例
`(expr)`	将表达式元素分组并捕获词元。	`'Joh?n\s(\w*)'` 捕获一个词元，该词元包含名字为 `John` 或 `Jon` 的任何人的姓氏。
`(?:expr)`	分组但不捕获词元。	`'(?:[aeiou][^aeiou]){2}'` 与两个连续的元音后跟非元音（例如 `'anon'`）的模式匹配。不进行分组时，`'[aeiou][^aeiou]{2}'` 与元音后跟两个非元音匹配。
`(?>expr)`	以原子方式分组。不在组中追溯以完成匹配，并且不捕获词元。	`'A(?>.)Z'` 与 `'AtoZ'` 不匹配，但 `'A(?:.)Z'` 与其匹配。使用原子组时，`Z` 将使用 `.*` 进行捕获并且不进行重新扫描。
`(expr1\|expr2)`	匹配表达式 `expr1` 或表达式 `expr2`。如果存在与 `expr1` 匹配的项，则将忽略 `expr2`。您可以在左括号后包括 `?:` 或 `?>` 以禁用词元或以原子方式分组。	`'(let\|tel)\w+'` 匹配包含 `let` 或 `tel` 但不以它们结尾的单词。

定位点

表达式中的定位点与文本或单词的开头或结尾匹配。

定位点	与以下项匹配	示例
`^expr`	输入文本的开头。	`'^M\w*'` 与以 `M` 作为文本开头的单词匹配。
`expr$`	输入文本的结尾。	`'\w*m$'` 与以 `m` 作为文本结尾的单词匹配。
`\<expr`	单词开头。	`'\<n\w*'` 与以 `n` 开头的任何单词匹配。
`expr\>`	单词结尾。	`'\w*e\>'` 与以 `e` 结尾的任何单词匹配。

环顾断言

环顾断言查找紧邻预期匹配项前后但并非该匹配项一部分的模式。

指针停留在当前位置，并且将放弃或不捕获对应于 test 表达式的字符。因此，前向断言可匹配重叠字符组。

环顾断言	描述	示例
`expr(?=test)`	向前查找与 `test` 匹配的字符。	`'\w*(?=ing)'` 匹配后跟 `ing` 的词汇，例如输入文本 `'Flying, not falling.'` 中的 `'Fly'` 和 `'fall'`。
`expr(?!test)`	向前查找与 `test` 不匹配的字符。	`'i(?!ng)'` 匹配字母 `i` 的不后跟 `ng` 的实例。
`(?<=test)expr`	向后查找与 `test` 匹配的字符。	`'(?<=re)\w*'` 匹配紧跟 `'re'` 的词汇，例如输入文本 `'renew, reuse, recycle'` 中的 `'new'`、`'use'` 和 `'cycle'`
`(?<!test)expr`	向后查找与 `test` 不匹配的字符。	`'(?<!\d)(\d)(?!\d)'` 与一位数字匹配（不紧随其他数字前后的数字）。

如果您在表达式之前指定前向断言，则运算等同于逻辑 AND。

运算	描述	示例
`(?=test)expr`	同时与 `test` 和 `expr` 匹配。	`'(?=[a-z])[^aeiou]'` 与辅音匹配。
`(?!test)expr`	匹配 `expr`，但不匹配 `test`。	`'(?![aeiou])[a-z]'` 与辅音匹配。

逻辑和条件运算符

逻辑和条件运算符允许您测试给定条件的状态，然后使用结果确定哪个模式（如果有）与下一条件匹配。这些运算符支持逻辑 OR、if 或 if/else 条件。

条件可以是词元、环顾运算符或 (?@cmd) 形式的动态表达式。动态表达式必须返回逻辑值或数值。

条件运算符	描述	示例
`expr1\|expr2`	匹配表达式 `expr1` 或表达式 `expr2`。如果存在与 `expr1` 匹配的项，则将忽略 `expr2`。	`'(let\|tel)\w+'` 匹配以 `let` 或 `tel` 开头的单词。
`(?(cond)expr)`	如果条件 `cond` 为 `true`，则匹配 `expr`。	`'(?(?@ispc)[A-Z]:\\)'` 匹配驱动器名称，例如 `C:\`（在 Windows^® 系统上运行时）。
`(?(cond)expr1\|expr2)`	如果条件 `cond` 为 `true`，则匹配 `expr1`。否则，匹配 `expr2`。	`'Mr(s?)\..?(?(1)her\|his) \w'` 匹配包含 `her` 的文本（当文本以 `Mrs` 开头时），或包含 `his` 的文本（当文本以 `Mr` 开头时）。

条件运算符

描述

示例

expr1|expr2

匹配表达式 expr1 或表达式 expr2。

如果存在与 expr1 匹配的项，则将忽略 expr2。

'(let|tel)\w+' 匹配以 let 或 tel 开头的单词。

(?(cond)expr)

如果条件 cond 为 true，则匹配 expr。

'(?(?@ispc)[A-Z]:\\)' 匹配驱动器名称，例如 C:\（在 Windows^® 系统上运行时）。

(?(cond)expr1|expr2)

如果条件 cond 为 true，则匹配 expr1。否则，匹配 expr2。

'Mr(s?)\..*?(?(1)her|his) \w*' 匹配包含 her 的文本（当文本以 Mrs 开头时），或包含 his 的文本（当文本以 Mr 开头时）。

词元运算符

词元是您通过将正则表达式的部分括在括号中而定义的匹配文本的部分。您可以按词元在文本中的顺序引用该词元（顺序词元），或将名称分配给词元以便于代码维护和使输出更易于阅读。

顺序词元运算符	描述	示例
`(expr)`	在词元中捕获与括起来的表达式匹配的字符。	`'Joh?n\s(\w*)'` 捕获一个词元，该词元包含名字为 `John` 或 `Jon` 的任何人的姓氏。
`\N`	匹配第 `N` 个词元。	`'<(\w+).>.</\1>'` 从文本 `'<title>Some text</title>'` 捕获 HTML 标记的词元，例如 `'title'`。
`(?(N)expr1\|expr2)`	如果找到第 `N` 个词元，则匹配 `expr1`。否则，匹配 `expr2`。	`'Mr(s?)\..?(?(1)her\|his) \w'` 匹配包含 `her` 的文本（当文本以 `Mrs` 开头时），或包含 `his` 的文本（当文本以 `Mr` 开头时）。

命名词元运算符	描述	示例
`(?<name>expr)`	在命名词元中捕获与括起来的表达式匹配的字符。	`'(?<month>\d+)-(?<day>\d+)-(?<yr>\d+)'` 在 `mm-dd-yy` 形式的输入日期中创建命名月、日和年词元。
`\k<name>`	匹配 `name` 引用的词元。	`'<(?<tag>\w+).>.</\k<tag>>'` 从文本 `'<title>Some text</title>'` 捕获 HTML 标记的词元，例如 `'title'`。
`(?(name)expr1\|expr2)`	如果找到命名词元，则匹配 `expr1`。否则，匹配 `expr2`。	`'Mr(?<sex>s?)\..?(?(sex)her\|his) \w'` 匹配包含 `her` 的文本（当文本以 `Mrs` 开头时），或包含 `his` 的文本（当文本以 `Mr` 开头时）。

注意

如果表达式具有嵌套括号，则 MATLAB^® 捕获对应于最外层括号的词元。例如，给定搜索模式 '(and(y|rew))'，MATLAB 将为 'andrew' 但不为 'y' 或 'rew' 创建一个词元。

动态正则表达式

动态表达式允许您执行 MATLAB 命令或正则表达式以确定要匹配的文本。

将动态表达式括起来的括号不创建捕获组。

运算符	描述	示例
`(??expr)`	解析 `expr` 并将得到的项包括在匹配表达式中。解析后，`expr` 必须对应于完整的有效正则表达式。使用反斜杠转义字符 (`\`) 的动态表达式需要两个反斜杠：一个用于 `expr` 的初始解析，一个用于完整匹配。	`'^(\d+)((??\\w{$1}))'` 通过读取匹配项开头的数字确定匹配的字符数。动态表达式括在另一组括号中，以便在词元中捕获生成的匹配项。例如，匹配 `'5XXXXX'` 将捕获 `'5'` 和 `'XXXXX'` 的词元。
`(??@cmd)`	执行 `cmd` 表示的 MATLAB 命令，并将该命令返回的输出包括在匹配表达式中。	`'(.{2,}).?(??@fliplr($1))'` 查找长度至少为四个字符的回文，例如 `'abba'`。
`(?@cmd)`	执行 `cmd` 表示的 MATLAB 命令，但放弃该命令返回的任何输出。（对诊断正则表达式有帮助。）	`'\w?(\w)(?@disp($1))\1\w'` 匹配包括双字母（例如 `pp`）的单词并显示中间结果。

运算符

描述

示例

(??expr)

解析 expr 并将得到的项包括在匹配表达式中。

解析后，expr 必须对应于完整的有效正则表达式。使用反斜杠转义字符 (\) 的动态表达式需要两个反斜杠：一个用于 expr 的初始解析，一个用于完整匹配。

'^(\d+)((??\\w{$1}))' 通过读取匹配项开头的数字确定匹配的字符数。动态表达式括在另一组括号中，以便在词元中捕获生成的匹配项。例如，匹配 '5XXXXX' 将捕获 '5' 和 'XXXXX' 的词元。

(??@cmd)

执行 cmd 表示的 MATLAB 命令，并将该命令返回的输出包括在匹配表达式中。

'(.{2,}).?(??@fliplr($1))' 查找长度至少为四个字符的回文，例如 'abba'。

(?@cmd)

执行 cmd 表示的 MATLAB 命令，但放弃该命令返回的任何输出。（对诊断正则表达式有帮助。）

'\w*?(\w)(?@disp($1))\1\w*' 匹配包括双字母（例如 pp）的单词并显示中间结果。

在动态表达式中，使用下列运算符定义替代文本。

替代运算符	描述
`$&` 或 `$0`	当前作为匹配项的输入文本部分
$`	位于当前匹配项之前的输入文本部分
`$'`	紧随当前匹配项的输入文本部分（使用 `$''` 表示 `$'`）
`$N`	第 `N` 个词元
`$<name>`	命名词元
`${cmd}`	在 MATLAB 执行命令 `cmd` 时返回的输出

注释

字符	描述	示例
`(?#comment)`	在正则表达式中插入注释。匹配输入时将忽略注释文本。	`'(?# Initial digit)\<\d\w+'` 包括一个注释，并匹配以一个数字开头的单词。

搜索标志

搜索标志修改匹配表达式的行为。在表达式中使用搜索标志的替代方法是传递 option 输入参量。

标志	描述
`(?-i)`	匹配字母大小写（`regexp` 和 `regexprep` 的默认值）。
`(?i)`	不匹配字母大小写（`regexpi` 的默认值）。
`(?s)`	将模式中的点 (`.`) 与任意字符匹配（默认值）。
`(?-s)`	将模式中的点与并非换行符的任意字符匹配。
`(?-m)`	匹配文本开头和结尾的 `^` 和 `$` 元字符（默认值）。
`(?m)`	匹配行开头和结尾的 `^` 和 `$` 元字符。
`(?-x)`	在匹配时包括空格字符和注释（默认值）。
`(?x)`	在匹配时忽略空格字符和注释。使用 `'\ '` 和 `'\#'` 匹配空白和 `#` 字符。

该标志修改的表达式可显示在括号后，例如

(?i)\w*

或显示在括号内并使用冒号 (:) 与该标志分隔开，例如

(?i:\w*)

后面的语法允许您更改较大表达式的一部分的行为。

数据类型: char | cell | string

`outkey` — 指示要返回的输出的关键字
`'start'` (默认) | `'end'` | `'tokenExtents'` | `'match'` | `'tokens'` | `'names'` | `'split'`

指示要返回的输出的关键字，指定为下列字符向量之一。

输出关键字	返回
`'start'`（默认值）	所有匹配项的开始索引，`startIndex`
`'end'`	所有匹配项的结束索引，`endIndex`
`'tokenExtents'`	所有词元的开始和结束索引
`'match'`	与 `expression` 中的模式匹配的每个子字符串的文本
`'tokens'`	`str` 中每个捕获的词元的文本
`'names'`	每个命名词元的名称和文本
`'split'`	`str` 的非匹配子字符串的文本

数据类型: char | string

`option` — 搜索选项
`'once'` | `'warnings'` | `'matchcase'` | `'emptymatch'` | `'dotexceptnewline'` | `'lineanchors'` | ...

搜索选项，指定为字符向量。选项成对出现：一个选项对应于默认行为，另一个选项允许您覆盖默认值。仅指定一对中的一个选项。选项可以按任意顺序显示。

默认值	覆盖	描述
`'all'`	`'once'`	尽可能多次地匹配表达式（默认值），或仅匹配一次。
`'nowarnings'`	`'warnings'`	取消警告（默认值），或显示警告。
`'ignorecase'`	`'matchcase'`	忽略字母大小写（默认值），或匹配大小写。
`'noemptymatch'`	`'emptymatch'`	忽略零长度匹配项（默认值），或包括这些匹配项。
`'dotall'`	`'dotexceptnewline'`	将点与任意字符匹配（默认值），或与除换行符 (`\n`) 之外的所有字符匹配。
`'stringanchors'`	`'lineanchors'`	将 `^` 和 `$` 元字符应用于字符向量的开头和结尾（默认值），或应用于行开头和结尾。换行符 (`\n`) 指定行的结尾。行的开头指定为第一个字符，或紧跟在换行符后面的任何字符。
`'literalspacing'`	`'freespacing'`	在匹配时包括空格字符和注释（默认值），或忽略它们。借助 `freespacing`，使用 `'\ '` 和 `'\#'` 匹配空白和 `#` 字符。

数据类型: char

输出参量

全部折叠

`startIndex` — 每个匹配项的开始索引
行向量 | 行向量元胞数组

每个匹配项的开始索引，以行向量或元胞数组的形式返回，如下所示：

如果 str 和 expression 均为字符向量或字符串标量，则输出为行向量（或者，如果没有任何匹配项，则为空数组）。
如果 str 或 expression 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是行向量元胞数组。输出元胞数组与输入数组具有相同的维度。
如果 str 和 expression 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。

`endIndex` — 每个匹配项的结束索引
行向量 | 行向量元胞数组

每个匹配项的结束索引，以行向量或元胞数组的形式返回，如下所示：

如果 str 和 expression 均为字符向量或字符串标量，则输出为行向量（或者，如果没有任何匹配项，则为空数组）。
如果 str 或 expression 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是行向量元胞数组。输出元胞数组与输入数组具有相同的维度。
如果 str 和 expression 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。

`out` — 有关匹配项的信息
数值数组 | 元胞数组 | 字符串数组 | 结构体数组

有关匹配项的信息，以数值、元胞、字符串或结构体数组的形式返回。输出中的信息取决于您为 outkey 指定的值，如下所示。

输出关键字	输出描述	输出类型和维度
`'start'`	匹配项的开始索引	对于 `'start'` 和 `'end'`：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出为行向量（或者，如果没有任何匹配项，则为空数组）。如果 `str` 或 `expression` 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是行向量元胞数组。输出元胞数组与输入数组具有相同的维度。如果 `str` 和 `expression` 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。
`'end'`	匹配项的结束索引
`'tokenExtents'`	所有词元的开始和结束索引	默认情况下，当返回所有匹配项时：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出是一个 1×`n` 元胞数组，其中 `n` 是匹配项数。每个元胞包含一个 `m`×2 数值索引数组，其中 `m` 是匹配项中的词元数。如果 `str` 或 `expression` 是字符向量元胞数组或字符串数组，则输出是一个与输入数组具有相同维度的元胞数组。每个元胞包含一个 1×`n` 元胞数组，其中每个内部元胞包含一个 `m`×2 数值数组。如果 `str` 和 `expression` 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。当指定 `'once'` 选项仅返回一个匹配项时，输出为一个 `m`×2 数值数组或一个与 `str` 和/或 `expression` 具有相同维度的元胞数组。如果在特定索引 `N` 处需要词元，但未找到，则 MATLAB 返回该词元的范围 `[N,N-1]`。
`'match'`	与 `expression` 中的模式匹配的每个子字符串的文本	默认情况下，当返回所有匹配项时：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出是一个 1×`n` 数组，其中 `n` 是匹配项数。如果 `str` 为字符向量，则输出为字符向量元胞数组。如果 `str` 为字符串标量，则输出为字符串数组。如果 `str` 或 `expression` 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是一个元胞数组，其维数与作为数组的参量相同。如果 `str` 是字符向量或字符向量元胞数组，则输出是字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中每个元胞包含一个字符串数组。如果 `str` 和 `expression` 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。如果 `str` 为字符向量元胞数组，则输出也为字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中每个元胞包含一个字符串数组。如果您指定 `'once'` 选项以便只返回一个匹配项，则输出为字符向量、字符串数组或与 `str` 和 `expression` 具有相同维度的元胞数组。
`'tokens'`	`str` 中每个捕获的词元的文本	默认情况下，当返回所有匹配项时：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出是一个 1×`n` 元胞数组，其中 `n` 是匹配项数。每个元胞包含一个 1×`m` 匹配项元胞数组，其中 `m` 是匹配项中的词元数。如果 `str` 为字符向量，则输出为字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中每个元胞包含一个字符串数组。如果 `str` 或 `expression` 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是一个元胞数组，其维数与作为数组的参量相同。每个元胞包含一个 1×`n` 元胞数组，其中每个内部元胞包含一个 1×`m` 数组。如果 `str` 是字符向量或字符向量元胞数组，则每个内部元胞包含一个 1×`m` 元胞数组。如果 `str` 为字符串数组，则每个内部元胞包含一个 1×`m` 字符串数组。如果 `str` 和 `expression` 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。如果 `str` 为字符向量元胞数组，则输出也为字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中最内侧元胞包含字符串数组。如果您指定 `'once'` 选项以便只返回一个匹配项，则输出为一个 1×`m` 字符串数组、字符向量元胞数组或与 `str` 和/或 `expression` 具有相同维度的元胞数组。如果在特定索引处需要有词元，但未找到，MATLAB 将为词元返回空值：对于字符向量，返回 `''`；对于字符串，返回 `""`。
`'names'`	每个命名词元的名称和文本	对于所有匹配项：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出是一个 1×`n` 结构体数组，其中 `n` 是匹配项数。结构体字段名称对应于词元名称。如果 `str` 或 `expression` 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是一个元胞数组，其维数与作为数组的参量相同。每个元胞包含一个 1×`n` 结构体数组。如果 `str` 和 `expression` 均为元胞数组或字符串数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。
`'split'`	`str` 的非匹配子字符串的文本	对于所有匹配项：如果 `str` 和 `expression` 均为字符向量或字符串标量，则输出是一个 1×`n` 数组，其中 `n` 是非匹配项数。如果 `str` 为字符向量，则输出为字符向量元胞数组。如果 `str` 为字符串标量，则输出为字符串数组。如果 `str` 或 `expression` 有一个是字符向量元胞数组或字符串数组，另一个是字符向量或字符串标量，则输出是一个元胞数组，其维数与输入数组相同。每个元胞包含一个 1×`n` 字符向量元胞数组。如果 `str` 是字符向量或字符向量元胞数组，则输出是字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中每个元胞包含一个字符串数组。如果 `str` 和 `expression` 均为元胞数组，则它们的维度必须相同。输出是具有相同维度的元胞数组。如果 `str` 为字符向量元胞数组，则输出也为字符向量元胞数组。如果 `str` 为字符串数组，则输出为元胞数组，其中每个元胞包含一个字符串数组。

详细信息

全部折叠

词元

词元是对应于正则表达式部分的匹配文本部分。要创建词元，请将正则表达式部分括在圆括号中。

例如，此表达式查找 dd-mmm-yyyy 形式的日期，包括日、月和年的词元。

str = 'Here is a date: 01-Apr-2020';
expression = '(\d+)-(\w+)-(\d+)';

mydate = regexp(str,expression,'tokens');
mydate{:}

ans =

  1×3 cell array

    {'01'}    {'Apr'}    {'2020'}

可以将名称与词元关联起来以使其更便于识别：

str = 'Here is a date: 01-Apr-2020';
expression = '(?<day>\d+)-(?<month>\w+)-(?<year>\d+)';

mydate = regexp(str,expression,'names')

mydate = 

  struct with fields:

      day: '01'
    month: 'Apr'
     year: '2020'

有关详细信息，请参阅正则表达式中的词元。

扩展功能

全部展开

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

regexpi 函数完全支持基于线程的环境。有关详细信息，请参阅在基于线程的环境中运行 MATLAB 函数。

版本历史记录

在 R2006a 之前推出

另请参阅

regexpi

语法

说明

示例

模式匹配

区分大小写的匹配

输入参数

str — 输入文本 字符向量 | 字符向量元胞数组 | 字符串数组

expression — 正则表达式 字符向量 | 字符向量元胞数组 | 字符串数组

outkey — 指示要返回的输出的关键字 'start' (默认) | 'end' | 'tokenExtents' | 'match' | 'tokens' | 'names' | 'split'

option — 搜索选项 'once' | 'warnings' | 'matchcase' | 'emptymatch' | 'dotexceptnewline' | 'lineanchors' | ...

输出参量

startIndex — 每个匹配项的开始索引 行向量 | 行向量元胞数组

endIndex — 每个匹配项的结束索引 行向量 | 行向量元胞数组

out — 有关匹配项的信息 数值数组 | 元胞数组 | 字符串数组 | 结构体数组

详细信息

词元

扩展功能

基于线程的环境 使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

版本历史记录

另请参阅

主题

`str` — 输入文本
字符向量 | 字符向量元胞数组 | 字符串数组

`expression` — 正则表达式
字符向量 | 字符向量元胞数组 | 字符串数组

`outkey` — 指示要返回的输出的关键字
`'start'` (默认) | `'end'` | `'tokenExtents'` | `'match'` | `'tokens'` | `'names'` | `'split'`

`option` — 搜索选项
`'once'` | `'warnings'` | `'matchcase'` | `'emptymatch'` | `'dotexceptnewline'` | `'lineanchors'` | ...

`startIndex` — 每个匹配项的开始索引
行向量 | 行向量元胞数组

`endIndex` — 每个匹配项的结束索引
行向量 | 行向量元胞数组

`out` — 有关匹配项的信息
数值数组 | 元胞数组 | 字符串数组 | 结构体数组

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。