strsplit

在指定分隔符处拆分字符串或字符向量

全页折叠

语法

C = strsplit(str)

C = strsplit(str,delimiter)

C = strsplit(str,delimiter,Name,Value)

[C,matches] = strsplit(___)

说明

注意

推荐使用 split 而不是 strsplit，因为前者提供更大的灵活性并允许向量化。有关其他信息，请参阅替代功能。

C = strsplit(str) 在空白处将 str 拆分为 C。空白字符等效于集合 {' ','\f','\n','\r','\t','\v'} 中的任何转义序列。

如果 str 具有连续的空白字符，则 strsplit 将它们视为一个空格。

示例

C = strsplit(str,delimiter) 在 delimiter 指定的分隔符处拆分 str。

如果 str 具有连续的分隔符，并且它们之间没有其他字符，则 strsplit 将它们视为一个分隔符。例如，strsplit('Hello,world',',') 和 strsplit('Hello,,,world',',') 返回相同的输出。

示例

C = strsplit(str,delimiter,Name,Value) 使用一个或多个名称-值对组参量指定其他分隔符选项。例如，要将连续分隔符视为单独的分隔符，可以指定 'CollapseDelimiters',false。

示例

[C,matches] = strsplit(___) 还返回数组 matches。matches 输出参量包含 strsplit 拆分 str 时遇到的所有分隔符。您可将此语法与上述语法中的任何输入参量一起使用。

示例

全部折叠

在空白处拆分字符向量

打开实时脚本

str = 'The rain in Spain.';
C = strsplit(str)

C = 1×4 cell
    {'The'}    {'rain'}    {'in'}    {'Spain.'}

C 是一个包含四个字符向量的元胞数组。

在特定分隔符处拆分值的字符向量

打开实时脚本

拆分包含逗号分隔值的字符向量。

data = '1.21, 1.985, 1.955, 2.015, 1.885';
C = strsplit(data,', ')

C = 1×5 cell
    {'1.21'}    {'1.985'}    {'1.955'}    {'2.015'}    {'1.885'}

拆分字符向量 data，其中包含数值文本、单位 m/s，且文本任意一侧可能有任意数量的空白。正则表达式 \s* 匹配出现零次或多次的任何空白字符。

data = '1.21m/s1.985m/s 1.955 m/s2.015 m/s 1.885m/s';
[C,matches] = strsplit(data,'\s*m/s\s*',...
    'DelimiterType','RegularExpression')

C = 1×6 cell
    {'1.21'}    {'1.985'}    {'1.955'}    {'2.015'}    {'1.885'}    {0×0 char}

matches = 1×5 cell
    {'m/s'}    {'m/s '}    {' m/s'}    {' m/s '}    {'m/s'}

在这种情况下，C 中的最后一个字符向量为空。此空字符向量在最后一个匹配的分隔符后。

根据文件分隔符拆分路径

打开实时脚本

myPath = 'C:\work\matlab';
C = strsplit(myPath,'\')

C = 1×3 cell
    {'C:'}    {'work'}    {'matlab'}

拆分具有多个分隔符的字符向量

打开实时脚本

根据 ' ' 和 'ain' 拆分字符向量，并将多个分隔符作为一个分隔符处理。在字符向量元胞数组中指定多个分隔符。

str = 'The rain in Spain stays mainly in the plain.';
[C,matches] = strsplit(str,{' ','ain'},'CollapseDelimiters',true)

C = 1×11 cell
    {'The'}    {'r'}    {'in'}    {'Sp'}    {'stays'}    {'m'}    {'ly'}    {'in'}    {'the'}    {'pl'}    {'.'}

matches = 1×10 cell
    {' '}    {'ain '}    {' '}    {'ain '}    {' '}    {'ain'}    {' '}    {' '}    {' '}    {'ain'}

根据空白和 'ain' 拆分同一字符向量，使用正则表达式并分开处理多个分隔符。

[C,matches] = strsplit(str,{'\s','ain'},'CollapseDelimiters',...
    false, 'DelimiterType','RegularExpression')

C = 1×13 cell
    {'The'}    {'r'}    {0×0 char}    {'in'}    {'Sp'}    {0×0 char}    {'stays'}    {'m'}    {'ly'}    {'in'}    {'the'}    {'pl'}    {'.'}

matches = 1×12 cell
    {' '}    {'ain'}    {' '}    {' '}    {'ain'}    {' '}    {' '}    {'ain'}    {' '}    {' '}    {' '}    {'ain'}

在这种情况下，strsplit 分开处理两个分隔符，因此输出 C 中连续匹配的分隔符之间显示了空字符向量。

拆分具有多个重叠分隔符的文本

打开实时脚本

根据字符向量 ', ' 和 ', and ' 拆分文本。

str = 'bacon, lettuce, and tomato';
[C,matches] = strsplit(str,{', ',', and '})

C = 1×3 cell
    {'bacon'}    {'lettuce'}    {'and tomato'}

matches = 1×2 cell
    {', '}    {', '}

由于该命令首先列出 ', ' 并且 ', and ' 包含 ', '，因此 strsplit 函数根据第一个分隔符拆分 str 并且不再继续处理到第二个分隔符。

如果您颠倒分隔符的顺序，则 ', and ' 具有更高优先级。

str = 'bacon, lettuce, and tomato';
[C,matches] = strsplit(str,{', and ',', '})

C = 1×3 cell
    {'bacon'}    {'lettuce'}    {'tomato'}

matches = 1×2 cell
    {', '}    {', and '}

输入参数

全部折叠

`str` — 输入文本
字符向量 | 字符串标量

输入文本，指定为字符向量或字符串标量。

数据类型: char | string

`delimiter` — 分隔字符
字符向量 | `1`×`n` 字符向量元胞数组 | `1`×`n` 字符串数组

分隔字符，指定为字符向量、1×n 字符向量元胞数组或 1×n 字符串数组。在 delimiter 中指定的文本不会显示在输出 C 中。

在元胞数组或字符串数组中指定多个分隔符。strsplit 函数根据 delimiter 的元素拆分 str。分隔符在 delimiter 中显示的顺序不重要，除非有多个分隔符都从 str 中的同一字符处开始匹配。在此种情况下，strsplit 将在 delimiter 中的第一个匹配分隔符处进行拆分。

delimiter 可以包含下列转义序列：

`\\`	反斜杠
`\0`	空值
`\a`	警报
`\b`	退格符
`\f`	换页符
`\n`	换行符
`\r`	回车符
`\t`	水平制表符
`\v`	垂直制表符

示例: ','

示例: {'-',','}

数据类型: char | cell | string

名称-值参数

全部折叠

将可选参量对组指定为 Name1=Value1,...,NameN=ValueN，其中 Name 是参量名称，Value 是对应的值。名称-值参量必须出现在其他参量之后，但对各个参量对组的顺序没有要求。

如果使用的是 R2021a 之前的版本，请使用逗号分隔每个名称和值，并用引号将 Name 引起来。

示例: 'DelimiterType','RegularExpression' 指示 strsplit 将 delimiter 视为正则表达式。

`CollapseDelimiters` — 多分隔符处理
`1 (true)` (默认) | `0 (false)`

多分隔符处理，指定为由 'CollapseDelimiters' 和 true/false 组成的逗号分隔对组。如果为 true，则 str 中的连续分隔符将作为一个分隔符处理。如果为 false，则连续分隔符将作为单独的分隔符处理，这会导致匹配的分隔符之间出现空字符向量 '' 元素。

示例: 'CollapseDelimiters',true

`DelimiterType` — 分隔符类型
`'Simple'` (默认) | `'RegularExpression'`

分隔符类型，指定为逗号分隔的对组，包含 'DelimiterType' 和下列字符向量之一。

`'Simple'`	除了在转义序列中之外，`strsplit` 将 `delimiter` 作为字面文本进行处理。
`'RegularExpression'`	`strsplit` 将 `delimiter` 作为正则表达式处理。

在这两种情况下，delimiter 可以包括转义序列。

输出参量

全部折叠

`C` — 原始文本的一部分
字符向量元胞数组 | 字符串数组

原始字符向量的一部分，以字符向量元胞数组或字符串数组形式返回。C 始终比 matches 多包含一个元素。因此，如果 str 以分隔符开头，则 C 的第一个元素不包含任何字符。如果 str 以分隔符结尾，则 C 中的最后一个元胞不包含任何字符。

`matches` — 找到的分隔符
字符向量元胞数组 | 字符串数组

标识的分隔符，以字符向量元胞数组或字符串数组形式返回。matches 始终比输出 C 少包含一个元素。如果 str 是字符向量或字符向量元胞数组，则 matches 是元胞数组。如果 str 是字符串数组，则 matches 是字符串数组。

替代功能

更新使用 strsplit 的代码以改用 split。split 的默认方向是按列。例如：

不推荐	推荐
str = strsplit("1 2 3") str = 1×3 string array "1" "2" "3"	str = split("1 2 3") str = 3×1 string array "1" "2" "3"

扩展功能

全部展开

C/C++ 代码生成
使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

用法说明和限制：

strsplit 的第一个输入参量必须是字符向量。

GPU 代码生成
使用 GPU Coder™ 为 NVIDIA® GPU 生成 CUDA® 代码。

请参阅“C/C++ 代码生成”部分中的用法说明和限制。同样的用法说明和限制也适用于 GPU 代码生成。

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

strsplit 函数完全支持基于线程的环境。有关详细信息，请参阅在基于线程的环境中运行 MATLAB 函数。

版本历史记录

在 R2013a 中推出

全部展开

R2025a: 代码生成支持

为 strsplit 函数生成 C/C++ 代码。

另请参阅

主题

正则表达式

strsplit

语法

说明

示例

在空白处拆分字符向量

在特定分隔符处拆分值的字符向量

根据文件分隔符拆分路径

拆分具有多个分隔符的字符向量

拆分具有多个重叠分隔符的文本

输入参数

str — 输入文本 字符向量 | 字符串标量

delimiter — 分隔字符 字符向量 | 1×n 字符向量元胞数组 | 1×n 字符串数组

名称-值参数

CollapseDelimiters — 多分隔符处理 1 (true) (默认) | 0 (false)

DelimiterType — 分隔符类型 'Simple' (默认) | 'RegularExpression'

输出参量

C — 原始文本的一部分 字符向量元胞数组 | 字符串数组

matches — 找到的分隔符 字符向量元胞数组 | 字符串数组

替代功能

扩展功能

C/C++ 代码生成 使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

GPU 代码生成 使用 GPU Coder™ 为 NVIDIA® GPU 生成 CUDA® 代码。

基于线程的环境 使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

版本历史记录

R2025a: 代码生成支持

另请参阅

主题

`str` — 输入文本
字符向量 | 字符串标量

`delimiter` — 分隔字符
字符向量 | `1`×`n` 字符向量元胞数组 | `1`×`n` 字符串数组

`CollapseDelimiters` — 多分隔符处理
`1 (true)` (默认) | `0 (false)`

`DelimiterType` — 分隔符类型
`'Simple'` (默认) | `'RegularExpression'`

`C` — 原始文本的一部分
字符向量元胞数组 | 字符串数组

`matches` — 找到的分隔符
字符向量元胞数组 | 字符串数组

C/C++ 代码生成
使用 MATLAB® Coder™ 生成 C 代码和 C++ 代码。

GPU 代码生成
使用 GPU Coder™ 为 NVIDIA® GPU 生成 CUDA® 代码。

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。