parquetinfo
说明
ParquetInfo
对象包含关于 Parquet 文件的信息,例如:文件大小、变量名称和类型、编码和压缩方案。要获取有关 Parquet 文件的信息,请使用 parquetinfo
函数创建 ParquetInfo
对象。
创建对象
输入参数
filename
— Parquet 文件的名称
字符向量 | 字符串标量
Parquet 文件的名称,指定为字符向量或字符串标量。ParquetInfo
兼容 Parquet 1.0 或 Parquet 2.0 文件。
根据文件的位置,filename
可以采用下列形式之一。
位置 | 形式 | ||||||||
---|---|---|---|---|---|---|---|---|---|
当前文件夹或 MATLAB® 路径上的文件夹 | 指定 示例: | ||||||||
文件夹中的文件 | 如果该文件不在当前文件夹或 MATLAB 路径下的文件夹中,则指定完整或相对路径名。 示例: 示例: | ||||||||
Internet URL | 如果文件指定为 Internet 统一资源定位器 (URL),则 示例: | ||||||||
远程位置 | 如果文件存储在远程位置,则
根据远程位置,
有关详细信息,请参阅处理远程数据。 示例: |
数据类型: char
| string
属性
Filename
— Parquet 文件的绝对路径
字符串标量
此 属性 为只读。
Parquet 文件的绝对路径,指定为字符串标量。
数据类型: string
FileSize
— 文件大小(以字节为单位)
双精度值
此 属性 为只读。
文件大小(以字节为单位),指定为 double
。
数据类型: double
NumRowGroups
— 行组的数量
双精度值
此 属性 为只读。
行组的数量,指定为 double
。
数据类型: double
RowGroupHeights
— 每个行组中的行数
双精度值
此 属性 为只读。
每个行组中的行数,指定为 double
。
数据类型: double
VariableNames
— 变量名称
字符串数组
此 属性 为只读。
变量名称,指定为字符串数组。如果 Parquet 文件包含 N
个变量,则 VariableNames
是包含变量名称的大小为 1
×N
的数组。
数据类型: string
VariableTypes
— 变量的数据类型
字符串数组
此 属性 为只读。
变量数据类型,指定为字符串数组。如果 Parquet 文件包含 N
个变量,则 VariableTypes
是大小为 1
×N
的数组,其中包含每个变量的数据类型名称。数组中的每个元素是 Parquet 文件中每个变量对应的 MATLAB 数据类型名称。
数据类型: string
VariableCompression
— 变量压缩算法
字符串数组
此 属性 为只读。
变量压缩算法,指定为字符串数组。如果 Parquet 文件包含 N
个变量,则 VariableCompression
是包含压缩算法名称的大小为 1
×N
的数组。数组中的每个元素对应于 Parquet 文件中每个变量所用的压缩算法。请参阅 parquetwrite
了解支持的压缩算法列表。
数据类型: string
VariableEncoding
— 变量编码
字符串数组
此 属性 为只读。
变量编码,指定为字符串数组。如果 Parquet 文件包含 N
个变量,则 VariableEncoding
是包含编码方案名称的大小为 1
×N
的数组。数组中的每个元素对应于 Parquet 文件中对该变量进行编码所用的编码方案。请参阅 parquetwrite
了解支持的编码列表。
数据类型: string
Version
— Parquet 版本
"1.0"
| "2.0"
此 属性 为只读。
Parquet 版本,指定为 "1.0"
或 "2.0"
。
数据类型: string
示例
获取有关 Parquet 文件的信息
使用 parquetinfo
函数创建包含文件有关信息的 ParquetInfo
对象。
info = parquetinfo('outages.parquet')
info = ParquetInfo with properties: Filename: "/mathworks/devel/bat/Bdoc22b/build/matlab/toolbox/matlab/demos/outages.parquet" FileSize: 44202 NumRowGroups: 1 RowGroupHeights: 1468 VariableNames: ["Region" "OutageTime" "Loss" ... ] VariableTypes: ["string" "datetime" "double" ... ] VariableCompression: ["snappy" "snappy" "snappy" ... ] VariableEncoding: ["plain" "plain" "plain" "plain" ... ] Version: "2.0"
显示文件中第三个变量的名称、类型和压缩方案。
disp([info.VariableNames(3) info.VariableTypes(3) info.VariableCompression(3)])
"Loss" "double" "snappy"
扩展功能
基于线程的环境
使用 MATLAB® backgroundPool
在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool
加快代码运行速度。
此函数完全支持基于线程的环境。有关详细信息,请参阅Run MATLAB Functions in Thread-Based Environment。
版本历史记录
在 R2019a 中推出R2022b: 在基于线程的环境中使用函数
此函数支持基于线程的环境。
MATLAB 命令
您点击的链接对应于以下 MATLAB 命令:
请在 MATLAB 命令行窗口中直接输入以执行命令。Web 浏览器不支持 MATLAB 命令。
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)