matlab.io.datastore.HadoopFileBased 类
命名空间: matlab.io.datastore
(不推荐)为数据存储添加 Hadoop 文件支持
不推荐使用 matlab.io.datastore.HadoopFileBased。请改用 matlab.io.datastore.HadoopLocationBased。
描述
matlab.io.datastore.HadoopFileBased 是一个抽象的 mixin 类,可为您的自定义数据存储添加 Hadoop® 支持。
要使用此 mixin 类,除了从 matlab.io.Datastore 基类继承之外,还必须从 matlab.io.datastore.HadoopFileBased 类继承。键入以下语法作为类定义文件的第一行:
classdef MyDatastore < matlab.io.Datastore & ...
matlab.io.datastore.HadoopFileBased
...
end要添加 Hadoop 支持和并行处理支持,请在您的类定义文件中使用以下行:
classdef MyDatastore < matlab.io.Datastore & ...
matlab.io.datastore.Partitionable & ...
matlab.io.datastore.HadoopFileBased
...
end要为自定义数据存储添加 Hadoop 支持,您还必须:
定义这些附加方法:
getLocation、initializeDatastore和isfullfile
有关创建支持 Hadoop 的自定义数据存储的详细信息和步骤,请参阅Develop Custom Datastore。
方法
getLocation | (不推荐)Hadoop 中文件的位置 |
initializeDatastore | (不推荐)使用 Hadoop 中的信息初始化数据存储 |
isfullfile | (不推荐)检查数据存储是否读取完整文件 |
示例
版本历史记录
在 R2017b 中推出
另请参阅
mapreduce | matlab.io.datastore.Partitionable | matlab.io.Datastore | matlab.io.datastore.DsFileSet | tall
主题
- Add Support for Hadoop
- 在 Spark 集群上使用 tall 数组 (Parallel Computing Toolbox)
- 使用 tall 数组和数据存储的大数据工作流 (Parallel Computing Toolbox)