主要内容

本页采用了机器翻译。点击此处可查看最新英文版本。

使用 mcc 命令创建可部署存档的配置文件

使用 mcc 命令创建可部署存档时,必须创建一个包含以下信息的文本文件:

参数类型描述

mw.ds.out.type

Hadoop® Mapreduce 作业的输出数据类型

选项为:

  • keyvalue

  • tabulartext

mw.mapper

MATLAB® map 函数的名称

mw.reducer

MATLAB reduce 函数的名称

mw.ds.in.format

包含表示要处理的数据格式的 datastore 对象的 MAT 文件的名称。

在大多数情况下,您将首先处理位于本地计算机上的一个小样本数据集,该数据集代表集群上的实际数据集。该示例数据集与集群上的实际数据集具有相同的结构和变量。通过为位于本地计算机上的数据集创建数据存储对象,您可以获取该结构的快照。通过访问此数据存储对象,在集群上执行的 Hadoop 作业将知道如何访问和处理驻留在 HDFS™ 上的实际数据集。

mw.ds.in.type

Hadoop mapreduce 作业的数据输入类型

选项为:

  • keyvalue

  • tabulartext

mw.ds.in.fullfile

默认值是 false

示例配置文件

config.txt

mw.ds.out.type = keyvalue
mw.mapper = maxArrivalDelayMapper
mw.reducer = maxArrivalDelayReducer
mw.ds.in.format = infoAboutDataset.mat
mw.ds.in.type = tabulartext

另请参阅

主题