主要内容

本页采用了机器翻译。点击此处可查看最新英文版本。

saveAsKeyValueDatastore

类: matlab.compiler.mlspark.RDD
命名空间: matlab.compiler.mlspark

将键值 RDD 保存为二进制文件,可以使用 datastore 函数读取

语法

saveAsKeyValueDatastore(obj,path)

说明

saveAsKeyValueDatastore(obj,path) 键值输入 RDD obj 保存为二进制文件,可以使用 datastore 函数读回。

输入参数

全部展开

输入 RDD,指定为 RDD 对象。

必须保存二进制文件的目录位置,指定为用 '' 括起来的字符向量。

数据类型: char

示例

全部展开

将键值 RDD 保存为二进制文件,可以使用 datastore 函数读取该文件。

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% saveAsKeyValueDatastore

% May require setting HADOOP_PREFIX or HADOOP_HOME environment variables to a
% valid Hadoop installation folder even if running locally.
% For example:
% setenv('HADOOP_PREFIX','/share/hadoop/hadoop-2.5.2')

inRDD = sc.parallelize({1,2,3,4,5});
redRDD= inputRDD.map(@(x)({x,1})).reduceByKey(@(x,y)(x+y))
% Store RDD in a key-value binary file that can be read back into MATLAB using datastore
redRdd.saveAsKeyValueDatastore('myKVdir')

版本历史记录

在 R2016b 中推出