主要内容

本页采用了机器翻译。点击此处可查看最新英文版本。

subtractByKey

类: matlab.compiler.mlspark.RDD
命名空间: matlab.compiler.mlspark

返回两个 RDD 之间的键差集所产生的键-值对组

语法

result = subtractByKey(obj1,obj2,numPartitions)

说明

result = subtractByKey(obj1,obj2,numPartitions) 返回由 resultobj1 之间的键的差集产生的键-值对组 RDD obj2numPartitions 指定在生成的 RDD 中创建的分区数。

输入参数

全部展开

输入 RDD,指定为 RDD 对象。

输入 RDD,指定为 RDD 对象。

要创建的分区数,指定为标量值。

数据类型: double

输出参量

全部展开

包含两个 RDD 之间的键差集的流水线 RDD,以 RDD 对象的形式返回。

示例

全部展开

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% subtractByKey
x = sc.parallelize({ {'a',1}, {'b',4}, {'b',5} , {'a',2} });
y = sc.parallelize({ {'a',3}, {'c',4} });
z = sc.parallelize({ {'a',2}, {'c',4} });
a = x.subtractByKey(y).collect(); % {{'b',4},{'b',5}}

版本历史记录

在 R2016b 中推出

另请参阅

|