主要内容

aggregate

类: matlab.compiler.mlspark.RDD
命名空间: matlab.compiler.mlspark

对每个分区的元素进行聚合,然后将所有分区的结果聚合为单个值

语法

result = aggregate(obj,zeroValue,seqOp,combOp)

说明

result = aggregate(obj,zeroValue,seqOp,combOp) 使用由 seqOpcombOp 指定的给定组合函数以及由 zeroValue 指定的中性“零值”将各个元素聚合为单个值。

输入参数

全部展开

输入 RDD,指定为 RDD 对象。

一个中性“零值”,指定为数字元胞数组。

数据类型: cell

用于聚合每个键的值的函数,指定为函数句柄。

数据类型: function_handle

用于聚合 seqOp 的结果的函数,指定为函数句柄。

数据类型: function_handle

输出参量

全部展开

包含聚合元素的 RDD,以 RDD 对象形式返回。

示例

全部展开

%% Connect to Spark
sparkProp = containers.Map({'spark.executor.cores'}, {'1'});
conf = matlab.compiler.mlspark.SparkConf('AppName','myApp', ...
                        'Master','local[1]','SparkProperties',sparkProp);
sc = matlab.compiler.mlspark.SparkContext(conf);

%% Aggregate
seqOp = @(x,y)({x{1} + y, x{2} + 1});
combOp = @(x,y)({x{1} + y{1}, x{2} + y{2}});
x = sc.parallelize({1, 2, 3, 4});
y = x.aggregate({0, 0}, seqOp, combOp) % {10,4}

版本历史记录

在 R2016b 中推出