Spark 应用程序
针对启用 Spark™ 的 Hadoop® 集群创建和执行编译的 MATLAB® 应用程序
支持的平台:仅限 Linux®。
您可以通过以下两种方式针对 Spark 部署 MATLAB 应用程序:
将 tall 数组部署到启用 Spark 的 Hadoop 集群
使用 MATLAB API for Spark 部署应用程序
要部署包含 tall 数组的 MATLAB 应用程序,请参阅将 tall 数组部署到启用 Spark 的 Hadoop 集群。要了解有关如何使用 tall 数组的详细信息,请参阅 tall 数组。
要部署使用在 Spark 程序中常见的 flatMap
等函数的 MATLAB 应用程序,请参阅使用 MATLAB API for Spark 部署应用程序。
MATLAB API for Spark 会将 Spark 编程模型公开给 MATLAB。因此,您会发现在创建 MATLAB 应用程序时可以方便地使用 flatMap
、mapPartitions
和 aggregate
等 Spark 函数。
注意
如果使用 MATLAB API for Spark 开发的 MATLAB 应用程序包含 tall 数组,则无法部署。
请参阅 Apache Spark 基础知识,了解 Spark 概念的简要概述以及有关已部署的 MATLAB 应用程序如何纳入这些概念的讨论。
MATLAB 拥有大量科学和工程算法,而 Spark 是一种快速通用的大规模数据处理引擎。通过针对 Spark 部署 MATLAB 应用程序,您可以在 MATLAB 中创建应用程序并针对启用 Spark 的集群执行这些应用程序。
支持的 Apache® Spark 版本:1.3–2.x。
类别
- 将 tall 数组部署到启用 Spark 的 Hadoop 集群
针对启用 Spark 的 Hadoop 集群创建和执行包含 tall 数组的 MATLAB 应用程序
- 使用 MATLAB API for Spark 部署应用程序
使用 MATLAB API for Spark 针对 Spark 创建和执行 MATLAB 应用程序