Main Content

为 Slurm 安装 MATLAB Parallel Server

如果您有一个带有 Slurm 的集群,请按照这些说明使用 MATLAB® Parallel Server™ 将 MATLAB 与您的调度器集成。如果您的集群中没有现有的调度器,请参阅:使用网络许可证管理器安装 MATLAB 作业调度器

这些说明将指导您完成以下任务:

将 MATLAB 与 Slurm 集成后,您可以通过 Parallel Computing Toolbox™ 的桌面 MATLAB 客户端会话访问集群中的工作进程。工作进程是 MATLAB 计算引擎,通常对应于核心。

这些步骤中的设置使用网络许可证管理器。

激活您的 MATLABParallel Server 许可证

要安装 MATLAB Parallel Server,您必须激活您的许可证。要激活您的 MATLABParallel Server 许可证:

  1. 导航至 https://www.mathworks.com/licensecenter

  2. 登录管理员的 MathWorks 帐户。

  3. 选择您的 MATLAB Parallel Server 许可证,然后点击安装并激活选项卡。

  4. 在最右侧的相关任务下,选择激活并获取许可证文件

  5. 填写所需信息。此信息必须指主机许可证管理器的机器。在这些指令中,它是头节点。有关详细信息,请参阅安装许可证管理器

  6. 填写信息后,下载或通过电子邮件发送许可证文件并复制文件安装密钥。这些将在后续进程中使用。

注意

试用无需激活。请联系您的销售代表以获取许可证文件和文件安装密钥。

获取安装文件

为了节省时间并消除为集群中的每台计算机进行基于安装程序的下载进程的需要,请在安装之前下载安装文件。这样做有利于在大量机器上进行安装。如果您有权访问许可证的管理员帐户,则可以使用安装程序下载文件而不安装它们。如果没有,请联系您的许可证管理员以获取安装文件的副本。有关详细信息,请参阅下载产品而不安装。使用安装程序下载文件时,请选择以下选项:

  • 为集群节点选择适当的操作系统。

  • 选择所有要下载的产品。MATLAB Parallel Server MATLAB 无法运行需要未安装产品的作业。

MATLAB Parallel Server 有三个服务器端组件:

  1. 许可证管理器,主机每个工作进程使用的 MATLABParallel Server 许可证。有关详细信息,请参阅安装许可证管理器

  2. 您的第三方作业调度器,它在头节点上运行并管理集群上的作业。您可以将这个调度器与 MATLAB Parallel Server 集成。有关详细信息,请参阅安装许可证管理器配置集群

  3. MATLABParallel Server,在计算节点上运行。有关详细信息,请参阅在计算节点上安装软件

A computer cluster running MATLAB linked to client computers. The cluster headnode is shown running a Third Party scheduler with a licence manager.

安装许可证管理器

选择一个计算机节点来主机许可证管理器。对于安装,请使用上一步中的离线安装程序。有关离线安装程序的详细信息,请参阅在离线计算机上安装 MathWorks 产品

  1. 从获取的安装文件中启动 MATLAB 安装程序获取安装文件

  2. 选择高级选项 > 我要安装网络许可证管理器

  3. 在许可证文件步骤中,浏览到您的 license.lic 文件(从激活您的 MATLABParallel Server 许可证)。

  4. 按照提示继续完成网络管理器的安装。有关该过程的更多信息,请参阅在许可证服务器上安装许可证管理器

  5. 启动许可证管理器。

在计算节点上安装软件

此过程类似于安装许可证管理器。有关离线安装程序的详细信息,请参阅在离线计算机上安装 MathWorks 产品

  1. 从获取的安装文件中启动 MATLAB 安装程序获取安装文件

  2. 选择高级选项 > 我有文件安装密钥并按照提示继续。

  3. 选择所有产品。或者,为了节省空间,仅安装集群用户获得许可的产品。

  4. 使用来自头节点的 license.dat 文件。您可以从 matlabroot/etc 文件夹获取此文件,其中 matlabroot 是 MATLAB 安装文件夹。

为了获得最佳性能,请在每个节点上本地安装。但是,您也可以安装在网络共享位置。

注意

如果您想的话,可以改为以非交互方式(静默)安装

  • 在没有图形用户界面 (GUI) 的机器上安装软件。

  • 节省为每个计算节点配置安装程序所需的时间。

有关详细信息,请参阅使用 MathWorks 产品安装程序执行静默安装

您可以通过在命令行界面中运行以下命令来测试安装和许可。matlabroot 是 MATLAB 安装文件夹。filename 是写入日志文件的位置,例如临时位置。您必须具有在此位置的写入权限。

matlabroot/toolbox/parallel/bin/checkLicensing -logfile filename

注意

当您想要为 Slurm 配置 MATLAB Parallel Server 时,无需启动 mjs 服务。

在本地桌面上安装软件

要使用 MATLABParallel Server,您必须使用运行 MATLAB 和 Parallel Computing Toolbox 的本地桌面。在您想要向集群提交作业的本地桌面上安装您获得许可的 MathWorks® 产品,包括 Parallel Computing Toolbox。有关此步骤的帮助,请参阅安装和许可

您启动的任何 MATLAB 集群工作进程都使用动态许可:他们可以使用您在 MATLAB 客户端中许可的所有功能,同时只签出集群中的 MATLABParallel Server 许可证。

配置客户端计算机

下一步详细信息

如果您满足所有这些条件,请使用开箱即用的支持。

  • 客户端计算机使用 Linux®

  • 客户端计算机和集群节点之间有一个共享文件系统。

  • 客户端计算机安装了第三方调度调度器提交工具。您可以通过在命令行中执行相关命令来检查这一点。例如提交脚本是 sbatch

遵循操作:使用现成的支持创建集群配置文件

使用通用调度器接口。

遵循操作:使用通用调度器接口创建集群配置文件

使用现成的支持创建集群配置文件

  1. 启动集群配置文件管理器。在主页选项卡的环境区域中,选择并行 > 创建和管理集群

  2. 创建一个新的 Slurm 配置文件。在集群配置文件管理器中,选择添加集群配置文件 > Slurm

  3. 要为其指定不同的名称,请选择新的配置文件并点击重命名

  4. 属性选项卡中,提供以下字段的设置。

    1. (可选)设置描述字段。

    2. JobStorageLocation 设置为您希望存储作业和任务数据的位置。所有工作进程机器必须能够访问此位置。

      注意

      不建议与运行不同版本的并行计算产品共享 JobStorageLocation;集群上的每个版本都应该有自己的 JobStorageLocation

    3. NumWorkers 字段设置为您想要在此配置文件中使用的工作进程数量(在您的许可限制范围内)。

    4. ClusterMatlabRoot 设置为工作进程机器要执行的 MATLAB 的安装位置。

    5. (可选)设置 SubmitArguments 以包含特定集群和调度器所需的任何其他命令参数。

    6. 填写字段后,对话框如下所示:

      Cluster Profile Manager with the Slurm cluster profile selected. The Slurm cluster properties are shown in the right pane.

  5. 点击完成以保存您的集群配置文件。

使用通用调度器接口创建集群配置文件

从 GitHub® 存储库下载用于与 Slurm 交互的插件脚本:

或者,您可以从 MATLAB Central™ File Exchange 下载插件脚本。

有关通用调度器接口的更多信息,请参阅使用通用调度器接口进行配置

验证集群配置文件

在此步骤中,您将验证您的集群配置文件,从而验证您的安装。您可以指定验证个人配置文件时要使用的工作进程数量。如果您没有在验证选项卡中指定工作进程的数量,那么验证将尝试使用与属性选项选项卡上的 NumWorkers 属性所指定值一样多的工作进程。您可以指定较少数量的工作进程来验证您的配置,而无需占用整个集群。

  1. 如果尚未打开,请启动集群配置文件管理器。在主页选项卡的环境区域中,选择并行 > 创建和管理集群

  2. 在列表中选择您的集群配置文件。

  3. 点击验证选项选项卡。

  4. 使用复选框选择所有测试或验证阶段的子集,并指定验证您的配置文件时要使用的工作进程数量。

  5. 点击验证

验证结果选项选项卡显示输出。下图显示了通过所有验证测试的配置文件的结果。

Cluster Profile Manager with the local cluster profile selected. The validation results for the local cluster are shown in the right pane.

注意

如果您的验证未通过,请联系 MathWorks 安装支持团队

如果您的验证通过,您现在就拥有一个可以在其他并行应用程序中使用的有效配置文件。您可以对您的配置文件进行任何适合您的应用程序的修改,例如 NumWorkersRangeAttachedFilesAdditionalPaths 等。

要为其他用户保存您的配置文件,请选择该配置文件并点击导出,然后将您的配置文件保存到方便位置的文件中。稍后,运行 集群配置文件管理器时,其他用户可以通过点击导入来导入您的配置文件。

运行并行代码

完成配置后,您就可以向集群提交作业了。有关示例,请参阅在集群和云上运行代码

另请参阅