主要内容

本页采用了机器翻译。点击此处可查看英文原文。

创建与探索集群

创建一个云集群。

如果您是云集群的新手,请参阅 云中心入门指南

  1. 通过 https://cloudcenter.mathworks.com 登录 Cloud Center。若您身处 MATLAB®,也可在 Home 选项卡的 Environment 区域选择Parallel > Create and Manage Clusters前往云端中心。

  2. 如果您从未使用过 Cloud Center,则需要进行一次性的设置,将您的云帐户与 Cloud Center 关联起来。请参阅将您的云帐户关联至 Cloud Center

  3. 要启动任何云资源,请点击 Cloud Resources 选项卡。

  4. MATLAB Parallel Server™ 旁边,点击 Create

    Create MATLAB Parallel Server resource button in the Cloud Resource tab.

  5. 在“创建云资源”页面上,配置您的集群设置。 Cloud Center 中的云机器配置设置参考了 GitHub® 上提供的以下参考架构:Amazon Web Services 上的 MATLAB Parallel Server

    提示

    点击 Start 尝试默认集群。 Cloud Center 会提示您是否需要创建新的 SSH 密钥。您可能需要配置其他集群设置,例如集群规模、机器类型和存储设置。例如,对于深度学习,请选择配备 GPU 的机器类型,如 P3、G4dn 或 G5 实例。

    配置设置描述
    Name请指定名称。
    Release选择与您本地桌面客户端 MATLAB 版本相同的 MATLAB 版本。
    Provider

    选择 Amazon® AWS®

    Account

    选择一个 AWS 帐户来启动您的集群。

    Operating System

    选择集群中实例的操作系统。

    Cloud Location选择 Region 来运行您的集群。请考虑您的所在位置和网络连接状况。
    Cluster Profile Name

    从 MATLAB 发现集群时使用的集群名称。此属性为只读属性。

    Shared State

    选择 Personal ClusterShareable Cluster

     个人集群(默认)- 个人集群仅限您本人访问。

     可共享集群 - 可共享集群可与他人共享。

    Auto-Manage Cluster Access

    选项用于指示是否自动更新 AWS 虚拟机 (VM) 的入站防火墙规则,以允许终端用户的当前公共 IP 地址。若需通过 MATLAB Online™ 访问您的集群,请启用此选项。您还可以在该集群的详细信息页面上管理有效的入站防火墙规则。有关详细信息,请参阅管理集群访问

    已选中 - 允许 Cloud Center 管理集群的入站防火墙规则。
    已清除 - 手动管理集群的入站防火墙规则。默认情况下,仅限于 Default IP Address 中指定的 IP 地址范围可访问该集群。
    Headnode Machine Type

    用于运行 MATLAB 作业调度程序 (MJS) 的主节点所使用的 AWS 虚拟机 (VM) 类型。该节点上未启动任何工作单元,因此其虚拟机规格可小于工作单元。请参阅 https://aws.amazon.com/ec2/instance-types/ 获取实例类型列表。推荐默认配置 c6id.2xlarge。

    Worker Machine Type

    用于工作单元的 AWS 虚拟机 (VM)。请参阅 https://aws.amazon.com/ec2/instance-types/ 获取虚拟机类型列表。推荐默认配置为 r7a.8xlarge。

    提示

    对于深度学习,请选择配备 GPU 的机器类型,例如 P3、G4dn 或 G5 实例。P3 系列配备高性能 GPU,适用于通用计算。G4dn 和 G5 实例配备的 GPU 具有卓越的单精度性能,适用于深度学习、图像处理、计算机视觉及自动驾驶仿真等场景。

    Allow cluster to auto-resize已启用 - 集群中的机器数量可根据提交至集群的工作量进行缩减或扩展。将 Workers in Cluster 设置为集群中所需的最大工作单元数。有关详细信息,请参阅自动调整集群大小

    禁用(默认)- 集群中的机器数量将固定为由 Workers in Cluster 设置的 worker 数量。

    Workers in Cluster

    通过 Upper Limit 菜单选择工作单元的数量。若选择大于 Workers per Machine 的数值,Machines in Cluster 的值将更新为显示多台机器。Cloud Center 每个集群最多支持 1024 个工作单元。

    Initial Count 字段显示集群初始启动的 worker 数量。如果 Allow cluster to auto-resize 被禁用,则 Initial Count 字段将匹配您的 Upper Limit 选择。

    如果启用了 Allow cluster to auto-resize,则 Upper Limit 菜单用于设置集群的最大工作单元数,增量单位为 Workers per Machine。字段 Initial Count 为零。您的集群初始状态为零个工作单元,并可扩展至最大工作单元数量。有关详细信息,请参阅自动调整集群大小

    Workers per Machine每台虚拟机 (VM) 上启动的 MATLAB 工作单元数量。为每个物理 CPU 核心指定 1 个工作单元,或为 GPU 计算指定每个 GPU 对应 1 个工作单元。例如,r7a.8xlarge 实例拥有 32 个物理核,因此可支持 32 个 MATLAB 工作单元。有关每种虚拟机类型的详细信息,请参阅 https://aws.amazon.com/ec2/instance-types/
    Auto-Shutdown (hrs)为集群选择一个超时时间,使其能够自动关闭。选择 Always OnOn Idle(基于工作单元活动)或指定小时数,以自动停止集群机器。选择 On Idle 选项时,若集群闲置约 10 分钟(启动时为 30 分钟),集群机器将停止运行。超时后,集群机器停止运行,但数据卷仍在运行并产生费用。为避免产生费用,请停止这些资源,并通过点击停止所有资源将集群的数据备份保存至您的云帐户。
    Log Level更改集群日志级别。日志级别控制生成的日志详细程度,范围从0-Off(仅记录系统关键消息,不记录其他日志)到4-Medium-High。若需与支持工程师共同诊断集群问题,请提高日志级别以获取更详细信息。高于 3-Medium 的日志级别可能对性能产生负面影响。
    VPC要部署此资源的现有虚拟私有云(VPC)的 ID。
    Subnet

    要部署此资源的现有公共子网的 ID。选择满足将台式计算机(客户端机器)连接至运行于 AWS 的 MATLAB Parallel Server要求的 VPCSubnet。有关详细信息,请参阅为 Cloud Center 配置 AWS 虚拟私有云(VPC)

    Enable Shared Storage选择以启用共享存储。该存储空间由所有工作单元共享,并在集群运行之间持续保持。装载于 /shared/persisted。若启用共享存储,则 MATLAB 作业调度程序数据库将包含在共享存储中。否则,MATLAB 作业调度程序数据库卷将设置为 100 GB。
    Shared Storage Size (GB)在集群中装载的持久化存储的大小(单位:GB)。存储空间的默认最小容量为 32 GB,可扩展至 100 TB。若设置为 0 或小于 100,则不会创建持久化存储。
    Name of SSH Key

    若您尚未拥有密钥,云中心将提示您创建密钥。在该区域启动 EC2 实例需要 SSH 密钥。点击 Create new,在对话框中输入名称,然后点击 Download Key。您的浏览器可能需要您确认位置。您将获得一个扩展名为 .pem 的根访问密钥文件。请将此文件存放在安全位置,因为您无法再次下载它。不过,您随时可以创建新密钥,并下载其密钥文件。您可以为多个集群指定相同的 SSH 密钥。

    若需以 ubuntu(root)身份登录云集群机器,您需要该机器的 SSH 密钥。集群机器没有密码,因此您需要使用密钥通过 SSH 登录。

    若您已有密钥,请从 AWS 帐户指定区域的密钥中选择,或创建新密钥。否则,Cloud Center 将使用先前选定的密钥或 AWS 帐户中按字母顺序排列的首个密钥。

    Default IP Address初始 IP 地址范围,允许从 MATLAB 通过 SSH 连接至此集群。您可以在该字段中添加以逗号分隔的 IP 地址范围列表。IP 地址必须采用无类别域间路由(CIDR)格式表示,即<ip_address>/<mask>。例如10.0.0.1/32。您可以在网上搜索“我的 IP 地址是什么”来查找您的公共 IP 地址。掩码决定了要包含的 IP 地址数量。32 位子网掩码对应单个 IP 地址。您可以使用此计算器构建特定范围:https://www.ipaddressguide.com/cidr。您可能需要联系您的 IT 管理员来确定哪个地址是合适的。
  6. 点击 Start 创建并启动您的集群机器。集群将启动若干台机器(实例),其数量取决于您对工作单元数量及每台机器工作单元数的配置。 Cloud Center 显示集群状态为 Starting

    集群完全启动可能需要数分钟时间。状态指示流程的阶段。要获取任何单个集群机器的状态,请在 Cluster Details 下点击 HeadnodeWorker 扩展器。

    当集群启动并准备就绪时,Cloud Center 将集群状态显示为 Running

提示

要使用新集群进行下一步操作,请从 MATLAB 发现正在运行的集群。请参阅发现集群

此图展示了创建个人集群的集群设置示例。

Create Cluster window with example settings for a personal cluster.

如果集群启动失败,请查看警告图标以获取更多详细信息。通常您可以关闭故障集群并尝试重新启动它。

在本地机器上发现集群

要访问您帐户中创建的运行中集群,请使用来自 MATLAB 的 Discover Clusters。有关详细信息,请参阅发现集群

若您拥有共享集群,可下载集群配置文件并与他人共享。当您的云集群启动或在线时,请通过 Actions 列下的 Download cluster profile 选项或其旁边的三个点下载集群配置文件。与他人共享集群配置文件,以便他们能够通过 MATLAB 和集群配置文件管理器访问该集群。有关详细信息,请参阅导入集群配置文件并访问云集群

另请参阅

主题