作业监控程序
作业监控程序显示由您选择的集群配置文件确定的调度器队列中的作业。从 MATLAB® 桌面的主页选项卡上的环境部分中,选择 并行 > 监控作业,打开作业监控程序。
作业监控程序列出了所选配置文件中指定的集群中存在的所有作业。您可以选择任何一个配置文件(当前会话集群配置文件管理器中可用的配置文件),以及是否显示所有用户的作业或仅显示您自己的作业。
典型用例
作业监控程序让您实现与作业跟踪和队列管理相关的许多不同目标。使用作业监控程序,您可以:
发现并监控特定用户提交的所有作业
确定作业的状态
确定作业中错误的原因
删除不再需要的旧作业
在 MATLAB 中创建一个作业对象,以访问队列中的特定作业
使用作业监控程序管理作业
使用作业监控程序,您可以管理集群的列出的作业。右键点击列表中的任意作业,然后从上下文菜单中选择以下任一选项。可用的选项取决于作业类型。
使用作业监控程序识别任务错误
由于作业监控程序可以指示某项作业是否有运行时错误,因此您可以使用它来识别在该作业中生成错误的任务。例如,以下脚本会生成错误,因为它尝试对向量执行矩阵求逆:
A = [2 4 6 8]; B = inv(A);
如果将此脚本保存在名为 invert_me.m
的文件中,则可以尝试在默认集群上将该脚本作为批处理作业运行:
batch('invert_me')
在作业运行后更新时,作业监控程序包括由 batch
命令创建的作业,以及该作业的错误图标 ()。右键点击列表中的作业,然后选择显示错误。对于该作业中所有出现错误的任务,任务信息(包括与错误相关的属性)都会显示在 MATLAB 命令窗口中:
Task with properties: ID: 1 State: finished Function: @parallel.internal.cluster.executeScript Parent: Job 8 StartDateTime: 12-Feb-2021 09:29:02 RunningDuration: 0 days 0h 0m 2s Error: Matrix must be square. Error Stack: invert_me (line 2) Warnings: none