主要内容

本页采用了机器翻译。点击此处可查看最新英文版本。

作业监控程序

作业监控程序显示由您选择的集群配置文件确定的调度器队列中的作业。从 MATLAB® 桌面的主页选项卡上的环境部分中,选择 并行 > 监控作业,打开作业监控程序。

The Job Monitor displays a single job containing one task, with state "Finished".

作业监控程序列出了所选配置文件中指定的集群中存在的所有作业。您可以选择任何一个配置文件(当前会话集群配置文件管理器中可用的配置文件),以及是否显示所有用户的作业或仅显示您自己的作业。

典型用例

作业监控程序让您实现与作业跟踪和队列管理相关的许多不同目标。使用作业监控程序,您可以:

  • 发现并监控特定用户提交的所有作业

  • 确定作业的状态

  • 确定作业中错误的原因

  • 删除不再需要的旧作业

  • 在 MATLAB 中创建一个作业对象,以访问队列中的特定作业

使用作业监控程序管理作业

使用作业监控程序,您可以管理集群的列出的作业。右键点击列表中的任意作业,然后从上下文菜单中选择以下任一选项。可用的选项取决于作业类型。

  • 取消 - 停止正在运行的作业并将其状态更改为 'finished'。如果作业处于待处理或排队状态,则状态将更改为 'finished',但不会运行。这与作业的命令行 cancel 函数相同。

  • 删除 - 删除作业数据并从队列中移除该作业。这与作业的命令行 delete 函数相同。还关闭并删除交互式池作业。

  • 显示详细信息 - 在命令行窗口中显示有关该作业的详细信息。

  • 显示错误 - 显示该作业中产生错误的所有任务及其错误属性。

  • 获取输出 - 这将把作业中的所有任务输出参量收集到客户端工作区中。

使用作业监控程序识别任务错误

由于作业监控程序可以指示某项作业是否有运行时错误,因此您可以使用它来识别在该作业中生成错误的任务。例如,以下脚本会生成错误,因为它尝试对向量执行矩阵求逆:

A = [2 4 6 8];
B = inv(A);

如果将此脚本保存在名为 invert_me.m 的文件中,则可以尝试在默认集群上将该脚本作为批处理作业运行:

batch('invert_me')

在作业运行后更新时,作业监控程序包括由 batch 命令创建的作业,以及该作业的错误图标 ()。右键点击列表中的作业,然后选择显示错误。对于该作业中所有出现错误的任务,任务信息(包括与错误相关的属性)都会显示在 MATLAB 命令窗口中:

 Task with properties: 

                   ID: 1
                State: finished
             Function: @parallel.internal.cluster.executeScript
               Parent: Job 8
        StartDateTime: 12-Feb-2021 09:29:02
     RunningDuration: 0 days 0h 0m 2s

                Error: Matrix must be square.
          Error Stack: invert_me (line 2)
             Warnings: none