管理和访问 MATLAB 作业调度器作业历史记录
MATLAB® 作业调度器集群可以保存作业历史记录数据。您可以使用作业历史数据来深入了解集群的使用情况。
启用保存作业历史记录
MATLAB 作业调度器集群与 MATLAB Parallel Server™ 版本 R2024a 或更高版本默认保存作业历史记录数据。要受益于作业历史记录保存,请将集群的 MATLAB Parallel Server 版本更新到 R2024a 版本或更高版本。
您可以使用 mjs_def 文件中的 SAVE_JOB_HISTORY 参数控制作业历史记录数据的保存。有关 mjs_def 文件的更多信息,请参阅定义 MATLAB 作业调度器启动参数。
管理作业历史记录文件
MATLAB 作业调度器将作业历史记录数据保存到头节点上的 CHECKPOINTBASE 位置的 job_history 文件夹中。检查 mjs_def 文件以找到检查点文件夹的位置。
调度器将作业历史记录数据保存到一组十个轮换的 CSV 文件中,文件名编号为 0 到 9。每个 CSV 文件的大小限制为 1 GB。默认情况下,当活动作业历史记录 CSV 文件 job_history.0.csv 的大小达到 1 GB 时,调度器会将该文件归档为 job_history.1.csv,并继续写入新的 job_history.0.csv 文件。同时,调度器删除最旧的文件 job_history.9.csv,并将现有的作业历史记录文件重命名为:job_history.1.csv 变为 job_history.2.csv,job_history.2.csv 变为 job_history.3.csv,以此类推,直到 job_history.8.csv 变为 job_history.9.csv。数据库文件夹中所有十个文件的总大小不得超过 10 GB。
在设置作业历史记录保存时,如果调度器遇到任何问题,例如无法创建文件或写入磁盘,则 startjobmanager 命令将返回错误。
读取作业历史记录文件
文件系统权限仅允许 admin 用户访问作业历史记录文件。
每个作业历史记录条目对应一项任务的已完成执行。以下是一个作业历史记录 CSV 文件的片段。
User,Version,Mode,Type,Job,Task,Attempt,Start,Duration,State,Worker,Host user2,R2024a,batch,independent,1,1,1,1697120886.345,45.868,finished,mjs-worker-1,wkr1hostid user5,R2024a,interactive,parpool,2,39,1,1697121035.862,72.551,finished,mjs-worker-25,wkr25hostid user5,R2024a,interactive,parpool,2,115,1,1697121035.862,72.49,finished,mjs-worker-94,wkr94hostid user5,R2024a,interactive,parpool,2,2,1,1697121035.862,72.613,finished,mjs-worker-10,wkr10hostid user5,R2024a,interactive,parpool,2,3,1,1697121035.862,72.621,finished,mjs-worker-100,wkr100hostid user5,R2024a,interactive,parpool,2,40,1,1697121035.862,72.585,finished,mjs-worker-26,wkr26hostid
此表列出了作业历史记录 CSV 文件中包含的数据。
| 数据名称 | 数据类型 | 描述 |
|---|---|---|
| 用户 | 字符串 | 任务所有者 |
| 版本 | 字符串 | MATLAB 版本的任务,例如 R2024a |
| 模式 | 字符串 | 与任务关联的作业的执行模式。可能的值包括:
|
| 类型 | 字符串 | 与任务相关的作业类型。可能的值包括:
|
| 作业 | 整数 | 与任务相关的作业的 ID 编号 |
| 任务 | 整数 | 任务的 ID 编号 |
| 尝试次数 | 整数 | 任务尝试次数 |
| 开始时间 | 双精度 | 任务的开始时间,以自 1970 年 1 月 1 日 00:00:00 UTC 以来经过的秒数表示。 |
| 持续时间 | 双精度 | 任务持续时间,以秒为单位。 |
| 状态 | 字符串 | 任务的完成状态。可能的值包括:
|
| 工作单元 | 字符串 | 运行任务的工作单元名称 |
| 主机 | 字符串 | 运行任务的工作单元的主机 |
您可以使用任何可以读取 CSV 文件的程序来查看、提取和分析作业历史记录文件中的数据。