机器学习运营 (MLOps)

什么是 MLOps

机器学习运营 (MLOps) 是一套重点管理机器学习模型的整个生命周期的做法。随着越来越多的组织依赖机器学习来实现数据和技术驱动的应用,最初以模型开发和部署为重点已扩展到包括持续监控和更新。

MLOps 将开发的设计、编译和测试活动与运营的部署、维护和监控活动关联起来,形成一个连续反馈的回路,从而简化了将机器学习模型纳入生产的过程。MLOps 的协作性和跨职能性意味着它通常需要数据科学家、工程师和 IT 专业人员团队等多方人员参与。

示意图:MLOps 生命周期,涵盖机器学习模型的开发以及持续监控和维护的运营。

MLOps 生命周期。

MLOps 和开发运营一体化有什么区别?MLOps 和开发运营一体化都致力于简化将软件开发纳入生产的过程,并涉及开发团队和运营团队之间的协作。不过,MLOps 的重点是机器学习模型的完整生命周期。

MLOps 为何重要

MLOps 能够将棘手的机器学习周期自动化过程简化。自动化还需要执行其他步骤:监控和评估模型性能,将该评估的结果纳入性能更好的模型中,然后重新部署新模型。MLOps 在将机器学习生产化能够带来显著的好处:减少错误,使团队之间更容易交接,并能持续改进 AI 系统。

MLOps 在以下的应用中特别有用:

使用 MATLAB 自动化 MLOps

使用 MATLAB®Simulink® 使您能够自动化 MLOps 流程。

  • 创建机器学习模型 - 使用预置的函数和专用 App 来选择设计功能,并为 classification、regression 和聚类创建机器学习模型。
并排显示的分类学习器和回归学习器的截图,显示创建机器学习模型和可视化分类和回归结果的步骤。

专用 MATLAB App(分类学习器回归学习器),用于以交互方式探查数据、选择特征以及训练、比较和评估机器学习模型。

  • 您可以使用 AutoML 来自动化 MLOps 的模型设计。对于深度学习,您可以从 MATLAB 或开源资源中获得预训练模型
  • 对 AI 系统进行仿真 - 使用专用模块,例如 SVM 分类模块目标检测模块,将机器学习模型集成到 AI 系统中,并在将其部署到生产之前对整个 AI 系统进行仿真。
  • 使用 CI 进行编译和测试 - 使用不同持续集成 (CI) 平台(例如 Azure® DevOps、Jenkins®)或您自己的 CI 服务器来运行 MATLAB 代码和对 Simulink 系统进行仿真。CI 支持代码和系统的自动编译和测试,团队之间的协作,以及在 MLOps 周期的早期检测集成问题。
  • 部署到生产中 - 将 MATLAB 机器学习模型部署到 MATLAB Production Server™ 中,而无需创建新代码或自定义基础架构。之后,多个用户可以自动访问部署的 MATLAB 模型的最新版本。
  • 监控运营 - 一旦您的机器学习模型投入到生产中,您就可以监控其性能并提供反馈。例如,使用漂移检测将观测的数据与训练数据进行比较,确定何时需要重新训练。