深度学习

 

将深度学习用于计算机视觉

语义分割、目标检测和图像识别。集成深度学习的计算机视觉应用可借助深度学习提升其高级算法的准确度。在 MATLAB® 中,您可以设计和创建深度学习模型,并将其与计算机视觉应用相集成。

以下功能专为计算机视觉设计,可帮助您轻松上手:

  • 图像和视频标注应用程序
  • 图像数据存储,可处理大量数据以用于训练、测试和验证
  • 专门针对图像和计算机视觉的预处理技术
  • 支持从 TensorFlow™-Keras 和 PyTorch 导入深度学习模型以进行图像识别

探索工作流程

借助 MATLAB 工具,构建将深度学习用于计算机视觉的自定义工作流程。

数据准备

访问

使用 ImageDatastore 轻松快速访问和管理大量数据。

合成

深度学习中所做的各种处理都是为了获取综合全面的数据来构建精确的模型。通过数据增强,工程师能够增加训练算法可用的样本和样本变体数量。借助图像数据增强技术,您可以在训练图像中纳入其旋转和缩放变体,由此获得更多训练图像,从而实现稳健分类。

标注和预处理

图像和视频标注包括像素标注和目标关注区域 (ROI),相比手工标注可节省大量时间。在训练网络之前,您可以先使用图像处理工具对图像进行剪裁、去模糊、亮化和增强。

了解更多

网络设计、训练和评估

交互式设计网络,使用 NVIDIA® GPU 加速训练,更快获得理想的结果。

设计

使用 ONNX™ 导入预训练的模型,然后使用 Deep Network Designer 应用程序添加、删除或重新组织层。

训练

无论您是使用单个 GPU、多个 GPU、云还是 NVIDIA DGX,只需一行 MATLAB 代码,即可支持多 GPU 训练。

评估

在任意时间点了解您的网络表现。

  • 训练前:使用网络分析器分析网络各层并确保层输入/输出兼容性。
  • 训练中:在网络训练时图形化显示验证准确度,并可随时停止训练。

了解更多

部署

将深度学习模型部署到各类平台 -- 自动生成代码以在 ARM® 和 Intel® MKL-DNN 上本地运行。导入深度学习模型,并针对 TensorRT 和 CuDNN 库生成 CUDA® 代码。

了解更多

将深度学习用于计算机视觉的示例

MATLAB 为特定的深度学习应用提供专门工具,例如:

语义分割

语义分割的作用是将每个像素都标注到一个类别。这是自动驾驶和医学图像处理中的关键技术。

目标检测

目标检测使用分类技术(如 YOLO v2 和 Faster-RCNN)识别场景中的物体。

图像和视频分类

使用最新的研究模型和迁移学习技术识别图像和视频中的物体。

三维数据

MATLAB 支持稀疏和稠密三维数据技术,从而实现三维数据处理。具体应用包括 Lidar 分类和医学图像三维堆叠。

有关将深度学习用于计算机视觉的更多内容