主要内容

本页翻译不是最新的。点击此处可查看最新英文版本。

实例分割

使用预训练的深度学习网络执行实例分割,并使用迁移学习基于自定义数据训练网络

实例分割是一种计算机视觉方法,它在执行需要精确目标定位和识别单个目标实例的任务中起着至关重要的作用,例如医学成像和自动驾驶任务。通过结合目标检测和语义分割的原理,实例分割可识别单个目标实例并逐像素描绘其边界,从而让您能够更精准地理解视觉数据。使用实例分割精确地识别、分类和分离图像中的单个目标。

您可以使用预训练的深度学习网络对图像运行推断,也可以使用迁移学习来训练网络。迁移学习是一种方法,通过这种方法,您可以从预训练网络开始,并根据您的应用基于自定义数据集对其进行训练。您可以使用图像标注器视频标注器真实值标注器 (Automated Driving Toolbox)来标注像素并导出标签数据,从而以交互方式生成用于训练的真实值数据。实例分割需要 Deep Learning Toolbox™。训练和推断支持支持 CUDA® 的 GPU。推荐使用 GPU,并且需要有 Parallel Computing Toolbox™。有关详细信息,请参阅MathWorks 产品中的并行计算支持 (Parallel Computing Toolbox)

Instance segmentation using SOLOv2: Left — segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — segmented image of PVC pipe connectors

函数

全部展开

配置实例分割网络

solov2Segment objects using SOLOv2 instance segmentation network (自 R2023b 起)
maskrcnnDetect objects using Mask R-CNN instance segmentation (自 R2021b 起)

执行推断

segmentObjectsSegment objects using Mask R-CNN instance segmentation (自 R2021b 起)
segmentObjectsSegment objects using SOLOv2 instance segmentation (自 R2023b 起)

加载训练数据

boxLabelDatastoreDatastore for bounding box label data
groundTruthGround truth label data
imageDatastore图像数据的数据存储
combine合并来自多个数据存储的数据

训练实例分割网络

trainSOLOV2Train SOLOv2 network to perform instance segmentation (自 R2023b 起)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (自 R2022a 起)

增强和预处理训练数据

poly2mask将感兴趣的区域 (ROI) 多边形转换为区域掩膜
bwboundaries跟踪二值图像中的目标边界
balanceBoxLabelsBalance bounding box labels for object detection
bboxcropCrop bounding boxes
bboxeraseRemove bounding boxes (自 R2021a 起)
bboxresizeResize bounding boxes
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarp对图像应用几何变换
imcrop裁剪图像
imresize调整图像大小
randomAffine2dCreate randomized 2-D affine transformation
centerCropWindow2dCreate rectangular center cropping window
randomWindow2dRandomly select rectangular region in image (自 R2021a 起)
insertObjectMask Insert masks in image or video stream
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertShapeInsert shapes in image or video
showShapeDisplay shapes on image, video, or point cloud
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (自 R2022b 起)
instanceSegmentationMetricsInstance segmentation quality metrics (自 R2022b 起)
metricsByAreaEvaluate instance segmentation across object mask size ranges (自 R2023b 起)
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (自 R2024a 起)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (自 R2024a 起)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (自 R2024a 起)

主题

快速入门

训练用于实例分割的数据

精选示例