Computer Vision Toolbox™ 提供多种算法、函数和 App,可用于设计和测试计算机视觉、三维视觉和视频处理系统。您可以执行目标检测和跟踪,以及特征检测、提取和匹配。您可以自动化单目相机、立体相机和鱼眼相机的标定工作流。对于三维视觉,该工具箱支持视觉和点云 SLAM、立体视觉、基于运动进行构建和点云处理。各种计算机视觉 App 可自动执行真值标注和相机标定工作流程。
您可以使用 YOLO v2、SSD 和 ACF 等深度学习和机器学习算法训练自定义目标检测器。对于语义和实例分割,您可以使用深度学习算法,例如 U-Net 和 Mask R-CNN。该工具箱提供目标检测和分割算法,用于分析太大而无法放入内存的图像。使用预训练模型,您可以检测面部、行人及其他常见目标。
您可以在多核处理器和 GPU 上运行算法以实现加速。工具箱算法支持 C/C++ 代码生成,以便集成到现有代码、桌面原型以及嵌入式视觉系统部署。
开始:
了解其他用户如何使用 Computer Vision Toolbox
目标检测与识别
训练、评估和部署目标检测器,例如 YOLO v2、Faster R-CNN、ACF 和 Viola-Jones。使用视觉词袋和 OCR 进行目标识别。使用预训练模型来检测面部、行人和其他常见目标。
语义分割
使用 SegNet、FCN、U-Net 和 DeepLab v3+ 等网络,对各个像素和体素进行分类,以分割图像和三维体。使用实例分割来生成分割地图并检测目标的唯一实例。
真值标注
使用视频标注器和图像标注器进行自动标注,以用于目标检测、语义分割、实例分割和场景分类。
立体相机标定
标定立体相机组,以计算深度并重建三维场景。
激光雷达和三维点云处理
借助激光雷达或三维点云数据,对几何形状进行分割、聚类、下采样、去噪、配准和拟合。 Lidar Toolbox™ 还针对激光雷达处理系统的设计、分析和测试提供了更多功能。
点云配准
使用正态分布变换 (NDT)、迭代最近点 (ICP) 和相干点漂移 (CPD) 算法配准三维点云。
特征检测、提取和匹配
在多个图像中检测、提取和匹配感兴趣的特征,例如斑点、边缘和角落。
基于特征的图像配准
在多个图像中匹配特征,以估计图像之间的几何变换并配准图像序列。
目标跟踪
跟踪视频序列中帧与帧之间的目标轨迹。
代码生成
为工具箱函数、类、System object 和模块生成 C/C++ 代码、CUDA 代码和 MEX 函数。