Computer Vision Toolbox

设计和测试计算机视觉、3D 视觉和视频处理系统

 

Computer Vision Toolbox™ 为计算机视觉、3D 视觉和视频处理系统的设计和测试提供算法、函数和应用程序。您可以执行对象检测和跟踪,以及特征检测、提取和匹配。对于 3D 视觉,该工具箱支持单相机、立体相机和鱼眼相机校准;立体视觉;3D 重建;激光雷达及 3D 点云处理。计算机视觉应用程序可自动执行地面实况标注和相机校准工作流程。

您可以使用深度学习和机器学习算法(如 YOLO v2、Faster R-CNN 和 ACF)训练自定义的对象检测器。对于语义分割,您可以使用 SegNet、U-Net 和 DeepLab 等深度学习算法。预训练模型可以检测面部、行人及其他常见物体。

可通过在多核处理器和 GPU 上运行算法来加速算法。大多数工具箱算法都支持 C/C++ 代码生成,以便与现有代码、桌面原型设计及嵌入式视觉系统部署集成。

开始:

深度学习和机器学习

使用深度学习和机器学习来检测、识别和分割对象。

对象检测与识别

用于训练、评估和部署对象检测器的框架,例如 YOLO v2、Faster R-CNN、ACF 和 Viola-Jones。对象识别功能包括视觉词袋和 OCR。预训练模型可以检测面部、行人和其他常见物体。

使用 Faster R-CNN 进行对象检测。 

语义分割

通过使用诸如 SegNet、FCN、U-Net 和 DeepLab v3+ 等网络,对各个像素和体素进行分类,以分割图像和三维体。

地面实况标注

使用 Video Labeler 和 Image Labeler 应用程序,自动做标注供对象检测、语义分割和场景分类。

使用 Video Labeler 应用程序标注地面实况。

激光雷达和 3D 点云处理

借助激光雷达或 3D 点云数据,对几何形状进行分割、聚类、下采样、去噪、配准和拟合。

激光雷达和点云 I/O

从文件、激光雷达和 RGB-D 传感器中读取、写入和显示点云。

点云配准

使用正态分布变换 (NDT)、迭代最近点 (ICP) 和相干点漂移 (CPD) 算法配准 3D 点云。

配准和拼接一系列点云。

分割和形状拟合

将点云分割成聚簇并使几何形状拟合到点云。分割激光雷达数据中的地平面,以用于自动驾驶和机器人应用。

分割的激光雷达点云。

相机校准

估算相机的内在、外在和镜头失真参数。

单相机校准

使用 Camera Calibrator 应用程序自动检测棋盘格并校准针孔和鱼眼相机。

立体相机校准

校准立体像对,以计算深度并重建 3D 场景。

Stereo Camera Calibrator 应用程序。

3D 视觉和立体视觉

从多个 2D 视图中提取场景的 3D 结构。使用视觉测距估计相机运动和姿势。

表示相对深度的立体视差图。

特征检测、提取和匹配

用于对象检测、图像配准和对象识别的基于特征的工作流程。

使用点特征检测、提取和匹配,检测杂乱场景中的对象。

基于特征的图像配准

在多个图像中匹配特征,以估计图像之间的几何变换并配准图像序列。

使用基于特征的配准创建的全景。

对象跟踪和运动估计

估计视频和图像序列中的运动并跟踪对象。

使用固定相机检测移动物体。

OpenCV 接口

将 MATLAB 与基于 OpenCV 的项目对接。

代码生成

将算法开发与快速原型设计、实施和验证工作流程集成在一起。

最新特性

Video and Image Labeler

复制粘贴像素标签;改进平移与缩放操作;改进帧导航;Image Labeler 新增线状 ROI、标签属性以及子标签功能

对象检测器的数据增强

对图像和边界框进行变换

语义分割

用 DeepLab v3+ 和 3D U-Net 网络,对图像和三维体中的每个像素进行分类

深度学习对象检测

执行 Faster R-CNN 端到端训练、定位框估计,以及使用多信道图像数据

深度学习加速

用 MEX 加速优化 YOLO v2 和语义分割

关于这些特性和相应函数的详细信息,请参阅发行说明

获取免费试用版

30 天探索触手可及。

马上下载

准备购买?

获取详细价格和并探索相关产品。

您是学生吗?

获得 MATLAB 和 Simulink 学生版软件。

了解更多