源于实践的 6 大 AI 应用方向
AI 技术蕴藏的巨大可能使我们在不经意间忽略了一个简单的事实:将多种机器学习算法用于一个系统的不同部分,就能构成我们所说的 AI。以下幻灯片将介绍可以使用 AI 完成的六项基本任务,以及相关示例与常见算法。这些任务用到了强化学习、深度学习和传统机器学习方法,同时也是许多现代 AI 应用的基石。
-
增强图像和信号
应用:改善图像分辨率、音频信号去噪、创建增强图像
输入:图像和信号数据
常见算法:LSTM、CNN、VDSR 神经网络
示例:执行图像间的域转换。白天/黄昏图像转换示例使用了无监督的图像到图像转换网络。
-
识别图像、视频以及信号数据中的目标或动作
应用:带有目标检测的高级驾驶辅助系统 (ADAS)、语义分割、机器人、图像识别计算机视觉感知、活动检测、语音生物识别(声纹)、关键词检测、智能设备
输入:图像、视频、信号
常见算法:CNN 和 YOLO、聚类、Viola-Jones
示例:对街道图像中的所有像素进行分类。使用深度学习进行语义分割示例使用了 Deeplab v3+ [1] CNN。
-
在现实或仿真中移动对象
应用:控制系统、制造机器人、自动驾驶汽车、无人机、视频游戏
输入:数学模型、传感器数据、视频、激光雷达数据
常见算法:强化学习、人工神经网络 (ANN)、CNN、循环神经网络 (RNN)
示例:进行路径规划以确定前往目的地的最佳可能路线。GitHub 上的弹球游戏 (Pong) 示例使用了强化学习。
-
基于历史和当前数据预测输出
应用:预测性维护、金融交易
输入:传感器数据、带时间戳的金融数据、数值数据
常见算法:线性回归、决策树、支持向量机 (SVM)、神经网络
示例:使用来自电机的实时传感器数据预测旋转机械的剩余使用寿命。基于相似性的剩余使用寿命估计示例使用了线性回归。
-
合成图像、信号以及文本
应用:生成故障数据、增大训练集、进行音频增强试验
输入:图像、信号以及文本数据
常见算法:GAN、自编码器
示例:使用现有数据创建全新类型的花卉图像。训练生成对抗网络示例使用了一个包含两个网络的 GAN,一个生成器 (Generator) 用于创建图像,另一个判别器 (Discriminator) 将图像分类为“真实”或“生成”。
-
揭示趋势、情绪、欺诈或威胁
应用:安全记录、市场或医疗研究、情绪分析、网络安全、文档摘要、推荐系统的自然语言处理
输入:流式文本数据、静态文本数据
常见算法:RNN、线性回归、SVM、朴素贝叶斯、隐含狄利克雷分布 (LDA)、潜在语义分析、word2vec
示例:确定文本数据中出现了多少主题。使用主题模型分析文本数据示例使用了 LDA 主题模型。
-
自行尝试
选择网站
选择网站以获取翻译的可用内容,以及查看当地活动和优惠。根据您的位置,我们建议您选择:。
您也可以从以下列表中选择网站:
如何获得最佳网站性能
选择中国网站(中文或英文)以获得最佳网站性能。其他 MathWorks 国家/地区网站并未针对您所在位置的访问进行优化。
美洲
- América Latina (Español)
- Canada (English)
- United States (English)
欧洲
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)