什么是深度学习?
我们在"机器如何学习?"视频中介绍了机器学习的基础知识,并说明了机器如何借助神经网络实现智能化。在本文中,我们会更详细地为您介绍各个子领域的应用情况,并以本文的主题为背景为您解释经常出现的各种技术术语:深度学习是机器学习的子领域,而机器学习又被视为人工智能的子领域。
1.人工智能(AI)
AI通常是指由机器(一般是计算机程序)通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域,例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模,有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。
2.机器学习
机器学习是AI的子领域,它由一系列自动程序组成,可以从一组示例数据推演出基本规则,即通过示例数据来"习得"规则。通过应用预定义和可理解的算法和规则,或者使用人工神经网络(如深度学习)就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中,学习的样本数据同时包含输入数据和相应的预期结果(例如分类),而在非监督式学习中,应该由系统来自行确定输入数据可能产生的结果。
3.深度学习
深度学习是一种机器学习方法,它作为人工神经网络可以根据学习过程中的示例数据来独立地构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。
深度学习的工作原理
1.人工神经网络
深度学习使用了某种形式的人工神经网络(ANN)技术,因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为推理"。在推理时,ANN会根据习得的规则对所提供的数据进行评估。例如,可以评估输入的图像中的物体是否存在缺陷。
2.神经元、层和连接
ANN由多个互相连接的"神经元"层组成。以最简单的情况为例,这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值,并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重,可以在结果矩阵中生成相应的值。
3.深度人工神经网络
"深度学习"一词指的是对深度ANN进行的训练。除了输入层和输出层外,在深度ANN的可见层之间还存在成百上千个用于输入和输出的"隐藏层"。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此,只由最后一层的输出矩阵来提供结果。
4.训练
在训练ANN时,最初的焦点是随机设置的,然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现(即结果评估的精度)在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据,则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练,那么在遇到与示例数据不同的数据时,ANN就会无法对字段进行估算。这种情况叫做ANN的"过拟合"(Overfitting)。
我可以使用深度学习技术做什么?
无论形状大小如何,曲奇饼干都是大家都喜爱的食物。这个曲奇饼干的例子将向您展示深度学习技术的工作原理。深度学习的应用领域非常多样化。特别是在机器视觉领域,深度学习技术是一种广泛应用的方法,可适用于各种任务。在可视化领域,需要深度学习技术的常见任务可能是图像分析分类以及图像数据分割。
1.图像分类
在图像分类应用中要将图像分配为不同的类别,例如区分有缺陷的组件与无缺陷组件,并根据不同类型的缺陷对图像进行排序,或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中,图像分类技术将检查所有饼干是否完好无损。
2.图像分割和物体识别
图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体,例如可以识别购物篮中的不同水果,或识别交通系统中的路标、道路和的人员。此外,我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。
3.图像处理
深度学习技术还可用于处理和优化图像数据,例如,它能消除图像的干扰噪声或补偿光学透镜造成的干扰。