什么是深度学习?深度学习是当今的热门话题,并且已经在众多行业中扎根,这些行业正在投资人工智能,大数据和分析等领域。例如,谷歌在其语音和图像识别算法中使用深度学习,而Netflix和亚马逊正在使用它来了解其客户的行为。事实上,你不会相信它,但麻省理工学院的研究人员正试图用深度学习来预测未来。现在,想象一下深度学习在彻底改变世界方面有多大的潜力,以及公司如何在深度学习中寻找经过认证的专业人士。在谈论深度学习之前,必须要了解它与机器学习和人工智能的关系。理解这种关系的最简单方法是通过下面的图表:
在这里,您可以在图像中看到机器学习是AI的一个子集。这意味着我们可以构建智能机器,可以根据自己提供的数据集进行学习。此外,您会注意到深度学习是机器学习的一个子集,其中类似的机器学习算法用于训练深度神经网络,以便在前者未达到标记的情况下获得更好的准确性。下面我要在此深学习教程中讨论的主题:
- 人工智能
- 机器学习
- ML的缺点
- 什么是深度学习?
- 深度学习应用
人工智能
AI这个词由John McCarthy于1956年创造,John McCarthy也被称为人工智能之父。人工智能背后的想法相当简单而又引人入胜,这就是制造可以自行决策的智能机器。您可能认为它是一种科学幻想,但就技术和计算能力的最新发展而言,这个想法似乎日益接近现实。
机器学习:迈向人工智能的一步
现在,您熟悉AI,让我们简单地谈谈机器学习,并了解当我们说我们正在编程机器学习时它意味着什么。让我们从一个非常着名的机器学习定义开始:
“据说,一个计算机程序从经验E中学习一些任务T和一些性能度量P,如果它在T上的性能(用P度量)随着经验E而提高的话。” – 卡内基梅隆大学Tom Mitchell
因此,如果您希望程序预测繁忙交叉口的交通模式(任务T),您可以通过机器学习算法运行它,其中包含有关过去交通模式的数据(经验E)。现在,预测的准确性(性能测量P)将取决于程序是否已成功从数据集中学习的事实(经验E)。
基本上,机器学习被称为一种人工智能(AI),它为计算机提供了学习的能力,而无需通过将它们暴露于大量数据而进行明确编程。机器学习背后的核心原则是从数据集中学习,并尽量减少错误或最大化其预测成真的可能性。
机器学习的缺点
- 传统的ML算法在处理高维数据时没有用处,也就是我们拥有大量输入和输出的地方。例如,在手写识别的情况下,我们有大量的输入,其中我们将具有与不同类型的手写相关联的不同类型的输入。
- 第二个主要挑战是告诉计算机它应该寻找哪些功能,这些功能将在预测结果方面发挥重要作用,同时在实现这一目标时实现更高的准确性。这个过程称为特征提取。
向算法提供原始数据很少能够工作,这就是为什么特征提取是传统机器学习工作流程的关键部分的原因。因此,如果没有特征提取,程序员面临的挑战就会增加,因为算法的有效性在很大程度上取决于程序员的洞察力。因此,将这些机器学习模型或算法应用于诸如对象识别,手写识别,NLP(自然语言处理)等复杂问题是非常困难的。
深度学习
深度学习是我们克服特征提取挑战的唯一方法之一。这是因为深度学习模型能够学习自己专注于正确的功能,几乎不需要程序员的指导。基本上,深度学习模仿了我们大脑的运作方式,即它从经验中学习。如你所知,我们的大脑由数十亿个神经元组成,这些神经元可以让我们做出惊人的事情。即使是一岁大的孩子的大脑也可以解决即使使用超级计算机也很难解决的复杂问题。例如:
- 认识到父母和不同物体的面貌。
- 分不同的声音,甚至可以根据他/她的声音识别特定的人。
- 从其他人的面部姿势等方面得出推论。
实际上,多年来我们的大脑已经不自觉地训练自己去做这些事情。现在,问题来了,深度学习模仿大脑的功能? 嗯,深度学习使用人工神经元的概念,其功能与我们大脑中存在的生物神经元类似。因此,我们可以说深度学习是机器 学习的 一个子领域,涉及受大脑结构和功能启发的算法,称为人工神经网络。
现在,让我们举一个例子来理解它。假设我们想要制作一个能够识别图像中不同人物面部的系统。 如果我们将此解决为典型的机器学习问题,我们将定义面部特征,例如眼睛,鼻子,耳朵等,然后,系统将识别哪些特征对于哪个人本身更重要。
现在,深度学习领先一步。由于深度神经网络,深度学习会自动找出对分类很重要的特征,而在机器学习的情况下,我们必须手动定义这些特征。
图: 使用Deep Networks进行人脸识别
如上图所示,深度学习的工作原理如下:
- 在最低级别,网络固定局部对比度的模式同样重要。
- 然后,下面的图层可以使用局部对比度的图案来固定类似眼睛,鼻子和嘴巴的东西
- 最后,顶层能够将这些面部特征应用于面部模板。
- 深度神经网络能够在其每个连续层中组成越来越复杂的特征。
你有没有想过Facebook如何自动标记或标记你上传的图像中的所有人?好吧,Facebook以与上例中所述类似的方式使用深度学习。现在,您已经意识到深度学习的能力以及在我们对可能影响结果的所有特征一无所知的情况下它如何能够超越机器学习。因此,Deep网络可以通过从没有适当标签的输入数据组成的数据集中得出推论来克服机器学习的缺点。
深度学习的应用
让我们看一下深度学习的一些现实应用,以了解它的真正力量。
- 语音识别
你们所有人都会听说过Siri,这是Apple的语音控制智能助手。与其他大型巨头一样,Apple也开始投资深度学习,以提供比以往更好的服务。
在像Siri这样的语音识别和语音控制智能助手领域,人们可以使用深度神经网络开发更准确的声学模型,并且目前是深度学习实施最活跃的领域之一。简单来说,您可以构建这样的系统,可以学习新功能或根据您自己进行调整,从而通过预先预测所有可能性来提供更好的帮助。 -
自动机器翻译
我们都知道谷歌可以即时翻译100种不同的人类语言,这种语言就像魔法一样快速。Google Translate背后的技术称为机器翻译并且因为说话语言不同而成为不能相互交流的人的救星。现在,你会认为这个功能已存在很长时间了,所以,这有什么新东西?让我告诉你,在过去两年中,在深度学习的帮助下,谷歌完全改革了谷歌翻译中的机器翻译方法。事实上,对语言翻译几乎一无所知的深度学习研究人员正在提出相对简单的机器学习解决方案,这些解决方案正在击败世界上最好的专家构建的语言翻译系统。可以在不对序列进行任何预处理的情况下执行文本转换,从而允许算法学习单词之间的依赖关系以及它们与新语言的映射。 -
即时视觉翻译
如您所知,深度学习用于识别具有字母的图像以及字母在场景中的位置。识别后,可以将它们转换为文本,翻译并使用翻译后的文本重新创建图像。这通常被称为即时视觉翻译。
现在,想象一下您访问过任何其他国家/地区语言未知的国家/地区。好吧,不用担心,使用谷歌翻译等各种应用程序,您可以继续进行即时视觉翻译,阅读用其他语言编写的标志或商店板。这仅仅是因为深度学习才有可能。
注意:您可以继续下载Google翻译应用程序,并使用上面的图像查看令人惊叹的即时视觉翻译。
- 行为:自动驾驶汽车
谷歌正试图通过深度学习将他们的自动驾驶汽车计划(称为WAYMO)提升到一个全新的完美水平。因此,他们现在可以使用不同传感器提供的数据来编程可以自行学习的系统,而不是使用旧的手工编码算法。深度学习现在是大多数感知任务以及许多低级控制任务的最佳方法。因此,现在即使不知道开车或残疾的人也可以继续前行而不依赖其他人。
在这里,我只提到了一些着名的现实使用案例,其中深度学习被广泛使用并显示出有希望的结果。深度学习还有许多其他应用以及许多尚待探索的领域。
所以,这就是深入学习。我相信到现在为止,您已经意识到机器学习和深度学习之间的区别,以及深度学习如何对各种现实应用非常有用。现在,在深度学习教程系列的后续文章中,我们将深入探讨深度学习的各种概念和算法及其应用程序的详细信息。