什么是深度学习

姚震玛
导读 如果您的组织正在广泛使用人工智能(AI) 和机器学习(ML),那么您很有可能正在开展一些深度学习项目。最近对深度学习的兴趣激增,它已成为许

如果您的组织正在广泛使用人工智能(AI) 和机器学习(ML),那么您很有可能正在开展一些深度学习项目。最近对深度学习的兴趣激增,它已成为许多不同行业的关键推动力。

行业报告反映了这种对深度学习的高涨兴趣。回顾几年前,​​2018 年一份题为“公司如何通过深度学习将人工智能应用于工作”的报告发现,只有 28% 的受访企业正在使用深度学习。但最近的企业 2021 人工智能采用调查发现,使用深度学习的受访者比例增加了一倍多,达到 67%。

您还可以在支出中看到越来越多地使用深度学习。Gartner 并未具体列出深度学习方面的支出,但它预测2022 年人工智能市场总额将达到 625 亿美元。这比 20221 年的 515 亿美元增长了 21.3%。

Grand View Research表示,仅人工智能市场的深度学习部分在 2021 年就价值 348 亿美元。它估计,从 2022 年到 2030 年,支出将以每年 34.3% 以上的速度增长。

显然,深度学习正在成为大生意。但究竟什么是深度学习?

深度学习、机器学习和人工智能

在了解深度学习之前,您需要了解两个基本概念:人工智能和机器学习。

人工智能涵盖了让机器像人类一样思考的所有技术。它包括理解和说人类语言、描述图像内容、确定说话者的情绪状态和学习新概念等能力。

机器学习是人工智能的一个子集。它指的是允许计算机在没有明确编程的情况下学习新事物的所有技术。

深度学习是机器学习的一个子集。它指的是发生在人工神经网络上的机器学习。

什么是深度学习?

几个不同的组织已经提供了深度学习的定义。但是,除非您有数据科学背景,否则其中许多定义很难理解。

例如,Gartner说:“深度学习是机器学习算法的一种变体,它使用多层算法通过从原始数据中提取知识并在各个层面进行转换来解决问题。”

IBM提供了一个更易于理解的定义:

深度学习试图模仿人脑——尽管远不及它的能力——使系统能够对数据进行聚类并以令人难以置信的准确度做出预测。深度学习是机器学习的一个子集,它本质上是一个三层或更多层的神经网络。这些神经网络试图模拟人脑的行为——尽管远不及它的能力——允许它从大量数据中“学习”。

从本质上讲,深度学习代表了一种让计算机像人类婴儿一样学习的尝试。当一个婴儿出生时,它什么都不知道。婴儿使用他们大脑中的神经元网络来获取关于他们周围世界的信息并理解它,慢慢地得出关于这个世界的结论。

深度学习系统依赖于与婴儿大脑中的神经元非常相似的人工神经网络。这些网络包括多个层,允许系统处理和重新处理数据,直到它了解正在分析的数据的重要特征。

深度学习的类型

您可以根据使用的数据类型将不同类型的深度学习分为三个不同的类别:

有监督的深度学习依赖于标记数据。在这种深度学习中,您向数据模型提供大量不同的数据,并告诉模型它是什么。然后,计算机会自行学习哪些特征会导致数据归为一类或另一类,以便它可以自行推断。相当于人类的是成年人指向不同的物体并告诉婴儿这些物体的名称。最终,婴儿会自己学习使“狗”与“瓶子”或“书”不同的原因。

无监督深度学习依赖于未标记的数据。本质上,系统通过模仿来学习。一个可能熟悉的例子是深度学习系统,它采用人类艺术的例子,然后生成自己的艺术作品。相当于人类的婴儿通过模仿它听到的成年人来学习说“mamamama”或“dadadada”之类的声音。随着时间的推移和强化,声音会变成有意义的可识别单词。

半监督深度学习涉及标记和未标记数据的组合。它可能是最接近实际婴儿的学习方式,经过一些明确的训练以及大量的观察和模仿。

每种深度学习都有自己的优点和缺点。监督学习产生最快和最准确的结果,但它需要系统操作人员的大量工作。无监督学习不需要相同级别的设置,但它不太可靠并且需要很长时间。半监督介于两者之间——比完全监督学习需要更少的设置,同时比无监督学习产生更可靠的结果。

深度学习架构

深度学习所依赖的人工神经网络可以采用多种不同的形式。完全解释这些需要一整本书,但这里有一些最常见的深度学习架构的简短描述:

卷积神经网络可能是使用最广泛的深度学习架构,尤其是图像处理,但它们需要图形处理单元 (GPU) 和高级处理能力来执行所需的复杂计算。

前馈神经网络是第一类人工神经网络;它们向一个方向提供数据,没有任何循环或循环。

径向基函数神经网络是一种前馈神经网络,包括输入层、径向基函数激活层和输出层。

递归神经网络遵循时间序列,对语音和笔迹分析特别有用。

Kohonen 自组织神经网络对于从无监督数据创建特征图很有用。

模块化神经网络包括一系列可以连接在一起的独立神经网络。

数据科学家一直在开发新型架构以及现有架构的变体,因此列表不断增长和变化。

深度学习用例

深度学习对于具有许多不同变量的非常复杂的问题最有用。一些最常见的用例包括:

自然语言处理允许计算机系统理解和生成人类语音。它可以包括语音到文本、文本到语音、机器翻译、标记、命名实体识别和情感分析。它支持数字助理(如 Siri 和 Alexa)、聊天机器人、垃圾邮件检测、社交媒体分析等应用程序。深度学习通过识别和模仿人类语音中的模式来帮助自然语言处理引擎随着时间的推移而改进。

图像处理是深度学习最常见的用途之一。它支持各种不同的应用,包括生物识别和面部识别、分析医学扫描、自动驾驶汽车、识别装配线上的故障部件、图像锐化,甚至是社交媒体和视频通话软件中流行的过滤器。

当组织使用深度学习技术来识别销售和财务数据中的异常模式时,欺诈预防变得更加准确。金融机构、零售商、执法机构、交通运输和其他组织使用深度学习来快速识别和阻止欺诈活动。

网络安全工具历来落后于网络分子,后者一直在开发新技术来规避现有的预防措施。深度学习技术使网络安全软件能够识别网络流量中的预期和意外模式,从而能够检测和阻止前所未有的全新攻击。

当研究人员采用深度学习技术时,药物开发会变得更快。在大流行期间,科学家们在生化数据集上训练模型,然后使用生成的算法来识别可能治疗这种疾病的药物。这些相同的技术可以加速针对各种不同疾病的药物开发。

气候科学模型涉及大量变量,使其成为深度学习方法的理想候选者。这些技术正在帮助科学家改进他们的模型并做出更准确的预测。

视频游戏正在广泛使用深度学习技术。深度学习使开发人员能够创建更逼真的角色和动画,实现更好的音频交互,并开发能力与最优秀的人类玩家相媲美的机器人。

预测分析已成为企业制定战略和优化运营的关键工具。虽然并非所有预测分析都需要使用深度学习技术,但在具有大量变量和大量历史数据的情况下应用深度学习可以产生出色的结果。

深度学习工具和服务

由于深度学习需要广泛的计算、图形处理、内存和存储能力,许多深度学习项目要么在高性能计算系统上运行,要么在公共云中运行。大多数主要的公共云供应商都提供支持深度学习的平台即服务 (PaaS) 产品。选项包括:

AWS SageMaker

谷歌云人工智能和机器学习服务

微软 Azure 机器学习

IBM 沃森工作室

甲骨文机器学习

其他流行的深度学习工具包括:

咖啡

咖啡2

深度学习4J

胶水

H20.ai

难的

MATLAB

PyTorch

TensorFlow

/西阿诺

深度学习的未来

展望未来,深度学习的未来与整个人工智能的前景密切相关。许多分析师表示,人工智能目前正处于十字路口。企业在这些技术上投入了大量资金,但人工智能计划并不总能达到预期的结果。

Gartner 高级研究总监 Alys Woodward 解释说:“人工智能软件市场正在加速发展,但其长期发展轨迹将取决于企业提高人工智能成熟度。”

“成功的人工智能业务成果将取决于对用例的仔细选择,”伍德沃德补充道。“提供显着业务价值但可以扩展以降低风险的用例对于展示人工智能投资对业务利益相关者的影响至关重要。”

深度学习的进步还很大程度上依赖于能够快速处理越来越大的数据集的更快硬件的开发。一些研究人员认为,量子计算系统的发展最终将使深度学习系统具有我们今天甚至无法想象的能力。

在这些系统到来之前,寻找研究人员继续改进他们的深度学习技术并扩展深度学习系统以处理更多数据并找到更多问题的答案。

标签:

版权声明:本文由用户上传,如有侵权请联系删除!