您只需几分钟即可了解AI



我欢迎哈伯的读者。 邀请您关注文章“在8分钟之内,您需要了解的所有关于AI的知识”的译文 。 内容面向的对象是那些不熟悉AI领域并且想对此有一个总体了解的人,然后也许可以深入研究其特定分支。

有时候,了解所有事情(至少对于试图在流行技术领域中导航的初学者而言)比了解一件事更有用。

许多人认为他们对AI有点熟悉。 但是这个地区还很年轻,成长如此之快,几乎每天都有突围发生。 在这个科学领域有太多发现,其他领域的专家可以迅速加入AI研究并取得显著成果。

本文仅针对他们。 我为自己设定了创建简短参考资料的目标,该参考资料将使受过技术教育的人员快速了解用于开发AI的术语和工具。 我希望本文对大多数对AI感兴趣的人(不是该领域的专家)有用。

引言


人工智能(AI),机器学习和神经网络是用于描述基于机器学习的强大技术的术语,可以解决现实世界中的许多问题。

在思考,做出决定等时 与人脑在机器中的功能相比,它们远非理想(当然,在人类中也不是理想的),最近,在AI技术和相关算法领域已经取得了一些重要发现。 大量可用于培训AI的各种数据的大样本发挥了重要作用。

人工智能领域与许多其他领域相交,包括数学,统计学,概率论,物理学,信号处理,机器学习,计算机视觉,心理学,语言学和大脑科学。 与社会责任和创建AI的道德相关的问题吸引了感兴趣的哲学家。

人工智能技术发展的动力在于,取决于许多可变因素的任务需要非常复杂的解决方案,这些解决方案难以理解且难以手动算法化。

公司,研究人员和普通人对机器学习的希望正在增长,以寻求不需要人描述特定算法的问题的解决方案。 黑盒方法引起了很多关注。 对用于建模和解决与大量数据相关的问题的算法进行编程需要开发人员花费大量时间。 即使我们设法编写处理大量各种数据的代码,也常常会变得非常麻烦,难以维护且难以测试(由于即使在测试时也需要使用大量数据)。

机器学习和AI的现代技术,再加上为系统正确选择和准备的“训练”数据,可以使我们教计算机如何为我们编程。



复习


情报-感知信息并将其保存为知识以在环境或上下文中建立适应性行为的能力

来自(英语)维基百科的智力定义可以同时应用于有机大脑和机器。 智力的存在并不意味着意识的存在 。 这是科幻小说家带给世界的普遍误解。

尝试在Internet上搜索AI的示例-您可能会使用机器学习算法至少获得一个到IBM Watson的链接,该算法在2011年赢得了一场名为“ Jeopardy”的游戏节目后就广为人知。此后,该算法进行了一些更改,并被用于作为许多不同商业应用的模板。 苹果,亚马逊和谷歌正在积极努力在我们的家庭和口袋中创建类似的系统。

自然语言处理和语音识别是机器学习商业应用的首例。 在它们之后出现的任务是识别自动化的其他任务(文本,音频,图像,视频,面部等)。 这些技术的应用范围在不断扩大,包括无人驾驶车辆,医疗诊断,计算机游戏,搜索引擎,垃圾邮件过滤器,犯罪控制,市场营销,机器人控制,计算机视觉,运输,音乐识别等等。

人工智能紧密地嵌入在现代技术中,以至于我们使用了许多技术,甚至没有将其视为“人工智能”,也就是说,它们并未将其与传统计算机技术区分开。 询问任何路人他的智能手机中是否有人工智能,他可能会回答:“否”。 但是AI算法无处不在:从预测输入的文本到相机的自动对焦。 许多人认为AI应该会在未来出现。 但是他前一段时间出现了,已经在这里了。

术语“ AI”是相当笼统的。 现在,大多数研究都集中在神经网络和深度学习的狭窄领域。

我们的大脑如何运作


人脑是一台复杂的碳素计算机,据粗略估计,它每秒执行10亿次操作(1000 petaflops),同时消耗20瓦能量。 中国的超级计算机“天河2号”(在撰写本文时,是世界上最快的)每秒执行33,860万亿次操作(33.86 petaflops),消耗1,600,000瓦(17.6兆瓦)。 在我们的硅计算机可以与进化形成的碳进行比较之前,我们必须做一些工作。

对大脑用来“思考”的机制的准确描述是讨论和进一步研究的主题(我个人很喜欢大脑的工作与量子效应有关的理论,但这是另一篇文章的主题)。 但是,通常使用神经元和神经网络的概念来模拟大脑各部分的工作机制。 据估计,大脑包含大约1000亿个神经元。



神经元使用特殊的渠道相互交流,使它们能够交换信息。 在激活其他神经元之前,先对各个神经元的信号进行权衡并合并。 对发送的消息,其他神经元的组合和激活的这种处理在大脑的不同层中重复进行。 考虑到我们的大脑中有1000亿个神经元,这些信号的加权组合的总和非常复杂。 至少可以说。

但这还不止于此。 在检查是否达到其激活阈值之前,每个神经元都会对加权的输入信号应用函数或变换。 输入信号的转换可以是线性的或非线性的。

最初,输入信号来自多种来源:我们的感觉,内部监控身体功能的手段(血液中的氧气水平,胃内容物等)和其他来源。 在决定如何响应之前,单个神经元可以接收成千上万的输入信号。

思维(或信息处理)以及由此产生的指令传递到我们的肌肉和其他器官,是来自神经网络不同层的神经元之间输入信号的转换和传递的结果。 但是大脑中的神经网络可以改变和更新,包括改变在神经元之间传输的信号的加权算法。 这是由于学习和经验。

这种人类大脑模型被用作在计算机仿真(人工神经网络)中重现大脑功能的模板。

人工神经网络(ANN)


人工神经网络是通过与生物神经网络进行类比而创建的数学模型。 人工神经网络能够对输入和输出信号之间的非线性关系进行建模和处理。 得益于学习算法,该算法可以对人工神经元之间的信号进行自适应加权,该算法读取观察到的数据并尝试改善其处理结果。



为了改善人工神经网络的操作,使用了各种优化技术。 如果ANN可以在不超过既定框架的时间(当然,时间因任务而异)内完成任务,则认为优化成功。

ANN使用多层神经元建模。 这些层的结构称为模型体系结构。 神经元是单独的计算单元,可以接收输入数据并对其应用一些数学函数,以确定是否进一步传输此数据。

在简单的三层模型中,第一层是输入层,然后是隐藏层,然后是输出层。 每层至少包含一个神经元。

由于增加层和神经元的数量使模型的结构变得复杂,解决ANN问题的潜力也随之增加。 但是,如果模型对于给定的任务而言“太大”,则无法将其优化到所需的水平。 这种现象称为过拟合

数据处理算法的体系结构,配置和选择是ANN构建的主要组成部分。 所有这些组件决定了模型的性能和整体性能。

模型通常以所谓的激活函数为特征 。 它用于将神经元的加权输入转换为其输出(如果神经元决定进一步传输数据,这称为其激活)。 有许多不同的转换可以用作激活函数。

人工神经网络是解决问题的有力手段。 但是,尽管少数神经元的数学模型非常简单,但是其组成部分数量增加的神经网络模型却变得相当混乱。 因此,有时将ANN的使用称为黑盒方法。 应该认真考虑选择ANN来解决问题,因为在许多情况下,最终的最终解决方案无法分解并分析为什么会变成这样。



深度学习


术语“ 深度学习”用于描述接收原始数据(需要一些有用信息)的神经网络及其中使用的算法。 通过神经网络的各个层来处理此数据以获得所需的输出。

无监督学习是深度学习技术表现出色的领域。 正确配置的ANN能够自动确定输入数据的主要特征(无论是文本,图像还是其他数据)并获得有用的处理结果。 如果不进行深入培训,对重要信息的搜索通常就落在开发用于处理这些信息的系统的程序员的肩上。 深度学习模型本身能够找到一种处理数据的方法,该方法使您能够从中提取有用的信息。 训练系统后(即找到从输入数据中提取有用信息的方法),可以减少维护模型所需的计算能力,内存和精力。

简而言之,学习算法允​​许使用专门准备的数据来“训练”程序以执行特定任务。

深度学习用于解决各种各样的问题,被认为是创新的AI技术之一。 还有其他类型的培训,例如有监督学习半监督学习 ,其特点是对数据处理中的神经网络训练的中间结果引入了额外的人工控制(有助于确定方向是否正确)移动系统)。

影子学习shadow learning )-用于描述深度学习的简化形式的术语,其中在搜索数据的关键特征之前,首先要由人员对其进行处理并输入特定于该数据所涉及领域的信息。 由于花费在系统设计上的时间增加,因此这些模型更加“透明”(就获得结果而言)和高性能。

结论


AI是功能强大的数据处理工具,比程序员编写的传统算法可以更快地找到复杂问题的解决方案。 人工神经网络和深度学习技术可以帮助解决许多不同的问题。 不利的一面是,最优化的模型通常充当“黑匣子”,因此无法研究选择一种或另一种解决方案的原因。 这一事实可能导致与信息透明有关的道德问题。

Source: https://habr.com/ru/post/zh-CN416889/


All Articles