现在,每个人都在谈论人工智能和机器学习带来的新革命。 聪明的算法涵盖了生活的方方面面:从寻找希格斯玻色子到晚上看电影。 最先进的公司已经在其产品和营销中积极实施这些技术。 个性化的推荐,广告,网站界面-所有这些都不是黑魔法,而是已经可用的技术。
毫无疑问,在国内市场上,Yandex是使用机器功能的最先进的公司。 Yandex服务营销总监Andrei Sebrant在给#amoCONF的报告中谈到了未来以及为每个公司带来的机遇。 优化您的业务以适应未来趋势!
免责声明 。 本文是Andrei Sebrant演讲的笔录。 有些人节省了时间并喜欢文字,有些人无法在工作中或路上观看视频,但乐于阅读Habr,还有听力障碍的人,他们的音轨无法访问或难以理解。 我们决定为所有这些内容和您解密出色的内容。 不管是谁喜欢的视频,都是结尾处的链接。
机器智能和技术商品化
下午好 您好,大家都聚集在奥运会上。 谢谢你的眼线笔。 是的,我要用可怕的话来谈论未来。 我怀疑“技术商品化”一词并未为任何人所熟知-别害羞,很多人通常不知道。 但这很有用,真的很简单。 我待会再谈他。 是的,有一个正确的说法:我要谈论的是即将到来,即将来临的未来,有些已经来临,所以只剩下刮ing。
问题是我在互联网上工作了20年,在我看来一切都很棒,而且很快就在发生-多么酷! 我现在知道,这20年中发生的一切都是令人难以置信的抑制过程,非常缓慢,但是现在它很快就开始了。 总的说来,整个报告的故事都是建立在一个奇怪的马赛克原理上的,这个马赛克……甚至,我最好这样说:基于一个分散的难题的原理。 如果看着这些碎片,这些拼图碎片中的图片开始在您的脑海中浮现-目标就实现了;如果没有实现-嗯,我不知道,看看唱片,然后尝试一下-也许结果就可以了。 因为这不是一本食谱-我不会告诉您如何做。 我将告诉您,在短短的几年内,在3-4-5(没有更多)的未来,您必须组织销售,吸引客户并以某种方式与与您相关的人进行沟通。
未来已经来临。 有两种情况与互联网和营销无关。
但我会告诉你一些奇怪的情况。 这是一个来自加利福尼亚的男人的故事。 我不是偶然地把他的年龄带到幻灯片上的-这个人65岁,他比我大。 他有一个问题:他有一个爱她干净的草坪的妻子(但这是加利福尼亚州,草坪周围没有两米高的围栏); 邻近的猫在草坪上行走,胡扯。 2016年如何解决此任务?
邻居的猫和最喜欢的草坪:如何与妻子解决问题
在2016年,这个人罗伯特·邦德(Robert Bond)在他的家用电脑上购买了一点铁,将一个已经站立的监控摄像头连接到该摄像头,该摄像头俯瞰着草坪,并做了一些不寻常的事情-它下载了负担得起的免费开源软件,是一个神经网络,并开始训练该神经网络以识别相机图像中的猫。
乍一看,这项任务显得微不足道,因为如果易学的东西就是猫,那是因为猫在互联网上乱七八糟,互联网上有数千万只猫。 如果一切都这么简单-可以在“数据集”上训练识别出这种“白天”的猫,那么它就简单地以吞吐通道的速度加载。 但是情况更糟:在现实生活中,猫大多在晚上胡扯。 互联网上几乎没有夜猫子在草坪上撒尿的照片。 正如我们所做的那样,人类就像任何从事正常数据科学和神经网络培训的公司一样。好吧,我们将另外挖掘图片,自己制作; 学会识别夜猫的网络也非常可靠...

然后是最后一步:将电控阀连接到该计算机的输出。 阀门位于通向喷涂机的管道上。 因此,一旦猫进入草坪并要适应,他们就会开始给它浇水-猫会倾倒。
这样就解决了任务,妻子很幸福,猫不会走路,而这一切都是一个奇怪的奇迹-神经网络学习识别猫,他们发现在互联网上,地狱,没有足够的源图像用于训练。 好的,我们将为您完成! 她完成了学业。 这可能是世界上唯一可以识别夜猫的神经网络。
所有这些都是由不是超级程序员的人完成的,他一生都没有在Google或Yandex上工作过,并且借助这种硬件,通常,它非常便宜,紧凑和简单。
日本黄瓜:如何帮助妈妈
另一个故事。 在加利福尼亚州的大洋彼岸,日本人在一个小型家庭农场种黄瓜。 这种形式的黄瓜通常分为9个不同的类别。
排序是由一位老母亲手动完成的。 这对她来说很难-她每天要站在传送带上8个小时,并且一生都在...嗯,不是全部,但是她将生命的最后几年致力于她的理解,看着黄瓜(丘疹,粉刺,颜色,大小和形状),其中在九个类别中,应归因于此。 他们有麻烦-他们甚至不能雇用临时工,因为必须将几个月的光荣过程教给该工人-才能认出黄瓜。 然后,您可能已经猜到了。

又是一台电脑。 但是,这一次,网格在云中了,因为Raspderry Pi计算机的功耗很低。 网被教导了妈妈作为训练样本的作用,他们利用了妈妈本人的动作:这是黄瓜的照片,是妈妈的照片。 我的母亲做了一万次之后:“塞托奇卡,这是给您的新黄瓜,您了解他的类别吗?”“我了解,”塞托奇卡说。

所有这些都体现在这样的设计中:传送带,黄瓜在跌落到传送带上之前就骑在上面,照相机看着它们,推动器沿着传送带站立并将黄瓜推入相应类别的盒子中。 同样,这是2016年的决定。 它说明了一个非常重要的观点,现在人们对此还知之甚少。 它写在屏幕上:

实际上,我们过去所说的信息技术已经不再是信息。 这些是操作技术:受过训练的机器本身会执行动作,但不会通知我们; 铃响了-“猫来了。 你会怎么做? 你会用毛巾系什么吗?” 并且在浮动黄瓜上显示类别编号。 “好吧,现在您可以用皇室之手推它了。”……不! 培训结束后,在此过程中完全没有人。 这是一张非常通用的图片,描绘了未来的工作方式,其中机器解决了智力任务(识别猫,了解黄瓜属于哪一类)。
信息技术已开始运作
实际上,这不是我们的想法。 通常,这不只是互联网和计算机上发生的某些虚拟事物的属性。 我特别介绍了这张幻灯片:通用电气(General Electric)是一家规模庞大的公司,与庞大的离线业务合作,他们认为2015年是这一转变发生的一年-信息技术已经投入运营,它们决定了我们的未来。 实际上,为了赶上所有这些,我们需要考虑如何在我们的业务流程中建立相同的过渡,因为转型始终是一件痛苦的事情,而不是一时的事情。
但是,如果您现在不准备这些信息,您可能会发现自己已被踩踏。 一个很好的例子:他们踩了柯达,他认为他受到了很好的保护(这种技术!)。 他们攻击了黑莓-他们真诚地认为,对人们施加压力很有价值,而且没人会在屏幕上拖拉手指弄脏屏幕。 黑莓在哪里?
最后,再次提及当局。 在今年年初在达沃斯举行的世界经济论坛上,这些话已经被官方一再重复说:我们现在正处于第四次工业革命的中心。 这场工业革命主要是由于以惊人的速度引入了人工智能和机器学习。

我讨厌“人工智能”一词,现在将解释原因。 因为事实上,我们在这个地方试图与自己比较汽车,并以某种方式吓the汽车(不怕):“您永远不会与我们相比! 我们是思想家!” 您会看到,这台机器在整个人类历史上都证明了它可以做更多的事情-更多,因为我们想出了它。
汽车总能做得更多
这是一个我喜欢讲的很好的例子-这是一个关于人工鸟类的故事。 我们无法重现。 我们真的不知道机翼中每根羽毛的工作原理,飞行中的功能。 而且,这些羽毛的翅膀在自然界中的多样性非常可怕!..然后还有蝙蝠。
什么是“人工鸟”?
没错,从技术的发展来看,我们不能而且不能再繁殖,也不能不能,在接下来的几年中-我们无法完全了解机翼中每一根毛发如何运作的飞行物理原理。 但是,由于我们是人类,因此人类受到飞鸟的启发而成为飞行的想法。 从这个意义上讲,第一只人造鸟是气球,在今天之前已经创造了多个世纪。 因为他让人们大呼过瘾。
然后,过了一段时间,他们回到了完全不同的机翼的构想,这种鸟没有意识到的轮廓-它是静止的,没有摆动的运动,可以使汽车保持飞行状态。 但是他有喷气发动机,这台机器开始将我们拖到大洋上,而鸟类则不能。
而且,在某个时候,我们人类飞向了星星……好吧,去火星! 到目前为止,还没有到星星,但是这种“好奇心”正在火星上爬行,并从那里转移自拍照。 同一只人工鸟也把他带到了那里。 您会看到,我们对飞行的想法有什么想法,应该是人造鸟。

听着,当他们现在告诉我有关人工智能的信息时...好吧,我们不知道它是如何工作的(指向头部)...是的! 就像我们对鸟的翅膀一无所知。 这并没有阻止我们在气球出现的阶段停下来,发明了算盘并简化了动物无法进行的某些操作,但是我们有口头说明-但是,该死的,它更容易。 然后,该技术帮助我们使其变得更加容易,然后该技术到达了经过自我训练的神经网络-这很重要! 他们自己学习!
什么是人工智能?
如果我们回想起猫的例子,没有人向这个网格解释猫与婴儿和狗之间的差异的形式参数。 Grid学习了自己,看着数百万张猫的照片,并最终学会了。 我们不知道如何。 那么,我们如何学习自己?
实际上,我现在所说的是,人工智能(机器语言仍然更正确)与麻雀的火箭对我们的大脑有着相同的关系-使生活如此有趣。 火箭不能鸣叫和拉屎。 麻雀可以。

同时,您可能会猜到,火箭可以:对邻近大陆的核弹药,从库里希蒂(Kurioshiti)到火星,进入卫星轨道以使卫星互联网工作的卫星,有很多东西,但这与麻雀绝对无关。 机器智能将发生完全相同的事情:它将完成我们无法弄清楚的事情,大脑可以做什么,但是可以做到。

同时,另一个有趣的故事并行发生,涉及的服务并不多...因为我现在谈论的是特定的服务-图像识别,实际上是围绕两个示例构建的功能,围绕图片进行搜索的功能,东西。 但这仍然是一项特定的服务。 您可以说个性化-我将有单独的示例。 这也是一项单独的服务-了解来找您的买家的一些信息。 但这是一项服务。
不仅服务本身,而且接口
首先,自学习系统,神经网络使得在所有服务中解决另一个绝对如此有趣的问题成为可能。 此任务是前端。
前一段时间,存在一个问题(尽管确实存在):您需要将信息转换为机器可读的形式,以便机器可以开始使用它。 再也没有这样的问题了! 因为...什么是机器可读视图? 如果有文字,她甚至可以从手稿,屏幕,甚至洞穴图上阅读文字。 此外,如果是图片,她可以理解该图片中发生了什么。 她可以听到大声说出的内容,如果出于某种原因需要,可以将其转换为印刷文本。 比这更糟糕的是-所有这些的含义是要理解...
语音,图像,语音合成的识别
这是现在正在发生的最有趣的故事。 举例来说,现在正在发生的事情是在几年内改变生活。 为了使机器学习不会愚蠢地听,而只是简单地将声音转换成字母,有必要教它一些含义。 在这里,一个有趣的任务开始了,这是一个绝对实际的任务,从外面看不到,这是一个巨大的突破,例如,由必须解决问题的搜索引擎解决了……

您知道,对于某些精神疾病(如果房间里有心理学家-他们知道这样的测试),他们会给出四个或更多的对象并说:“这里有什么多余的? 找到它。” 在许多情况下,对于某些疾病,完全令人惊讶的奇怪答案对我们来说似乎是虚幻的。 因此,汽车的相同任务是:四个对象-找到额外的对象。

事实证明,在古老的传统语言分析模型中,这是一个很大的埋伏。 因为,如果我们看一下对象2和对象4,结果发现虽然没有听到书面文字和强调,但LOCK和LOCK并没有区别。 而且,即使是对形容词的深入分析也表明,这是描述该名词显然来自其材料的东西。 而且似乎这两个对象非常接近(指向“石城堡”和“铁城堡”),而这个对象(“旧堡垒”)通常不存在,没有相似之处。 但是您和我知道故事完全不同:总的来说,这个对象是多余的(铁城堡),但是这三个是相同的。 如何向汽车解释? 尤其是当涉及到一个图像时,为了简单起见,更确切地说,是为了现实,我们假定该图像在图片中不包含文本-例如,在找到它的页面上。 只是一张图片。 在相册中。 如何分类? 我是否应“老堡垒”的要求显示它?
事实证明,有一种东西在一段时间内似乎是不科学的小说,就像一个非常多维的意义空间,您可以在其中教导机器构建一些矢量。 这些向量的片段显示在图片下方,甚至粗略地看一看,它们(前三张图片)通常是相似的-好吧,伙计们,有8、7、1、3 ...等等,在这里-brrr,显然是-根本不是。 就是说,这三者在这个巨大的多维意义空间的某个地方,一个区域,大约一个区域中伸出某个地方,而在那个地方的某个地方伸出一个地方。
这就解决了至少从什么对象有意义地彼此靠近的角度理解含义的问题。 很酷的一项任务是,例如解决彼此相似的问题,这将使同一个Microsoft在Skype中提供出色的同步翻译。 因为就在此刻,当神经网络被连接起来时,而不是偶然遇到的经典语言模型(锁定-锁定)时,翻译变得有意义了。 然后,伙计们,他们已经通过语言连接语言。 那时,当这些含义向量的空间已满时,将其投影到任何语言中纯粹是技术操作。 此时此刻,我们星球上的语言问题就消失了。
这是一个非常重要的故事! 我并不是说有才华的Yandex,有才华的Microsoft,有才华的Google现在正在这样做。 我正在谈论它如何以我们无法想象的方式改变生活,像这样-半踢。 我们甚至不会看到界面中的所有内容突然都进行了自我翻译。 它看起来像这样-不像任何单独的超级服务。
尝试传统科学? 不,与她共生!
我想以科学为例,而不是某些商业产品,来说明传统领域正在发生的事情。 看,与我们大家有关的科学是气象学。 大家都想了解:我们需要带雨伞吗,今天会下雨吗? 实际上,也许不一定要带雨伞,而只是要穿保暖的衣服,就不会下雨,那个混蛋很糟糕。
在这里,我将再次介绍Yandex解决方案,因为它再次出现了……我不想在这里出售Yandex,因为没有我的销售,Yandex足够大。 这些与气象有关的事情现在已经由所有从事预测世界天气现象的大公司完成:无论是天气频道还是其他公司,IBM都在机器学习方面建立了联系。 幸运的是,我们内部有一个预测(Yandex服务之一),对于某些事情,我们有足够的机器学习能力。
关于天气预报和气象
因此,Meteum出现了。 简要介绍一下天气预报。 这是一组很棒的完全不同的数据,实时地涌入超级计算机。 数据从屏幕上的当前内容中获取。 这些是数十个气象卫星,在该卫星的光谱的各个部分中,信息从该卫星流过,位于其下方的地球部分。 , (, , ) : , , , , , , – .

, , , , , - ( , ) – , , , , – , ( ), , (, , ).

-, , , -, ( «» )… , , , , , , .
, , - . : +30 (). , ( , ) – , , , , ?
, – , «» ( ). , , : -- (, 9 «»). , , – , 9 , . , . - .

– , , ; , , ( , - ) , .
, : , , . , . 怎么了 ! , . , , , , , , -.
«.» , , -, , , … - - . , , . «» , , , … , – . , - .
, . . – . . , , , , . , , , , . , .
:
- - , . , . , : amoCRM , , , , .
, , , amoCRM. , amoCRM, , ( , , ).
2016 : , . : , – , , , - , «», 20 . , , - , – , , , , , , . , , – . , «-» . – , .

, ? , , , … , … , ?! , , , , , .

, . , , , : . , , - . , , , .
Crypta
, – … -, . , , , , « » , «» - «».

!
: , , . . . - RFM-, , … , . , – , , , , .
( ), -, – «! ?». – ; …

«»?
, , , «». . – , , « »… --… , , .

«.»
, , , «». . «» , . , : , , , – .

. , , – , . , – .
«»
«» . , , . , .

. , - . , . – . . , , …
…
, , … ?
, . , – , .
, . , – . – , , «», . , -. , . , : – , – . , , «-» , API – , ( ).
, , , , .
2020+:
伙计们,当他们要我做这张幻灯片时:“好吧,您能告诉我大约二十或二十吗?”我说:“是的,这很容易。” 因为它可以归结为三个要点。

您必须与具有创造力的智能机一起工作(如果需要,如果愿意,则可以)。 该死的 我从Yandex的经验中知道。 在这里(由于聚光灯使我看不见你)我请你大声回答这个问题:这里有没有其他员工在从属地位的人(他们听众说“是”)? 好的,您可以轻松地委派他们吗(听众“不”)? 预期的。 我们也是! 想象一下:您必须委派机器,晚上不开车去喝啤酒或喝点什么,然后说:“瓦西娅,你是什么...来吧,你不会再那样了。” 这台机器真的无法向您解释她为何做出此决定。 但是,如果您不学习如何使用它(是的,它有时会像我们中的任何一个人和我们的任何员工一样“笨拙”),那么这仅仅是一个“掩护”。
克拉克定律
这是最新的幻灯片。 这是克拉克定律之一。 我带着一条灰色的尾巴出去,说了些奇怪的话。 有一条法律说:如果我这个年龄的人出来,就开始对以下事实有所了解:“这永远不会发生! 人是万物的尺度,所以机器永远不会……(深呼吸)这是年龄保守主义,伙计们,对不起。”

当一个人说:“听着,尽管我很保守,但一定会!”,如果他是这方面的专家,他很可能是对的。 但过去20年来,我一直在上网。
所以谢谢! 一种或另一种方式,但它会发生!
一点广告:)
感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或向您的朋友推荐来支持我们
,开发人员的云VPS从4.99美元起 ,
为Habr用户提供
30%的折扣,这是我们为您发明的入门级服务器的独特模拟: 关于VPS(KVM)E5-2650 v4的全部真相(6核心)10GB DDR4 240GB SSD 1Gbps from $ 20或如何共享服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。
戴尔R730xd便宜2倍? 只有我们有
2台Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100电视在荷兰起价199美元 ! 戴尔R420-2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB-$ 99起! 阅读有关
如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?