Gartner 2019年图表:这些流行语是关于什么的?

Gartner为从事技术领域工作的人员安排的日程就像是一场高级时装展览。 看一下它,您可以提前了解哪些单词是本季最热门的新闻,以及您将在即将举行的所有会议上听到的信息。

我们已经破译了此图上漂亮的单词后面隐藏的内容,以便您也可以说这种语言。





首先,请说几句,这是什么样的时间表。 每年8月,Gartner咨询机构都会发布一份报告-Gartner Hype Curve。 在俄语中,这是“炒作曲线”,或更简单地说,是炒作。 30年前,来自“公共敌人”组织的说唱歌手唱道:“不相信炒作。” 信不信由你,这个问题是个人的,但是如果您从事技术领域的工作并想了解世界趋势,那么至少值得了解这些关键字。

这是公众对特定技术的期望的图表。 根据Gartner的说法,在理想情况下,该技术按顺序经历了五个阶段:技术的发布,期望值的高峰,失望的谷底,教育的坡度,生产力的稳定期。 但是也有可能它淹没在“失望之谷”中-您可以很容易地回忆起这些示例,并使用相同的比特币:最初在“未来的钱”达到顶峰时,当技术的缺点变得明显时,它们迅速下滑,首先交易数量的限制以及产生比特币所需的大量电力(已经带来了环境问题)。 当然,我们一定不能忘记Gartner图表只是一个预测:例如,在这里,您可以阅读详细的文章 ,其中整理出了最生动的未实现的预测。

因此,让我们回顾一下新的Gartner图表。 技术分为5大主题组:

  1. 先进的AI和分析
  2. 后古典计算与通信
  3. 感官和流动性
  4. 增强人类
  5. 数字生态系统

1.先进的AI和分析


在过去的十年中,我们已经看到了深度学习的高潮(Deep Learning)。 这些网络对于他们的任务确实有效。 在2018年,Jan Lecun,Jeffrey Hinton和Yoshua Benjio因其开放而获得了图灵奖,这是最负盛名的奖项,类似于诺贝尔计算机科学奖。 因此,图表上显示了该领域的主要趋势:

1.1。 转移学习


您不是从头开始训练神经网络,而是选择一个已经训练过的神经网络,并将其分配给其他目标。 有时候,您需要重新训练一部分网络,而不是整个网络,这要快得多。 例如,如果您使用在ImageNet1000数据集上训练的现成的ResNet50神经网络,则将获得一种算法,该算法可以对图像中的许多不同对象进行非常深的分类(基于由50个神经网络层生成的属性的1000类)。 但是您不需要训练整个网络,这将花费数月的时间。

例如,在三星在线课程 “神经网络和计算机视觉”中,在最后的Kaggle任务中 ,将印版分类为干净和脏污,该方法显示出在5分钟内可以为您提供一个深度神经网络,该网络可以区分脏印版和干净污垢。建立在以上架构上。 原始网络不知道总体上是什么板块,只学会了区分鸟类和狗(参见ImageNet)。


资料来源:三星在线课程 “神经网络与计算机视觉”

对于转移学习,您需要知道什么方法有效,什么是现成的基本体系结构。 通常,这极大地加速了机器学习的实际应用的出现。

1.2。 生成对抗网络(GAN)


这是针对那些我们很难制定培训目标的情况。 任务离现实生活越近,对我们来说越容易理解(“带床头柜”),但是将其表述为技术任务就越困难。 GAN只是试图摆脱这个问题。

这里有两个网络:一个生成器(Generative),另一个鉴别器(Adversarial)。 一个网络学会做有用的工作(对图片进行分类,识别声音,绘制卡通)。 另一个网络学会了学习该网络:它具有真实的示例,并且学会找到一个以前未知的复杂公式,用于根据真正重要的深层迹象将眼睛的生成部分与实际对象(训练集)进行比较:眼睛的数量,与宫崎骏风格的接近程度,正确的英语发音。


网络生成动漫人物的结果示例。 来源

但是,在那里,当然很难构建体系结构。 投掷神经元还不够;需要做好准备。 而且你必须学习数周。 三星人工智能中心的同事们处理了GAN主题,这是他们的主要研究问题之一。 例如,这就是这样的发展 :使用生成网络来合成姿势可变的人的真实照片-例如,创建虚拟试衣间或合成人脸,这可以减少需要存储或传输的信息量,以确保高质量的视频通信,广播或保护个人资料。


来源

1.3。 解释了AI


在一些罕见的任务中,深度架构的进步突然使深度神经网络的功能更接近于人类。 现在的战斗是扩大此类任务的范围。 例如,机器人吸尘器可以在正面相遇时轻松区分猫和狗。 但是在大多数生活中,他将找不到猫在亚麻布或家具中睡觉的猫(但是,在大多数情况下,就像我们一样)。

深度神经网络成功的原因是什么? 他们不是基于“肉眼可见”的信息(照片的像素,音量的跳跃……),而是基于经过数百层神经网络对该信息进行预处理后获得的信号,来开发问题的表示。 不幸的是,这些关系也可能是无意义的,矛盾的,或者在原始数据集中带有缺陷的痕迹。 例如,关于在招聘中漫无目的地使用AI会导致什么,有一款小型计算机游戏《最适合生存》


标记图像的系统称为烹饪女人的人,尽管图片实际上是男人( Source )。 弗吉尼亚研究所注意到了这一点

需要可解释的AI方法来分析我们通常无法表述的复杂和深层的关系。 他们组织了深度神经网络的信号,以便在训练后我们可以分析网络学习到的内部表示,而不仅仅是依靠其解决方案。

1.4。 外围分析/ AI(边缘分析/ AI)


“边缘”一词所代表的一切含义如下:将一些算法从云/服务器传输到终端设备/网关的级别。 这样的算法将运行更快,并且不需要连接到中央服务器即可工作。 如果您熟悉“瘦客户端”的抽象,那么在这里我们可以稍微增加一下此客户端。
这对于物联网可能很重要。 例如,如果机器过热并且需要冷却,则在工厂级别立即发送有关此信号的信号就很有意义,而不必等待数据传到云端并从那里传到班次主机。 另一个例子:无人机可以自行处理流量情况,而无需访问中央服务器。


来源

还是从安全性角度来看这很重要的另一个示例:当您在手机上键入文本时,它会记住您常用的单词,以便电话键盘会更方便地提示您-这称为预想输入法。 将您在键盘上输入的所有内容发送到数据中心的某处将侵犯您的隐私,并且完全不安全。 因此,键盘培训仅在您设备的框架内进行。

1.5。 AI平台即服务(AI PaaS)


PaaS-平台即服务是一种商业模型,通过该模型,我们可以访问集成平台,包括其基于云的数据存储和现成的过程。 因此,我们可以将自己从基础结构任务中解放出来,并完全专注于生产有用的产品。 用于AI任务的示例PaaS平台:IBM Cloud,Microsoft Azure,Amazon Machine Learning,Google AI平台。

1.6。 自适应机器学习(Adaptive ML)


如果我们允许人工智能适应……您会问-那是怎么办?..它仍然不能适应任务吗? 问题是这样的:我们在构造一个人工智能算法来解决它之前,就辛苦地安排了每个这样的任务。 他们会回答您-事实证明,此链条可以简化。

正常的机器学习基于开放系统(开环)的原理进行工作:准备数据,发明神经网络(或其他任何东西),进行训练,然后查看一些指标,如果喜欢的话,可以将神经网络发送到智能手机以解决用户任务。 但是,在有大量数据且其性质逐渐变化的应用程序中,需要其他方法。 这样的系统会自行适应和训练,并组织成封闭的自学习回路(闭环),并且它们应该正常运行。

应用程序-这可以是Stream Analytics(基于此),许多商人可以在此基础上做出决策,也可以采用自适应生产管理。 在现代应用程序的规模中,考虑到人们对风险的更好理解,解决此问题的方法,所有这些方法均以通用名称Adaptive AI收集。


来源

看着这张照片,很难摆脱未来学家不喂面包的感觉-让机器人学会呼吸...

后古典计算与通信


2.1。 第五代移动通信(5G)


这是一个非常有趣的话题,我们立即参考我们的文章 。 好吧,这是一个简短的挤压。 通过增加5G数据传输的频率将使Internet的速度变得异常快。 短波穿过障碍物更加困难,因此网络的布置将完全不同:基站的需求量将增加500倍。

随着速度的提高,我们将获得新的现象:增强现实的实时游戏,通过网真进行复杂的任务(例如手术),通过机器之间的通信防止事故和困难情况的出现。 从更平淡的角度来看:在大型活动(例如体育场比赛)期间,移动互联网最终将停止下降。


图片来源-路透社(Niantic)

2.2。 下一代存储器


在这里,我们谈论的是第五代RAM-DDR5。 三星宣布到2019年底将有基于DDR5的产品。 预计新的内存在保留尺寸的情况下速度将是内存的两倍,容量将是内存的两倍,也就是说,我们可以为计算机获得容量高达32GB的内存条。 将来,这对于智能手机(新内存将在低功耗版本中)和笔记本电脑(DIMM插槽数量受到限制)尤其如此。 机器学习需要大量RAM。

2.3。 低地球轨道卫星系统


用大量廉价的小型卫星代替笨重,昂贵,功能强大的卫星的想法并不是什么新鲜事物,并且可以追溯到90年代。 关于“ Elon Mask将很快从卫星向每个人分发Internet”这一事实现在只有懒惰的人没有听说过。 在这里,最著名的公司是铱星公司,铱星公司在90年代末破产,但以美国国防部的利益为代价得以挽救(不要与俄罗斯智能家居系统iRidium混淆)。 Elon Mask(Starlink)的项目远非唯一的项目-理查德·布兰森(Richard Branson)(OneWeb-1440颗所谓的卫星),波音(3000颗卫星),三星(4600颗卫星),以及其他一些人参加了卫星竞赛。

该地区的情况如何,那里的经济状况如何-阅读评论 。 我们正在等待第一批用户对这些系统的首次测试,该测试将于明年进行。

2.4。 纳米级3D打印(纳米级3D打印)


3D打印虽然并没有进入每个人的生活(以个人家庭塑料工厂承诺的形式),但很早以前就已经将技术领域留给了极客。 您可以通过以下事实来判断:至少有3D雕刻笔对于任何学生都是已知的,许多人都梦想着购买带有转轮和挤压机的盒子……“就这样”(或已经购买)。

立体光刻(3D激光打印机)允许使用单个光子进行打印:正在研究新的聚合物,对于该聚合物,两个光子足以固化。 这将允许在非实验室条件下创建全新的过滤器,底座,弹簧,毛细管,透镜和...,您可以在注释中选择! 而且距离光聚合还很遥远-只有这项技术才能让您“打印”处理器和计算电路。 此外,不是第一年就有印刷石墨烯500-nm三维结构的技术 ,但是还没有彻底的发展。


来源

3.感官和移动性(传感和移动性)


3.1。 4级和5级无人驾驶(4级和5级自动驾驶)


为了避免混淆术语,值得弄清区分自治的水平(摘自我们向所有感兴趣的人推荐的详细文章 ):

级别1:巡航控制:在非常有限的情况下帮助驾驶员(例如,在驾驶员将脚离开踏板后将汽车保持在给定速度)
第2级:在转向和制动方面的协助有限。 驾驶员应准备好几乎立即进行控制。 他的手放在方向盘上,视线对准道路。 这就是特斯拉和通用汽车已经拥有的。
第3级:驾驶员不再需要不断监控道路。 但是他必须保持警惕并准备采取控制措施。 这是现有汽车上没有的东西。 目前存在的所有内容-处于1-2级。
级别4:真正的自动驾驶仪,但有其局限性:仅在特定条件下(例如在无雪的情况下)在经过仔细映射并为系统普遍了解的已知区域中行驶。 Waymo和通用汽车都拥有这样的原型,他们计划在多个城市推出它们并进行实际测试。 Yandex在Skolkovo和Innopolis设有无人出租车的测试区:这次旅行是在坐在乘客座位上的工程师的监督下进行的; 到今年年底,该公司计划将车队扩大到100辆无人驾驶汽车。
级别5:全自动驾驶,完全替代现场驾驶员。 这样的系统不存在,并且在未来几年内不太可能出现。

在可预见的将来看到这一切有多现实? 在这里,我想将读者重定向到“为什么特斯拉承诺到2020年无法推出Robotaxi”一文。 部分原因是缺少5G连接:可用的4G速度还不够。 部分原因是自动驾驶汽车的成本很高:到目前为止,自动驾驶汽车无利可图,其商业模式令人费解。 简而言之,这里的一切都很复杂,Gartner写道,对第4级和第5级大规模实施的预测并不早于10年,这并非巧合。

3.2。 3D感应相机


八年前,Microsoft Kinect游戏控制器通过提供价格合理且相对便宜的3D视觉解决方案而引起轰动。 从那以后,与Kinekt一起进行的体育教育和舞蹈游戏经历了短暂的兴衰,但是3D相机已用于工业机器人,无人驾驶汽车和移动电话中以通过面部识别。 技术变得更便宜,更紧凑,更实惠。


三星S10手机具有一个飞行时间摄像头,可以测量到被摄对象的距离,从而使对焦更加轻松。 来源

如果您对此主题感兴趣,那么我们将重定向至深度相机的非常详细的概述: 第1 部分第2部分

3.3。 小型货运无人机(轻型货运无人机)


今年,亚马逊在展览上展示了一款新型的能够载重不超过2公斤的小型飞行无人机,因此大惊小怪。 对于交通拥堵的城市来说,这似乎是完美的解决方案。 让我们看看这些无人机如何在不久的将来证明自己。 也许值得包括谨慎的怀疑:存在许多问题,首先是容易盗窃无人机,最后是对无人机的立法限制。 亚马逊Prime Air已经存在了六年,但仍处于测试阶段。


亚马逊的新无人机今年春天揭晓。 其中包含有关《星球大战》的信息。 来源

除了亚马逊之外,这个市场上还有其他参与者(有详细的评论 ),但没有一个成品:一切都在测试阶段和市场营销活动中。另外,值得一提的是非洲非常有趣的高度专业化的医疗项目:在加纳(14,000根飞索,Zipline)和卢旺达(Matternet)的献血。

3.4。飞行自动驾驶汽车


很难说明确的话。根据Gartner的说法,这将不早于10年。通常,这里的问题与无人驾驶汽车一样,只是它们具有新的尺寸-垂直方向。保时捷,波音,Uber宣布了打造飞行出租车的雄心。

3.5。 增强现实云(AR Cloud)


真实世界的永久数字副本,可让您创建所有用户共有的新现实层。用一种更具技术性的语言来说,我们正在谈论建立一个开放的云平台,开发人员可以在其中集成其AR应用程序。货币化模型是可以理解的,它是一种Steam类似物。这个想法根深蒂固,以至于现在有些人认为没有云的AR根本没有用。

一段小视频描绘了未来的情况。看起来像下一个系列的《黑镜》:


您也可以阅读评论文章。

4.增强人类


4.1。情感人工智能


如何测量,模拟和应对人类情感?这里的一些客户是生产语音助手的公司,例如Amazon Alexa。如果他们学会了识别情绪,他们就会真正习惯于房子:了解用户不满意的原因,并尝试解决这种情况。通常,上下文中的信息比消息本身中的信息多得多。上下文是面部表情,语调和非语言行为。

在其他实际应用中:分析工作面试中的情绪(通过视频面试),评估对广告或其他视频内容的反应(微笑,笑声),教育帮助(例如,公共演讲领域的独立实践)。

关于这一主题,要比6分钟短的作者说得好偷乌尔的感觉一段机智而时尚的视频演示了如何为营销目的衡量我们的情绪,并从您的即时反应中找出您是否喜欢比萨饼,狗,坎耶·韦斯特,甚至您的收入水平和近似智商。通过使用上面的链接进入电影网站,您将使用笔记本电脑的内置摄像头成为交互式视频的成员。这部电影已经在几个电影节上放映过。


来源

甚至有如此有趣的研究:如何在文本中识别讽刺。我们使用#讽刺标签进行了推文,并针对世界上的所有内容制作了25,000个讽刺推文和100,000条常规推文的训练样本。我们使用了TensorFlow库,对系统进行了训练,结果如下:


来源

因此,现在,如果您不确定您的同事或朋友-他对您说的话很认真或嘲讽-您可以使用已经训练有素的神经网络

4.2。增强智能


使用机器学习方法自动化知识工作。似乎没有什么新意了?但是这里的措辞本身很重要,特别是因为它与人工智能的缩写相吻合。这指的是关于“强”和“弱” AI的争论。
强大的AI与科幻电影中的人工智能相同,完全等同于人类的思维,并承认自己是一个人。这还不存在,也不清楚是否会存在。

弱小的AI不是独立的人,而是人类的助手。他并不假装像人一样思考,而只是知道如何解决信息问题,例如确定图片中显示的内容或翻译文本。


来源

从这个意义上讲,增强智能最纯净的形式是“弱人工智能”,其措辞似乎很成功,因为它不会引起和吸引人们在这里看到每个人梦见以求的“强人工智能”(如果您回想起有关“叛乱”的众多论点,他们会感到害怕害怕)。 “我,机器人”)中,我们进入了赛博赛博朋克(在这种类型的的电影中,各种扩展人类的的植入物被称为“)”)。

至于埃里克Brinolfsson和Andrew MakAffi: “这是在未来10年会发生什么。不是AI会取代经理,,但是那些使用AI的经理会会取代那些还没有做到的经理。”

范例:

  • : , ,
  • : , , .
  • -: , , 80% , 20% —

4.3. (Biochips)


这是所有赛博朋克电影和书籍中最喜欢的主题。总的来说,砍碎宠物不是一种新习惯。但是现在这些芯片也已经开始植入人类。

在这种情况下,炒作很可能与美国公司Three Square Market中的耸人听闻的案件有关。在那里,雇主开始提供芯片植入皮肤下以换取费用。该芯片允许您打开门,登录计算机,在机器上购买零食-即通用雇员卡。而且,这种芯片正好用作识别卡,它没有GPS模块,因此不可能用它跟踪任何人。如果一个人想从他的手上取下切屑,在医生的帮助下需要5分钟。


通常将芯片植入拇指和食指之间。 来源

阅读详细的文章了解世界上最先进的切削技术

4.4。沉浸式工作区


“沉浸式”是另一个无处可去的新词。它无处不在。沉浸式剧院,展览,电影院。什么意思 当作者和观看者,虚拟世界和现实世界之间的界限消失时,沉浸感就是一种沉浸感的创造。相对于工作场所,这大概意味着模糊执行者与发起者之间的界限,并通过重新设置其环境来鼓励员工采取更加积极的立场。

由于敏捷现在在我们身边无处不在,因此灵活性和紧密的交互作用-工作场所应尽可能易于配置,应鼓励团队合作。经济决定了它的条件:临时工越来越多,办公空间的租金成本不断增长,在竞争激烈的劳动力市场条件下,IT公司正试图通过创造休闲区和其他好处来提高员工满意度。所有这些都会影响工作的设计。


诺尔报告

4.5。拟人化


每个人都知道广告中的个性化。这是当您今天与同事讨论房间里有些东西干了,您需要在办公室里购买加湿器时,第二天,您会在社交网络上看到一则广告-“购买加湿器”(发生在我身上的真实情况)。


来源

根据Gartner的说法,拟议的广告化是对用户日益关注的的将其个人数据用于广告我们个人的广告。例如,我们的位置,设备的类型,一天中的时间,天气情况-这并不违反我们的个人数据,我们也不会监视监视的不适感。

关于这两个概念之之区别的间,见安德鲁·弗兰克在网站上的一个博客Gartner的数据。由于存在的如此细微区别和类似的词语,您可能知道其不当的区别,冒着却与您的很对话者争论长时间的风险,通常不会对此怀疑都是正确的(这也是作者所经历过的真实案例)。

4.6。生物技术-人造纤维(生物技术-培养或人工组织)


首先,这是种植人造肉的想法。 同时,世界各地的几个团队都在从事Meat 2.0实验室的开发-预计它会比平时便宜,快餐店和超市将开始使用它。 在这项技术的投资者中,有比尔·盖茨,谢尔盖·布林,理查德·布兰森等人。


来源

每个人都对人造肉如此感兴趣的原因:

  1. 全球变暖:农场的甲烷排放量。 这是影响气候的全球气体总量的18%。
  2. 人口增长。 肉类的需求在增长,并且无法为所有人提供天然肉类-根本就是昂贵。
  3. 缺乏空间。 亚马逊地区70%的森林已经被砍伐用于牧场。
  4. 道德考量。 有些人对此很重要。 PETA动物保护组织已经向将在市场上投放人造鸡肉的科学家提供了100万美元的奖金。

用大豆代替真正的肉是部分解决方案,因为人们会很好地感受到口味和质地的差异,并且不太可能放弃牛排而转向大豆。 因此,需要的是真正的有机肉。 现在,不幸的是,人造肉太贵了:从每公斤12美元起。 这是由于这种肉的生长过程复杂。 阅读所有这篇文章

如果我们谈论的是组织生长的其他情况(已经在医学领域),那么与人工器官有关的话题就很有趣:例如, 特殊的3D打印机打印的心肌“贴片”。 有一些已知的故事,例如人造心脏的生长,但总的来说,一切都没有超出临床试验的范围。 因此,未来几年我们几乎看不到科学怪人。

在此,Gartner的估计非常谨慎,显然牢记他对2015年的失败预测,即在2019年,发达国家的10%人口将拥有3D打印的医疗植入设备。 因此,它表示达到生产力稳定水平的时间-至少10年。

5.数字生态系统


5.1。 去中心化网络


这个概念与网络发明者的名字,图灵奖获得者蒂姆·伯纳斯·李爵士紧密相关。 对他来说,计算机科学中的道德始终很重要,互联网的集体本质也很重要:为超文本打下基础,他深信网络应该作为网络而不是层次结构运行。 因此,它只是在网络开发的初期。 但是,随着Internet的发展,由于多种原因,其结构变得集中。 事实证明,只需几个提供商即可轻松阻止整个国家的网络访问。 用户数据已成为Internet公司实力和收入的来源。

Burners-Lee说:“互联网已经分散了。” -问题在于,一个搜索引擎,一个大型社交网络,一个微博平台占​​主导地位。 我们没有技术问题,但是有社会问题。”

在对万维网成立30周年的公开信中 ,网络的创建者概述了互联网的三个主要问题:

  1. 有针对性的危害,例如国家资助的黑客攻击,犯罪和在线骚扰
  2. 系统的特定设备(对用户不利)为以下机制创建了基础:诱骗点击诱饵的财务推广和虚假信息的病毒式传播
  3. 系统设计的意外结果导致冲突和质量降低的在线讨论

蒂姆·伯纳斯·李(Tim Berners-Lee)已经就“健康人互联网”的基本原则提出了答案,而没有出现问题2:“对于许多用户而言,广告收入仍然是与网络交互的唯一模型。 即使人们担心自己的数据正在发生什么,他们也同意与营销机器进行交易,以获得机会免费接收内容。 想象一下一个这样的世界,在该世界上,双方都可以轻松且轻松地享受服务商品的付款。” 安排方式的选择包括:音乐家可以不用iTunes的中介就可以出售其唱片,而新闻网站可以使用微支付系统阅读一篇文章,而不必靠广告赚钱。

作为这种新Internet的试验性原型,蒂姆·伯纳斯·李(Tim Berners-Lee)发起了SOLID项目,其实质是将数据存储在“壁炉”(信息存储)中,并且可以将这些数据提供给第三方应用程序。 但是原则上,您自己就是数据的主人。 所有这些都与点对点网络的概念紧密相关,也就是说,您的计算机不仅请求服务,而且还提供服务以免将一台服务器视为单个通道。


来源

5.2。 权力下放的自治组织


这是一个受以计算机程序形式记录的规则支配的组织。 她的财务活动基于区块链。 创建这样的组织的目的是消除中间人的角色,为交易对手创建一个共同的,可信任的环境,交易对手不是一个人一个人,而是一个人所有。 也就是说,从理论上讲,如果该想法扎根,应该废除公证人和其他熟悉的验证机构。

此类组织最著名的例子是DAO,该公司专注于风险业务,2016年筹集了1.5亿美元,其中有50个是通过规则中的合法“漏洞”立即被盗的。 立即面临一个困难的难题:要么退回并退还资金,要么承认提取资金是合法的,因为这丝毫没有违反平台规则。 结果,为了将资金返还给投资者,创建者不得不销毁DAO,重写区块链并违反其基本原理-不变性。


关于以太坊(左)和The DAO(右)的漫画。 来源

这整个故事破坏了DAO想法本身的声誉。 该项目是基于以太坊加密货币进行的,预计明年将推出Ether 2.0版本-也许作者(包括著名的Vitalik Buterin)会考虑错误并展示一些新东西。 这可能就是为什么Gartner将DAO放在上升线上的原因。

5.3综合数据


为了训练神经网络,需要大量数据。 手动标记数据是一项艰巨的工作,只能由人类完成。 因此,您可以创建人工数据集。 例如,网站https://generation.photos上相同的人脸集合。 它们是使用GAN-算法创建的,上面已经提到过。


这些人不属于人。 来源

此类数据的一大优点是使用它没有法律上的困难:没有人同意处理个人数据。

5.4。数字运算


自从DevOps扎根于我们的演讲以来,后缀“ Ops”变得非常流行。 现在了解什么是DigitalOps-它只是DevOps,DesignOps,MarketingOps的概括...您还不觉得无聊吗? 简而言之,这是DevOps中采用的方法从软件行业到业务的所有其他方面(市场营销,设计等)的转移。


来源

DevOps的想法是通过创建程序员,测试人员,安全性和管理员的共同团队来消除开发本身(运营)和运营(业务流程)之间的障碍。 某些实践的实施:持续集成,以基础架构为准则,减少和加强反馈链。 目标是加快产品在市场上的发布。 如果您认为它像敏捷,那您就认为它是对的。 现在,从精神上将这种方法从软件开发领域转移到一般的开发中-您将了解DigitalOps是什么。

5.5。 知识图


一种模拟知识领域的软件方法,包括使用机器学习算法。 知识图建立在现有数据库之上,以将所有信息链接在一起:结构化(事件或人员列表)和非结构化(文章文本)。

最简单的示例是您可以在Google搜索结果中看到的卡片。 如果您正在寻找某种人或机构,那么您会在右侧看到一张卡片:


请注意,“即将发生的事件”不是来自Google地图的信息的副本,而是日程安排与Yandex.Afishey的集成:如果您单击事件,则可以轻松看到它。 也就是说,这是几个数据源的组合。

如果您要求提供名单(例如“著名导演”),他们将为您显示“轮播”:


对于那些读到最后的人有奖励


现在,当我们为自己澄清每个要点的含义时,我们可以看到相同的图片,但是已经是俄语了:



在社交网络上免费分享!


Tatyana Volkova-三星IT学院物联网跟踪课程的作者,三星研究中心的企业社会责任计划专家

Source: https://habr.com/ru/post/zh-CN477040/


All Articles