对象识别系统的前5个应用领域



几十年前开始尝试教各种系统以人的方式去了解和理解世界,但是现在这些技术已经变得如此完美,以至于它们被广泛应用于我们生活的许多领域。 哈布雷(Habré)已经有关于机器视觉,神经网络和识别算法的详细文章,因此我们将不再深入介绍这些复杂的技术,我们将讨论这些系统在现实世界中的实际使用。

如何运作? 简要地


对于我们来说,对于图像识别系统而言,摄影只是一组具有不同颜色参数的像素。 要教系统识别图像中的单个对象,必须为它提供一个数据集-数千个图像的集合,这些图像准确指示所需对象的位置。 例如,如果我们希望系统学习图片中的人物识别,则需要向其显示很多不同年龄,不同姿势和不同衣服,不同条件的人物的照片。 经过这样的训练,系统将能够准确地识别照片中的人。 但是,另一个问题是:如果对于系统而言,照片只是像素的集合,那么神经网络如何理解照片中确切描绘的内容?

可以使用各种方法来识别图像中的对象,但是最有前途的方法之一是定向梯度直方图(HOG)方法。 图像变色,然后系统以16x16像素的块找到颜色变化的方向(渐变矢量),在整个图像上建立这些矢量的映射图,从而``快照''对象的符号,这些符号不会根据位置/位置和照明而变化。 该算法的一种改进版本称为CoHOG-它考虑了对象的边界,也就是说,它不仅可以识别形状而且可以识别梯度矢量。

东芝改进了CoHOG方法,显着改善了在弱光下的识别能力-例如,传统的CoHOG在行人几乎看不到大灯的情况下,在黑暗中的快速识别效果不佳。 ECoHOG方法 (定向梯度的组合直方图技术)通过对轮廓的方向和大小进行额外分析来确定一个人的头部,腿,臂,肩,从而确定该人。 如果CoHOG只是在图像上隔离人体测量轮廓(分析“对象边界-边界向量”),则对于ECoHOG,对象边界相对于彼此的尺寸非常重要。

五个关键应用领域


市场行销


模式识别是广告和营销中一个有前途的领域。 神经网络可以在几个小时内学习事物,在其他情况下,这需要庞大的专业团队和数周甚至数月的研究才能找到。 例如,俄罗斯服务YouScan(一种社交媒体监控系统)可在社交网络上跟踪品牌的提及。 此外,他不仅在帖子文本中而且在照片中都这样做,还有助于得出有关该产品的某些结论。 在模式识别的帮助下,照片发现了一个有趣的模式 ,任何人都不会发现这种模式 :在动物中,使用Apple技术的猫更多,而使用阿迪达斯品牌的狗更常见。 此异常信息对于广告定位很有用。


搜索Adidas徽标时,YouScan服务使用所有者手中的智能手机过滤照片。 版权:YouScan

视频监控


在城市监控摄像头上进行模式识别可能是使用机器视觉的最不可避免的前景。 自2017年以来,智能视频监控系统已在莫斯科进行了测试,以识别拥挤场所中的罪犯。 俄罗斯公司NTechLab的技术已经帮助拘留了数十名违法者,并将其连接到城市摄像机网络。 在中国,这种视频监控系统不仅可以识别人脸,还可以识别公共场合的汽车和衣服品牌,随后营销人员可以将其用于研究。

视频显示了识别图像和面部的真实工作SenseTime


模式识别已经成为医学领域的真正突破-在许多情况下,即使是最有经验的医生,计算机也会注意到某些东西。 他们充当特殊的助手,他们的“技术”观点证实了医生的假设或引起了更深入的研究。

在俄罗斯,正在进行在CT,MRI和PET图像上诊断癌症的软件系统的开发。 为此,通过神经网络驱动成千上万个标记图像,之后新图像的识别精度提高到95-97%。 其中一个平台的开发是由莫斯科信息技术部使用Google TensorFlow开放库进行的。

谷歌创建的盗梦空间神经网络分析了淋巴结活检的显微镜检查,以寻找乳腺中的癌细胞。 对于一个人来说,这是一个非常漫长而费力的过程,在此过程中很容易犯错或错过重要的事情,因为在某些情况下,图像大小为100,000 x 100,000像素。 初始神经网络提供的灵敏度约为92%,而医师为72%。 尽管允许错误警报,但神经网络将不会看不见图像的所有可疑区域,随后医生会对其进行过滤。

汽车


汽车中的对象识别是ADAS(高级驾驶员辅助系统)安全系统的必要组成部分。 ADAS可以使用复杂的工具(例如雷达和红外传感器)或单眼相机来实现。 在上一篇文章中,我们已经说过一个摄像机足以使汽车实时识别行人,标志和交通信号灯。 但是,这种“即时”识别是非常耗费资源的任务,需要专用处理器。 东芝多年来一直在开发一系列处理器。 他们基于来自单个摄像机的运动图像来构建三维模型,从而注意到道路上未知的障碍物。 确实,如果训练了一个神经网络以仅识别人,标记和标志,那么位于沥青上的轮胎或围栏将不会被识别并视为危险。


Visconti处理器可以识别图像中的区域,对其进行分类,并帮助自动驾驶仪或ADAS做出决定。 资料来源:东芝

无人驾驶飞机


在无人机中,对象识别用于娱乐和科学目的。 在2015年,百合花无人驾驶飞机在为船东提供抛掷和跟踪功能时发出了很多噪音,并具有自动发动机启动功能。 莉莉将镜头对准所有者,而不管其运动的轨迹和速度如何。 没错,莉莉的这项功能与模式识别无关,因为无人机不仅可以观看人的图像,还可以观看放置在所有者手上的控制面板。


图像识别无人机也用于更严重的事情。 例如,挪威的eSmart Systems公司开发了智能电网解决方案。 在他们的项目之一“连接无人机”中,无人机被用来对电源线进行故障排除。 他们经过对电网元素识别的培训,可以验证电线,绝缘子和电力线其他部分的完整性。 当向城市或企业的电源依靠线路供电时,这对于快速定位故障非常重要。 鉴于电力线通常建在难以到达的地方,因此,派遣无人机人员在针叶林或山区中发现故障的方法要比派遣人员有效得多。


ESmart无人机可以找到能源基础设施的组成部分,并在发生损坏的情况下标记对象,并向操作员发出警告。 资料来源:eSmart Systems

Source: https://habr.com/ru/post/zh-CN433544/


All Articles