使用机器学习方法在视频流中进行坦克识别(在Elbrus和Baikal平台上有+2个视频)


在我们的活动过程中,我们每天面临确定发展重点的问题。 鉴于IT行业发展的高动态,企业和国家对新技术的不断增长的需求,每次确定发展载体并将自己的资源和资源投入到公司的科学潜力中,我们确保我们的所有研究和项目都是基础性的和跨学科的。


因此,在开发我们的主要技术-HIEROGLYPH数据识别框架时,我们既关注提高文档识别的质量(我们的主要业务),又关注着应用该技术解决相关识别问题的可能性。 在今天的文章中,我们将介绍基于识别引擎(文档)如何识别视频流中较大的,具有战略意义的对象。


问题陈述


利用现有经验,构建一个坦克识别系统,该系统可以对物体进行分类,并在控制不佳的情况下确定基本几何参数(方向和距离),而无需使用专用设备。


解决方案


作为解决该问题的主要算法,我们选择了统计机器学习的方法。 但是机器学习的关键问题之一是需要足够数量的学习数据。 显然,从包含我们所需对象的真实场景中获得的实物图像对我们来说是无法访问的。 因此,由于我们在此地拥有丰富的经验,因此决定求助于培训所需的数据。 然而,完全合成用于此任务的数据似乎是不自然的,因此准备了特殊的布局来对真实场景进行建模。 在布局上安装了各种模拟乡村的对象:独特的景观覆盖物,灌木,树木,障碍物等。 使用小型数码相机拍摄图像。 在捕获图像的过程中,场景的背景发生了显着变化,以确保算法对背景变化具有更大的稳定性。


图片


四种战车模型被用作目标:T-90(俄罗斯),M1A2艾布拉姆斯(美国),T-14(俄罗斯),Mercava III(以色列)。 对象位于多边形的不同位置,从而扩展了对象可接受的可见角度的列表。 工程屏障,树木,灌木丛和其他景观元素发挥了重要作用。


图片


因此,在几天之内,我们已经为训练和随后的算法质量评估(了数以万计的图像)组装了足够的集合。


他们决定将识别直接分为两部分:对象定位和对象分类。 本地化是使用训练有素的分类器Viola和Jones进行的(毕竟,坦克是正常的刚性物体,不比面部差,因此“细节盲目” Viola and Jones方法可以快速定位目标物体)。 但是我们将卷积神经网络委托给角度的分类和定义-在这项任务中,对我们而言重要的是,探测器能够成功识别出那些可以区分T-90和Merkava的特征。 结果,可以构建有效地构成算法的组合,从而成功解决相同类型对象的定位和分类问题。


图片


此外,我们在我们拥有的所有平台(英特尔,ARM,Elbrus,贝加尔湖,COMDIV)上启动了结果程序,优化了计算难度较大的算法以提高性能(我们已经在文章中对此进行了介绍,例如,此处https:// habr .com / ru / company / smartengines / blog / 438948 /https://habr.com/en/company/smartengines/blog/351134/ ),并已在设备上实时实现了程序的稳定运行。




作为上述所有操作的结果,我们获得了具有重要战术和技术特征的成熟软件产品。


智能坦克阅读器


因此,我们向您介绍我们的新开发成果-一种用于识别Smart Tank Reader视频流中坦克图像的程序,该程序:



  • 它可以实时解决给定对象集的“敌对友”问题。
  • 定义几何指示符(到对象的距离,对象的首选方向);
  • 它可以在不受控制的天气条件下以及异物部分重叠的情况下工作;
  • 在目标设备上完全自主运行,包括在没有无线电通信的情况下;
  • 支持的处理器体系结构列表:Elbrus,Baikal,COMDIV以及x86,x86_64,ARM;
  • 支持的操作系统列表:Elbrus OS,AstraLinux OS,Atlix OS以及MS Windows,macOS,支持gcc 4.8,Android,iOS的各种Linux发行版;
  • 完全国内发展。

通常,根据我们在哈布雷(Habré)上的文章的总结,我们提供了一个指向市场的链接,每个想要使用手机的人都可以下载该应用程序的演示版,以实际评估该技术的性能。 这次,考虑到最终应用程序的细节,我们希望所有读者都不要面对快速确定坦克是否属于某一侧的问题。

Source: https://habr.com/ru/post/zh-CN446176/


All Articles