森林不屈服于搜索技术,但工程师反击


照片: Lisa Alert

如果一个人在森林中失踪了,找到他的最好方法是发送训练有素的搜索引擎进行梳理。 尚无搜索技术可以取代人们。 初夏,我们撰写了几支团队的文章,作为奥德赛竞赛的一部分,他们开发了野生动物解决方案。 许多工程师依靠带有摄像头和计算机视觉的无人机,但是并没有遇到明显的问题-通讯不良,海量数据的低处理和传输,茂密的树冠等等。

结果,没有一个具有计算机视觉的解决方案能够进入比赛的决赛。 但是技术专家说-如果这些团队联合起来,建立一个数据集并对其进行算法训练,则计算机视觉可能会有机会。

上周,即8月9日,搜索小分队Lisa Alert和Beeline宣布推出了一款可在无人机照片中搜索人物的工具。 我们参加了专门针对该发布会的新闻发布会,并了解了它的工作原理。

数万张照片


演讲是在紧急状态部关于飓风的丑闻宣布的第二天举行的,飓风在主要电视频道的播出中播放了十分钟。 飓风没有发生,但是天气仍然很糟糕。 对于Liza Alert小组来说,这有时就在眼前-森林中失踪人员的申请数量急剧下降,因为在恶劣的天气下,他们根本不去那里。 这释放了进行更复杂搜索的力量。 另一方面,在寒冷期间,失踪人员面临更大的危险。

例如,7月《丽莎快讯》收到1,083份森林申请。 其中大约有700个在郊区。 许多迷路的人仍然有电话,并且他们在网络覆盖范围内。 他们从森林中被“森林接触”小组带走,该小组解释了如何从阳光或自然地标中脱身。 有时,他们派出一个组来警报或将一个人带出去。

但是,最困难的搜索是那些与丢失内容无关的搜索。 例如,在几天的新闻发布会上,在Shchelkovo地区搜寻了一名73岁的妇女。 搜索引擎小组共走了2300公里,并从无人机上拍了8400张照片。

“现在我们的技术就是这样工作的,”格里高里·谢尔盖耶夫(Grigory Sergeyev)说,“我们拍照,然后将其上传到服务中,该服务由我们的志愿者编写,特殊小组可以查看照片。 班外的许多人也可以提供帮助。 在这些框架中,我们正在寻找与森林不同的东西。 远足团体立即出去看看它是什么。 现在,在Shchelkovo的搜索中,我们需要检查一百多个标记。 为了绕过所有人,您必须走三百多公里。”


当我们与“奥德赛”竞赛的参与者交谈时,他们对从空中拍摄森林的照片表示怀疑。 但是今年,“ Lisa Alert”每周在直升机的帮助下至少找到一个人。 据格雷戈里说,两年前,他们以这种方式发现整个季节只有两个人。 去年-六个。

无人机飞过一个人很难去的区域-防风林,沼泽。 无人机“ Lisa Alert”负责人亚历山大·洛蒙诺索夫(Alexander Lomonosov)展示了搜索小组追踪者的录音。 用单位梳理会留下很多白点。 无人机完全覆盖了这个领土。

“如果团队风风雨雨,他们将花费至少三个小时。 无人机在15分钟内在该区域工作。 在那里找到一个人-从空中。 他可以进入防风林,再也没有足够的力量离开防风林。 几名训练有素的人撤离了他四个多小时。 在此期间,只有370米通过了。 无人驾驶飞机,开阔的田野和沼泽,无人驾驶飞机的工作速度比普通的行走团队快许多倍。 如果田野上长满15厘米的草,则由训练有素的搜索引擎组成的步行小组将对其进行6-8个小时的梳理,而将无人机进行一小时的梳理。 他将携带整个区域的照片,并且将完全排除死区。”



平均而言,一次搜索可带来250张照片。 在六个月的时间里,他们积累了3.3万。 但现在,该机队中几乎没有直升机和飞行员。 如果数量增加,并且在Lisa Alert运营的所有20个地区都使用了无人机,那么一天之内将收集到33,000张图像。 而且,该分队花了240个小时才查看Shchelkovo的搜索照片。



搜索引擎和电信能力的数据集


两个月前,Lisa Alert和Beeline开始测试Beeline AI-人物搜索算法,该算法可以分析无人机的照片。

该项目始于学习如何自动滤除空白照片的想法,以便仅将怀疑有人在场的照片发送给正在观看的组。

“一次我试图找到特殊的数据集,尽管有人试图收集它们,但世界上并不存在,”亚历山大·洛蒙诺索夫说,“因此,我们自己将开发人员的照片传递给了开发人员:普通路人,进入采摘场的人,采蘑菇者,搜索引擎本身在工作。 所有这些都为机器视觉所基于的数据集奠定了基础。”



组装这样的数据集也是一项具有许多微妙之处的任务。 人们可以在任何位置进入框架:坐着,躺着,站着。 它们可以被分支覆盖,以至于只有一小部分可见。 周围的背景因风景,地区和季节而异。

“在许多地区,我们特别要求人们为受害者准备典型的姿势并拍照。 然后图片被人为地传播。 例如,他们在罗斯托夫(Rostov)拍摄了一个人的照片,并将其放在其他地区的底物上,”格里高里·谢尔盖耶夫(Grigory Sergeev)说。

在收到的照片中,直线数据科学家开始学习算法。

“作为运营商,我们习惯于处理大量数据。 我们有五个巨大的数据中心。 只有用于与Lisa Alert配合使用的Yaroslavl数据中心才能处理15 PB的数据。 因此,我们学会了如何构建非常现代的模型,” Beeline数字业务开发副总裁George Held说。



“照片进入我们的系统,我们需要确定照片上是否有人。 看到帽子,靴子,手,耳朵等等。 因此,我们将每个图像切成30-35层。 做了巨大的工作来找到适合于此的体系结构并创建算法,因为任何错误都会导致我们会在照片中错过人们的事实。 需要大量的计算资源来快速处理每一层。 我们使用与定位相同的模型。 我们采用它们的组件并在该项目上重复使用。”

该模型不仅可以搜索整个人,还可以注意到图片中森林中所有小的可疑伪像。 现在是测试的第一阶段,当算法丢弃所有照片的可能性为98%时,没有人。

剩下的图像会立即交给在那寻找人的志愿者,并在必要时将它们发送到搜索引擎或无人机以进行其他拍摄。 在测试系统时,还将检查丢弃图像的人员-但排在第二位。

下一步,开发人员计划讲授该算法,以更准确地确定人的照片并建立他们在森林中运动的预测模型。



为什么在这里5G


现在,系统具有两个选项。 第一个是脱机程序,用于在没有连接的情况下处理笔记本电脑上的图片。 它的功能是有限的,而且每次连接到网络时都必须对其进行更新,因为该算法一直在学习中。 在线服务发挥了最大的作用-将照片上传到Beeline服务器。 已经有1500万张图像通过数据中心。



丽莎警报使用DJI无人机进行搜索,因为她使用DJI无人机的程序进行自主飞行。 Mavic 2 Pro型号的一幅照片重约20 MB,每次飞行后,您都必须平均上载20 GB的照片并将其传输到服务中。 即使对于具有良好网络覆盖范围的地方,这也很多。

乔治·霍尔德(George Held)认为,搜索算法的工作是支持建立5G网络的一个论据。

“通过大型高质量网络传输信息非常重要,因此我们现在正投入大量资金来改善基站,正在建设5G网络。 许多运营商对此表示自豪。 但是最大的问题是-它是做什么用的? 要在YouTube上观看视频? 在4G上也可以正常工作。 5G需要真正的理由。 与Lisa Alert合作是一个很好的例子,因为必须快速传输大量信息。”



无需热成像仪


在初夏,在搜索技术竞赛中,只有一个依靠计算机视觉的团队才有资格进入决赛。 但是她用热像仪拍摄。 格里高里·谢尔盖夫(Grigory Sergeev)对此持怀疑态度。



“ 9年来,我们没有在热像仪的帮助下找到一个人。 每个人都想相信这是一件很酷的事情。 是的,我们可以使用它来停止搜索,例如晚上在空旷的地方。 但是对于其他所有内容,它都不适合。 草不透明,所有树冠都不透明。 一个人穿着衣服在森林里,衣服的环境温度很高。 热像仪是一个很酷的幻想,但对搜索无效。 我们尝试了所有防御设备,尝试了外国模型。 “它们适合复制,但是考虑到成本和有效性,我对热成像仪说不。”

当被问及为什么没有人能够有效地使用计算机视觉时,Georgy简单地回答:“他们没有我们现在拥有的开发能力。”

Source: https://habr.com/ru/post/zh-CN463667/


All Articles