Google的汽车将以高精度识别行人
在无人驾驶汽车问世之前,剩下的时间不多了。 Google让我想到了机器视觉技术和最重要的元素之一-实时识别行人。Google Research研究人员Alex Krizhevsky,Anelia Angelova及其同事介绍了一种使用神经网络检测行人的新方法。该方法显示出令人鼓舞的结果:通过Caltech行人测试,可以在73.8%的情况下以高精度检测到行人,该测试包含一个在城市和乡村条件下的50,000行人的数据库。此结果可与最佳替代设计相媲美。专家说,近年来有希望的领域之一是在神经网络中使用GPU加速器来执行几乎实时的复杂算法,以进行模式识别,NLP和视频流的流畅分析。在最近的Nvidia GPU技术大会上,介绍了几种此类解决方案。自2010年以来举行的ImageNet大规模视觉识别挑战赛测试就是最好的体现。从那时起,机器视觉算法在图像分类中的错误级别已大大降低。
行人识别是使用新技术的实际任务之一。将来,具有GPU加速功能的神经网络可能会在监控摄像头,车辆交通控制系统等中找到应用。回到Google的发展,识别行人是一项非常艰巨的任务,因为它需要在几乎实时的不断变化的环境条件下解决。汽车周围的物体在运动。现有技术相对成功地解决了这个问题。例如,其中一种方法在Caltech行人测试中显示的准确度为58%;另一种称为VeryFast的方法提供的视频拍摄速度为100帧/秒(相比之下,Google的拍摄速度为15帧/秒),但该准确性较低。有些方法具有较高的精度,但是它们的工作速度慢得多,将速度降低到195倍。Google Research设定了一个目标,即在不牺牲速度的情况下提高识别准确性。以15帧/ s的速度显示时,其准确性显着提高到73.8%。科学论文中的“ 26.2%平均未命中率”这一短语不应引起误解:我们并不是在谈论汽车错过了行人并且没有像Carmageddon一样获得积分的事实。相反,该短语表示此算法“缺失”并且没有识别出要在他面前制动的人。在Google Research上,机器视觉系统是在旧版Nvidia K20 Tesla GPU图形加速器上启动的。现在发布了K40和K80的新版本,这些版本已在Top500等级的某些超级计算机中使用。Google研究小组打算通过增加神经网络的级联深度并优化性能和准确性的比率来改善结果。一种或另一种方式,但是随着街上机器人汽车的到来,最好是穿光亮而不是伪装,以使汽车的机器视觉不会将背景与您混淆。另一方面,当汽车经常由半盲,半醉和分心的驾驶员驾驶时,即使在现在也可以提供此类建议。Source: https://habr.com/ru/post/zh-CN382879/
All Articles