视频:神经网络描述了在阿姆斯特丹的漫步
这位美国艺术家展示了NeuroTalk神经网络的功能,该网络描述了实时视频的场景。系统犯了错误,自行纠正,但有时正确地告诉了发生了什么。猫咪下方的视频中,“一个男人拿着一个用芥末和番茄酱包子的香肠”,“剪刀正坐在钱包旁边的桌子上”和“从火车窗外看火车”。
在过去的几年中,计算机在识别图像中的对象(无论是面孔,动物还是家具)方面学到了很多东西。能够随着时间学习的神经网络可以描述复杂的场景。从美国艺术家和程序员凯尔·麦克唐纳(Kyle MacDonald)拍摄的视频中可以明显看出,这些系统远非绝对准确。麦克唐纳(MacDonald)修改了斯坦福大学和Google研究人员开发的神经网络,以分析在阿姆斯特丹街头的网络摄像头捕获的视频。艺术家使用了NeuralTalk开源软件。它能够实时描述场景。该程序会出错,有时会自行纠正。有时,此类系统被称为人工智能,但它们会费力地做到这一点:在描述图像和视频时,该软件无法理解图片中的内容-它只是在寻找对象之间的连接。Facebook正在开发
类似的系统。该公司正在开发一种识别照片中物体和人物的系统,包括使残障人士更容易使用该社交网络。Facebook视频分析尚未进行讨论,但可以假定该公司正在考虑将这种想法用于新闻源的智能设置。
Facebook开发人员使用这些照片教该系统识别狗的品种。 Source: https://habr.com/ru/post/zh-CN387227/
All Articles