神经网络的实际使用



当然,许多人还记得去年发布的《硅谷》第4季的第4集,其中Dzang Young推出了Not HotDog应用程序。

事实证明,这是一个真正的应用程序,专门为该系列制作了HBO,而Habr早已对此进行了介绍。

好吧,我们将告诉您我们如何制作一个机器人来不仅确定热狗,而且还确定许多其他项目,并根据照片确定人们的性别和年龄。

背景知识

我们不会处理神经网络。 我们只是想做一个项目,以提高零售网络中商人的生产率。



采购员的职责尤其包括检查货架上的货物可用性,为此,他们几乎每天都必须访问零售店并向主管报告货物的存在/不存在。

通常,将几家商店分配给该销售商,并且每天他们都会去各个领域-分配给他们的商店。

通常,采购员必须照相架子并把这些图片发送给主管-仿佛证明采购员确实在商店里。

实际上,在销售人员层级中最低的商人,他们的工作收入很少,他们并不总是真诚地工作,有时他们不去现场,而是将旧照片发送给主管。 他们被解雇,转到其他网络,该过程再次重复-在这个职位上,总会有大量人员流动,并且有固定的采购员。

经理们进行了各种尝试来改善对商人的控制-他们引入了带有地理坐标的棘手应用程序,无法发送旧照片等。

还雇用了神秘购物者来控制商人-他们必须在商店的货架上拍照,布置材料等。甚至有些公司也在学生,学童等中寻找这类神秘购物者,并将这些服务零售。 但是,这里出现了一个问题-谁来控制神秘的购物者,也就是说,所有依赖于人的意识的事物都需要不断监控。 而且,商人通常仍能找到绕过控制的方法,通常是盾牌和剑的问题。

这种想法总的来说是为了放弃人为因素。 我们的解决方案是,我们无需任何采购员的参与即可提供商品展示的视觉控制和货架上商品的可用性控制,我们做到了24/7。

事实是,我们的Messenger具有视频监控功能,也就是说,您可以将便宜的智能手机放在指尖上,并可以查看所有感兴趣的方(商人,主管,领导等)的视线。因此,您可以随时实时查看不管货架上发生了什么,销售商总是有相关的信息-是否需要去物品。

主管还可以随时监视采购员的工作,例如,如果主管是联邦网络,在该地区有大量代表,则主管可以随时随地查看其商品的状况。

出现一个合理的问题-为什么不使用便宜的便携式摄录机来完成这项任务?

答案是使用智能手机安装视频监控的便捷性以及在Messenger中的便捷使用性。

在大多数情况下,对于仅具有Wi-Fi连接的廉价便携式摄像机,您需要将该Wi-Fi放在某个地方,并且很可能需要一台带有3-4G调制解调器的路由器,也就是说,您已经需要两台设备。 另外,智能手机已经有电池,即断电期间没有问题。

为了使路由器正常工作,必须由或多或少有资格的人员进行某些设置,对于电话,视频监视模式可以非常简单地打开并且几乎可以由任何用户执行。

另外,要查看大量摄像机,您需要特殊的软件,需要考虑访问权限,提供用户名和密码,对于Messenger而言,访问访问的组织非常简单-正确的用户拥有允许他使用的摄像机列表,仅此而已。

智能手机的成本也很低-零售价为25-30美元。 对于智能手机,有很多类型的底座,可以放置小型智能手机,例如,在架子上的车内灯等。

80亿美元的问题



在深入探讨该主题的过程中,事实证明,例如,商店货架上商品的可用性(OSA-货架可用性)问题是全球性的,由于货架上缺少必要的产品,全球行业每年损失高达80亿美元。

有很多初创公司借助神经网络解决了这个问题-采购员在他出现在商店时,拍摄货架的照片,将其发送到云中,神经网络用货架图检查照片并以提示的形式发送结果-哪些物品正确站立,哪些产品不在货架上等

但是还有一个人为因素-一名员工早上来,拍照,按照规则张贴货物,然后离开。 然后,从字面上看,经过5分钟,一辆载有客户的公共汽车可以过来,他们将改变他所做的一切,而主管将认为一切都很好。

因此,我们认为最好一天进行几次分析,而且这种分析可以帮助确定某些商品的销售模式。

为了实现这一想法,我们决定最好在白天拍摄几张照片,然后定期将其发送给云以供识别。

但是我们没有使用神经网络的经验,并且制造自己的引擎然后对其进行训练似乎相当困难。

因此,我们决定采用一些现成的解决方案。 有人可能认为这种方法是错误的-您必须为在云中处理图像付费。

但是有一些反对意见-制造您自己的引擎既昂贵又持久,并且您需要训练神经网络,这也是一个费力的过程。

此外,使用现成的解决方案,您可以快速推出成品,而无需参与其创建,而是踩各种耙子并从错误中吸取教训。 而且我们不想成为神经网络的专家-对我们来说,它们只是解决特定问题的工具。

此外,市场上已有许多可用的平台-Amazon Rekognition,Google API等。随着这些平台的发展和它们之间的竞争,价格只会下降。

因此,我们决定将IBM Watson与它的视觉识别引擎一起使用。

视觉识别机器人

该项目的一个副产品是控制机器人在货架上的商品展示,我们将其称为视觉识别。

该机器人可以根据下载或拍摄的照片确定各种物体,并且还知道如何根据照片确定人物的性别和年龄。

我们还在IBM Watson上发布了该机器人本身及其算法,因此它在同一位置使用带有或多或少训练有素的神经网络的Visual Recognition引擎。

在Bluemix平台上,该机器人看起来像这样:



如何使用机器人

下载适用于AndroidiOS的 M1 Messenger。

在搜索中注册后,我们找到了视觉识别机器人:



添加到机器人:



该机器人将在“业务”标签中创建一个聊天记录:



现在您可以将照片上传给他:



单击处理并获得结果:



因此,热狗决定尝试汉堡包:



有一个非常流行的应用程序Vivino ,用户可以从一瓶任何葡萄酒中为标签拍照,并获得所有特性,等级,价格等:



借助Visual Recognition机器人,您可以对啤酒,伏特加酒等进行几乎相同的操作。 -IBM Watson具有学习模块。

好吧,通过照片识别年龄:



除了性别和年龄,神经网络仍在尝试确定服装行业:



确定照片中的年龄,性别和坐标:





Source: https://habr.com/ru/post/zh-CN422585/


All Articles