狗吃了神经网络

您在街头狗狗上见到您。 您总是在街上看到狗。 根本没有人注意到他们,也没有麻烦,也没有这些精神上的折磨,总的来说,我们可以假设他们在大街上有规范。 但是你! 他注意到,您的眼睛在潮湿的地方,有人认为:“小狗。 是的,好可爱,我愿意接受,但我不能接受。 但这是直接的,但绝不是。” 他走得很远。 但是他拍了张照片,抚摸了一下。


这是您需要将此动物的地理位置和几张照片放入系统的此类小动物。

有些人真的很想找到自己的逃生伴侣或其他一些小狗。 我只是真的很想找到一个宠物。 他们自己放置广告,穿过大门,地下室和各种场所。

2019年有利于更多技术解决方案。 我们的项目名称为PetSI(PetSearchInstrument)就是这样。

概念图


作为开放数据科学社区的机器学习促进社会公益发展的一部分,我们与9851754和我们的团队一起创建了一种寻找失踪动物服务,所有者可以在其中指定动物的照片,丢失地址和其他特征,并从我们的角度获得最相关的信息。报告发现或看到的动物的算法。

我们服务的简要算法:我们汇总来自多个地点的数据(照片,位置,品种等),通过神经网络将图像转换为矢量,训练knn并显示所输入照片的最近邻居。 您找到了丢失的动物,该动物返回了家。 大家都开心)



除了寻找失踪的宠物外,我们还开发了一种推荐系统,以加速向新主人添加庇护所动物。 虽然我们没有网站上用户行为的统计信息,但是我们因此使用基于视觉相似性的基于内容的推荐。



已经有什么了


  • 一支优秀的初学者和经验丰富的专业团队;
  • http ://petsiai.ru-具有网络界面的可运行原型,用于输入动物的照片并显示类似的照片(该原型将在发布后几天内提供);
  • 自动化管道,用于收集和处理信息;
  • 更新了动物数据库(约11,000只狗和6,000只猫)。

引擎盖下


python正在开发中。 我们使用以下技术堆栈:

  • Docker,Gitlab CI / CD,用于应用程序部署;
  • Google Kubernetes Engine,用于托管我们的服务和应用程序;
  • Scrapy,RabbitMQ用于数据收集;
  • Sklearn,ML的喀拉拉邦;
  • 该站点的Django,Flask,Bootstrap;
  • 用于文本搜索的Elasticsearch。

为了同步工作流程的所有阶段,我们使用Airflow:

多阶段数据收集。 首先,蜘蛛会收集信息,并以原始形式将其发送到队列。 在队列的另一侧,特殊处理器将数据转换为所需的格式(例如,将文本转换为地址)并将其添加到DBMS。



收集的数据经过验证并发送到训练模型。 为该站点编写了一项特殊服务,该服务可以下载新数据和模型,还可以为每个用户启动重新搜索结果的计数。 整个周期大约需要8个小时。

我们如何使用机器学习和数据分析:

  • 通过文字确定性别;
  • 通过文字对品种的定义;
  • 从消息中分配地址;
  • 图像分割
  • 将图像转换为矢量和人工神经网络。

即时计划


  • 确认项目的可操作性,并连接第一对“主人失落的宠物”;
  • 发展与庇护所的合作,简化主人宠物对的配对;
  • 与其他资源进行协作,并使服务尽可能地易于使用。

来找我们




为了进一步发展,我们需要:

  • 前端和后端军队的战士;
  • ML专家;
  • 数据工程师和系统管理员支持管道的功能;
  • DevOps,用于在k8上部署应用程序并协助其管理;
  • 蜘蛛工匠(草皮);
  • 记者推广该项目;
  • python中的程序员。

为什么需要这个:

  • 如果您感兴趣,请承担社会责任。 突然间,您想受益吗?
  • 一个真正的项目,您可以在其中实施自己的炫酷技能或发挥他们的才能;
  • 您很陌生,可以去任何邀请的地方。 这也是一个不错的选择。
  • 您自己正在寻找宠物,您知道它的感觉;
  • 或者,您是一个不能只通过街头事件但又不知道该如何处理的人。

有一个计划。 需要团队中的人。

填写个人信息或填写表格并加入!

而不是结论


最后,我们使用算法发现了来自庇护所的模因犬和类似犬,以供选择

Source: https://habr.com/ru/post/zh-CN459988/


All Articles