您在街头狗狗上见到您。 您总是在街上看到狗。 根本没有人注意到他们,也没有麻烦,也没有这些精神上的折磨,总的来说,我们可以假设他们在大街上有规范。 但是你! 他注意到,您的眼睛在潮湿的地方,有人认为:“小狗。 是的,好可爱,我愿意接受,但我不能接受。 但这是直接的,但绝不是。” 他走得很远。 但是他拍了张照片,抚摸了一下。
这是您需要将此动物的地理位置和几张照片放入系统的此类小动物。
有些人真的很想找到自己的逃生伴侣或其他一些小狗。 我只是真的很想找到一个宠物。 他们自己放置广告,穿过大门,地下室和各种场所。
2019年有利于更多技术解决方案。 我们的项目名称为PetSI(PetSearchInstrument)就是这样。
概念图
作为开放数据科学社区的
机器学习促进社会公益发展的一部分,我们与
9851754和我们的团队一起
创建了一种寻找失踪动物
的服务,所有者可以在其中指定动物的照片,丢失地址和其他特征,并从我们的角度获得最相关的信息。报告发现或看到的动物的算法。
我们服务的简要算法:我们汇总来自多个地点的数据(照片,位置,品种等),通过神经网络将图像转换为矢量,训练knn并显示所输入照片的最近邻居。 您找到了丢失的动物,该动物返回了家。 大家都开心)

除了寻找失踪的宠物外,我们还开发了一种推荐系统,以加速向新主人添加庇护所动物。 虽然我们没有网站上用户行为的统计信息,但是我们因此使用基于视觉相似性的基于内容的推荐。

已经有什么了
- 一支优秀的初学者和经验丰富的专业团队;
- http ://petsiai.ru-具有网络界面的可运行原型,用于输入动物的照片并显示类似的照片(该原型将在发布后几天内提供);
- 自动化管道,用于收集和处理信息;
- 更新了动物数据库(约11,000只狗和6,000只猫)。
引擎盖下
python正在开发中。 我们使用以下技术堆栈:
- Docker,Gitlab CI / CD,用于应用程序部署;
- Google Kubernetes Engine,用于托管我们的服务和应用程序;
- Scrapy,RabbitMQ用于数据收集;
- Sklearn,ML的喀拉拉邦;
- 该站点的Django,Flask,Bootstrap;
- 用于文本搜索的Elasticsearch。
为了同步工作流程的所有阶段,我们使用Airflow:

多阶段数据收集。 首先,蜘蛛会收集信息,并以原始形式将其发送到队列。 在队列的另一侧,特殊处理器将数据转换为所需的格式(例如,将文本转换为地址)并将其添加到DBMS。

收集的数据经过验证并发送到训练模型。 为该站点编写了一项特殊服务,该服务可以下载新数据和模型,还可以为每个用户启动重新搜索结果的计数。 整个周期大约需要8个小时。
我们如何使用机器学习和数据分析:
- 通过文字确定性别;
- 通过文字对品种的定义;
- 从消息中分配地址;
- 图像分割
- 将图像转换为矢量和人工神经网络。
即时计划
- 确认项目的可操作性,并连接第一对“主人失落的宠物”;
- 发展与庇护所的合作,简化主人宠物对的配对;
- 与其他资源进行协作,并使服务尽可能地易于使用。
来找我们

为了进一步发展,我们需要:
- 前端和后端军队的战士;
- ML专家;
- 数据工程师和系统管理员支持管道的功能;
- DevOps,用于在k8上部署应用程序并协助其管理;
- 蜘蛛工匠(草皮);
- 记者推广该项目;
- python中的程序员。
为什么需要这个:
- 如果您感兴趣,请承担社会责任。 突然间,您想受益吗?
- 一个真正的项目,您可以在其中实施自己的炫酷技能或发挥他们的才能;
- 您很陌生,可以去任何邀请的地方。 这也是一个不错的选择。
- 您自己正在寻找宠物,您知道它的感觉;
- 或者,您是一个不能只通过街头事件但又不知道该如何处理的人。
有一个计划。 需要团队中的人。
填写个人信息或填写
表格并加入!
而不是结论
最后,我们使用算法发现了来自庇护所的模因犬和类似犬,以供选择