
朋友,我们发起了AI / ML开发人员之间的竞赛
-RAIF Hackathon 。 我们邀请您参加! 该活动是RAIF 2018商业商业论坛(俄罗斯人工智能论坛)的一部分。 一年前,我们进行了类似的
黑客马拉松 ,但是这次的格式将有所不同。 有两个阶段在等您:在线排位赛和RAIF宾客面前的最终离线战役。 Rosreestr,Utkonos和Novolipetsk Metallurgical Plant(NLMK)承担三个任务,并据此选择三个提名。 奖金超过一百万卢布。 是的,与去年一样,有必要借助机器学习技术来解决任务;)。
您可以单独参加,也可以最多3人参加。 您可以自行决定选择一项,两项甚至全部三种任务。 在这三种情况下,您都可以使用我们合作伙伴的真实数据(当然是匿名的)。 也就是说,您将有很大的机会了解他们的业务幕后,我们认为,这比大多数黑客马拉松提供的抽象虚构任务要有趣得多。
一个任务是绝对的结果:
该流的参与者将能够在竞赛网站的排行榜上查看其结果。
其他两项任务很有创意:
- 分析商品需求(“鸭嘴兽”)。
- 预测房地产的地籍价值(Rosreestr)
在这里,我们仅提供来自合作伙伴的数据,您自己将必须弄清楚该数据可以做什么。
但是首先是第一件事。
在线和离线
RAIF Hackathon将分两个阶段举行:在线和离线。 在10月19日(含当日)之前,我们将举行NLMK的在线资格巡回赛。 对于Utkonos和Rosreestr的任务,此阶段要少1天-直到10月18日。 在帐户中注册并填写个人资料后,您可以下载数据。 完成工作后,有必要在您个人帐户的同一位置卸载创建的数学模型。
10月11日是“时钟和解”的日期:在这一天,您可以发送中间(或已经确定)的解决方案,并获得黑客马拉松策展人的反馈。 及时的专家建议会增加您进入决赛的机会。 此选项对于参加Utkonos和Rosreestr提名的人尤其重要,每个提名都涉及几种解决方案。
10月20日,将对资格赛阶段的结果进行汇总,10月21日,结果将
发送给邮件列表中
的参与者,并将在
RAIF Hackathon网站上发布。
在每个类别中,符合决赛资格的前10名球队将在10月23日在莫斯科举行会议,这是RAIF商业论坛在决赛中的一部分。 决赛入围者正在等待其他数据和4个小时的编码,以完成他们的项目。 所有这些都在AI / ML领域公认的专家和大型俄罗斯公司的高层管理人员面前。 总之,将进行汇报和奖励。
在NLMK的提名中,优胜者将由绝对结果决定。 在Utkonos和Rosreestr的提名中,评审团将根据提交作品的保护结果来确定最佳决定。 奖金将由3个团队分享-每个团队将获得35万卢布。
任务,他们是提名
NLMK的AI
任务是预测钢带在热轧机现场的通过时间。
NLMK的热轧机可生产宽度最大为1850毫米,厚度为1.45毫米至16毫米的轧制产品。 等级范围-从低碳到高强度,包括碳等级以及电工钢。 热轧卷板的主要消费者是建筑企业,造船,汽车,管道制造商以及他们自己生产的冷轧产品。
热轧产品如下。 加热后的板坯从方法炉中卸载到轧机生产线上-钢板用作轧制的坯料。 在沿着轧机生产线的轧制过程中,一条钢带在粗轧和精轧机组的机架中被压缩,变得越来越薄,越来越长,最后在特殊的卷取机上被卷起。 地带越薄越长,它在营地周围移动的速度就越快。
带钢的匿名数据(宽度,厚度等)和轧制下一个带钢之前轧机运行的非个性化数据(辊台速度,机架功率等,不参考方案)用作输入数据。标明了它们的物理意义。
NLMK数据分析总监Andrzej Arshavsky:
在hackathon格式中,我们要尝试解决预测关键单位之一的钢租用时间的问题。 黑客马拉松使人们有可能从不同角度看待通常的生产过程,并观察如何使用不同的,有时是意想不到的方法对其进行优化。 对于RAIF Hackathon参与者来说,这是一个证明自己,尝试解决另一个实际问题并了解他们在同事中的水平的机会。
Rosreestr的AI
创意任务!
确定影响房地产价值的参数,并建立一个数学模型来估算这些物品的市场价值。
新技术,特别是机器学习,可以显着提高房地产评估的效率。 在对房地产市场状况以及各种因素对房地产价值的影响程度进行分析的基础上,通过机器学习算法“生成”的结论可以逐步替代通过分析得出的结论。
在该竞赛中,邀请参与者根据提供的卸载和来自开源的任何其他数据(将确定对象的市场价值)建立预测模型。 同时,作为确定市场价值基础的数据以及用于构建模型的样本本身,参与者必须在开源中独立找到。 作为黑客马拉松的估计结果,将考虑一堆提议的数学模型和表示形式。
演示文稿必须反映:
- 模型构建中使用的外部数据
- 评估模型及其结果正确性的方法
- 模型本身的描述
- 在此基础上可以得出的最重要参数和结论的说明。
创意评估选项- 实际适用性
- 良好 :已完成分析工作。 在构建模型时,考虑了影响房地产价值的各种外部因素。 鉴于缺乏许多外部因素的信息,该模型可以预测房地产的价值。
- 错误 :结论是所有因素都以相同的方式影响,或者模型仅对一小部分对象起作用
- 一种评估解决方案准确性的方法
- 良好 :找到正确的测试样本,能够演示模型的运行
- 差 :根据众所周知的公式计算地籍值
- 使用外部数据
- 良好 :您已经分析并评估了各种外部因素的影响(与关键基础设施的距离,交通便利性,房屋状况,公园/森林公园的存在,水体,缺少垃圾填埋场等)
- 错误 :未添加任何参数或未正确使用它们(允许目标变量泄漏)
- 新颖性
- 良好 :结论和解决方案与知名度和可访问性不同
- 不良 :使用标准公式进行计算
Rosreestr的IT部门副主管Timofey Alekseev:
对我们来说,评估所提出的解决方案的实际好处以及在服务工作中进一步应用这些解决方案的可能性将非常有趣。 我们期望参与者能够提供非标准的解决方案并关注细节。
鸭嘴兽的人工智能
创意任务!
使用过去几年中从仓库赎回商品的历史数据分析在线大卖场对产品的需求。
鉴于需求不断变化,该解决方案将帮助公司在仓库中提供所需数量的货物。
在此任务的框架内,以下内容很有趣:
- 可以考虑价格变化和某些商品的可用性如何影响其他商品需求的算法和解决方案(晕轮效应,“吞噬”)。
- 替代品和相关产品的定义。
- 识别客户行为模式,并根据这些模式预测商品订单。
乌特科诺斯岛预测自动化经理Vladimir Alabin:
我们希望对需求以及影响需求的因素有更完整的了解,以便尽可能满足客户的需求,并在另一方面优化仓库的运营。
创意评估选项- 领域理解
- 良好 :该解决方案基于对业务需求的理解。
- 不好 :根据参与者的说法,所有参数都是同等有用的,或多或少是可以预测的-没有区别。
- 成本效益
- 良好 :您计算了零售业务可能感兴趣的指标(例如,从系统实施中获利)。
- 不良 :计算出的抽象AUC或准确性。 该商店的用途尚不清楚。
- 使用外部数据
- 好 :您赞赏假期,天气和其他外部因素的影响。
- 错误 :添加了牵强的参数(例如天气对火星的影响)。
- 新颖性
- 好 :您带来了自己的东西,并展示了它与现成的解决方案的不同之处。
- 错误 :打开Stackoverflow,找到一个类似的问题和答案,以类推。
>> 成为RAIF Hackathon的会员 <<
注意! 我们将为技术部分抽取10张门票
在RAIF Hackathon完成后,将举行一个技术部分,您可以在其中聆听来自数据科学的知名专家-著名的俄罗斯和外国公司(包括初创公司)的代表。 其中:FUPM MIPT智能系统系教授
Konstantin Vorontsov ;
Omitoklassniki的软件工程师
Dmitry Bugaychenko ;
Emeli Dral ,Mechanica.AI首席数据科学家 Jet Infosystems数据科学团队负责人
Nikolay Knyazev ;
Alexey Dral BigData团队首席执行官等。
所有黑客马拉松决赛入围者都可以免费参加技术部分。 对于尚未对自己的能力有信心或不打算参加黑客马拉松的人,但真的想参加这次活动,我们宣布抽出10张门票! 在10月9日(含当日)之前,请在Facebook和/或Vkontakte上重新发布并以个人消息的形式在此处发送链接。 获奖者将在10月10日由随机数生成器确定。 我们将通过毒品通知所有人。
UPD:朋友们,为了与RAIF Hackathon参与者进行业务互动,我们创建了一个电报聊天t.me/RAIFHACK-您可以在那里询问有关hackathon的问题。