精确到接近百分之一:SmartData 2017十大报告



SmartData会议与会者是喜欢使用数据的人。 必须假设他们在去年的会议之后非常认真地对报告进行了评估。

现在,根据这些估算,我们已经整理了前10个视频。 同时,为了取悦数据发烧友,他们指出了十个报告中每个报告的所有相关数字:排在首位,准确的收视率,收视率。

一般而言,最高排名的收视率通常不会有显着差异。 因此,也许您不应该太重视“谁跟随谁”-更重要的是,所有这些报告都获得很高的评价。 但是,另一方面,当它是如此令人兴奋时,又怎么不能太关注数字呢!



Neurona:我们为什么要以Kurt Cobain的精神教神经网络写诗?


演讲者: 伊万·雅姆希科夫(Ivan Yamshchikov)
位置:1
等级:4.51±0.08
观众人数:〜200
报告简报

会议的明确负责人是神经防御和Neurona项目创建者的闭幕主题演讲。 这是一种可访问的性能,不需要查看者的大量准备-但同时,这不仅仅是“神经网络如何工作”的十分之一的解释。 这似乎是一种“有趣的”格式(立即听到的声音不太可能影响您的工作项目)-但从长远来看,所有这些不仅非常有趣,而且很有用。 总的来说,我们邀请Ivan参加即将到来的SmartData 2018不足为奇。




从单击到预测,反之亦然:Odnoklassniki中的数据科学管道


演讲者: 德米特里·布加钦科(Dmitry Bugaychenko)
地点:2
等级:4.36±0.08
观众人数:〜140
报告简报

而这是相反的。 首先,这不是一般的“机器学习可以给我们带来什么”,而是“确切地说我们如何实现一切”的细节。 而且该报告本身并不是关于ML(以新闻订阅源的个性化为例),而是与之相关的一切:“要做所有这些ML-beauty工作需要做什么。” 一般而言,如果Yamshchikov的演讲甚至可能引起广泛的听众的兴趣,那么仅与机器学习相关的人会感到很有趣,但是他们可以为自己承担很多责任。




CatBoost-下一代梯度提升


演讲者: 安娜·维罗妮卡·多罗古什
位置:3
等级:4.32±0.12
观众人数:〜100
报告简报

如果梯度增强不是您的专长,并且报告的主题引起了这样的感觉:“对于那些已经已经用威武和主要力量做到这一点的人来说,可能会有细微差别”,消除了这种担忧。 该报告对初学者很友好,并且不会立即浮出水面,而是首先说明基本内容。 考虑到在过去的一年中,Yandex CatBoost库比上一年变得更加美丽和流行,即使您现在不必处理它,对它有所了解也很有用,并且该报告可以作为一个很好的介绍。




回到现代银行系统的未来


演讲者: 弗拉基米尔·克拉西希奇克(Vladimir Krasilshchik)
位置:4
等级:4.31±0.17
观众人数:〜80
报告简报

如果由于最终的一致性,您的季度报告数据与每月报告不一致,并且审计师和监管者有疑问,该怎么办? 弗拉基米尔·克拉西尔希克(Vladimir Krasilshchik)解释说,比特时代成为关键概念:存在“事件何时发生”,以及“何时系统被发现”,您需要同时使用这两个尺度并将其演示给第三方测试人员。 该报告不仅仅限于此,还有很多-例如,您是否认为在IT会议上您会听到“没有正义,您不应该尝试创建它”的说法?




名称是功能


演讲者: Vitaly Khudobakhshov
位置:5
评分:4.28±0.08
观众人数:〜280
报告简报

会议最矛盾的陈述,迫使您困惑不解。 一方面,对于任何有理智的人来说,这是完全显而易见的:没有明显的理由可以使一个人的名字与之相关(如果我们谈论的是俄罗斯流行的名字)以及该人是否会与人建立关系。 另一方面,Vitaly呈现相反的数据。 他本人没有确切的解释,但没有人真正找到令人信服的反对意见。 您可以尝试搜索自己。




没有数据? 没问题! CGI的深度学习


演讲者: 伊万·德罗金(Ivan Drokin)
位置:6
评分:4.26±0.18
观众人数:〜40
报告简报

如您所知,算法不足以进行深度学习-我们需要用于学习的初始数据。 结果,好的数据集已成为宝贵的资源。 但是,如果您现在还没有它,并且您不是Google并且无法投资巨大的资源,该怎么办? 事实证明,并非总是需要从现实世界中获取“真实”数据,并且在某些条件下可以从字面上生成它们。 该报告涉及这种特定情况。




用于对象检测和图像分割的深度卷积网络


演讲者: 谢尔盖·尼古连科
地点:7
评分:4.24±0.17
观众人数:〜80
报告简报

如果您仍然距离机器/深度学习还差得远,那么本报告的前20分钟可能就很好了:从1950年代开始的一次历史考察就对该主题进行了详尽的介绍。 而且,如果您从整体上了解了所有内容,但您不了解深度卷积网络的子主题,那么您可以立即跳过该介绍,并关注报告的下半部分,该部分将介绍卷积神经网络。




Hadoop高可用性:Badoo体验


演讲者: 亚历山大·克拉申尼科夫
地点:8
等级:4.22±0.14
观众人数:〜100
报告简报

看来,除了“大数据”的概念外,“增长数据”也将是有用的,因为增长决定了它自己的特性。 一旦Badoo将数据量级减小了一个数量级并采用了一种方法,那么数据量就会增加并且需要进行更改-应该牢记的是,明天一切都会变得更加强大,“无所不能”地完成所有工作。

即使他们通常在这两个词之间写“不兼容”,这两家公司也开始对“ Hadoop”和“实时”的结合产生了兴趣,现在他们谈论了他们在Hadoop方面的经验并提供了高可用性。 奖励:幻灯片上的Vasily Lozhkin有点创造力。


我们每天实时细分6亿用户


演讲者: Artyom Marinov
地点:9
等级:4.21±0.09
观众人数:〜120
报告简报

在这里,该项目与Badoo截然不同:不是约会,而是DMP(数据管理平台),您要在其中突出显示受众群体中的细分受众群,例如“车龄超过5年的家庭主妇”。 但是,首先,它的规模也很大(每秒约十万个事件)。 其次,在这里您需要为增长做更多的准备:“在数据源中-像素安装,如果明天超级流行的网站将您的像素置于自身之中-将需要处理大量的数据流。” 他们处理什么技术?使用得如何? 报告中的答案。




大数据分布式机器学习:在ivi中构建推荐系统的经验


演讲者: Boris Schminke
位置:10
等级:4.21±0.09
观众人数:〜100
报告简报

最后,上一份报告也是“关于基础结构,而不是算法”,并且也是基于大型产品的经验。 曾几何时,ivi开始使用提供“建议即服务”的第三方服务来实施建议。 然后他们从中“成长”起来,开始创建自己的系统。 该公司早在2014年就在哈布雷(Habré)上发表过相关文章,从报告中您可以了解当前的情况。


如果您对这些报告感兴趣,请注意: SmartData 2018将于今年秋天举行。 与前10名不同的演讲者将返回新报告,其中将有全新的名字。 有关该程序的最新信息始终可以在网站上看到,您也可以在该网站上购买门票-并且它们的价格正在逐渐上涨,因此,您应该立即考虑。

Source: https://habr.com/ru/post/zh-CN416985/


All Articles