第二个薄饼:SmartData 2018的发布



第一次会议与第二次会议有何不同? 准备第一场比赛时,既没有机会“照常做”,也没有听众的反馈,组织者必须做出大胆的假设。 这并不意味着结果会很糟糕。 但这意味着第一次之后肯定会出现新的考虑因素,而第二次考虑会有所帮助。

去年,我们第一次举行了SmartData会议,现在是“第二次”了:我们宣布将于10月15日在圣彼得堡举行的SmartData 2018

会议期待什么? 谁应该去找她? 与去年相比发生了什么变化? 我们谈论削减的一切。



最主要的


会议的形式是计划委员会最了解的-选择报告并帮助改进报告的人。 因此,我们询问了PC的参与者,并在他们的直接讲话中补充了该文本。 在准备第一个SmartData期间, Roman p0b0rchy Poborchiy再次成为了所有人中最健谈的人。

新SmartData的第一个明显区别是该站点立即显示了“本次会议的对象”枚举:数据科学家,数据工程师,数据架构师和统计学家。 一年前,这只是一次“数据会议”。 添加特定角色的背后是什么?

罗曼:“上次我们从听众那里收到了很多反馈,但对于这次会议的对象是谁,尚不清楚:对于数据工程师还是对于数据科学家? 该程序在这两个方面都有报告,但是对人们来说并不明显。

现在我们要明确指出该事件是针对两者的。 我们正在尝试以这种方式做到这一点:在SmartData的框架内,我们既有工程师的正式会议,又有科学家的正式会议。 这样一来,每个时段中的每个人都可以听一些东西。”

第二点可以引起我们的注意:如果一年前,以SmartData为名的副标题为``关于大数据和智能数据'',现在它已被题词``为那些沉浸于机器学习,分析和数据处理领域的人们的会议''所取代。 这背后是什么?

Tanya Denisyuk (计划协调员):“这是我们第一次在定位上存在不确定性,并且描述中大肆宣传“大数据”这一词组可能吸引“随机”人。 但是会议根本不是关于炒作,它需要沉浸在处理数据的世界中。 因此,现在我们删除了这句话,并大体上改变了定位,以便精通技术的人来。”

您还能期待其他什么变化?

罗曼:“首先,上一次所有的报道都是说俄语的,现在我们想请知名的外国演讲者参加。 如果可能的话,甚至那些不在俄罗斯的人也很少。 现在在这里作出任何承诺还为时过早,但是工作正在进行中。

其次,我们希望会议不仅要有报告,还要有其他有趣的与数据处理有关的“魔术”。 也许以互动的形式出现,可以在休息时戳。 也许以讨论的形式,参与者将能够宣布他们感兴趣的主题。”



细节


由于距离会议还有几个月的时间,因此大多数发言人和报告将更接近重点。 但是现在我们可以举一些例子,让您对程序有一些了解:

文本分析是一个雄心勃勃的重要领域:很明显,人类还没有取得很大成就,但是进步仍在继续,其成就可以为人类带来巨大利益。 从科学的观点和应用的观点来看,所有这些都是有趣的。

这些主题需要具有适当口才的发言人,并且将在SmartData上进行。 康斯坦丁·沃龙佐夫Konstantin Vorontsov)是与机器学习相关的最著名的俄罗斯专家之一。 此外,他同时从“学术”和“工业”两个方面看到了这幅图:康斯坦丁同时还是俄罗斯科学院计算中心的高级研究员和Yandex的专家。


谁能比其他人更了解人脸识别? 用户每天向其上传数千万张照片的照片。 Odnoklassniki的亚历山大·托博尔Alexander Tobol)现在知道即使在大规模和高负荷下也能有效实现人脸识别。 并且在SmartData上将与他人共享知识:使用什么,如何优化,何时进行重新培训。






以前使用SmartData的人不需要代表Ivan Yamshchikov :他的演讲“我们为什么要教神经网络以库尔特·科本的风格写诗?” 收视率最高。 对于不在那里的人,我们补充说,伊万在马克斯·普朗克研究所工作,他对人工智能原理很感兴趣,这可能有助于理解我们的大脑如何工作。

现在,他将做出一个完全不同的报告,这是伊万本人的描述:“我们将讨论在严酷的企业环境中使用机器学习与B2C有何不同,我们将探讨在数据短缺的情况下是否有可能构建AI解决方案,并讨论最佳解决方案。使用ABBYY产品示例在“战斗”条件下使用机器学习的实践。”


Yandex徽标如何出现在Apple演示文稿中? 多亏了CatBoost Gradient Boost Library:当机器学习在WWDC 2018主题演讲上开始时,它的名字与TensorFlow和Caffe等巨头合而为一。

去年,CatBoost团队的Anna Veronika Dorogush已经讨论过SmartData上的项目,然后在报告发布后,她直接被问题包围了。 从那时起,该库在GitHub上既具有新功能,又具有新星 -显然,它将再次非常有用,对于演讲者来说,还有一些SmartData演讲者专用的讨论区。


同时,我们也请您注意,现在报告接收正如火如荼。 因此,如果您正在使用数据并且需要共享,请不要保留并联系!



谁是评委?


今年,SmartData的计划委员会有许多新面孔。 而且由于这些人取决于对程序的期望,因此有必要了解他们自己在数据处理任务的哪一侧。 我们要求PC的参与者简要介绍一下自己。

Anton ZlodeiBaal Maltsev :“我从事计算机视觉已有10年了。 我们(来自Fiztekh的两个或三个同班同学)执行订购任务,或者执行我们自己的matmodel,模块,然后出售并实现。 在启动和定制开发之间。 十年来,我们的解决方案已经在很多地方得到实施。 首先,这是与计算机视觉相关的另一种生物特征识别:虹膜,手静脉的识别以及一点点面部识别。 还有一些解决方案可以识别货架,车号,火车上的货物。”

Alexander Sterligov :“我曾经在Yandex工作,当时我从事云管理。 这是由于从某种意义上说数据是由于云是大量的服务器,它们崩溃了,存在故障,您需要在每台服务器上部署自己的软件,而这一切都取决于数据。 现在,我在Joom项目中工作,负责整个分析平台和基础结构:数据收集,数据收集,处理。 我为分析师和数据科学家的工作提供工具。”

Alexey Tikhonov :“我在Yandex工作:五年来我从事搜索分析,现在从事设计分析。 此外,他还隶属于Yandex.Autopoet等项目,并以“神经防御”和Neurona的精神从事工艺品。

Pavel Plotnikov :“我在Wrike工作,最初是分析部门的自动化工程师,然后成为数据工程师。 我花了很多时间来拥抱Spark,然后我们尝试创建一个Mesos集群来计划Spark任务,并为它们分配资源。 同时,他们建立了一个平台来帮助启动服务(例如Kubernetes,当时还不那么流行)。 现在,我被称为分析操作人员,因为数据工程师被分为几个细分部门,而现在我更多地参与了基础架构和工具的开发。”

Nikita Povarov :“我在JetBrains尝试用机器学习(在有意义的地方)替换IDE中的启发式方法。 “以前,我从事A / B实验(通常是A / B实验)的Yandex指标,现在我有时会就此主题为一些外部公司提供建议。”

Roman Poborchiy :“我也在Yandex工作了很多年,一直在那儿,他们从事与数据相关的各种有趣的事情,而我自己也参与其中。 在我看来,作为一种近似,我似乎学会了将当下与假货区分开,并且我想组织一次会议,对那些真正在做某事的人来说,只有当下,而不用大肆宣传。 这是第一次成功,但现在我想完全做到。”

维塔利·胡多巴赫肖夫(Vitaly Khudobakhshov)仍然是不请自来的人,但是您已经从礼拜堂和关于恋爱关系的概率如何取决于一个人的名字的报告中知道了他。 感谢Vitaly在Odnoklassniki的工作,该帖子随附了一份报告,现在他从事一项新的主要活动:他致力于JetBrains中数据科学工具的开发。



门票


与上一年相比,门票也有所变化。

这里保持不变:随着会议的临近,它们的价格上涨,因此尽早购买是有意义的(最近的涨价已经是7月1日)。

但是正在发生变化:现在出现了几种选择,而不是全部使用一个统一的价格。 对于在一家大公司工作并自费参加会议的参与者而言,总体而言,一切仍然没有发生。 对于那些对门票价格持敏锐态度的小型企业,现在已经出现了折扣。 对于那些“独自一人走”的人,折扣更大。

门票已经在现场出售。 程序中的所有补货也将出现在此处。 因此,如果您已经决定参加会议,请立即访问该链接,如果您需要更多数据,请在将来打开它。

在SmartData见!

Source: https://habr.com/ru/post/zh-CN415357/


All Articles