
大约一年半以前,我开始参加黑客马拉松。 在这段时间里,我设法参加了莫斯科,赫尔辛基,柏林,慕尼黑,阿姆斯特丹,苏黎世和巴黎的20多个不同规模和主题的活动。 无论如何,我都从事一种或另一种形式的数据分析。 我喜欢自己一个人来到新城市,结识新朋友,想出新主意,在短时间内实现旧主意,并在表演和结果公布时感到肾上腺素。
这篇文章是有关黑客马拉松的三篇文章中的第一篇,我将告诉您什么是黑客马拉松,为什么要开始参加黑客马拉松。 第二篇文章将讲述这些事件的阴暗面-组织者在行为过程中如何犯错,以及导致错误的原因。 第三篇文章将专门回答关于近黑客马拉松主题的问题。
什么是黑客马拉松?
Hackathon是为期数天的活动,目的是解决问题。 通常,黑客马拉松上有几个问题,每个问题都代表一个单独的轨道。 发起人公司提供任务说明,成功指标(指标可以是主观的,例如“新颖性和创造力”,也可以是客观指标,延迟数据集上的分类准确性)和成功资源(公司API,数据集,硬件)。 分配时间的参与者应提出问题,提出解决方案并展示其产品原型。 最好的解决方案将从公司获得奖励,并有可能进一步合作。
黑客马拉松阶段
任务宣布后,黑客马拉松的参与者将加入团队:每个“孤独者”都会收到一个麦克风,并讨论选定的任务,他的经验,想法以及需要实施哪种计划的专家。 有时,一个团队可以由一个人组成,这个人能够在相当高的水平上独自完成一个项目的所有工作。 这与数据分析黑客马拉松相关,但在杂货店活动中通常被禁止或不受欢迎-组织者的目标是对该项目进行进一步的工作,但已经在公司进行; 与只想创建产品的参与者相比,组建的团队具有许多优势。 最佳团队通常由4人组成,包括:前端,后端,科学家和业务人员的日期。 顺便说一句,数据仓库/食品黑客马拉松的分离非常简单-如果您的数据集具有清晰的指标和排行榜,或者您可以在jupyter笔记本中使用代码获胜,这就是数据仓库hackathon; 其他所有东西-您要在其中制作应用程序,网站或粘性物品的地方-杂货店。
通常,项目的开始工作从星期五的晚上9点开始,截止日期为星期日的上午10点。 这部分时间应该花在睡觉上(不要睡觉和编码-我检查过,这肯定是失败的方法),这意味着参与者没有太多时间去做高质量的事情。 为了帮助参与者,公司代表和指导员在现场。
该项目的工作始于与公司代表的沟通,因为他们可以更好地了解任务的细节,度量标准,并且最有可能在最后评估您的工作。 交流的目的是了解哪些领域最相关,以及值得您关注的重点和时间。
在一次黑客马拉松上,将回归任务设置在具有表格数据和图片以及清晰指标-RMSE的数据集上。 与公司的数据中心交谈之后,我意识到他们不需要回归,而是需要分类,但是只有管理层的某个人认为可以用这种方法最好地解决问题。 而且,他们不需要分类即可获得金钱指标的增长,而是为了了解哪些参数在做出决定时最重要,然后手动进行处理。 也就是说,初始任务(与RMSE回归)变为分类。 评估的优先级从获得的准确性变为解释结果的可能性。 反过来,这消除了使用堆叠和黑盒算法的可能性。 这样的对话为我节省了大量时间,并增加了获胜的机会。
一旦了解了您需要做什么,就可以开始对该项目的直接工作。 您必须设置一个检查小马-完成任务所必需的时间; 在此过程中,很高兴继续与导师(公司代表和技术专家)保持联系,这对于调整项目的路线非常有用。 重新看待该问题可能会提出一个有趣的解决方案。
由于有大量的初学者参加黑客马拉松,因此组织者的一个很好的口气是进行讲座和大师班。 通常会有三场讲座-关于如何将您的想法表达为产品,关于技术主题的讲座(例如,关于在机器学习中使用开放API的知识,这样您不必在两天内就编写语音文本,而要使用现成的讲座),关于音调的讲座(如何展示您的产品,如何正确地在舞台上挥动手臂,以免听众感到无聊)。 有各种各样的活动可以使参与者振作起来-瑜伽课,桌上足球和网球,或者在控制台上玩。
在周日上午,您需要将工作结果提供给陪审团。 在出色的黑客马拉松比赛中,一切都始于技术专长-您所说的确实有效吗? 该测试的目的是淘汰具有漂亮演示文稿和流行词的团队,但不要使用真正做某事的人提供的产品。 不幸的是,并不是所有黑客马拉松都具备技术专长,在某些情况下,一支由12张幻灯片和一组矿山组成的团队“……区块链,量子计算,然后AI将完成……”获第一名。 这样的先例并没有那么频繁,但是由于人们最好地记住了它们,因此许多人认为,出色的演讲是黑客马拉松比赛的99%胜利。 顺便说一句,演示文稿确实很重要,但其贡献不超过30%。
参加者表演后,评审团决定授予获奖者。 这就完成了黑客马拉松的正式部分。
参加黑客马拉松的动机
体会
就获得的经验而言,黑客马拉松是一项独特的活动。 在自然界中,没有太多地方可以在两天内从零开始实现这个想法并获得有关您工作的即时反馈。 在hackathon的批判性思维,团队合作,时间管理,在压力很大的情况下工作的能力,以可理解的方式展示其工作结果的能力,演讲技巧和许多其他技能的过程中,人们得到了极大的帮助。 因此,对于具有理论知识并希望获得实际经验的人来说,hackathon是一个绝佳的地方。
奖品
通常,黑客马拉松的奖金池约为1.5k-1k欧元(在俄罗斯为100-300 000卢布)。 参与的预期收益(期望值,EV)可以使用以下简单公式计算:
EV = Prize * WinRate + Future_Value - Costs
其中
奖品是奖品的大小(为简单起见,我们假设只有一个奖品);
WinRate-获胜的可能性(对于新手团队,此值将限制为10%以上,对于经验丰富的团队,此值将限制为50%及以上;我遇到了为每次黑客马拉松比赛留有奖金的人,但这是该规则的例外,他们的获胜率将是很长的距离低于100%);
Future_Value-一个显示参加黑客
马拉松的未来收益的值:可以是从获得的经验,建立的关系,收到的信息等中获得的收益。 该值几乎不可能精确确定,但必须记住。
费用 -交通,住宿等费用
参加此次比赛的决定是将EV hackathon与没有hackathon时您想做的EV活动进行比较:如果您想周末躺在沙发上捡鼻子,那么您应该参加hackathon。 如果您与父母或女孩共度时光-则将他们带到团队参加黑客马拉松(开个玩笑,自己决定),如果您是自由职业者-比较美元小时。
根据我的计算,我可以说在俄罗斯,对于一个普通的初级中级数据中心来说,参加黑客马拉松相当于可以从正常工作日赚钱,但是也有细微差别(团队规模,例如黑客马拉松,奖金池等)。 总的来说,骇客马拉松目前尚不算是一笔大财富,但它们可以极大地提高您的个人预算。
公司招聘和人脉
对于公司而言,黑客马拉松是雇用新员工的一种方式。 要证明自己是一个合适的人并且知道如何在黑客马拉松上工作,比在面试时旋转木板上的二叉树要容易得多(顺便说一句,这并不总是与您在数据中心专家的真实工作中所做的相对应,但必须尊重传统)。 在“战斗”条件下进行的这种测试可以代替测试日。
感谢黑客马拉松,我找到了第一份工作。 在黑客马拉松大会上,我表明可以从数据中榨取更多的钱,并告诉我我将如何做。 我在黑客马拉松上开始了这个项目,赢得了它,然后在赞助公司中继续了这个项目。 这是我生命中的第四次黑客马拉松。
获得唯一数据集的能力
这与黑客马拉松的日期非常相关,并不是所有人都了解它的重要性。 通常,赞助公司在活动期间提供真实的数据集。 此数据是保密的,位于NDA之下,不会停止向您显示真实数据集上的概念证明,而不是玩具泰坦尼克号上的概念证明。 将来,这样的结果将大大有助于在该公司或竞争对手公司中找到工作,或为类似项目提供证据。 同意,ceteris paribus已完成的项目得到了积极评估比总比没有好。 一般而言,此类已实施项目在咳嗽中具有奖牌和地位的作用,但对于整个行业而言,它们的价值更为明显。
小费
通常,在黑客马拉松上工作是一种非常多样化的经历,很难制定规则列表。 但是,在这里我想提供一些对初学者有帮助的意见:
- 即使您没有经验或团队,也不要害怕参加黑客马拉松。 考虑一下您可能有用的东西。 例如,您可能有一个有趣的主意,或者您擅长任何领域? 您可以使用您的领域知识来提出问题并找到非平凡的解决方案。 也许您最有能力使用Google? 如果您可以在github中找到现成的实现,那么您的技能将节省大量时间。 还是您非常擅长调整lightgbm参数? 在这种情况下,请勿参加黑客马拉松,而应在kagla比赛中证明这一点。
- 战术比演习更重要。 在黑客马拉松比赛中,您的任务是解决问题。 有时要解决问题,就必须找出来。 检查您发现的问题与公司确实相关。 检查您的决定是否符合问题,并向自己提出有关解决方案最佳性的问题。 在评估您的解决方案时,他们首先将研究问题的相关性以及所提出解决方案的适当性。 神经网络的体系结构,或者您收到了多少手,对任何人都不感兴趣。
- 参加尽可能多的黑客马拉松,但不要犹豫,不要组织混乱的活动。
- 将您在hackathon上的工作成果添加到您的履历表中,不要害怕公开写这篇文章。
黑客马拉松的实质。 简要地