如果您超过40岁并且不是程序员,那么如何成为数据中心

有一种观点认为,您只能成为具有适当高等教育或学位的数据中心。

但是,世界在变化,技术正在向凡人提供。 也许我会让某人感到惊讶,但是今天任何业务分析师都能够掌握机器学习技术,并取得与专业数学家甚至最好的数学家竞争的结果。

为了没有根据,我将告诉您我的故事-作为一名经济学家,我成为了数据分析师,通过在线课程和参加机器学习竞赛获得了必要的知识。



现在,我是QIWI大数据小组的首席分析师,但三年前,我离数据正弦还很远,并且从新闻中只听说过人工智能。 但是后来一切都改变了,这在很大程度上要归功于Coursera和Kaggle。

所以,首先是第一件事。

关于我自己


我是经济学家,曾担任商业顾问一段时间。 我的专长是为后续自动化开发预算和报告方法。 如果采用简单的方式-这是关于首先正常构建流程,那么以后将获得自动化的结果。

3年前,在42岁的时候,我觉得从咨询方面的成功开始,我开始青铜器,并开始思考变革的必要性。 关于下一个职业。 我已经有过从头开始职业的经验(30岁时,我把经济学家的安静生活变成了咨询工作),所以这些变化并没有吓到我。

这不是我马上想到的,但是当您考虑一下时,很明显,尽管我已经工作了20年,但退休还有25年的时间(早就知道,我们应该将退休重点放在70岁甚至更晚) ) 通常,前面的路要比已经通过的路长,因此最好选择一个实际的专业。 因此,值得学习。 当时,我是自由职业者,为了将来,我减少了项目数量,并能够分配足够的时间来学习。

当我在考虑进一步发展时,我发现了Coursera。 西方的教育方法首先解释了含义,总体思想,然后才是细节,结果却与我很接近。 与残酷的苏联教育体系不同,后者假设只有有价值的人才会升起,但它们给像我这样在基础教育方面存在差距的人提供了机会。

我从商业分析课程开始。 作为顾问,这对我非常有帮助。 相同的课程帮助我更好地了解了AI技术在业务发展中的作用,最重要的是,了解了我在其中的作用。 这与其他技术相同-完全没有必要开发新技术的人将其应用程序做到最好。 要使技术真正对企业有帮助,了解该企业很重要。 业务流程方面的专业知识与理解机器学习,大数据处理等技术同样重要。

然后,我参加了有关数据正弦,统计和编程的课程。
由于受到干扰,在一年的时间里,我在Coursera掌握了30多门课程,不再觉得自己像大日期和机器学习领域的外星人。

卡格勒


一些课程推荐Kaggle作为练习的好地方。 不要重复我的错误-只有当我已经感觉到我已经积累了足够的知识时,我才来到那里。 当六个月前第一次了解什么和如何出现时,这是值得的。 六个月会凉爽一些。 毕竟,这不仅是竞赛的场所之一,还是实践中掌握机器学习的最佳(目前)平台,这对于初学者和超级大师都是有用的。 正如他们所说,在那里,您一天成长为两天-只有没有实践的课程不会产生这样的效果。

我的第一个比赛是桑坦德银行的比赛 -预测客户满意度。 我是一个初学者,想检查我的业务知识水平。 我结合了自己作为银行客户的经验,分析业务案例和机器学习技术的技能,并制定了一个很好的模型,并以此跻身公共排行榜前50名。 鉴于有5,000多人参加了比赛,这比我对第一场比赛的期望要高得多。

但是,并非一切都那么简单。 我没有度过一个快乐的周末。 我在实践中遇到了“初学者”这样的初学者中常见的问题。 本地验证的组织性很差,我太专注于公开,结果-在测试的封闭部分,我飞了500多个职位。 当然,我很沮丧,但该课程适用于未来:良好的验证是机器学习的基础,需要认真解决。 现在,此组件是我模型的优势之一。

尽管第一手成绩不佳,但我们有信心进入顶峰是真实的,您需要更多的练习和更多的知识。

对于那些不知道Cuggle有什么好处的人,社区已准备好帮助初学者克服一些麻烦,讨论想法,分享“它如何工作”的例子。 嗯,同样重要-在比赛结束时,有机会研究领导者的决策。 借鉴他人的经验,您可以快速进步。 不必自己踩所有耙子。

我立刻不禁想起了讲俄语的数据科学家社区OpenDataSaines(ods.ai)。 ods组织的机器学习培训是了解该主题的另一种方法。 嗯,作为交流任何问题的平台,它也很有帮助。 如果您正在考虑在datasines上的未来,并且尚未向ods注册,这是一个严重的错误。

由于经常在Datacenter职位的空缺中提到对Cuggle取得高绩效的期望,因此我看到了这样做的机会-除了获得经验的事实之外,还有机会用或多或少的相关经验填写一份空缺的简历。 我开始将Cuggle视为可以开始职业生涯的奖金。

空闲时间一出现,我就在Cuggle上建立了模型,每次比赛结果都变得更好。

我拥有大多数参与者没有的东西-分析业务案例的能力以及我在咨询方面的经验,这在构建模型时大有帮助。 六个月后,我在桑坦德银行的下一场比赛中获得第七名,并获得了我的第一枚金牌。

如果您坚持不懈地追求一个特定的目标,那么您将会实现这一目标-一年后的2017年6月,我在Cuggle进行了一些努力,我们与拉脱维亚开发商Agnis Lukis一起赢得了Sberbank的一项竞争,以预测莫斯科的公寓价格。



我们的强项是了解案例(这是一项复杂的任务,不像大多数人那样,应该在额头上解决问题),并且要进行强有力的本地验证。 我们在公开比赛中获得了第二名,但是我们的模型并没有受到太多的重新训练,也没有在封闭数据上下垂-最终,我们是第一个获得巨大利润的公司。

这次胜利使我进入了全球Kaggle排名的前50名,从而获得了工作机会。 在研究了选择方案之后,我选择了银行作为一个可以执行许多任务的地方,并且可以在开发模型时感受到生活的全部真相-尽管如此,比赛中的条件还是很复杂的。

我的职业生涯计划雄心勃勃,没有考虑“不急于工作几年才能发展到更高水平”的选择。 有必要在工作中进行深入研究,在第二个转变中不要忘记Cuggle。 这并不容易,但是现在对谁来说容易呢? 这样就产生了结果-再获得3枚金牌,我在Cuggle上获得了Grandmaster的肩章,并跻身全球顶尖(现在排名第23)。

就像蛋糕上的樱桃一样-在银行计分比赛中获得三等奖,这是我去年的专业工作。 而且,显然,他表现不错。

las,银行的生活真相也是一个非常保守和快速的决策过程。 我的模型的介绍进展缓慢。 没有重建整个银行工作的计划,因此尽管感到遗憾,但换工作比较容易。

事实证明这并不困难-借助Cuggle的结果,搜索并不需要花费很多时间,而且几个月以来,我一直在QIWI中挖掘数十亿张表。 我们有许多有趣的任务 ,我相信很快我们就能将我们的数据转化为公司的利润-经济学家的背景对此有很大帮助。 卡格卢普(Caggloop)在某些情况下也出现在票房上。

现在关于如何在比赛中取得成功


最重要的部分是了解问题并找到可能影响结果的所有驱动程序。 您对案例了解得越多,就越有可能使它变得更酷。 每个人都可以生成数百甚至数千个统计功能,但是他们可以提出专门针对此任务量身定制的功能,并很好地解释目标,这要复杂得多。 投资于此,并迅速将自己置于顶部。 值得应用任何相关经验(企业,家庭等)-会有所帮助。

然后-本地验证。 您的主要敌人是再培训,尤其是当您使用梯度增强等强大技术时。 我知道停止专注于公共排行榜在心理上有困难,但是如果您不希望失望,正确的答案是使用交叉验证,对延迟的选择说“不”。 当然,也有例外,但是即使在时间序列方面存在问题,也可以进行交叉验证,从而大大提高了模型的可靠性。 本地验证方案并非总是那么简单,但是值得花时间在比赛和现实生活中。 奖励将是稳定的模型。

当然,您需要很好地学习基本工具。 了解不同技术的原理,您可以适当地选择解决特定问题的最佳工具。 对于表格数据,渐变增强现在是领导者,尤其是Lightgbm。 但是重要的是,能够使用从登录到神经网络的其他方法-在生活和比赛中,它们不会是多余的。

顺便说一句,当一切都在快速变化时,了解现在正在驱动什么技术的最好方法是查看竞争领导者使用的图书馆。 近年来,许多有价值的技术通过Cuggle进入了世界。

超参数 重要的是要了解所使用工具的关键超参数。 通常不需要更改很多参数。 我的信念是,您不应在选择超参数上花费大量时间。 当然,有必要找到良好的超参数,但您不应在其中进行循环。

通常,在概述模型时,我会选择一套或多或少稳定的参数,并在其他想法用尽时,才在接近终点时返回到它们的调整。 常识表明,花在创建和测试新变量,库和非标准构想上的时间,与从将一组良好的超参数转变为理想的超参数相比,可以带来更大的模型增长。

如果您依靠Kaggle作为一项功能,它将使您的简历更加丰富-将其视为一项工作,您将不会后悔。 它帮助了我,它将帮助您。

一次又一次关于比赛。 她在这里很高,所以独自一人赢得非常非常困难。 团队合作非常有用,想法的协同作用使您跃上头顶。 随时使用它。

合计


好吧,最后一点动机。 首先,我向自己证明了我可以在44岁时成为数据中心。 食谱竟然非常简单-在线教育,面向业务的思维,绩效和决心。



现在,我正在以各种方式鼓励我的朋友们走同样的路。 新的数字经济需要(并且将需要)顶尖的专业人员。 Coursera + Kaggle只是一个不错的起点。

曾几何时,Excel是一种新的且难以理解的工具(我什至还记得用传统计算器进行首战是多么困难)。 毕竟,现在,没有人会怀疑,精通其业务的专家可以从Excel中获得比Excel开发人员本身更多的实际收益。

将会花费一些时间,拥有机器学习工具将像拥有Excel一样具有强制性,那么为什么不提前做好准备,现在就赢得劳动力市场的竞争呢?

而且,竞争是不值得的。 来自业务方面的人越多,使用datasines的钱就越多。 在传统的经济领域中引入新技术可以加速企业发展,为此,企业应开始了解新技术今天所带来的机遇。 实际上,任何精通几门课程的业务分析师都可以站在发展的最前沿,并帮助他的公司超越保守的竞争对手。

我希望我的经验可以帮助某人做出重要决定。
如果您对Kaggle有任何疑问,请写信,我将很乐意在评论中回答。

Source: https://habr.com/ru/post/zh-CN427311/


All Articles