有关银行业的Netology课程“数据科学”的毕业生

在网络学中,数据科学的方向出现在2016年。 刚开始时,人们担心的是:这个领域是新的,对于公司的科学家约会的需求虽然不错,但希望进入这一领域的人潮并不多,而且网络上还有很多免费的自学英语资源可供自学,这就是我们冒险的原因。

但是今天,已经有10个有关数据处理的各种专业课程,毕业生人数超过800。我们决定向其中一位毕业生询问有关数据处理的知识,他如何进入该领域,机器学习如何发展的。 Loco Bank和他的团队正在寻找什么样的人。

Vyacheslav Potapov, Loko Bank的数据分析和机器学习负责人, 数据科学家课程的毕业生

我毕业于莫斯科国立技术大学。 鲍曼(Bauman)于2011年进入“太空飞船”专业,并进入更高阶段。 之后,他在分析师,数据库开发人员和仓库架构师的各个地方工作了7年。 在这段时间里,我学到了很多有关数据处理和存储的知识,但是在某个时候,我想进一步研究分析-了解所有这些数字的含义,存储和处理的内容。

我开始寻找增长的方向:我研究了IT领域的相关职位,研究了行业中的薪水水平以及需求量。 关于Habr的文章很多,关于Youtube的视频很多,它们在某种程度上帮助我了解了处理数据的本质以及当时的现有技能如何有用。

然后我遇到了数据科学(DS)和机器学习(ML),但是基础知识还不够。 这个领域非常广泛,当您观看一些视频或文章时,您只会得到零碎的知识,但总的来说,您不了解该专业的本质是什么,方向,方法和工具是什么。 这是为大学阅读一本厚厚的数学教科书的方法,但是如果没有解释和实践,将很难应用所获得的知识。

一位同事告诉我有关Netologiya的信息,那里有一个大型的全日制数据科学课程,而在俄语市场上,我没有满足这样的合适条件。 结果,他成功地学习并捍卫了他关于“使用神经网络进行图像识别”主题的论文。 就像我现在记得的那样,这是非常困难的,我没有解决成熟任务的实践,而且我确实真正想做的不仅仅是教育工作,而是一项完整的项目。

在学习的同时,他尝试解决Kaggle的问题并开展工作项目。
在课程刚结束时,我开始寻找一个可以完全从事数据分析的地方,因为很难将BI系统架构师的工作与DS中的实践相结合。

经过一系列采访之后,他选择了Loko-Bank和DS的指导。

在我看来,数据科学作为研究所的类似物,需要管理层的信任,耐心和对观点的理解。

在Loko-Bank,他们看到了这些前景-因此我开始在Digital Business部门工作,该部门正在发展分析的方向。

乐高银行的分析师和数据科学家正在做什么


现在,该银行拥有一个经典的IT部门,负责基础架构和数据存储,其他部门则使用这些数据源,并设置集成新数据源的要求。 总共有大约40名员工在公司进行分析工作。

在Loko银行,流程自动化,数据分析和建立数据驱动型经济正在成为公司的首要任务。 我希望基于这些信息,我们将能够更正确地建立销售,进行风险评估以及整个业务。

在业务部门中,使用分析的工作分为两个领域:经典分析-BI,BI的专家分析公司的计划和实际绩效,准备有关销售,余额,收入和支出以及ML方向的报告。

机器学习专注于创建算法,该算法基于经典分析师的证据进行预测,生成新数据并查找隐藏的依存关系和异常情况。 这是我负责的部门。

银行中的ML才刚刚开始发展。 但是,我的目标是-建立一个系统,使其对业务有所帮助,并允许您使用所有现代方法来增加收入和降低成本。 我们必须彻底改变业务流程,并寻找在现有IT体系结构中实施机器学习工具的方法。 这样做可能会很困难,因为该体系结构不是昨天设计的,并且其中的一些要求根本没有列出。

例如,要求收集日志以供客户进入移动银行。 对于经典分析,不需要它们,因此从未收集或存储它们。 我解释说,基于这些日志,我们可以训练模型以预测平台负载,并查看移动银行的使用与客户获利能力之间的关系。 如果不是为了ML的开发,那么这样的分析将根本不存在,因为没人会处理这一问题。 所需要的是一个指南,该指南将解释为什么以及为什么,给出指导,如何构建体系结构,如何收集数据,如何构建模型以及在何处应用它们。

随着机器学习的引入,我想建立一种在整个银行中处理数据的文化:数据的收集,处理以及新资源的集成。 同时,我们已经在为客户解决预测分析的任务,我们正在进行客户细分,以优化关税并增加公司的销售额。

我们还从事财务监控,我们分析可疑客户和交易。 现在,公司在此任务上花费了大量的人力和财力。 我们希望简化这些流程并使之更高效。

如果我们谈论已经完成的事情,那么我们就开始收集和存储我上面写过的数据,尤其是用户日志。 现在,我们在联邦税务局的客户卡中存储有关更改历史记录的信息。

目前,我们正在开发一种模型来确定客户(法律实体和个体企业家)的负面行为,并且已经收到了良好的效果。 一项流行指标的得分是0.86。 在算法中,我们使用梯度增强。 我们计划在不久的将来实现其工作的稳定性,包括通过连接其他来源来实现。 该模型应有助于降低公司风险并优化寻找不诚实客户的成本。

机器学习指导需要什么样的专家


我们的团队仅在组建中,所以现在我尝试聘请通才。 当然,一个人可能更倾向于开发或相反地倾向于业务分析,但是尽管如此,他仍必须了解创建整体解决方案的过程,并了解其在解决方案中的作用。 对于那些想尝试不同角色的人来说,这是一个不错的选择。

重要的是,一个人知道如何解决实际的实际问题,至少可以解释方法和步骤集。 在面试中,我尝试提出逻辑问题,并且要求对算法和技术有一个总体的了解,而无需数学。

由于我本人是一名工程师,因此我尝试在我的团队中寻找具有工程背景的人,尽管这不是禁忌。 我知道人们未经技术教育进入该行业的例子。

创建ML解决方案绝非易事,因此仅获取所有数据,将其放入算法中并等待奇迹还远远不够。 您需要能够将自己沉浸在主题领域中,能够进行交流,提问和聆听,在某些地方这些技能可能比技术技能更有价值。

更具体地说,该部门现在主要对大数据工程师感兴趣。 神经网络和xgboosts很好,但是首先您需要找到可以收集大量正确的,准备好的数据的专家。 没有它们,机器学习将无法正常进行。 在这个方向上,我至少需要两个人。 但是公司对它们有许多要求:他们必须了解ETL工具,SQL,并具有建立店面和数据仓库的经验,并且能够解决优化问题。

最好增加两名分析师的工作人员,最好是具有银行业经验的人员。 尽管数据科学是重中之重,但该领域可以是任何领域。

市场的主要问题是缺乏能够将业务需求转换为有意义的ML任务,有时会主动提出解决方案的人员。

要解决此问题,您需要了解业务本身和现有工具,并具有良好的软技能以正确地提出问题的解决方案。 很难找到这样的东西。

在哪里发展


由于我们只是在商业公司中引入机器学习,因此我们需要执行一些决策,这些决策将取决于整个领域的进一步信心。 这些决定与业务部门存在的理由有关。 如今,机器学习已为大家所熟知,因此特别受关注。

在我的部门内成功实施ML工具之后,我们计划在整个银行范围内扩展任务库和专家团队。

首先,银行是大量的数据流,庞大的客户群,因此是巨大的责任。

一方面,有些客户想要获得优质的服务并保存其数据,另一方面,总有人希望访问存储设施以获取机密信息。

我认为,随着工作量的增加和流程的复杂性,将某些职责和功能委托给机器是公司稳定增长的唯一可能条件。

一个想要在银行业走向机器学习方向的人必须首先能够将机器学习工作任务与银行的主要目标联系起来。

给那些想进入机器学习领域的人的提示


首先,有必要回答自己到底想做什么的问题,只有在这之后,才知道需要什么。 DS是一个巨大的发展领域,一方面是一个很好的领域,但另一方面,您可以徘徊很长时间,而不会遇到一些特定的问题。

一开始,我不建议您深入学习数学。 着重解决实际问题和工具(库,方法)。 开发数据库,​​清理和处理数据以及初级分析的经验对我很有帮助。 在实际工作中,大部分时间都是数据收集和准备工作,朝着这个方向的高质量工作将在未来显着提高ML解决方案的质量。

很高兴我们生活在一个容易找到任何信息的时代。 该网络在各个领域都有许多课程,社区(ODS),会议和讲习班定期举行。 但是您需要了解ML是一门年轻的学科,它只是形成而已,没有基本的学习方法。 因此,必须谨慎选择发展路径:学习不同的培训计划,为自己设定正确的口音。 我很幸运-我选择了符合我的要求和期望的课程,并为Loko-Bank开发了一个巨大而有希望的方向。

来自编辑



Source: https://habr.com/ru/post/zh-CN455517/


All Articles