我叫Azat Bulyakkulov。 我在金融科技公司ID Finance担任风险分析师。 我从分析开始,为风险,市场和财务部门创建报告。 在我们规模相对较小的公司中,我必须与所有部门进行互动。 结果,我设法获得了多样化的专业经验。 我参与了财务准备金的计算,在A / B测试中的表现进行了比较,针对市场进行了细分的客户等。在不到一年的工作中,我参与了计分卡的开发。 我意识到我想更好地了解数据分析和处理。

我们使用经典的逻辑回归来预测客户违约。 我们数据的来源之一是金融交易,如果需要,客户可以向我们提供访问权限。 与他们合作需要一种创新的方法,因为可以从该数据仓库中提取很多有用的信息。 后来我知道,该过程称为功能工程。 它吸引了我-我对数据科学越来越感兴趣。
与其他部门合作,我发现应用ML的范围非常广泛。 我们在重型SAS-e中进行开发,这一事实对我对DS的兴趣发挥了不小的作用。 它没有最方便的界面和不完整的功能。 我想使用一种更灵活的工具。
我意识到,例如在Coursera进行数据科学的自学,需要坚强的意志和自律,而我对此还不够。 因此,我开始把目光转向在线课程,而不是在线课程,包括讲座,讨论和家庭作业。
我向工作中的主管告知了我要发展的方向。 管理层来找我,并愿意支付课程费用,随后去了公司内部的数据科学部门。
因此,我开始选择课程。 奇怪的是,在线课程在DS教育市场中占主导地位。 即使在莫斯科,也没有大量的严肃课程可供选择,其风格不是“我们将在21天之内教您数据科学”。 我了解质量培训应至少持续六个月。 我没有考虑Yandex SHAD,因为它需要完全沉浸和日常活动。 全职工作,将很难以高质量的方式吸收和处理教材。 展望未来,我会说,在所选课程中,我在学习时间上遇到了问题,更不用说免费课程了。 结果,我在其中一所热门学校中持续了六个月的数据科学家课程中停了下来:5个月的强化培训+一个月写文凭。
关于课程
培训费用约为20万卢布。 有很多课程-每周3次,每次3个小时。 大约每3堂课中有2堂课完成作业。 该程序是经典程序,包括机器学习,推荐系统,图像识别,机器视觉,自然语言处理(NLP)和时间序列的基本方法。 另外,还有几场黑客马拉松和一份文凭,专为那些需要交最少所需家庭作业的人提供。

在鲍曼斯卡亚(Baumanskaya)上课,该小组招募了30人,但他们稳步行走15至20。 我在工作日和星期六的晚上从10:00到13:00练习了两次。 奇怪的是,来自不同领域的人员(不一定与IT相关)参加了这些课程。 是的,有前端/后端开发人员,但是课程的一半与产品/业务或风险分析有关。 对于几乎每个人来说,这些课程都意味着职业的改变。 有些人之所以来是因为现在对数据科学有一定的炒作,另一些人对当前的活动感到无聊,而另一些人则计划在其工作中使用DS。 几乎每个人都自己支付培训费用,因此兴趣水平很高。
我的印象
这一切都始于python和数据可视化的基本知识和编程技能。 然后我们转向疾驰,并在一堂课中开始遵循一种机器学习方法:关键树,线性/逻辑回归,随机森林,助推器。 我个人认为,学习这些经典方法需要更多时间。
我喜欢什么
- 我们研究了几乎所有现代机器学习方法和方法。
- 功能工程上有一个单独的模块-多达3节课。 这是有用的信息,但不幸的是,讲师并未以最佳方式阅读本部分。
- 家庭作业的一部分来自Kaggle比赛。 提交结果后,您可以看到自己的位置。 在那之后,人们有动力去改进模型,调整模型参数,而不仅仅是在“地狱”上做功课。
- 有关于推荐系统,NLP和计算机视觉的深入课程,每个课程有6-8个班级。 我认为,那里有最好的讲师。
- 在限制计算机视觉和时间序列之后,有两次黑客马拉松。
事实证明这是非常有用的练习。 在最短的时间内获得令人满意的结果的需求激活了大脑,并使大脑负荷最大。 另外,在团队中工作时,您会看到其他人的方法。
- 在我的个人帐户中,有一个学生评分,在那里我看到了同学们在家庭作业方面的进步。 那很有帮助。 自从休息期间,我走近“书呆子”,问他们如何做这个或那个家庭作业。
- “现场”讲座的优点是课程中的问题。
- 在听众中,根据讲师的指示,我们立即使用python做了一些小练习
- 学生社区-与同学交流,交换意见,很有趣的是听到别人关于他们的动机和他们感兴趣的领域的消息。
什么不喜欢
- 主要方法概述中的高密度-每种方法只有一堂课。
- 通常,我每周要上2堂课,而不是3堂课。就我个人而言,学习很辛苦,我几乎把所有的业余时间都吃了。 我羡慕的一部分同学可以在工作中学习。
- 出于未知原因,该设备通过NLP转移到计算机视觉(CV)中。 结果,在NLP,我们不得不使用神经网络,仅在CV方面进行了详细描述。
- 有些讲师的教学能力极低。 此外,他们没有按时检查作业。
数据科学的范围最近在扩大。合计
我接受了5个月的强化培训,在那里我深入到ML领域。 我学会了用Python编写数据处理,对其进行可视化并构建各种模型。 还使用神经网络生成文本,分类图像。
我认为我有一个很好的经验开始。 我的文凭导师说,我们的知识是由中级数据科学家吸收的,经验是由初级的。 好吧,我们会在几个月后看到。 自从我搬到公司的数据科学部门工作了两个星期。