数据学院:如何将数学与商业结合

图片

是什么阻止数学和商业成功结合?

本文是有关如何正确集成大数据工具以获取业务利益的系列文章的第一篇。

小破坏者:如果您还记得企业本身,一切都会顺利进行。

甚至在5年前,大公司都想引入一种新型的bigdat。 但是真正的实验者很少。 那些绝对拥有大量数据的人除外:电信,银行,互联网公司。 而在2018年,企业本身以及来自最意外的领域:冶金,保险,飞机行业的大数据专业知识便来了。

模型从哪里开始?


大数据已不再是魔咒(现在,区块链已经戴上了王冠)。 但是直到她摆脱了主要的神话:

“或多或少有足够的数学家可以在一张纸上画出一个模型,他们会迅速实施它,然后您可以喝一杯鸡尾酒并观察销售额的增长。”

我当然夸大了,但不是很夸张。 我将以我们的实践为例。

有一家建筑用砖的制造商。 规模小,有经验并有稳定的销售。 在这样的时刻,公司经常问自己一个问题:我们将如何进一步降低成本和增加利润?

改进的候选人是后勤。 砖交付时混乱不堪,很难预先估计客户需求,因此燃料和润滑油的成本以及车辆的折旧令人不安。 在了解了大数据之后,公司决定:我们将预测砖在客户建筑工地上何时用完,以便将其快速发送到那里。 我们分析了以前的数据,制作了一个模型,该模型可以保证有趣的优化百分比。

所有的欢乐打破了通常的秩序。 首先,有必要找到可以迅速交付的机器并仔细考虑路线。 其次,这些计算机只能在严格定义的时间段内进入仓库进行装载,因为客户端计算机的到达时间表是提前几周制定的。 转移客户是不可能的。 因此,效率是灰烬。

原来,我们从通常的“让我们预测”开始,最终转变了业务流程。

大数据问题有两个设置:业务和数学。 他们的命令就是这样。 在安排分析师建立模型之前,您需要经历三个阶段。

1.从业务角度定义任务。


假设我们要与客户流失作斗争。 他们决定预测某些买家群体将接近竞争对手。 对于他们来说,我们将形成各种面包。

乍看之下,这项任务是微不足道的。 分析师根据历史数据(已故客户和固定客户)建立模型,以得出两者的迹象。 例如,在移动运营商的实际情况中,匿名用户的流出=该用户已停止使用通信。 但是,为了记录在“泄漏”中,它应该不打开多少时间(一周,一个月,一年)?

有几种方法可以定义此任务。 根据现成的业务模板,这是可能的。 还是根据历史数据-几个月未使用连接的订户多久返回一次? 如果是这样-多达10%? 例如,订户出差很长时间或导致另一运营商的份额有限。

在这里很重要:应该将谁视为“荣誉”-完全是一项商业决定。

任何大数据单元的必需最小值是2个角色。 首先是数据科学家,在其上进行数学和模型构建。 第二个在团队之间的含义有所不同-产品所有者,产品经理,业务分析师。 这个人的良心是对问题的正确陈述。 他的任务是深入研究客户业务的复杂性,并选择所需的工具。 此外,要与各方积极沟通。

2.检查业务案例。


好的,我们将决定模型。 但是优化会花多少钱?

采取相同的流出。 为了让潜在的客户离开,您可以致电或发送带有正确消息的信标。 或者,如果有资源,则提供奖金。 通过分析其费用,您可以告诉客户一个更经济有趣的费率。

但是,由于我们正在考虑奖金,因此这就是我们在此类客户上的支出。 好吧,我们可以肯定的是,如果不采取任何措施,该客户将离开。 但是模型的预测并不理想。 我们会正确对待某人。 而且,例如,实际上有20%的潜在“削片者”并非如此。 在这种情况下,我们将向他们提供奖金。 这将花费多少钱,在我们的情况下是允许的吗?您需要查看客户群的数量,资金流出的规模并考虑绝对数字。

这称为第一类错误和第二类错误。 我们必须理解,该模型的执行结果将带给您更多的收获。 这对我们来说应该是可以接受的差异。 模型的要求在构建之前就已形成。 也许他们会以这样一种方式出来,即不需要花费时间作为科学家。

3.计划如何使用结果。


商业案例告诉我们:“经济已经趋同”。 “我们最终可以建立模型吗?”

快点 我们需要考虑结果将会发生什么。

这里将为我们提供一个200,000人的模型,他们每个月都可以变成“荣誉”。 我们将决定打电话给他们。 我们有时间遍历所有吗? 毕竟,联络中心不是橡胶的。

另一点-您需要了解在预测离开和客户实际离开之间会有什么时滞。 如果客户在不久的将来“膨胀”,我们为什么需要预测? 毕竟,我们可能没有时间联系他们。 但是,离我们离开的那一步越远,给出答案,预测的准确性就越低。 再次,您必须计算收益与风险之间的最佳值。

第三点-我们如何在业务流程中实施创新? 不能正常工作,例如砖制造商的例子。

总结


对于数据科学家来说,完成一项明确任务的途径本身就是一项任务。

如果我们检查了所有三个点,结果一切都出现了,并且模型出现了,我们在等待下一个有趣的阶段-集成。 建立模型和相关数学通常需要大约20%的时间。 剩余的80%(有时还会更多,具体取决于公司的灵活性)-在生产中实施。 长达几个月。

模型只是MVP。 每个人都喜欢构建它们,因为每个人都喜欢假设的结果。 然后,将它们引入到实际的业务流程中,对大多数公司来说都是停滞不前。 毕竟,最困难的事情是更改调试顺序。

因此,在任何大数据项目中,都必须有一位数据科学家,在该科学家上负责数学,负责业务的产品经理以及具有项目团队的项目经理。 后者将必须实施并改变业务流程。 有时会很痛苦又困难。 但是只有在这种配置下,处理大数据才有好处。

我们在数据学院为分析师管理人员开设的课程中讲授数据分析在商业中应用的这些和其他功能。

该职位是由数据学院根据 Kyivstar PJSC的Business HUB中该学院创始人的出版而准备的

Source: https://habr.com/ru/post/zh-CN413243/


All Articles