优步数据的民主化

大家好!


在万圣节期间,我参加了在布达佩斯举行的会议( Data Crunch ),并听了一些有趣的演讲。 其中一位来自Uber,他谈到了他们组织数据管理平台的方法。 这份报告不像管理和杂货那么技术性。


Uber广泛利用了与乘客和驾驶员互动后收集的数据。 他们计算旅行费用,评估人员流量,更改价格算法,并根据收集到的数据向驾驶员提供如何赚钱的建议,以及所有这些建议。 在这样的公司中,所有处理数据的工作都不能集中在一组分析师和DS的手中,因为 否则,他们将不得不雇用过多的员工,此外,他们并不总是沉浸在业务环境中。


从一开始,该公司就开始构建数据管理平台,该平台将允许相当广泛的用户使用相当先进的分析工具。 他们确定了4个主要类别:


  1. 普通用户-他们知道基本的SQL,基本上只需要数据表,仪表板)
  2. 区域经理-他们了解一些SQL,了解不同部分的数据,非常需要切片和切块
  3. 数据分析师-高级SQL,构建仪表板,进行研究,寻找数据见解
  4. 数据科学-对数据处理,构建模型,进行实验,A / B测试等的最高了解。
    在场外,我还从他们那里了解到,实际上有一个第五层-高层管理人员,他们主要使用高层报告和仪表板。

有趣的是,在Uber中,以某种方式处理数据的人至少应该至少了解SQL。


作为他们基于平台创建的产品的示例,他们引用了A / B测试的自动化。 该公司花费大量的A / B并分配给每位数据科学家,以便他组织一个实验,然后对测试进行评估-再次,这不是奢侈的事情。 因此,他们希望为普通用户提供正确解释和使用A / B的机会,而不会出现错误,而无需加载Data Scientist。


他们对该产品的构建始于与数据科学家的深入合作, 如果这些人不确定是否一切都正确,那么任何Data产品都将无法正常工作。 实际上,他们开始自动化A / B测试的启动和评估,从而为Data Scientist提供了使他们的生活更轻松的工具。 之后,他们在此工具上构建了一个界面,该界面将以简单的形式显示测试结果(启动了什么,有什么区别,区别是否显着)。 同时,他们“隐藏”了A / B测试中固有的最大细微差别,因此用户无需深入研究数学和统计学。


有趣的是,与我一起喝咖啡休息的大多数人说,他们的实践中没有任何A / B测试,他们在做出决策时会使用大量定性研究和直觉。 因此,与其他地方一样,一旦您想到了,就需要削减!

Source: https://habr.com/ru/post/zh-CN428772/


All Articles