太空研究人员远离天堂,可以帮助您决定穿什么,看什么和听什么。 但是星级数据和Stitch Fix存储数据都是使用机器学习处理的。
Stitch Fix是使用物理学更好地了解其客户的所有样式问题的公司之一。克里斯·穆迪(Chris Moody)直接了解宇宙。 作为天体物理学家,他做了银河系的模拟,在超级计算机上模拟了宇宙的膨胀和银河系的碰撞。 在一个晚上,在为加州大学圣克鲁斯分校的博士学位辩护后不久,他会见了一群其他的天体物理学家,为他们喝了一杯啤酒。 但是那天晚上,他们都没有提到星系。 他们谈论时尚。
穆迪(Moody)的几个天体物理学家的伙伴最近退出了科学领域,转而从事在线造型公司Stitch Fix,该公司现在的估值为20亿美元,穆迪惊讶地看着他们。 “他们问我:您觉得这项任务有趣吗?” 他说。 他真的是这么认为的。 但是,当他的朋友使用“贝叶斯模型”或“庞加莱空间”之类的短语详细描述他们的工作(包括预测客户可能喜欢的衣服)时,看起来很奇怪,就像他在做的工作一样为博士。 他发现,对风格的定量评估“证明与广义相对论非常相似”。
四年过去了,现在穆迪还为Stitch Fix工作。 他来自一个逐渐成长的天体物理学家,他们不再探索太空,而是开始为技术行业创建推荐算法和数据模型。 他们是Netflix,Spotify和Google等公司的数据科学团队的成员。 甚至在精英大学中,越来越少的天体物理学家在获得博士学位后仍然留在学术环境中。 这些人越来越多地被送到硅谷。
要了解天体物理学家被涉及消费产品的初创公司所吸引,让我们回顾一下最近对机器学习(MO)的兴趣激增。 天体物理学家长期使用MO模型,处理通过强大的望远镜向天空注视的大量数据,并根据提供的示例“教”计算机执行任务。 告诉计算机您需要在一张星际空间照片中找到什么,他将能够对剩下的3000万张照片进行处理,然后开始进行预测。 但是,MO还可以用于预测用户行为,并且在2012年,公司开始招募知道如何应用此方法的人员。
如今,MO几乎是一切的中心,从Stitch Fix的服装盒到Netflix上的个性化电影推荐。 Spotify如何设法预测每周个性化列表上如此完美的惊喜歌曲? 它适用于机器学习。 尽管MO已经形成了自己的研究领域,但由于来自天体物理学等领域的科学家多年来一直在使用这种模型,因此他们是填补从事数据科学工作的团队的理想人选。
Netflix前天体物理学家Sudip Das说:“甚至在大数据成为一个独立领域之前,我们就已经在从事大数据研究。”
达斯(Das)通过检查遗留辐射-大爆炸留下的电磁辐射来捍卫他在普林斯顿大学的博士学位[
更确切地说,它是在大爆炸结束约380万年后形成的。 佩雷夫 ]。 此后,他研究了智利阿塔卡马宇宙望远镜获得的数据长达数年。 戴斯(Das)每天晚上从太空中收集大约TB的数据,在如此庞大的数据中,达斯发现了一种难以捉摸的天体信号。 这是多年来辛勤工作的难得奖励。 这一发现引起了密西根大学的注意,在那里他被任命为助理教授。
但是,达斯拒绝了,而是搬到了硅谷-首先是在Beats Music担任数据专家,然后是OpenTable,现在是Netflix。
没有多少因素影响离开科学界的决定:薪水更高,工作更丰富。 他说:“成为该研究所的全职成员存在障碍。” 在旧金山湾地区,他和他的妻子(也是天体物理学家)都不需要担心找工作。 但是,令他真正感到惊讶的是,技术公司的工作真的很有趣。 他在Beats遇到了“志同道合的人,从事着智力上相似的任务”。 数学是相同的,应用是不同的。
达斯注意到越来越多的物理学家正在改变科学家的重任-您可以在其中从事博士后十年的不稳定财务工作-在科技公司中从事高薪轻松的工作。 他说:“在普林斯顿为自己的博士学位辩护的所有同学中,只有两个没有进入商业公司,”他说。 “要留在那里,您需要成为核心科学家。”
这场大爆炸夺取了整个行业。 Stitch Fix算法首席荣誉专家Eric Colson说:“天体物理学家是我们的第一名。” “大多数人在处理数值数据领域都有博士学位,但是如果您制作图表,我认为天体物理学家将是第一位。 他们很好地教授数学-许多物理学家比数学家更精通数学。 他们也很好地教编程。 他们比大多数计算机科学家更精通计算机科学。”
穆迪(Moody)于2015年加入科尔森(Colson)团队,他将在天体物理学领域获得的知识指导解决了诸如标记客户的“隐藏风格”之类的问题-服装的独特个人品味。 Stitch Fix不会要求客户使用一些普通标签来定义其样式。 它使用样式随机播放(Style Shuffle)等工具收集有关人们购物偏好的数据,这种工具可以使人们标记自己喜欢还是不喜欢某些东西。 收集之后,所有这些数据形成一个“样式空间”-客户喜欢的所有事物以及这些项目如何相互关联的地图。 穆迪和团队使用此模型来预测客户可能还会喜欢的东西。 该算法可能得出结论,如果您喜欢粗大的珠子,那么您也可能喜欢珠子的珠子-类似地,Netflix算法建议您可能要和另一个扮演主角的女人一起看喜剧。
穆迪说,这些任务与他在攻读博士学位时所处理的任务没有太大不同。 隐藏式卡片? “这就是Poincare空间。 穆迪说,这就是爱因斯坦用来描述相对论空间的东西。
其他物理原理也涉及对隐藏样式的理解。 穆迪(Moody)的团队使用
矩阵频谱分解之类的东西,一种线性代数的概念,以一种个人风格来分离单个“音符”,例如“拉吉他弦并听一些音符”。 客户可能喜欢女性化的事物,但比专业事物更随意。 每个人的风格都有许多数据点-很少有人可以归因于明确定义的风格-穆迪说,借助物理,他的团队可以更好地理解客户对待风格的态度的所有复杂性。
穆迪说:“学习物理学的人都不会去做衣服,但事实证明,这个领域非常富裕。” “从科学的角度去思考一个人的个人风格真是太神奇了。”
科尔森说,他的团队中的许多天体物理学家都被公司的工作吸引住了,“因为在理论科学中很少见到明显的结果。” 他们可以在这里将一件产品投入生产并查看结果。” 当Moody正确地做所有事情时,Stitch Fix更有可能为客户提供他们喜欢的东西-他的团队可以每天跟踪和改进此指标。
在科学界,天体物理学家可以为同一任务奋斗多年。 前机器学习工程师和天体物理学家,现在是Insight Data Science的员工Amber Roberts说,许多最有趣的问题已经解决,该数据可帮助科学家进入该行业。 “我们已经了解了宇宙的大小。 我们测量了光速。 我们发现了脉冲星。 我们发现了黑洞,”她说。 -许多重大发现,例如对时空或引力畸变原理的理解,引起了人们对空间探索和宇宙学的兴趣。 但是,您真正要做的是扩大知识领域的一小部分,并且三年来撰写一份科学论文,这将使全世界十几个人感兴趣。”
Netflix的天体物理学家戴斯(Das)说,很难放弃探索宇宙的浪漫气氛。 “当我向父母解释发生了什么事时,他们说:您在宇宙上做了如此出色的事情,现在您正在向人们推荐电影!” -Das说。 但是,他同意他的例行工作与技术问题有关,例如“试图将参数的测量误差从50%降低到5%”,而不是探索宇宙。
在Netflix中,技术工作看起来像这样。 但是,当他思考自己在工作中的真正表现时(他将世界各地的人们与电影和故事结合在一起,将有助于他们彼此更好地相互理解),与作为天体物理学家一样,他对自己的贡献感到满意。 达斯说:“这就像在探索另一个宇宙。” “人类的宇宙。”