引言
我再次与一家从事与机器学习(ML)相关的项目的公司合作,我注意到经理们使用ML领域的术语,而不是了解其本质。 尽管单词在语法上正确且在句子的正确位置发音,但对它们的含义并不比指定sepules更清楚,如您所知,seepales用于分隔。 同时,在团队负责人和简单的开发人员看来,他们与管理层说的是相同的语言,这导致冲突情况使项目工作复杂化。 因此,本文致力于开发人员与管理人员之间的沟通的简化技术(拉丁语:简化或简化),或如何简单明了地解释ML的基本术语,从而使您的项目成功。 如果您很喜欢这个话题,欢迎来关注。
注释的美感:瑟菲尔,坟墓和坟墓是巧妙的斯坦尼斯拉夫·列姆在《太平洋》第14趟旅程中使用的术语。
项目开始
ML项目应从验证指标的合法化开始。 听起来很吓人,不是吗? 让我们开始解释。 合法化(在拉丁语中用俄语是合法化)只是各方达成的协议,以书面形式确定并得到认可-当然,也希望以书面形式达成。 缔约方既是捐助者,项目管理者,也是执行者。
现在让我们继续验证 。 ML程序员通常具有编写验证代码的经验,并且在进行跟踪时,他会看到返回的是非。 但是,如何向不处理代码的经理解释这个概念呢? 让我们使用这个简单的生活示例。
想象一下,您正在通过一个市场,然后看到:桃子被出售了。 卖方告诉您:“好! “哈罗莎(Harosha)parsik,新鲜,多汁,可惜。” 但是,您仔细看一看,发现它在一个地方被损坏了。 您说:“好,他在哪里好? 这太烂了。” 卖方提供半价。 如果您认为:“您可以切掉被损坏的一个,只有四分之一,它似乎可以盈利”-并购买它,然后在ML语言中进行验证,然后将桃子(在lang语ML中为示例)视为有效。 如果您认为可以在另一个地方找到最好的而不是被宠坏的地方,那么就会出现残疾,您认为桃子是无效的。
事实证明,验证没有什么复杂的事情,并且我们每个人每天都要进行验证,将一件事情视为好,适合自己,或者使某件事情无效,再将另一件事情视为不好,不合适。
给Estete的说明:突然,Jourdain得知自己的一生都用散文表达时感到惊讶。 贵族商人莫里哀。
最后,剩下的只是解释什么是验证指标 。 让我们考虑一下为什么我们决定从前面的示例中购买桃子?
- 它足够便宜(价格<阈值)
- 它已经很成熟(成熟度>阈值),但是还不成熟(成熟度低于第二阈值)
- 它的大小正常,也就是说,其大小属于“正常”类别(所有类别:太小,太小,正常,大,巨大)
- 没有足够的变质(腐烂和变质区域的面积小于阈值)
上面列出的所有这些都是本示例中由4个类别组成的验证指标的示例。 在最简单的情况下,当桃子同时满足所有条件时,它将被视为有效并已购买。
现在,显而易见的是,为什么从一开始就如此重要,验证将如何精确地进行,关于多少参数以及所有相关方将满意的阈值是至关重要的。 在部分符合条件的情况下的操作说明可能会占据特殊的部分。
自然,每个ML项目根据其主题领域,将具有自己的验证指标。 固定验证指标的文档对于ML项目与国家宪法同样重要。
只有在文档最终出现在规范验证指标的项目中并可供所有项目参与者使用之后,才有必要编写其代码。 验证代码是项目的核心,其质量必须无懈可击,这部分中的任何错误都极有可能导致整个ML项目的崩溃。
计算精度的奥秘
管理项目中当前事务状态的最重要指标是准确性 。 怎样才能简单地向经理解释这是什么以及需要执行哪些操作才能计算出来?
首先,我们需要解释什么是经过验证的样本。 在我们的示例中,这是我们购买的不是桃子,而是一吨的时候。 我们坐下或雇用工人,他们将桃子分成2个容器。 容器上的铭文:X(好)和P(坏)。 通过对桃子进行分类来完成的工作是创建经过验证的样本。
如何解释为什么需要经过验证的样品? 想象一下,你有一个妹妹,想教她如何选择桃子。 您将其推向市场并说:“学习,观察我的工作方式。” 在您看来她已经学过的时候,您想测试她的技能。 怎么做? 您创建一个对照样品,即 例如,您从容器中取出100个已经从每个容器中分拣出来的桃子,然后悄悄地在它们上面贴上秘密贴纸,以了解它们是从您自己那里拿走的,但这对您妹妹来说是未知的,并建议她将它们独立地放在新的空容器中。 您姐姐的选举与秘密贴纸匹配的百分比是准确性的度量。 换句话说,准确性是您为您选择的桃子可以信任多少姐妹的客观价值。 100%表示她是您的翻版,所做的一切与您完全一样。 0%-她的意见与您完全相反。
给Esthete的说明:是的,您是对的,随着时间的流逝,桃子可能会开始变质,因此您需要考虑到它们的有效性必须不时进行审查。 而且,这也发生在计算机数据中,例如具有“相关性”的特征。
现在,让我们看一下可以混淆的4个ML性能指标。 它们是真阳性(TP),假阳性(FP),真阴性(TN)和假阴性(FN)。 单词的前半部分表示您姐姐的意见是巧合(true)还是不匹配(false),上面有一个秘密的桃子贴纸。 后半部分仅表示您姐姐将桃子扔进的容器(X良好-阳性,P不良-阴性)。 两个词加在一起就是该类别中桃子的数量。
除了准确性,还使用了3个辅助指标,分别是精度(准确性),召回率(灵敏度)和f1_score。
精度显示与您对将桃子扔进容器X(好的)的意见的百分比匹配。 100%表示您认为合适的所有桃子都会被您的姐姐认出。 较低的值表示那些被认为不适合的容器也已进入容器X。 当对一个有价值的桃子不能落入合适的桃子的企业至关重要时,该指标很重要,但是如果发现合适的桃子被错误地不合适,那么就没有什么可担心的了。
回忆显示正确选择的好桃子(TP)与该值的总和与被误认为不适合的好桃子(TP + FN)之间的比率。 100%表示您的妹妹永远不会把好桃子和坏桃子丢在篮子里,这与Precision相反。 当企业需要让合适的桃子尽可能少地落入无法使用的容器中时,此指标很重要。
F1分数是综合分数,结合了准确性和查全率的优点。 它的高度重要性证明了训练的平衡性,并建议由于好的桃子不会与坏桃子一起落入篮子,因此,坏桃子不会急于求成好桃子。
Esthete注意:此指标是精度和召回率之间的谐波平均值,由以下公式计算得出:
f1_score = 2*(recall*precision) / (recall + precision)
问题经常出现:为什么ML项目经理需要如此深刻地了解和理解所有这些指标。 答:这对业务很重要。 作为奶牛场经理,您需要知道什么是牛奶产量,以及如何考虑它们的配方,作为奶牛场经理,您需要知道什么是牛奶产量以及如何计算。 是的,经理可能不会研究奶牛的挤奶方式,犊牛的产犊方式和处理方式,但是了解项目的主要业务指标是业务成功的关键。
总结
作为ML项目的参与者,我们所有人都做得很好和必要。 作为学生,我们当中哪一个人没有梦想,而是在一个集体农场里整理土豆,西红柿和卷心菜,以便机器人为他而不是一个人来做。 我们使故事成真,让我们的项目取得成功。 如果本文对ML项目的成功启动有所帮助,我将感到高兴。
如果这篇文章对您似乎有用,请写评论,然后我将在第二篇文章中介绍如何解释对管理的可加性和概括性,这是正确,合适的ML项目的这些支柱。