Yandex众包平台如何帮助培训Alice并节省资金

我们将继续讨论如何在Yandex和其他大型公司中使用众包。 在上一篇文章中,我们讨论了无人机和产品搜索的质量。

今天,您将了解Toloka在Alice培训中的应用,更新目录和审核注释。 所有子标题都是可单击的,并会导致记录报告。 走吧

图片

在现场工作:收集和检查Yandex.Directory的信息


Yandex.Directory是一个庞大的组织数据库,其中包含联系人,照片,评论和其他数据。 为了保持最新状态,您必须收集和处理大量信息。

Toloka很好地处理了这些任务-平均每月有5万个任务可以解决Directory中的1500万个任务。 其中包括需要在家中解决的台式机和需要在街上执行的现场。

在桌面版Tolok中,为目录创建了数十种标记,例如审核用户照片或解密咖啡馆和餐馆的菜单,以根据菜式搜索场所。

并非所有组织都有电话和站点来远程澄清信息。 为了更新有关此类组织的数据,通勤者走上街头,并使用智能手机执行任务。 该地图显示了过去几个月中完成的野外任务,超过一百万点。



Toloka如何帮助Alice变得现代而机智


每天有数百万人与爱丽丝交谈。 每个人都能解决自己的任务:他学习天气,接收信息或只是聊天。 为了让Alice理解并帮助所有人,她需要学习识别语音,这需要大量数据。

Toloka帮助收集此数据。 例如,任务之一是收听音频记录并将其解密。 在操作者大约一个小时的操作中,您可以获得5个小时的带标记的录音。

如果您要求某人识别音频录音,那么他的错误将是错误识别的单词的5-6%。 如果将一项任务分配给多个执行者,则可以选择最佳选项。 最终数据中的误差可以减少到1-2%。

仅仅了解用户所说的还不够。 您仍然需要正确回答。 爱丽丝的答案有几个方面的质量。 她必须做出适当的回应,不要因为“您”而与用户联系,不要粗鲁,也不要以男性的方式谈论自己。 所有这些指标都表示为Tolok上的任务。 储物柜确定答案是否具有一个或另一个指示的属性。

但并非总是可以将质量方面形式化。 因此,语音合成应该是自然的,具有正确的语调,并且没有技术缺陷。 这些是主观参数,很难以评估模型的形式来想象。 因此,在Tolok中,邀请表演者听一个短语的两个版本,并选择最佳版本。

如何让每个人都在Yandex中玩游戏。


Yandex.Buses是一项为乘客和承运人提供服务的服务。 有时,有些不道德的司机会在车站接载乘客,不为他们签发机票,而是将收走的钱收归自己。 结果,承运人损失了收入,这在长途航线上非常明显。

组织从乌法到莫斯科的整个路线的管制员的工作非常昂贵。 打电话给乘客并询问公交车上有多少人(如果驾驶员沿途接送某人)效率低下。 另一种方法是在公交车入口处设置人员柜台。 但是在很长的距离上,那里有很多停靠站,人们不断进出,这带来了明显的错误。 每个“丢失”的人可能会损失航班收入的2.5-10%。 另外,驾驶员仍然可以通过遮盖传感器来轻易地欺骗载体。

Yandex.Bus团队决定将广角IP摄像机安装到公交路由器上,并定期为乘客舱拍照并发送至控制室。 因此,对于每个航班,照片都是累积的,您可以在其中看到机舱中有多少乘客。 顺便说一下,乘客的所有面孔都在算法上初步被“洗掉”了。 还需要学习如何处理照片,即计算乘客人数。 在这个阶段出现了一个问题:由于拍摄通常是在黑暗中进行的,因此图像并不总是具有高质量。 此外,公交车上只有一个摄像头;面部并不总是会出现在照片上。 找不到能够计算此类图像中人数的现成模型;编写您自己的模型将太长。

开发人员转向了tolokers。 沙龙的照片将发送到Toloka,任务是计算其中的人数。 该解决方案的成本不到150美元。 要计算一个航班,您需要7卢布。

实验是在四辆公共汽车上进行的,飞行了300次。 事实证明,收益的9%围绕着承运人。 现在,越来越多的Yandex.Bus运营商正在连接到该系统。

雇用100,500位主持人并保存:漫步者组经验


Rambler Group开发了20多个项目,包括新闻提要和主题站点,每个用户都在其中发表评论。 这增加了在网站上花费的时间和视图的深度,这对于资源是有利的。

但是,硬币还有另一面:出版物负责评论的内容。 要检查它们,您需要一组主持人。 由于评论不断出现,主持人必须全天候工作,这既昂贵又困难。

为了寻找解决方案,漫步者集团求助于Tolok。 首先,他们启动了实验:他们选择了由常规主持人处理的24,717条评论,并将这些评论的实际流程重新创建到Toloka。 一项任务包括10条评论,给出了3分钟的处理时间。 为了控制节制的质量,向三个表演者提供了一项任务。 成本设置为最低-1美分。

结果:



Rambler Group的资源具有后审核系统:任何评论都会立即发送到站点,您需要尽快删除不正确的评论。 事实证明,tolokers在一分钟内处理10条评论,而定期主持人-12。此外,实验表明,使用tolokers服务比为每个出版物维持一名主持人的工作收益高60%。

实验被认为是成功的,但是条件有所改变。 现在向两名表演者提供一项任务,如果他们的意见分歧,他们将与第三名表演者联系。 作业中的评论数量从10条增加到15条。这又使成本降低了35%。

使用API​​,评论会自动发送到Toloka,进行审核并返回判决。 现在,通过Toloka对所有Rambler Group项目的评论进行审核。

Source: https://habr.com/ru/post/zh-CN430034/


All Articles