Comment la plateforme de crowdsourcing Yandex aide Ă  former Alice et Ă  Ă©conomiser de l'argent

Nous continuons à parler de la façon dont le crowdsourcing est utilisé dans Yandex et dans d'autres grandes entreprises. Dans un article précédent , nous avons parlé des drones et de la qualité des recherches de produits.

Aujourd'hui, vous découvrirez l'application de Toloka pour la formation d'Alice, la mise à jour de l'annuaire et la modération des commentaires. Tous les sous-titres sont cliquables et conduisent à l'enregistrement des rapports. C'est parti!

image

Travail sur le terrain: collecte et vérification des informations pour Yandex.Directory


Yandex.Directory est une énorme base de données d'organisations avec des contacts, des photos, des critiques et d'autres données. Pour le maintenir à jour, vous devez collecter et traiter de grandes quantités d'informations.

Toloka fait bien face à ces tâches - une moyenne de 50 000 par mois résout 15 millions de tâches du répertoire. Parmi eux, le bureau, qui est résolu à la maison, et sur le terrain, nécessitant une exécution dans la rue.

Dans le bureau Tolok, des dizaines de types de balises sont créées pour l'annuaire, telles que la modération des photos des utilisateurs ou le déchiffrement du menu des cafés et des restaurants pour rechercher des établissements par plat.

Toutes les organisations ne disposent pas de téléphones et de sites pour clarifier les informations à distance. Pour mettre à jour les données sur ces organisations, les tolokers descendent dans la rue et effectuent des tâches à l'aide d'un smartphone. La carte montre les missions sur le terrain achevées au cours des derniers mois, plus d'un million de points.



Comment Toloka aide Alice Ă  ĂŞtre moderne et pleine d'esprit


Plusieurs millions de personnes parlent à Alice chaque jour. Tout le monde résout ses tâches: il apprend la météo, reçoit des informations ou simplement des conversations. Pour qu'Alice comprenne et aide tout le monde, elle doit apprendre à reconnaître la parole, ce qui nécessite beaucoup de données.

Toloka aide à collecter ces données. Par exemple, l'une des tâches consiste à écouter l'enregistrement audio et à le décrypter. En environ une heure de fonctionnement des tolokers, vous pouvez obtenir 5 heures d'enregistrements audio balisés.

Si vous demandez à une personne de reconnaître un enregistrement audio, son erreur sera de 5-6% de mots mal reconnus. Si vous confiez une tâche à plusieurs interprètes, il devient possible de choisir la meilleure option. L'erreur dans les données finales peut être réduite à 1-2%.

Comprendre ce que l'utilisateur a dit ne suffit pas. Vous devez toujours répondre correctement. Les réponses d'Alice ont plusieurs aspects de la qualité. Elle doit répondre de manière appropriée, ne pas contacter l'utilisateur pour "vous", ne pas être impolie et ne pas parler d'elle de manière masculine. Toutes ces métriques sont représentées comme des tâches sur Tolok. Les tolockeurs déterminent si une réponse possède l'une ou l'autre des propriétés indiquées.

Mais les aspects qualité ne peuvent pas toujours être formalisés. La synthèse vocale doit donc être naturelle, avec l'intonation correcte, sans défauts techniques. Ce sont des paramètres subjectifs difficiles à imaginer sous la forme d'un modèle d'évaluation. Par conséquent, à Tolok, l'interprète est invité à écouter deux versions d'une phrase et à choisir la meilleure.

Comment faire jouer tout le monde dans Yandex.Bus selon les règles


Yandex.Buses est un service qui fournit des services aux passagers et aux transporteurs. Parfois, il y a des chauffeurs sans scrupules qui viennent chercher les passagers aux arrêts, ne rédigent pas de billets pour eux et prennent l'argent reçu pour eux. En conséquence, le transporteur perd des revenus, ce qui est très visible sur les longs trajets.

Organiser le travail des contrôleurs tout au long de l'itinéraire, par exemple, d'Oufa à Moscou, est assez coûteux. Appeler des passagers et leur demander combien de personnes se trouvaient dans le bus, si le chauffeur choisissait quelqu'un en cours de route, est inefficace. Une autre façon consiste à installer un compteur de personnes à l'entrée du bus. Mais à longue distance, où il y a de nombreux arrêts, les gens entrent et sortent constamment, ce qui donne une erreur tangible. Chaque personne «perdue» représente une perte potentielle de 2,5 à 10% des revenus du vol. De plus, le conducteur peut encore facilement tromper le transporteur en couvrant le capteur.

L'équipe Yandex.Bus a décidé de fixer une caméra IP grand angle au routeur du bus, de prendre périodiquement une photo de l'habitacle et de l'envoyer à la salle de contrôle. Ainsi, pour chaque vol, des photos sont accumulées, où vous pouvez voir à quel point le nombre de passagers dans la cabine. Soit dit en passant, tous les visages des passagers sont préalablement «délavés» algorithmiquement. Reste à savoir comment traiter la photo, c'est-à-dire compter le nombre de passagers. À ce stade, un problème est survenu: l'image ne se révèle pas toujours de haute qualité, car la prise de vue se fait en mouvement, souvent dans l'obscurité. De plus, il n'y a qu'un seul appareil photo sur le bus; les visages ne sont pas toujours sur la photo. Il n'était pas possible de trouver des modèles prêts à l'emploi capables de compter le nombre de personnes dans de telles images; il serait trop long pour écrire les vôtres.

Les développeurs se sont tournés vers les tolokers. Des photos du salon sont envoyées à Toloka avec la tâche de compter le nombre de personnes dessus. Le coût de la solution est inférieur à 150 $. Pour calculer un vol, vous avez besoin de 7 roubles.

L'expérience a été réalisée sur quatre bus pour 300 vols. Il s'est avéré que 9% des recettes ont été versées au transporteur. De plus en plus de transporteurs Yandex.Bus se connectent à ce système.

Embauchez 100 500 modérateurs et économisez: l'expérience du Rambler Group


Rambler Group développe plus de 20 projets, y compris des fils d'actualités et des sites thématiques, sur chacun desquels les utilisateurs laissent des commentaires. Cela augmente le temps passé sur le site et la profondeur des vues, ce qui est bénéfique pour la ressource.

Mais il y a un autre côté à la médaille: la publication est responsable du contenu des commentaires. Pour les vérifier, vous avez besoin d'une équipe de modérateurs. Comme les commentaires apparaissent constamment, les modérateurs doivent travailler 24 heures sur 24, ce qui est coûteux et assez difficile.

A la recherche d'une solution, le Groupe Rambler s'est tourné vers Tolok. Tout d'abord, ils ont lancé l'expérience: ils ont sélectionné 24 717 commentaires traités par des modérateurs réguliers et recréé le flux réel de ces commentaires vers le Toloka. Une tâche comprenait 10 commentaires, 3 minutes ont été accordées pour leur traitement. Pour contrôler la qualité de la modération, une tâche a été proposée à trois interprètes. Le coût a été fixé à un minimum - 1 cent.

RĂ©sultats:



Les ressources du Groupe Rambler disposent d'un système de post-modération: tout commentaire va immédiatement sur le site, vous devez supprimer les plus incorrects le plus rapidement possible. Il s'est avéré que les tolokers traitent 10 commentaires en une minute et les modérateurs réguliers - 12. De plus, l'expérience a montré que l'utilisation des services des tolokers est 60% plus rentable que de maintenir un personnel de modérateurs pour chaque publication.

L'expérience a été considérée comme réussie, mais les conditions ont un peu changé. Une tâche est désormais proposée à deux interprètes, si leur avis diverge, ils en connectent un troisième. Le nombre de commentaires dans la mission est passé de 10 à 15. Cela a permis de réduire les coûts de 35% supplémentaires.

À l'aide de l'API, les commentaires sont automatiquement envoyés à Toloka, modérés et renvoyés avec un verdict. Désormais, les commentaires sur tous les projets du Groupe Rambler sont modérés via Toloka.

Source: https://habr.com/ru/post/fr430034/


All Articles