"La science des données, comme les mathématiques et la physique, est une autre façon d'explorer le monde qui vous entoure."

Habr, bonjour! Nous poursuivons une série d'entretiens avec des anciens de Newprolab dans lesquels ils parlent de leur histoire de s'orienter vers le domaine du travail avec les mégadonnées. Les histoires sont différentes et seront intéressantes pour ceux qui envisagent de changer leur cheminement de carrière ou de voir comment de nouvelles connaissances peuvent aider à résoudre les problèmes actuels. Rencontrez Oleg Khomyuk, chef de la R&D chez Lamoda.

Oleg a parlé de son cheminement de carrière, de ses valeurs, des raisons pour lesquelles il a choisi Lamoda, et non d'une entreprise de la vallée, des projets en cours, de son équipe, des projets les plus réussis et les plus infructueux, de l'attitude envers la science des données et bien plus encore.

image

- Oleg, comment s'est déroulé votre parcours professionnel en tant que Responsable R&D de Lamoda?

- Il me semble que tout parcours professionnel est le résultat de plusieurs raisons et parfois d'accidents. Parmi ces raisons, plusieurs principales peuvent être distinguées: les caractéristiques de la pensée, les valeurs de la vie et, en général, comment une personne comprend ce qu'est le succès. Cette compréhension du succès est le vecteur même que nous utilisons comme boussole, en choisissant un parcours professionnel.

En ce sens, tout s'est avéré tout simplement pour moi: l'école a clairement montré des capacités pour les sciences exactes, a constamment participé à des compétitions, a même réussi à prendre la 3e place en 9e année à l'Olympiade régionale de mathématiques parmi les écoliers. Et dans l'ensemble, c'était toujours très intéressant de résoudre des énigmes, de chercher des motifs, j'aime toujours les tâches sur l'ingéniosité.

J'ai aussi aimé étudier à l'université: je suis diplômé du MSTU. N.E. Bauman avec les honneurs en "Instrumentation Optoélectronique", nous a appris à concevoir assez sophistiqué, du point de vue de la physique et de la microélectronique, des équipements: imageurs thermiques, caméras numériques, télescopes, même des viseurs de sniper, des systèmes de homing et des appareils de vision nocturne. Je dois dire que c'est une profession incroyablement intéressante, et notre personnel enseignant était stellaire. Une telle ingénierie réelle est à la jonction de plusieurs domaines de connaissances. Parfois, c'est un peu dommage que cela n'ait pas fonctionné sur ce sujet.

- Pourquoi pas?

- Dans les derniers cours, j'étais un peu déçu de ce que je faisais. Il s'est avéré que la demande d'une profession dans le pays est faible, tout est très local, les meilleurs des meilleurs ingénieurs travaillent principalement dans les laboratoires des instituts, les rares usines sont capables de mettre en œuvre des projets d'ingénierie, des équipements obsolètes, etc. Il y a eu, bien sûr, quelques succès, mais la portée n'était pas la même que celle que j'imaginais au début de mes études. Ce facteur a été complété par des taux bas pour les chercheurs, il a été possible de s'engager dans le transport privé et de gagner plus. Bien sûr, il y avait encore des options pour gagner de l'argent, ne fonctionnant pas tout à fait officiellement pour les entreprises japonaises, naturellement sans droits de propriété intellectuelle.

À un moment donné, mes amis m'ont invité à travailler dans un assez grand fournisseur d'accès Internet près de Moscou, et j'ai accepté. J'étais tout à fait prêt à apprendre de nouvelles choses, l'enseignement technique donne beaucoup de possibilités en ce sens.

Là, j'ai acquis de nouvelles compétences techniques, pris connaissance du sujet de la gestion de la qualité et généralement abordé les pratiques mondiales à cet égard. Il existe une telle norme de gestion de la qualité, même une série de normes ISO 9000, qui offrent certaines pratiques pour organiser les processus dans une entreprise, en prenant comme axiome la relation entre la qualité du produit final et la façon dont l'entreprise gère en interne ses processus. L'idée principale est que si vous faites tout dans le cadre de la norme, la qualité de vos produits s'améliore constamment, car vous mesurez, pensez, planifiez, faites et mesurez à nouveau chaque processus qui peut affecter cette qualité. Cette activité cyclique d'amélioration continue a même un nom - le cycle de Deming. J'ai été en quelque sorte captivé par ce sujet, comme la gestion, mais c'est très mathématique.

En conséquence, j'y ai travaillé pendant environ 2 ans, faisant diverses choses, y compris la gestion d'un petit département, les processus de construction, en discutant beaucoup avec le service de la qualité.

Vient ensuite Yandex. À un moment donné, j'ai vu qu'ils embauchaient des chefs de projet dans le service qualité de la recherche. Le poste lui-même n'était pas si accroché, la tâche de test était plus intéressée: décrire le problème de recherche Yandex existant et trouver comment le résoudre. Eh bien, le déclencheur dans ma tête pour le mot «qualité» a probablement fonctionné. J'ai travaillé sur la tâche pendant 10 heures d'affilée, cela s'est avéré être plusieurs pages. En conséquence, ils m'ont contacté, ont demandé une entrevue et ont fait une offre, que j'ai acceptée avec plaisir.

Pendant que je travaillais chez Yandex, spécialement pour moi, tout s'est mis en place, j'ai vu comment les mégadonnées, les mathématiques, les algorithmes, se concentrer sur l'utilisateur, ses besoins fonctionnent ensemble comme un seul mécanisme et vous permettent de créer des produits révolutionnaires d'une part, et de gagner de l'argent de l'autre. Il me semble que j'ai enlevé à Yandex ce désir formé de fabriquer des produits basés sur des données et de s'engager dans l'apprentissage automatique. Depuis lors, il a commencé à se développer activement dans cette direction.

- C'était en 2011, le sujet du big data n'était pas encore très populaire, il n'y avait pas de programmes. Où avez-vous étudié, lu tout?

- Bien sûr, le contenu disponible n'était pas suffisant, et nous avions tous tellement faim de connaissances. Mais Coursera était déjà là, et d'ailleurs, ShAD aussi. J'ai écouté les conférences de Vorontsov 15 fois et je n'ai rien compris. Beaucoup sont passés par là, c'était une époque intéressante.

En général, j'ai commencé à m'éloigner un peu du sujet de la recherche d'informations, j'ai aimé travailler avec les données, j'ai été attiré par un nouveau domaine lié au machine learning, et en 2012 j'ai quitté l'entreprise.

- Et après Yandex?

Après Yandex était «Consultant Plus». Déjà plus consciemment choisi la direction associée à l'analyse des données. Juste les données des actions des utilisateurs commençaient à peine à être collectées à grande échelle, alors j'ai rejoint cette activité et commencé à faire des projets.

En général, c'était une période intéressante, maintenant il y a beaucoup de bibliothèques disponibles pour l'apprentissage automatique, par exemple, xgboost, et nous avons écrit notre boost de dégradé sur les arbres en C ++, maintenant, bien sûr, toutes les équipes ne peuvent pas se le permettre, et il n'y a pas besoin - tout est déjà réalisé. Une telle histoire.

- Avez-vous écrit par vous-même ou aviez-vous déjà une équipe?

- L'équipe était déjà, oui, en plus des talents. Au cours de la deuxième année de mon travail chez Consultant Plus, un étudiant talentueux de VMK s'est joint à nous, qui a écrit en quelques mois sa mise en œuvre du boosting et a commencé à former des modèles.

À ce moment-là, nous avions déjà pour objectif de former une équipe entière de scientifiques des données, nous pensions qu'il y avait beaucoup de nouvelles opportunités dans les données. Puis, l'opportunité de prendre deux diplômés de ShAD, qui en connaissaient probablement plus que moi, et des développeurs pour la création de référentiels, s'est révélée très réussie. Tout le monde l'a essayé, a travaillé principalement sur le cluster Hadoop, bien que selon les normes modernes, il n'y avait pas beaucoup de données.
Au sommet de nous, probablement, il y avait 9 personnes en tout, ils résolvaient de bons problèmes. Par exemple, ils recherchaient des explosions d'intérêt des utilisateurs dans divers sujets, ce qui a aidé les auteurs à aborder de manière plus optimale le choix de ceux sur lesquels il est logique d'écrire de nouveaux documents.

Après cela, j'ai travaillé pour Ezhome, une startup à Palo Alto. Soit dit en passant, Mitya Kataev m'a recommandé là-bas, avec qui nous avons étudié ensemble le programme Big Data Specialist . Sa connaissance, Kirill Klokov, travaillant à Ezhome en tant que directeur du développement, cherchait simplement un scientifique des données dans l'équipe. L'idée principale de l'entreprise est la création de l'expérience Uber pour les services à domicile; Comme point de départ, un service de soin de la région a été choisi - à partir de la tonte des pelouses, se terminant par le nettoyage, la plantation de plantes et d'arbres. En conséquence, j'ai commencé à travailler là-bas en tant que Data Scientist, je voulais vraiment essayer ma main dans une startup et je voulais travailler avec mes mains. Je ressens périodiquement cette démangeaison analytique, je veux faire quelque chose de significatif moi-même, même si depuis un certain temps, je me concentre principalement sur les processus organisationnels. J'avais l'habitude d'espérer qu'un jour les démangeaisons disparaîtront, mais non, à ce jour j'essaye de "m'asseoir sur deux chaises", c'est-à-dire de me développer à la fois en tant que manager et en tant que spécialiste.

- Même maintenant?

"Même maintenant." Bien que pour le moment, bien sûr, il n'y ait pas assez de temps pour beaucoup: une grande équipe, de nombreuses tâches de gestion, je suis en retard le week-end, car maintenant il y a beaucoup d'opportunités pour cela - kaggle, par exemple. Je veux aussi faire quelque chose de mes propres mains, mais j'ai des gars dans mon équipe qui sont clairement meilleurs que moi dans leur domaine. Mais, à mon avis, pour une gestion de projet efficace dans le domaine de l'analyse des données, le manager doit avoir des compétences pointues. J'apprends constamment. En ce moment, par exemple, j'ai décidé de passer par une spécialisation en programmation, juste pour ne pas oublier ce qui se passait.

- Retour à Ezhome: pourquoi avaient-ils besoin d'un data scientist? À quelles tâches avez-vous dû faire face?

- C'est une bonne question. Au tout début, j'ai demandé quel résultat on attendait de moi. La réponse était dans l'esprit: "nous-mêmes ne comprenons pas encore exactement, essayons." Mais rapidement, une bonne tâche a été trouvée: à cette époque, il y avait un goulot d'étranglement pour attirer de nouveaux clients, car chaque nouvelle demande était traitée par une personne, mesurait un site à partir d'une image satellite, essayait de comprendre combien cela devait coûter pour entretenir un tel site. Il y avait un modèle linéaire expert qui traitait de cette évaluation. Il est clair que la qualité de la prévision devait être améliorée et comment prendre en compte un plus grand nombre de paramètres de manière experte, vous ne pouvez pas le déterminer. C'est là que l'apprentissage automatique est devenu utile. Nous avons commencé à prévoir le temps que le jardinier passera à utiliser les paramètres du site. Les paramètres des sites ont été tirés de sources ouvertes et les «enseignants» ont été tirés de données historiques. Ensuite, il y avait déjà une petite base de clients actifs sur un abonnement à des services hebdomadaires.

En conséquence, la tâche a été renvoyée, des données étaient disponibles pour la plupart des appels entrants, il a été possible de formuler des prix individuels à la volée. Automatisation classique - les robots fonctionnent, les gens se détendent. Ensuite, j'ai été invité à venir au siège social de la Vallée pendant un certain temps, environ un mois et demi.

Avant cela, je travaillais à distance, là-bas presque toute l'équipe était éloignée: USA, Inde, Grèce, Pologne, Russie. L'équipe était très cool, c'était un plaisir de travailler. J'ai réussi à faire de nombreuses tâches intéressantes, à la fin on m'a proposé le poste d'analytique de chef d'équipe. Nous avons apporté quelques améliorations à l'infrastructure, ce qui nous a permis d'augmenter le nombre de projets que nous faisions parfois. Ils ont ensuite proposé de s'unir à une autre équipe qui développait un logiciel de construction de parcours pour les salariés: 5 000 clients, 150 jardiniers, comment les contourner de manière optimale. C'était très excitant, et maintenant il me semble que les tâches qui concernent davantage l'informatique que les données sont également très intéressantes.

- Parallèlement à Lamoda, vous envisagiez plusieurs propositions, pourquoi le choix a-t-il été fait en faveur de Lamoda? Qu'est-ce qui était essentiel pour vous?

- Oui, il y a eu plusieurs propositions. Qu'est-ce qui m'a accroché à Lamoda? Une stratégie claire, des attentes claires de ma part, de la confiance et un plan de ressources réaliste en matière de finances, c'est-à-dire qu'ils m'ont fixé une tâche claire: «nous sommes ici maintenant, nous devons être ici, nous voulons développer la R&D, nous sommes prêts à investir X, nous attendons tel ou tel effet économique» . C’est tout. Aucun raisonnement sur la façon dont les vaisseaux spatiaux laboureront les étendues de l'univers ou que les robots remplaceront tout le monde. Plus une histoire honnête sur la façon dont l'entreprise se porte. Tout était transparent, clair, et cela, en général, m'a soudoyé parce que j'avais le sentiment complet que je rejoignais une équipe de personnes qui étaient vraiment axées sur les résultats et comprenaient ce qu'elles voulaient. De plus, ils m'ont donné carte blanche pour développer ce domaine. Pour moi, c'était une sorte de défi personnel, je n'ai jamais eu l'occasion de constituer une équipe aussi importante. Maintenant, 17 personnes, et nous sommes toujours en croissance.

- Ce n'est pas la première entreprise où vous construisez un département R&D à partir de zéro, réunissez une équipe. Quelles sont les 5 premières étapes que vous prenez en rejoignant une entreprise?

- Le département R&D était à Lamoda et avant moi, en 7 ans même plusieurs équipes et dirigeants ont été remplacés. De plus, nous avons réuni environ la moitié de l'équipe actuelle à l'intérieur. Donc pas vraiment à partir de zéro.

Les cinq premières étapes d'une nouvelle entreprise? Je pense que l'algorithme n'est pas spécifique à la R&D; en principe, cela peut être le cas si vous venez dans une nouvelle entreprise pour au moins une sorte de position de leadership.

Tout d'abord, vous devez comprendre la stratégie actuelle de l'entreprise, comprendre quels sont les objectifs de l'entreprise, quel KPI mesurera les réalisations.

La seconde consiste à décrire comment, en tenant compte de votre compétence ou de votre rôle dans l'entreprise, vous pouvez influencer ces KPI, il devrait y avoir un ensemble d'outils et d'idées disponibles. Décrivez les besoins de l'entreprise et l'état cible, c'est-à-dire ce que nous voulons généralement atteindre, puis évaluez les outils disponibles. L'apprentissage automatique n'est que l'un d'entre eux et n'est pas optimal pour chaque tâche.

Le troisième point - vous devez vérifier l'état actuel - les personnes, les compétences, les processus, les données, les produits, l'infrastructure, en particulier l'infrastructure.
En général, ce n'est qu'à la 4ème étape après l'audit de l'état actuel qu'il devient possible de décrire une autre stratégie pour la transition de l'état actuel à l'état cible. Essentiellement, cela représente beaucoup de travail, y compris de nombreuses consultations avec les parties intéressées et les parties prenantes, sur la base desquelles plusieurs scénarios de développement possibles doivent être développés. Dans ma pratique, il était utile de faire au moins 3 - conservateur, réaliste et agressif en termes de coûts des ressources. Ensuite, c'est plus simple: après avoir choisi une stratégie, nous établissons une feuille de route, spécifions l'estimation des ressources et nous mettons au travail.

- Qu'est-ce que la science des données pour vous?

- La science des données est mon outil préféré. C'est un domaine extrêmement excitant, c'est comme les mathématiques et la physique, une autre façon d'explorer le monde qui vous entoure. C'était la première fois que je le ressentais particulièrement clairement dans Yandex, lorsque nous étions engagés dans l'analyse des requêtes de recherche, nous comprenions les besoins des utilisateurs, comment ils les résolvent, ce qui se passe dans le monde. Autrement dit, vous pouvez regarder le monde à travers un petit clic sur les données avec lesquelles vous travaillez. C'est intéressant et, à mon avis, n'est pas différent des autres façons de savoir, juste un autre «canal», considérez que c'est le 7ème sentiment. La même chose s'est produite dans «Consultant Plus»: nous avons examiné quels utilisateurs résolvent des problèmes lorsqu'ils recherchent des décisions de justice, c'est-à-dire ce qui excite spécifiquement les gens, quels conflits ils ont qui doivent être résolus en justice. Si nous parlons des données que nous analysons chez Lamoda, ce n'est pas moins excitant. Surtout quand vous découvrez que les chemisiers et les jupes sont achetés dans des couleurs différentes plutôt que les mêmes. Une curieuse observation avec laquelle vous pouvez aller plus loin dans la vie. Vous pouvez en apprendre beaucoup sur le monde qui vous entoure grâce aux données. Par conséquent, je dis que c'est mon outil préféré. Et c'est ici, d'une part, un outil cognitif, et d'autre part, un outil actif, avec l'aide de celui-ci, vous pouvez créer quelque chose de nouveau.

- Si vous prenez une entreprise, quel rôle attribuez-vous aux données dans l'entreprise?

- La chose la plus importante ici n'est pas de succomber au battage médiatique. Si nous parlons d'entreprise, les données devraient bien sûr fonctionner. Les résultats de l'analyse des données doivent être rentables ou réduire les coûts. S'ils ne le font pas, alors quelque chose a mal tourné quelque part. Dans le même temps, la culture axée sur les données n'a pas besoin d'être prise au pied de la lettre, nous pouvons prendre des décisions sans compter sur les données, c'est normal. De plus, dans certains cas, c'est la seule chose à faire.

- Dites-moi, quels projets faites-vous chez Lamoda? Quel est le projet le plus réussi mis en œuvre par votre équipe?

- La première chose à mentionner est probablement la plate-forme de test A / B - essentiellement un service qui divise les utilisateurs en groupes et gère l'activation / désactivation des fonctionnalités expérimentales. Pourquoi est-ce important pour nous? Parce qu'en général, ce domaine lui-même, lié à l'apprentissage automatique, ne peut exister sans tester constamment différentes hypothèses et idées. Nous ne pouvons pas savoir à l'avance que nos utilisateurs l'aimeront plus ou moins. Toute nouvelle idée doit être testée. Amazon fournit des statistiques intéressantes, ils disent que 70% des idées qu'ils testent perdent le test. Cela doit être traité avec calme, même si l'indicateur est plus élevé. Cela signifie que pour publier 5 projets réussis par trimestre, il faut faire ± 17. Par conséquent, une plate-forme fiable pour mener des expériences contrôlées est la base sans laquelle il est absolument impossible d'avancer en termes de développement de produits. Compte tenu de nos plans ambitieux, il a fallu procéder à une mise à niveau de ce système. La première version a été faite avant moi, nous l'avons considérablement mise à jour: maintenant vous pouvez exécuter plus d'expériences en même temps, avant qu'il y ait quelques limitations dans ce sens.

- Quelles autres directions?

- Recherche, et ici il y a des différences avec de grands acteurs comme Yandex et Google, parce que nous pouvons très bien travailler notre sujet, il est plutôt étroit par rapport à la "recherche universelle sur Internet". Il est impossible de faire une ontologie de tout, de décrire toutes les relations, mais dans un petit domaine spécifique, vous pouvez prendre de très bonnes décisions qui fonctionneront. Nous faisons notre linguistique pour un moteur de recherche qui pourrait prendre en compte certaines relations implicites entre différentes entités. , , , , , , . , Tommy Hilfiger Tommy Jeans, . , — , — - . , , Lamoda.

, , , — . . , , , , .
, , , .

— , .

— . , . , , , , — . , , . , . , , .

— ? ? ?

— , : , , , , -. , -, . , . -, , , . .

4-6 . , . , - . . - , , – .

— Amazon 70% , Lamoda?

— , . , , . , – success, learning. . — . , , , , . - .

— , ? learning'e, .

— , . , . , , , . , , learning, , . ( , ) , , , . , , , .

— ? , , , . , ?

— , : , , . , , , . , , .

— , , Newprolab Lamoda, . , , , ?

— , , , , , , . ( Newprolab — . .), , - . . , Newprolab , . - , , , . , . 3 10 , , . . , , , , , .

— , , , , , , , .

— , , 4 , , Coursera, , . , , , . , , , , , , .

image

« » , , . , ?

— – - . , , - , . - , . , . ? : - , . , . , , , , , , . , . , , , , - . , , .

— , -. , ? ?

— , «» «», , , , - . , - , . . , , , . , Lamoda . - , .

— , ?

— Slack ODS, , , . , , , , , , .

— , , . , , ?

— , : , . , , data science, . , , - .

— , , .

— , . . , , . , , - - , . — , , , , . , - - . , , , , , , , - , .

, — , , , . , , . : , , , . Ezhome — : data scientist, -, , . , - . , . , .

C'est probablement pourquoi j'aime tellement mon travail, cela me permet d'utiliser mes forces pour atteindre des objectifs qui sont précieux à la fois pour l'entreprise et pour moi personnellement.

Source: https://habr.com/ru/post/fr431124/


All Articles