RUVDS et Habr commencent un projet consistant en une série d'entretiens avec des personnes intéressantes, à notre avis, dans l'environnement informatique. Aujourd'hui, nous présentons une interview avec le chef du développement des systèmes interactifs à Yandex, Boris Yangel.
Pourquoi Alice, pas Max, pourquoi l'ancien ministre des Communications Nikifirov s'est trompé, pourquoi lancer Tesla dans l'espace. Réponses dans la vidéo et le texte sous la coupe.
Les interviews ont été préparées par Lera Negra et le rédacteur en chef de Habr, Nikolai Zemlyansky.
Salut Je suis Lera Negra, et aujourd'hui notre invité est Boris Yangel, le chef du groupe de développement des systèmes de dialogue chez Yandex. Bien sûr, nous allons commencer par votre travail, que faites-vous maintenant chez Yandex?- Maintenant à Yandex, mon projet principal est Alice, l'assistante vocale que Yandex a lancée en octobre dernier, et mon groupe est responsable de ce que l'on peut appeler arbitrairement le cerveau d'Alice. Nous interprétons ce que l'utilisateur a dit en langage naturel et le transformons en une représentation structurée. C'est notre première tâche, et la seconde, c'est quand nous savons déjà à quoi l'utilisateur doit répondre, transformez-le également en une réponse en langage naturel.
"
Vous occupez ce poste depuis deux ans maintenant." Pendant tout ce temps, vous étiez engagé dans le développement. La sortie d'un assistant vocal a-t-elle été tardive, car les concurrents l'ont publiée plus tôt?"Non, bien sûr, il n'est pas trop tard." Si nous regardons les concurrents, qui est le vrai concurrent? Il y a Siri, le seul assistant vocal qui comprend également la langue russe, mais cela ne fonctionne que sur iOS et MacOS, ce n'est pas la plate-forme la plus populaire en Russie, et il y a certaines questions sur Siri en tant que produit. De plus, disons que Google lancerait déjà son assistant Google en russe, cela vaudrait-il la peine de s'impliquer? Eh bien, peut-être que cela en valait la peine, car vous pouvez essayer de rivaliser avec Google sur votre territoire pour un public, d'autant plus qu'avec une recherche, nous réussissons plus ou moins. Eh bien, et probablement, le dernier point ici est important: ce que nous voyons maintenant, c'est l'aube de l'ère des systèmes de dialogue, et en fait, ni Google, ni Apple, ni, probablement, nous savons encore comment les rendre normaux. Par rapport aux moteurs de recherche, avec ce qui s'est passé au début des années 2000, c'est conditionnellement l'ère des Altavistes, quand il y a des produits, mais ils fonctionnent toujours sur des principes étranges et fonctionnent ainsi, et à tout moment venez google conditionnel et changez complètement l'industrie. Par conséquent, bien sûr, cela vaut toujours la peine d’y entrer maintenant. De nombreux défis et problèmes technologiques qui n'ont pas encore été résolus. Un nouveau joueur peut venir tout renverser, et nous sommes en fait dans une position légèrement plus avantageuse, car nous avons commencé plus tard, ce qui signifie que nous avons moins de pile héritée, c'est-à-dire que nous pouvons immédiatement travailler avec de nouvelles technologies. Et Siri, par exemple, que Dieu sait quand l'a fait, a beaucoup d'ancien code qui est déjà difficile à modifier, et à cause de cela, ils rencontrent beaucoup de problèmes.
-
Dans votre discours à la Yandex Academy, vous avez dit avoir attrapé un certain train de battage médiatique. Comment a-t-il réussi et ce train est-il parti maintenant?- Probablement, cela a été possible tout d'abord grâce à une décision très audacieuse qui a été prise dans notre produit. Tous les concurrents ont un certain nombre de scénarios qui sont énoncés de manière rigide dans ces produits: «nous pouvons répondre à telle ou telle question, parler de la météo ou de quelque chose d'autre, et si ce que dit l'utilisateur ne relève d'aucune à partir de ces scénarios, nous répondons avec une sorte de talon comme "Désolé, je ne vous ai pas compris." Nous avons décidé d'agir différemment et avons créé un module de réseau neuronal qui, dans de telles situations, peut répondre avec quelque chose qui pourrait être approprié dans le contexte du dialogue précédent, et en fait, il peut communiquer avec l'utilisateur sur n'importe quel sujet. Ce n'est peut-être pas toujours approprié à 100%, mais dans plus de la moitié des cas, il peut certainement dire certaines choses qui devaient être dites à ce moment-là. Et notre module a dit beaucoup de choses que les utilisateurs aimaient. Les réponses ridicules d'Alice, que nous n'avons pas insérées ici, mais qu'elle a générées elle-même, se sont instantanément répandues sur les réseaux sociaux, ce qui a créé le train très hype. Bien sûr, il part un peu, c'est inévitable, toutes ces blagues sont ennuyeuses, mais nous essayons de développer le produit plus loin et d'attraper le battage médiatique petit à petit là où nous le pouvons.
-
Vous avez essayé de rendre Alice aussi intéressante que possible pour un utilisateur russe. Comment la voix a-t-elle été choisie et pourquoi était-elle Alice?- Honnêtement, je n'ai pas participé au processus de choix d'une voix et je ne sais pas par quels principes elle a été mise en œuvre, sauf que c'est une voix cool de l'actrice russe Tatyana Shitova, que tout le monde aime, est tout à fait reconnaissable.
Je peux parler du nom d'Alice et des caractéristiques. Nous avons pensé et écrit un certain nombre de propriétés que nous aimerions avoir un assistant. Par exemple, il ne doit pas être arrogant, aider une personne, être amical, intelligent, c'est-à-dire un ensemble de propriétés positives et négatives. Et puis nous avons posé des questions sur notre plateforme de crowdsourcing, par exemple, ce nom est-il associé à cette propriété ou non? Nous avons examiné les noms que nous avions précédemment choisis parmi certains principes corrélent plus avec les propriétés positives qu'avec les propriétés négatives, et selon ce critère, le nom Alice a simplement détruit tous les autres concurrents de la liste restreinte. Cela est probablement dû au fait que ce nom dans la culture russe a des annotations positives, par exemple, Alice au pays des merveilles, Alice Selezneva, des exemples classiques. Et cela s'applique également aux propriétés phonétiques du nom. Puisque c'est le nom qui sera adressé à Alice, il faut qu'il n'y ait pas de sons que certaines personnes auront du mal à prononcer. Par exemple, la lettre "P" ne devrait certainement pas être là, le sifflement ne devrait pas non plus. Le nom Alice satisfait ces propriétés.
-
Pourquoi Alice, pas Max, pourquoi n'est-elle pas un homme?- En fait, beaucoup de recherches ont été menées et une femme est un choix plus sûr. L'évolution nous a rendus si heureux qu'une femme est une mère, quelque chose de sûr, chère, et qu'un homme est un guerrier qui viendra simplement avec une lance et vous tuera. Par conséquent, une assistante est normale pour les femmes et les hommes, mais si l'assistant est un homme, un tel produit sera moins utilisé.
-
Il y a quelques années, il y avait une histoire pas très agréable lorsque le bot de chat Microsoft s'est comporté de manière complètement incorrecte. Y avait-il un risque similaire avec Alice, ou peut-être même des situations similaires se sont-elles produites?- Bien sûr que ça l'était, et nous avons beaucoup pensé à cette histoire quand Alice a été lancée. Comme je l'ai dit plus tôt, nous avons un module de réseau neuronal qui répond dans toutes les situations, et pas seulement dans le cadre d'un scénario. Et il a une liberté absolue, en fait. Dans les limites de certaines restrictions que nous fixons, il a la liberté de parler et, dans certaines situations, il peut dire des choses que nous ne voudrions pas qu'il dise. Notre langue est très puissante et riche, il y a un milliard de façons d'être d'accord ou pas, nous ne les compterons jamais toutes. Comment l'empêcher de se mettre d'accord quand on lui demande quelque chose de dangereux est déjà une tâche de recherche très difficile.
-
Est-ce en quelque sorte lié au fait qu'elle dit souvent: «Je ne veux pas en parler»?- Elle dit «je ne veux pas en parler» lorsque nous comprenons que la situation est trop dangereuse pour que le module de réseau neuronal donne une réponse. En fait, si vous permettez à Alice de dire seulement oui ou non, c'est suffisant pour offenser qui que ce soit. Il suffit de lui demander: "Soutenez-vous X" où X est le fascisme, le génocide, peu importe. Si elle dit oui, tout est parti.
-
Après l'obtention du diplôme, vous avez immédiatement commencé à travailler chez Yandex, c'est un département qui est engagé dans la recherche d'images par demande de texte. Après cela, a-t-il été soudainement décidé de travailler chez Microsoft Research à Cambridge?
- Eh bien, pas si soudainement, c'était naturel. J'ai travaillé chez Yandex, je voulais continuer à développer, faire des choses plus complexes.
-
Ça n'a pas marché dans Yandex?- Dans Yandex, d'une part, il s'est avéré, d'autre part, j'ai déjà commencé à diriger un groupe à Yandex qui était responsable de la qualité de la recherche en images. Je n'étais probablement pas très bien préparé pour le travail d'un leader, et je ne l'aimais pas vraiment, je l'aimais et maintenant j'aime programmer, et le travail laissait très peu d'opportunités pour cela, à moins que vous ne vouliez travailler 16 heures par jour. Je n'aimais pas beaucoup ça, je voulais me développer en tant que programmeur, spécialiste de l'analyse de données, et ici j'ai trouvé une excellente option, un poste vacant chez Microsoft, pour ainsi dire, très pertinent pour mon parcours.
-
Qu'avez-vous fait là-bas?- Il existe un tel domaine dans l'apprentissage automatique, appelle la conclusion bayésienne. Il s'agit de savoir comment prendre des décisions absolument rationnelles dans des conditions d'informations incomplètes, de sorte que l'on pourrait prouver qu'une décision plus rationnelle ne pourrait pas être prise dans cette situation. J'ai travaillé dans une équipe qui a créé une bibliothèque de logiciels, avec l'aide de laquelle il serait possible d'utiliser toute la puissance de cet appareil mathématique pour prendre des décisions dans certaines situations. En fait, il s'agit d'une bibliothèque d'apprentissage automatique, simplement basée sur quelques principes spécifiques, non conventionnelle.
-
Et le travail là-bas préparé pour un poste de direction?- Non, quand je suis rentré de Cambridge à Yandex, je me suis honnêtement demandé de ne diriger personne, j'ai dit que si j'écrirais du code, j'aime vraiment écrire du code. Dans le même temps, je n'ai pas été impliqué dans les projets les plus importants de l'entreprise et n'ai pas divulgué complètement mes fonctionnalités. Au début, je développais un backend pour certaines applications mobiles expérimentales, puis j'ai développé des méthodes de classification de texte dans un groupe de réseaux de neurones, et à un moment donné, la direction a décidé: pourquoi ne faites-vous pas quelque chose d'utile, allez faire Alice.
-
Il y a deux ans, la presse a activement discuté du fait que l'enseignement fondamental des technologies de l'information, du moins dans notre pays, n'était pas suffisamment développé. Dans quelle mesure étiez-vous préparé? Qu'est-ce qui vous a aidé? S'agit-il de l'école Yandex, ou vous êtes-vous senti suffisamment en confiance après l'université?- Je peux programmer car je viens de programmer beaucoup. Enfant, je me suis assis devant un ordinateur et j'ai programmé, à l'université aussi. Là, tout le monde est allé boire un verre et je suis allé boire un verre ou assister à une programmation et dès la première année, j'ai presque travaillé dans de vraies entreprises, j'ai acquis de l'expérience dans l'industrie. Cette connaissance fondamentale était suffisante pour comprendre les autres choses qui sont nécessaires directement pour travailler vous-même.
L'école d'analyse des données , bien sûr, a aidé, c'est une initiative sympa qui donne les connaissances qui font actuellement défaut à la sortie de l'université. Certes, je n'y ai étudié qu'un an, car cela prenait tellement de temps, il y avait tellement de tâches, si difficiles. J'ai déjà travaillé chez Yandex à l'époque, je n'avais tout simplement pas le temps. Mais en général, je recommanderais à tout le monde d'y aller.
-
Selon l'ancien ministre des Communications Nikiforov, dans notre pays, il y a déjà trop de programmeurs, trop de spécialistes dans le domaine informatique. En est-il ainsi? Y a-t-il vraiment beaucoup de très bons spécialistes?- Je ne sais pas ce que pense M. Nikiforov, mais en tant que personne qui a besoin d'embaucher des spécialistes directement dans son équipe, j'ai d'énormes problèmes d'embauche. Nous avons une tâche assez difficile, et des spécialistes avec un niveau supérieur à la moyenne sont requis. Il n'y a pratiquement pas de spécialistes de ce type dont j'ai besoin sur le marché, tous ceux qui travaillent probablement déjà chez Yandex, enfin, dans un petit nombre d'autres endroits. Je ne sais pas qui il considère comme des programmeurs, mais il y a très peu de spécialistes hautement qualifiés, en particulier dans le domaine des réseaux de neurones, une formation approfondie.
- À
quoi voyez-vous l'intérêt de votre travail, à la fois dans une entreprise distincte et en général dans l'industrie?- Probablement, si vous regardez les choses à l'échelle mondiale, ce serait formidable de trouver quelque chose de cool, une technologie ou une idée telle que les gens qui entreront dans l'industrie après moi construiront leurs propres développements sur cette technologie. Autrement dit, il entrera dans la fondation, pour ainsi dire, sur laquelle tout est progressivement construit. Je ne sais pas ce que ce sera, mais je voudrais en laisser au moins une trace, et c'est plus facile à faire, probablement si vous vous développez en tant que leader, car alors il y a plus de ressources, vous pouvez essayer des idées plus globales et ambitieuses . Mais si je mets la main dans mon cœur bien droit, je ne peux pas dire que j'aime vraiment diriger les gens, c'est vraiment un travail difficile, cela prend beaucoup de temps, de force morale et ne me permet pas de faire ce que j'aime faire - programmer. Par conséquent, je voudrais évoluer dans une direction qui me permettra de trouver l'équilibre optimal entre l'échelle des choses que je peux faire et que je peux influencer, et la capacité de faire directement ces choses de mes propres mains. Pour l'industrie dans son ensemble, c'est une question plus intéressante. Il me semble que la même chose se produit avec les interfaces vocales qui se sont produites avec les interfaces graphiques, quand elles ont juste commencé à apparaître, quand les premiers moniteurs couleur sont apparus, et nous sommes passés de consoles où il fallait saisir des commandes, à quelques boutons sur lesquels c'était possible appuyer sur. Et quand ils sont apparus pour la première fois, personne ne savait comment les faire normalement, il n'y avait pas de paradigmes, de modèles architecturaux, de cadres, tout le monde faisait ce qu'ils voulaient, et les interfaces étaient tordues, misérables, il était très difficile de les faire, il était impossible de lire le code, mais les gens Nous y avons pensé, et de beaux concepts ont progressivement émergé sur la façon de faire ces interfaces, des outils pratiques sont apparus, et maintenant un professionnel dans ce domaine peut créer un site Web avec une interface assez compliquée très rapidement. Nous pensons comment faire de même avec les interfaces vocales. Quels outils devraient être, afin qu'ils puissent être faits de manière pratique et qu'ils se révèlent bons. Même si tout à coup nous n’obtenions pas un bon produit, nous pourrions peut-être bénéficier à l’ensemble de l’industrie dans son ensemble en inventant quelque chose dans ce sens.
-
Qu'est -
ce qui peut remplacer Alice?- Je ne sais pas ce que ce sera. Quelle interface pourrait être encore plus pratique que la voix ... Contrôler probablement le pouvoir de la pensée, quelque chose comme ça.
"
Si Alice meurt, seras-tu triste?"- Je serai laissé sans travail, oui, je serai triste.
-
Grandes entreprises, grands projets, quels sont selon vous les premiers candidats au départ?"Eh bien, je ne donnerai probablement aucun nom, ce serait faux." Je ne peux pas dire que quelqu'un est candidat au vol, car il fait un mauvais produit. Là où je m'attendais à des échecs, c'est là que des subventions sont nécessaires pour le développement de l'entreprise. Par exemple, un marché de taxi ou une sorte de livraison de nourriture conditionnelle - Food Fox, Deliveru Club. D'une part, ce sont des projets informatiques, d'autre part, ils interagissent avec le monde réel. Pour y aller, il faut maintenant subventionner beaucoup, vider les concurrents pour faire des prix très compétitifs, évincer tout le monde du marché et ensuite augmenter les prix. Cela conduit au fait que beaucoup de gens viennent y brûler simplement parce qu'ils manquent d'argent. Ils n'ont pas le temps de forcer qui que ce soit et les mastodontes comme le taxi Yandex sur certains marchés d'Uber écrasent tout le monde.
-
Crypto -
monnaies. Vous investissez, non, investi, quoi, pourquoi.- Je ne suis pas l'investisseur de crypto le plus performant, je fais partie de ces personnes qui ont décidé d'investir un peu au moment le plus inopportun, bien sûr, et maintenant ils sont assis et espèrent qu'après tout, Bitcoin va repousser. Ne fais pas comme moi.
-
Les concurrents ont-ils essayé de vous attirer?- Oui, je réponds habituellement que maintenant je ne cherche pas d'autre emploi.
-
Si ce n'était pas pour l'informatique, alors quoi?- Je ne sais pas, j'aime le parachutisme, peut-être que je deviendrais alors monitrice de parachutisme.
-
Pourquoi lancer Tesla dans l'espace?- Parce que c'est cool.
-
Merci beaucoup, Boris. Notre invité d'aujourd'hui, Nikolay Zemlyansky, rédacteur en chef de Habr, vous posera quelques questions supplémentaires.-
Bonjour, Boris. Je veux rappeler le film récemment sorti, Blade Runner 2049, où l'agent K avait un assistant Android. Je ne me souviens pas de son nom, laisse Masha être. Quand ils parlaient et qu'il n'aimait pas quelque chose, il pouvait dire: "Masha, garce moins trois" ou "Sexualité Masha plus cinq". En fonction de cela, la communication avec l'assistant a été ajustée. Selon vous, qu'est-ce qui est réel dans un avenir prévisible et y a-t-il un sens?- J'ai déjà parlé un peu de la façon dont nous traitons les réponses insultantes d'Alice. C'est vraiment une grande histoire et c'est pourquoi. Pour qu'Alice n'offense pas l'interlocuteur, nous enseignons en fait certains modèles pour prédire si telle ou telle réponse est offensante, et si oui, dans quelle mesure. Maintenant, nous utilisons ces modèles selon un principe très simple: si le modèle dit que la réponse est offensante, nous ne lui donnons pas de réponse. En termes que vous dites, nous tournons l'insulte à zéro. En fait, nous avons déjà un modèle qui évalue la gradation de cette insulte, et si un besoin de produit survient, nous pourrions déjà faire un curseur qui rend les réponses plus ou moins audacieuses. L'approche que nous utilisons pour cela peut être appliquée à d'autres caractéristiques du comportement du système. Cela, bien sûr, nécessitera un travail spécifique à chaque caractéristique spécifique, mais pour faire un tel assistant, dont les caractéristiques peuvent être ajustées avec des curseurs, ne sera pas possible dans 20 ans, mais plutôt bientôt, comme il me semble.
—
, , , , , «». , . . , , ?— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .
, « » -, , , , - — - , — , . « », . .
—
, . , , , - ?— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .
—
, .— , , , , .
—
, , , , .— , -.
—
. ? , , , . , ?— . Google, , Google- , . , , , . , , .
—
, , ?— . . , , , . Google, , . , .
—
, Siri. ?— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .
—
, , , , ?— , , . , , . , - — , . - , . — , , , . , Google .
- Merci Boris, c'était très agréable de te parler.
- Je vous en prie.