Entrevista con el "cerebro principal de Alicia"

RUVDS junto con Habr comienzan un proyecto que consiste en una serie de entrevistas con personas interesantes, en nuestra opinión, en el entorno de TI. Hoy presentamos una entrevista con el jefe del desarrollo de sistemas interactivos en Yandex, Boris Yangel.

Por qué Alice, no Max, en qué se equivocó el ex Ministro de Comunicaciones Nikifirov, por qué lanzar Tesla al espacio. Respuestas en el video y texto debajo del corte.

Las entrevistas fueron preparadas por Lera Negra y el editor de Habr, Nikolai Zemlyansky.



Hola Soy Lera Negra, y hoy nuestro invitado es Boris Yangel, el jefe del grupo de desarrollo de sistemas de diálogo en Yandex. Por supuesto, comenzaremos con su trabajo, ¿qué está haciendo ahora en Yandex?

- Ahora en Yandex, mi proyecto principal es Alice, la asistente de voz que Yandex lanzó en octubre pasado, y mi grupo es responsable de lo que arbitrariamente se puede llamar el cerebro de Alice. Interpretamos lo que el usuario dijo en lenguaje natural y lo convertimos en una representación estructurada. Esta es nuestra primera tarea, y la segunda es cuando ya sabemos lo que el usuario necesita responder, convertirlo en una respuesta en lenguaje natural también.

" Has estado en esta posición durante dos años". Todo este tiempo estuviste comprometido con el desarrollo. ¿Se retrasó el lanzamiento de un asistente de voz cuando los competidores lo lanzaron antes?

"No, por supuesto, no es demasiado tarde". Si miramos a los competidores, ¿quién es el verdadero competidor? Está Siri, el único asistente de voz que también entiende el idioma ruso, pero funciona solo en iOS y MacOS, esta no es la plataforma más popular en Rusia, y hay ciertas preguntas sobre Siri como producto. Además, supongamos que Google ya lanzaría su asistente de Google en ruso, ¿valdría la pena involucrarse? Bueno, tal vez valió la pena de todos modos, porque puedes intentar competir con Google en tu territorio por una audiencia, especialmente porque con una búsqueda tenemos más o menos éxito. Bueno, y probablemente, el último punto aquí es importante: lo que estamos viendo ahora es el comienzo de la era de los sistemas de diálogo, y de hecho, ni Google ni Apple, ni, probablemente, todavía sepamos cómo normalizarlos. En comparación con los motores de búsqueda, con lo que sucedió a principios de la década de 2000, esta es condicionalmente la era de los Altavistas, cuando hay algunos productos, pero aún funcionan con algunos principios extraños y funcionan de manera regular, y en cualquier momento ven a google condicional y cambia la industria por completo. Por lo tanto, por supuesto, todavía vale la pena entrar ahora. Muchos desafíos tecnológicos y problemas que aún no se han resuelto. Un nuevo jugador puede venir y cambiar todo, y en realidad estamos en una posición un poco más ventajosa, porque comenzamos más tarde, lo que significa que tenemos menos legado, es decir, podemos trabajar inmediatamente con nuevas tecnologías. Y Siri, por ejemplo, que Dios sabe cuándo lo hizo, tiene un montón de código antiguo que ya es difícil de modificar, y debido a esto se encuentran con muchos problemas.

- En su discurso en la Academia Yandex, dijo que cogió un cierto tren de bombo. ¿Cómo tuvo éxito y este tren se fue ahora?

- Probablemente fue posible en primer lugar gracias a una decisión muy audaz que se tomó en nuestro producto. Todos los competidores tienen un cierto número de escenarios que se detallan de manera rígida en estos productos: "podemos responder a tal o cual pregunta, hablar sobre el clima u otra cosa, y si lo que el usuario dice no cae bajo ninguna de estos escenarios, luego respondemos con algún tipo de trozo como "Lo siento, no te entendí". Decidimos actuar de manera diferente e hicimos un módulo de red neuronal que en tales situaciones puede responder con algo que podría ser apropiado en el contexto del diálogo anterior, y de hecho puede comunicarse con el usuario sobre cualquier tema. Puede que no siempre sea 100% apropiado, pero en más de la mitad de los casos ciertamente puede decir algunas cosas que debían decirse en ese momento. Y nuestro módulo decía muchas cosas que les gustaban a los usuarios. Las ridículas respuestas de Alice, que no pusimos allí, pero que ella misma generó, se extendieron instantáneamente a través de las redes sociales, lo que creó el tren muy publicitario. Por supuesto, se va un poco, esto es inevitable, todos estos chistes son aburridos, pero tratamos de desarrollar el producto aún más y atrapar la publicidad poco a poco donde podamos.

- Intentaste hacer que Alice fuera lo más interesante posible para un usuario ruso. ¿Cómo se eligió la voz y por qué era Alice?

- Honestamente, no participé en el proceso de elegir una voz y no sé por qué principios se implementó, excepto que es una voz genial de la actriz rusa Tatyana Shitova, que todo el mundo ama, es bastante reconocible.

Puedo hablar sobre el nombre de Alice y sobre las características. Pensamos y escribimos una serie de propiedades que nos gustaría tener un asistente. Por ejemplo, no debe ser arrogante, ayudar a una persona, ser amable, ser inteligente, es decir, un conjunto de propiedades positivas y negativas. Y luego preguntamos a las personas en nuestra plataforma de crowdsourcing preguntas, por ejemplo, ¿este nombre está asociado con esta propiedad o no? Observamos qué nombres elegimos previamente de algunos principios se correlacionan más con las propiedades positivas que con las negativas, y según este criterio, el nombre Alice simplemente destruyó a todos los demás competidores de la lista corta. Esto probablemente se deba al hecho de que este nombre en la cultura rusa tiene algunas anotaciones positivas, por ejemplo, Alicia en el país de las maravillas, Alice Selezneva, ejemplos clásicos. Y esto también se aplica a las propiedades fonéticas del nombre. Dado que este es el nombre que se dirigirá a Alice, es necesario que no haya sonidos que a algunas personas les resulte difícil de pronunciar. Por ejemplo, la letra "P" definitivamente no debería estar allí, el silbido tampoco debería estarlo. El nombre Alice satisface estas propiedades.

- ¿Por qué Alice, no Max, por qué no es un hombre?

- De hecho, se han realizado muchas investigaciones y una mujer es una opción más segura. La evolución nos hizo tan felices que una mujer es una madre, algo seguro, querido, y un hombre es un guerrero que simplemente vendrá con una lanza y te matará. Por lo tanto, una asistente femenina es normal tanto para mujeres como para hombres, pero si el asistente es un hombre, entonces dicho producto se usará menos.

- Hace unos años hubo una historia no muy agradable cuando el bot de chat de Microsoft se comportó de manera completamente incorrecta. ¿Hubo un riesgo similar con Alice, o tal vez incluso ocurrieron situaciones similares?

- Por supuesto que sí, y pensamos mucho en esta historia cuando se lanzó Alice. Como dije antes, tenemos un módulo de red neuronal que responde en cualquier situación, y no solo dentro del marco de un escenario. Y tiene absoluta libertad, de hecho. Dentro de los límites de algunas restricciones que establecemos, él tiene la libertad de hablar, y en algunas situaciones puede decir cosas que no queremos que diga. Nuestro lenguaje es muy poderoso y rico, hay mil millones de formas de estar de acuerdo o en desacuerdo, nunca los contaremos a todos. Cómo evitar que ella esté de acuerdo cuando se le pregunta sobre algo peligroso ya es una tarea de investigación muy difícil.

- ¿Está relacionado de alguna manera con el hecho de que a menudo dice: "No quiero hablar de eso"?

- Ella dice "No quiero hablar de esto" cuando entendemos que la situación es demasiado peligrosa para que el módulo de red neuronal dé una respuesta. De hecho, si permites que Alice diga sí o no, eso es suficiente para ofender a cualquiera. Es suficiente preguntarle: "¿Apoyas a X", donde X es fascismo, genocidio, lo que sea. Si ella dice que sí, todo, la escritura se ha ido.

- Después de la graduación, inmediatamente comenzó a trabajar en Yandex, era un departamento que se dedicaba a la búsqueda de imágenes por solicitud de texto. Después de eso, ¿se decidió de repente trabajar en Microsoft Research en Cambridge?

- Bueno, no tan de repente, fue natural. Trabajé en Yandex, quería desarrollarme más, para hacer cosas más complejas.

- ¿No funcionó en Yandex?

- En Yandex, por un lado, resultó que, por otro lado, ya comencé a liderar un grupo en Yandex que era responsable de la calidad de la búsqueda en imágenes. Probablemente no estaba muy bien preparado para el trabajo de un líder, y realmente no me gustó, me encantó y ahora me gusta programar, y el trabajo dejó muy pocas oportunidades para esto, a menos que quiera trabajar 16 horas al día. No me gustó mucho, quería desarrollarme solo como programador, especialista en análisis de datos, y aquí encontré una gran opción, una vacante en Microsoft, por así decirlo, muy relevante para mi experiencia.

- ¿Qué hiciste allí?

- Existe tal área en el aprendizaje automático, se llama conclusión bayesiana. Se trata de cómo tomar decisiones absolutamente racionales en condiciones de información incompleta, de modo que se pueda probar que no se podría tomar una decisión más racional en esta situación. Trabajé en un equipo que creó una biblioteca de software, con la ayuda de la cual sería posible utilizar todo el poder de este aparato matemático para tomar decisiones en algunas situaciones. De hecho, esta es una biblioteca para el aprendizaje automático, basada simplemente en unos pocos principios específicos, poco convencionales.

- ¿ Y el trabajo allí preparado para una posición de liderazgo?

- No, cuando regresé de Cambridge de regreso a Yandex, honestamente me pedí que no guiara a nadie, dije que si era posible escribiría código, realmente me gustaría escribir código. Al mismo tiempo, no participé en los proyectos más importantes para la empresa y no revelé completamente mi funcionalidad. Al principio, estaba desarrollando un back-end para algunas aplicaciones móviles experimentales, luego desarrollé métodos de clasificación de texto en un grupo de redes neuronales, y en algún momento la gerencia decidió: ¿por qué no haces algo útil? Ve a hacer Alice.

- Hace dos años, la prensa discutió activamente el hecho de que la educación fundamental en TI, al menos en nuestro país, no está suficientemente desarrollada. ¿Qué tan preparado estabas? ¿Qué te ayudó? ¿Es esta la escuela Yandex, o te sentiste lo suficientemente seguro después de la universidad?

- Puedo programar porque acabo de programar mucho. Cuando era niño, me sentaba en una computadora y programaba, también en la universidad. Allí, todos fueron a tomar una copa y yo fui a tomar una copa o me senté a programar y desde el primer año trabajé en compañías reales casi un poco, gané experiencia en la industria. Este conocimiento fundamental fue suficiente para comprender las otras cosas que se necesitan directamente para trabajar usted mismo. La escuela de análisis de datos , por supuesto, ayudó, esta es una iniciativa genial que brinda el conocimiento que actualmente falta a la salida de la universidad. Es cierto, solo estudié allí durante un año, porque me llevó mucho tiempo, había tantas tareas, tan difíciles. Entonces ya trabajaba en Yandex, simplemente no tenía tiempo. Pero en general, recomendaría a todos que vayan allí.

- Según el ex Ministro de Comunicaciones Nikiforov, en nuestro país ya hay demasiados programadores, demasiados especialistas en el campo de TI. Es asi? ¿Hay realmente muchos especialistas realmente buenos?

- No sé cómo piensa el Sr. Nikiforov, pero como persona que necesita contratar especialistas directamente para su equipo, tengo grandes problemas con la contratación. Tenemos una tarea bastante difícil, y se requieren especialistas con un nivel superior al promedio. Prácticamente no hay especialistas que necesito en el mercado, todos los que probablemente ya trabajan en Yandex, bueno, en algunos otros lugares. No sé a quién considera programadores, pero hay muy pocos especialistas altamente calificados, especialmente en el campo de las redes neuronales, la capacitación en profundidad.

- ¿Cuál es el punto de su trabajo, tanto en una empresa separada como en general en la industria?

- Probablemente, si nos fijamos en las cosas a nivel mundial, sería genial tener algo genial, una tecnología o una idea tal que las personas que vienen a la industria después de mí construyan sus propios desarrollos sobre esta tecnología. Es decir, entrará en la base, por así decirlo, sobre la cual todo se construirá gradualmente. No sé qué será, pero me gustaría dejar al menos un poco de ello, y es más fácil hacerlo, probablemente si te desarrollas como líder, porque entonces hay más recursos, puedes probar algunas ideas más globales y ambiciosas. . Pero si pongo mi mano en mi corazón, no puedo decir que realmente me gusta liderar a la gente, es un trabajo muy duro, toma mucho tiempo, fuerza moral y no me permite hacer lo que me gusta hacer: programar. Por lo tanto, me gustaría desarrollar en una dirección que me permita encontrar el equilibrio óptimo entre la escala de las cosas que puedo hacer y en las que puedo influir, y la capacidad de hacer estas cosas directamente con mis propias manos. Para la industria en su conjunto, esta es una pregunta más interesante. Me parece que lo mismo está sucediendo con las interfaces de voz que ocurrieron con las interfaces gráficas, cuando comenzaron a aparecer, cuando aparecieron los primeros monitores en color, y cambiamos de consolas donde era necesario ingresar comandos, a algunos botones en los que era posible para presionar. Y cuando aparecieron por primera vez, nadie sabía cómo hacerlos normalmente, no había paradigmas, patrones arquitectónicos, marcos, todos estaban haciendo lo que querían, y las interfaces estaban torcidas, miserables, era muy difícil hacerlas, era imposible leer el código, pero la gente Pensamos en ello, y gradualmente surgieron algunos conceptos hermosos sobre cómo hacer estas interfaces, aparecieron herramientas convenientes, y ahora un profesional en este campo puede crear un sitio web con una interfaz bastante complicada muy rápidamente. Estamos pensando cómo hacer lo mismo con las interfaces de voz. Qué herramientas deberían ser, para que se puedan hacer convenientemente y para que resulten buenas. Incluso si de repente no obtuviéramos un buen producto, tal vez beneficiaríamos a toda la industria en su conjunto al inventar algo en esta dirección.

- ¿Qué puede reemplazar a Alice?

- No sé lo que será. Qué interfaz podría ser aún más conveniente que la voz ... Probablemente controlando el poder del pensamiento, algo así.

" Si Alice muere, ¿estarás triste?"

- Me quedaré sin trabajo, sí, estaré triste.

- Grandes empresas, grandes proyectos, ¿cuáles son los primeros candidatos para la partida en su opinión?

"Bueno, probablemente no daré ningún nombre, eso estaría mal". No puedo decir que alguien sea candidato para el vuelo, porque hace un mal producto. Donde esperaba fracasos, aquí es donde se necesitan subsidios para el desarrollo del negocio. Por ejemplo, un mercado de taxis o algún tipo de entrega de alimentos condicional: Food Fox, Deliveru Club. Por un lado, estos son proyectos de TI, por otro lado, interactúan con el mundo real. Para ir allí, ahora necesita subsidiar mucho, deshacerse de los competidores para obtener precios muy competitivos, sacar a todos del mercado y luego aumentar los precios. Esto lleva al hecho de que muchas personas vienen y se queman allí simplemente porque se están quedando sin dinero. No tienen tiempo para exprimir a nadie, y mastodontes como el taxi Yandex en algunos mercados de Uber aplastan a todos.

- Criptomonedas. Inviertes, no, inviertes, qué, por qué.

- No soy el inversor criptográfico más exitoso, soy una de esas personas que decidió invertir un poco en el momento más inoportuno, por supuesto, y ahora están sentados y esperando que, después de todo, Bitcoin vuelva a crecer. No hagas como yo.

- ¿Intentaron los competidores atraerlo?

- Sí, generalmente respondo que ahora no busco ningún otro trabajo.

- Si no fuera por TI, ¿entonces qué?

- No sé, soy aficionado al paracaidismo, tal vez entonces me convertiría en instructor de paracaidismo.

- ¿Por qué lanzar Tesla al espacio?

- Porque es genial.

- Muchas gracias, Boris. Nuestro invitado de hoy, Nikolay Zemlyansky, editor de Habr, le hará algunas preguntas más.

Hola, Boris. Quiero recordar la película recientemente lanzada, Blade Runner 2049, donde el Agente K tenía un asistente de Android. No recuerdo su nombre, deja que sea Masha. Cuando hablaban y no le gustaba algo, podía decir: "Masha, perra menos tres" o "Sexualidad Masha más cinco". Dependiendo de esto, se ajustó la comunicación con el asistente. ¿Qué crees que es real en el futuro previsible, y tiene algún sentido?

- Ya hablé un poco sobre cómo lidiamos con las insultantes respuestas de Alice. Todo esto es realmente una gran historia y es por eso. Para que Alice no ofenda al interlocutor, en realidad enseñamos algunos modelos para predecir si esta o aquella respuesta es ofensiva y, en caso afirmativo, en qué medida. Ahora usamos estos modelos de acuerdo con un principio muy simple: si el modelo dice que la respuesta es ofensiva, no le damos una respuesta. En los términos que usted dice, cambiamos el insulto a cero. De hecho, ya tenemos un modelo que evalúa la gradación de este insulto, y si surgiera la necesidad de un producto, ya podríamos hacer un control deslizante que haga que las respuestas sean más o menos audaces. El enfoque que utilizamos para esto se puede aplicar a otras características del comportamiento del sistema. Esto, por supuesto, requerirá un trabajo específico para cada característica específica, pero para hacer tal asistente, cuyas características se pueden ajustar con controles deslizantes, no será posible en 20 años, sino más bien pronto, como me parece.

, , , , , «». , . . , , ?

— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .

, « » -, , , , - — - , — , . « », . .

, . , , , - ?

— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .

, .

— , , , , .

, , , , .

— , -.

. ? , , , . , ?

— . Google, , Google- , . , , , . , , .

, , ?

— . . , , , . Google, , . , .

, Siri. ?

— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .

, , , , ?

— , , . , , . , - — , . - , . — , , , . , Google .

- Gracias Boris, fue muy agradable hablar contigo.

- De nada.

Source: https://habr.com/ru/post/es412535/


All Articles