A RUVDS, juntamente com a Habr, inicia um projeto que consiste em uma série de entrevistas com pessoas interessantes, em nossa opinião, no ambiente de TI. Hoje estamos apresentando uma entrevista com o chefe do desenvolvimento de sistemas interativos em Yandex, Boris Yangel.
Por que Alice, e não Max, o que o ex-ministro das Comunicações Nikifirov estava errado, por que lançar Tesla no espaço. Respostas no vídeo e texto abaixo do corte.
As entrevistas foram preparadas por Lera Negra e pelo editor da Habr, Nikolai Zemlyansky.
Oi Sou Lera Negra, e hoje nosso convidado é Boris Yangel, chefe do grupo de desenvolvimento de sistemas de diálogo da Yandex. Claro, vamos começar com o seu trabalho, o que você está fazendo agora no Yandex?- Agora, no Yandex, meu projeto principal é Alice, a assistente de voz que o Yandex lançou em outubro do ano passado, e meu grupo é responsável pelo que pode ser arbitrariamente chamado de cérebro de Alice. Nós interpretamos o que o usuário disse em linguagem natural e o transformamos em alguma representação estruturada. Essa é a nossa primeira tarefa, e a segunda é quando já sabemos o que o usuário precisa responder e também a transformamos em uma resposta em linguagem natural.
"
Você está nessa posição há dois anos." Todo esse tempo você esteve envolvido no desenvolvimento. O lançamento de um assistente de voz foi atrasado quando os concorrentes o lançaram anteriormente?"Não, é claro, não é tarde demais." Se olharmos para os concorrentes, quem é o verdadeiro concorrente? Existe o Siri, o único assistente de voz que também entende o idioma russo, mas funciona apenas no iOS e no MacOS, essa não é a plataforma mais popular na Rússia e há algumas perguntas sobre o Siri como produto. Além disso, digamos que o Google já inicie seu assistente do Google em russo, valeria a pena se envolver? Bem, talvez valha a pena de qualquer maneira, porque você pode tentar competir com o Google em seu território por uma audiência, especialmente porque, com uma pesquisa, obtemos mais ou menos sucesso. Bem, e provavelmente, o último ponto aqui é importante: o que estamos vendo agora é o alvorecer da era dos sistemas de diálogo e, de fato, nem o Google, nem a Apple, nem, provavelmente, ainda sabemos como fazê-los normais. Quando comparado com os mecanismos de pesquisa, com o que aconteceu no início dos anos 2000, esta é condicionalmente a era dos Altavists, quando existem alguns produtos, mas eles ainda funcionam com alguns princípios estranhos e funcionam de maneira mais ou menos a qualquer momento. venha google condicional e mude completamente a indústria. Portanto, é claro, ainda vale a pena entrar agora. Muitos desafios e problemas tecnológicos que ainda não foram resolvidos. Um novo jogador pode vir e mudar tudo, e na verdade estamos em uma posição um pouco mais vantajosa, porque começamos mais tarde, o que significa que temos menos pilha herdada, ou seja, podemos trabalhar imediatamente com novas tecnologias. E a Siri, por exemplo, que Deus sabe quando fez, possui muitos códigos antigos que já são difíceis de modificar e, por causa disso, eles encontram muitos problemas.
-
Em seu discurso na Academia Yandex, você disse que pegou um certo tremor. Como teve sucesso e este trem saiu agora?- Provavelmente foi possível antes de tudo, graças a uma decisão muito ousada que foi tomada em nosso produto. Todos os concorrentes têm um certo número de cenários detalhados nesses produtos: “podemos responder a essa e aquela pergunta, conversar sobre o clima ou algo mais e se o que o usuário diz não se enquadra em nenhuma a partir desses cenários, respondemos com algum tipo de esboço como "Desculpe, eu não entendi você". Decidimos agir de maneira diferente e criamos um módulo de rede neural que, em tais situações, pode responder com algo que pode ser apropriado no contexto do diálogo anterior e, de fato, pode se comunicar com o usuário sobre qualquer tópico. Nem sempre pode ser 100% apropriado, mas em mais da metade dos casos, ele certamente pode dizer algumas coisas que precisavam ser ditas naquele momento. E o nosso módulo disse muitas coisas que os usuários gostaram. As respostas ridículas de Alice que não colocamos lá, mas que ela mesma gerou, se espalharam instantaneamente pelas redes sociais, e isso criou o próprio hype. É claro que ele deixa um pouco, isso é inevitável, todas essas piadas são chatas, mas tentamos desenvolver ainda mais o produto e pegar hype aos poucos onde pudermos.
-
Você tentou tornar Alice o mais interessante possível para um usuário russo. Como a voz foi escolhida e por que ela estava Alice?- Honestamente, não participei do processo de escolha de uma voz e não sei por quais princípios ela foi implementada, exceto que é uma voz fria da atriz russa Tatyana Shitova, que todo mundo adora, é bastante reconhecível.
Eu posso falar sobre o nome Alice e sobre as características. Pensamos e escrevemos várias propriedades que gostaríamos de ter um assistente. Por exemplo, ele não deve ser arrogante, ajudar uma pessoa, ser amigável, ser inteligente, ou seja, algum conjunto de propriedades positivas e negativas. E então perguntamos às pessoas em nossa plataforma de crowdsourcing perguntas, por exemplo, esse nome está associado a essa propriedade ou não? Vimos quais nomes que escolhemos anteriormente de alguns princípios se correlacionam mais com propriedades positivas do que negativas, e por esse critério o nome Alice simplesmente destruiu todos os outros concorrentes da lista curta. Isso provavelmente se deve ao fato de esse nome na cultura russa ter algumas anotações positivas, por exemplo, Alice no País das Maravilhas, Alice Selezneva, exemplos clássicos. E isso também se aplica às propriedades fonéticas do nome. Como esse é o nome que será endereçado a Alice, é necessário que não haja sons que algumas pessoas achem difícil pronunciar. Por exemplo, a letra "P" definitivamente não deveria estar lá, assobiando também não deveria. O nome Alice satisfaz essas propriedades.
-
Por que Alice, não Max, por que ela não é um homem?- De fato, muita pesquisa foi realizada e uma mulher é uma escolha mais segura. A evolução nos deixou tão felizes que uma mulher é mãe, algo seguro, querido, e um homem é um guerreiro que simplesmente virá com uma lança e matará você. Portanto, uma assistente feminina é normal para homens e mulheres, mas se a assistente for homem, esse produto será menos utilizado.
-
Alguns anos atrás, houve uma história não muito agradável quando o bot de bate-papo da Microsoft se comportou de maneira completamente incorreta. Houve um risco semelhante com Alice, ou talvez situações semelhantes tenham acontecido?- Claro que era, e pensamos muito nessa história quando Alice foi lançada. Como eu disse anteriormente, temos um módulo de rede neural que responde em qualquer situação, e não apenas dentro da estrutura de um cenário. E ele tem liberdade absoluta, de fato. Dentro dos limites de algumas restrições que estabelecemos, ele tem liberdade para falar e, em algumas situações, pode dizer coisas que não queremos que ele diga. Nossa linguagem é muito poderosa e rica, existem bilhões de maneiras de concordar ou discordar; nunca contaremos todas elas. Como impedi-la de concordar quando lhe perguntam sobre algo perigoso já é uma tarefa de pesquisa muito difícil.
-
Está de alguma forma relacionado ao fato de ela frequentemente dizer: "Eu não quero falar sobre isso"?- Ela diz "não quero falar sobre isso" quando entendemos que a situação é perigosa demais para o módulo de rede neural dar uma resposta. De fato, se você permitir que Alice diga apenas sim ou não, isso é suficiente para ofender alguém. Basta perguntar a ela: "Você apoia X", onde X é fascismo, genocídio, qualquer que seja. Se ela disser sim, tudo, a escrita se foi.
-
Após a graduação, você imediatamente começou a trabalhar no Yandex, era um departamento que se dedica à pesquisa de imagens por solicitação de texto. Depois disso, decidiu-se repentinamente trabalhar na Microsoft Research em Cambridge?
- Bem, não tão de repente, era natural. Eu trabalhei na Yandex, queria desenvolver mais, fazer algumas coisas mais complexas.
-
Não funcionou no Yandex?- No Yandex, por um lado, descobriu-se, por outro lado, eu já comecei a liderar um grupo no Yandex responsável pela qualidade da pesquisa em imagens. Provavelmente não estava muito bem preparado para o trabalho de um líder e não gostei muito, adorei e agora gosto de programar, e o trabalho deixou muito poucas oportunidades para isso, a menos que você queira trabalhar 16 horas por dia. Não gostei muito, queria me desenvolver como programador, especialista em análise de dados, e então tive uma ótima opção, um emprego na Microsoft, como se fosse muito relevante para o meu histórico.
-
O que você fez lá?- Existe uma área desse tipo em aprendizado de máquina, é chamada a conclusão bayesiana. Trata-se de como tomar decisões absolutamente racionais em condições de informações incompletas, de modo que se possa provar que uma decisão mais racional não pode ser tomada nessa situação. Trabalhei em uma equipe que criou uma biblioteca de software, com a ajuda da qual seria possível usar todo o poder desse aparato matemático para tomar decisões em algumas situações. De fato, esta é uma biblioteca para aprendizado de máquina, simplesmente baseada em alguns princípios específicos, não convencionais.
-
E o trabalho lá preparado para uma posição de liderança?- Não, quando voltei de Cambridge para Yandex, sinceramente, pedi que não liderasse ninguém, disse que, se possível, escreveria código, realmente gosto de escrever código. Ao mesmo tempo, não participei dos projetos mais importantes da empresa e não divulguei totalmente minha funcionalidade. No começo, desenvolvia um back-end para alguns aplicativos móveis experimentais, desenvolvi métodos de classificação de texto em um grupo de redes neurais e, em algum momento, a gerência decidiu: por que você não faz algo útil, faça Alice.
-
Há dois anos, a imprensa discutiu ativamente o fato de que a educação fundamental em TI, pelo menos em nosso país, não está suficientemente desenvolvida. Você estava preparado? O que te ajudou? Esta escola é Yandex ou você se sentiu confiante o suficiente depois da universidade?- Eu posso programar porque acabei de programar bastante. Quando criança, sentei-me em um computador e também programava na universidade. Lá, todo mundo foi a um lugar para tomar um drinque e eu fui a um drinque ou assisti a programação e, desde o primeiro ano, trabalhei em empresas reais quase um pouco, adquiri experiência no setor. Esse conhecimento fundamental foi suficiente para entender as outras coisas que são necessárias diretamente para você trabalhar.
A escola de análise de dados , é claro, ajudou, é uma iniciativa interessante que fornece o conhecimento que falta atualmente na saída da universidade. É verdade que só estudei lá por um ano, porque demorou tanto tempo, havia tantas tarefas, tão difíceis. Eu já trabalhava na Yandex na época, simplesmente não tinha tempo. Mas, em geral, eu recomendaria a todos que fossem para lá.
-
Segundo o ex-ministro das Comunicações Nikiforov, em nosso país já existem muitos programadores, muitos especialistas no campo de TI. É isso mesmo? Existem realmente bons especialistas?- Não sei como o Sr. Nikiforov pensa, mas como pessoa que precisa contratar especialistas diretamente para sua equipe, tenho grandes problemas com a contratação. Temos uma tarefa bastante difícil, e são necessários especialistas com um nível acima da média. Praticamente não existem especialistas de que eu preciso no mercado, todos os que provavelmente já trabalham no Yandex, bem, em um pequeno número de outros lugares. Não sei quem ele considera programadores, mas existem muito poucos especialistas altamente qualificados, especialmente no campo das redes neurais, treinamento aprofundado.
-
O que você vê do ponto de vista do seu trabalho, tanto em uma empresa separada quanto em geral no setor?- Provavelmente, se você observar as coisas globalmente, seria ótimo criar algo interessante, uma tecnologia ou uma idéia que permita que as pessoas que vierem para o setor atrás de mim desenvolvam seus próprios desenvolvimentos nessa tecnologia. Ou seja, ele entrará na fundação, por assim dizer, sobre a qual tudo será gradualmente construído. Não sei o que será, mas gostaria de deixar pelo menos alguns vestígios, e é mais fácil fazê-lo, provavelmente se você se desenvolver como líder, porque há mais recursos, você pode tentar idéias mais globais e ambiciosas . Mas se eu colocar minha mão no meu coração, não posso dizer que gosto muito de liderar pessoas, é um trabalho muito difícil, leva muito tempo, força moral e não me permite fazer o que gosto de fazer - para programar. Portanto, gostaria de desenvolver uma direção que me permita encontrar o equilíbrio ideal entre a escala das coisas que posso fazer e das quais posso influenciar, e a capacidade de fazer essas coisas diretamente com minhas próprias mãos. Para a indústria como um todo, essa é uma pergunta mais interessante. Parece-me que o mesmo acontece com as interfaces de voz que ocorreram com as interfaces gráficas, quando elas começaram a aparecer, quando os primeiros monitores coloridos apareceram, e trocamos de consoles onde era necessário inserir comandos, para alguns botões nos quais era possível para pressionar. E quando eles apareceram pela primeira vez, ninguém sabia como fazê-los normalmente, não havia paradigmas, padrões arquiteturais, estruturas, todo mundo estava fazendo o que queria, e as interfaces eram tortas, miseráveis, era muito difícil fazê-las, era impossível ler o código, mas as pessoas Nós pensamos sobre isso e alguns belos conceitos surgiram gradualmente sobre como fazer essas interfaces, ferramentas convenientes apareceram e agora um profissional nesse campo pode criar um site com uma interface bastante complicada muito rapidamente. Estamos pensando em como fazer o mesmo com interfaces de voz. Quais ferramentas devem ser, para que possam ser feitas de maneira conveniente e para que se tornem boas. Mesmo que de repente não obtivéssemos um bom produto, talvez pudéssemos beneficiar toda a indústria como um todo inventando algo nessa direção.
-
O que pode substituir Alice?- Eu não sei o que será. Qual interface poderia ser ainda mais conveniente que a voz ... Provavelmente controlando o poder do pensamento, algo assim.
"
Se Alice morrer, você ficará triste?"- Ficarei sem trabalho, sim, ficarei triste.
-
Grandes empresas, grandes projetos, quais são os primeiros candidatos a sair na sua opinião?"Bem, eu provavelmente não vou dar nomes, isso seria errado." Não posso dizer que alguém é candidato ao voo, porque ele faz um produto ruim. Onde eu esperava falhas, é aqui que são necessários subsídios para o desenvolvimento dos negócios. Por exemplo, um mercado de táxi ou algum tipo de entrega condicional de alimentos - Food Fox, Deliveru Club. Por um lado, esses são projetos de TI, por outro lado, eles interagem com o mundo real. Para ir para lá, agora você precisa subsidiar muito, despejar concorrentes para obter preços muito competitivos, espremer todo mundo para fora do mercado e aumentar os preços. Isso leva ao fato de que muitas pessoas vêm e queimam lá simplesmente porque estão ficando sem dinheiro. Eles não têm tempo para espremer ninguém, e mastodontes como o táxi Yandex em alguns mercados da Uber esmagam todos.
-
Criptomoedas. Você investe, não, investiu, o quê, por quê.- Não sou o investidor de criptografia mais bem-sucedido, sou uma daquelas pessoas que decidiram investir um pouco no momento mais inoportuno, é claro, e agora estão sentadas e esperando que, afinal, o Bitcoin volte a crescer. Não faça como eu.
- Os
concorrentes tentaram atrair você?- Sim, costumo responder que agora não estou procurando outro emprego.
-
Se não fosse por TI, e daí?- Não sei, gosto de paraquedismo, talvez então me tornasse instrutor de paraquedismo.
-
Por que lançar Tesla no espaço?- Porque é legal.
-
Muito obrigado, Boris. O convidado de hoje, Nikolay Zemlyansky, editor da Habr, fará mais algumas perguntas.Olá Boris. Quero relembrar o filme lançado recentemente, Blade Runner 2049, onde o Agente K tinha um assistente para Android. Não me lembro do nome dela, deixe Masha. Quando eles conversavam e ele não gostava de algo, ele podia dizer: "Masha, vadia menos três" ou "Masha sexualidade mais cinco". Dependendo disso, a comunicação com o assistente foi ajustada. O que você acha que é real no futuro próximo e existe algum sentido?- Eu já falei um pouco sobre como lidamos com as respostas ofensivas de Alice. Tudo isso é realmente uma grande história e é por isso. Para que Alice não ofenda o interlocutor, na verdade ensinamos alguns modelos para prever se essa ou aquela resposta é ofensiva e, em caso afirmativo, até que ponto. Agora, usamos esses modelos de acordo com um princípio muito simples: se o modelo diz que a resposta é ofensiva, não damos a ela uma resposta. Nos termos que você diz, torcemos o insulto para zero. De fato, já temos um modelo que avalia a gradação desse insulto e, se um produto surgir, já poderíamos criar um controle deslizante que tornasse as respostas mais ou menos ousadas. A abordagem que usamos para isso pode ser aplicada a outras características do comportamento do sistema. É claro que isso exigirá algum trabalho específico para cada característica específica, mas tornar esse assistente, cujas características podem ser ajustadas com controles deslizantes, não será possível em 20 anos, mas em breve, como me parece.
—
, , , , , «». , . . , , ?— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .
, « » -, , , , - — - , — , . « », . .
—
, . , , , - ?— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .
—
, .— , , , , .
—
, , , , .— , -.
—
. ? , , , . , ?— . Google, , Google- , . , , , . , , .
—
, , ?— . . , , , . Google, , . , .
—
, Siri. ?— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .
—
, , , , ?— , , . , , . , - — , . - , . — , , , . , Google .
- Obrigado Boris, foi muito bom conversar com você.
- De nada.