Pesquisador do Laboratório Sberbank AI - sobre tarefas de Data Science e RnD



As redes neurais não são apenas divertidas Prisma e FindFace. Hoje, o aprendizado de máquina e o Big Data são capazes de resolver problemas reais de negócios. Dmitry Babaev, ex-chefe da divisão de ciência de dados da MTS, desenvolvedora do algoritmo para concluir consultas no mecanismo de pesquisa Yandex, conhece novas tecnologias no setor de B2B.

Agora ele trabalha como pesquisador no laboratório de inteligência artificial do Sberbank. Infelizmente, a maioria dos desenvolvimentos do banco é um segredo comercial, mas o especialista contou ansiosamente tudo o que era permitido.

Entrevistador: Daria Kozlova
Recorrido: Dmitry Babaev

Quais empresas russas têm seu próprio laboratório de IA e Big Data?

Na Rússia, poucas empresas possuem laboratórios semelhantes, pois essa é uma história amplamente acadêmica. Yandex definitivamente tem uma unidade de pesquisa. Eles também estão disponíveis em empresas estrangeiras - por exemplo, Google, Microsoft, Facebook. Grandes e algumas empresas de médio porte possuem divisões de ciência de dados, mas geralmente não prestam muita atenção à pesquisa teórica.

Que tarefas você acha que eles estão tentando resolver?

As divisões de ciência de dados abordam os desafios que as empresas precisam. Antes de realizar uma tarefa, eles avaliam o efeito econômico de sua implementação, com base no qual decidem fazer algo ou não. Mas nos departamentos de pesquisa isso é mais fácil - os benefícios potenciais da solução de problemas de pesquisa já são considerados bastante altos.

Você vai dar alguns exemplos?

A tarefa usual da ciência de dados pode ser demonstrada por um exemplo do campo das telecomunicações: encontrar pessoas interessadas na nova tarifa. Outro exemplo: otimização do sortimento de mercadorias nas redes de varejo. Muitas vezes, as empresas conseguem economizar quantias muito grandes, simplesmente trazendo o sortimento certo para as lojas certas, por exemplo, enviando mercadorias caras para a loja onde serão compradas, e não para as que irão acumular poeira nas prateleiras.

As tarefas de pesquisa podem parecer diferentes. Um exemplo dessa tarefa é entender por que uma rede neural fornece uma ou outra previsão - para um ou outro dado de entrada. Mas, em geral, as tarefas de RnD são muito diversas.

Quais valores são investidos em desenvolvimentos relacionados à IA e aprendizado de máquina?

Depende da empresa. Nas grandes corporações, eles estão prontos para gastar mais dinheiro com isso, nas pequenas - menos. Nas telecomunicações, de acordo com minhas observações, um grande projeto, onde os dados são centenas de terabytes, precisa de dezenas a centenas de milhões de rublos. Por outro lado, não há limite para a perfeição (sorrisos - aprox. Ed.) .

No Yandex, você desenvolveu um mecanismo para o preenchimento automático de consultas de pesquisa. Isso pode ser considerado tecnologia de rede neural? Como o algoritmo funciona?

Não, era uma abordagem clássica de aprendizado de máquina (ML) com base nas estatísticas de consulta de pesquisa. Dependendo do início da consulta e das consultas típicas do usuário, foram selecionadas as opções mais adequadas para adição automática do banco de dados das consultas de pesquisa mais frequentes. Isso foi antes das redes neurais, quando todos as consideravam uma tecnologia sem saída. Então eles ainda eram inferiores aos algoritmos do ML clássico.

Conte-nos sobre as realizações russas mais significativas no campo da IA.

O exemplo mais famoso é o Prisma. A empresa não está registrada na Rússia, mas, no entanto, a espinha dorsal do estado são especialistas nacionais. A propósito, os cientistas que desenvolveram o método de processamento de imagem usado no Prism também são da Rússia (grupo de Victor Lempitsky).

No Yandex, os algoritmos de IA estão no centro do ranking dos resultados de pesquisa. O algoritmo de classificação para a proximidade do texto da consulta e do site usando a rede neural é chamado Palekh.

Outro exemplo conhecido é o FindFace do NTechLab. Estas são demonstrações da operação de seu algoritmo de reconhecimento facial, que ela vende como produto comercial.

As empresas russas envolvidas em tecnologias de voz, por exemplo, o Center for Speech Technologies, também são conhecidas no mercado mundial.

A propósito, no Sberbank, a tecnologia da biometria facial de uma das empresas russas é utilizada há vários anos. É usado para combater o roubo de identidade nos empréstimos a varejo. O laboratório emprega as pessoas que participaram deste projeto.

A transição para novas tecnologias requer a substituição de hardware e software, que o usuário final sente por si mesmo na forma de falhas e erros de rede. Como realizar a fase de transição da maneira mais discreta possível para o cliente?

De fato, esta é uma tarefa clássica no desenvolvimento, pois eles foram capazes de resolvê-la por um longo tempo. Um método é testar. Antes de apresentar a nova versão, ela é testada por um longo tempo: eles verificam os casos limites, bem como se o software pode suportar a carga necessária e, em seguida, abrem a nova versão para um pequeno grupo de usuários. Nesse caso, se algo der errado, a menor porcentagem de usuários sofrerá.

A IA é capaz de corrigir independentemente erros e falhas no sistema?

Existem algoritmos projetados apenas para essas situações. Mas a tarefa deles não é detectar ou corrigir a falha, mas prever que isso acontecerá em breve - ver padrões anormais no sistema. Normalmente, em um sistema complexo, existem muitos indicadores de que estado ele está agora. Tendo descoberto um padrão anormal, a inteligência artificial pode enviar uma mensagem aos administradores: algo está errado - veja o que - algo precisa ser feito. Por exemplo, a carga aumentou, é necessário adicionar capacidades ociosas para que o sistema a suporte.

Hoje, a IA tem um caráter observacional e uma função de detecção "antecipadamente" (por exemplo, duas horas). Mas, para corrigir o problema, uma pessoa ainda é necessária.

No que eles estão trabalhando no laboratório do AI Sberbank agora?

O Sberbank AI Laboratory foi criado para desenvolver a competência de IA na organização. Agora, com o advento de métodos eficazes de ensino para redes neurais profundas, essa área fez grandes progressos. As grandes empresas precisam de pessoas versadas em novas tecnologias de IA para acompanhar o progresso rápido. Também é importante entender em quais áreas a IA faz sentido investir esforço e dinheiro. O laboratório ajudará a descobrir.

Outra missão importante do laboratório é a sua própria pesquisa nessa área, bem como a criação de novas tecnologias que beneficiarão o banco. Obviamente, estamos envolvidos em pesquisas que podem ser aplicadas no banco, mas também tentamos garantir que nossos resultados sejam úteis não apenas no campo financeiro. Por exemplo, estamos interessados ​​na direção da análise de séries temporais; Existem muitos dados com essa estrutura (transacional e outra) no setor bancário. Dos trabalhos com um componente científico maior, recorda-se a pesquisa sobre a criação de novos métodos para interpretar os resultados do trabalho da rede neural.

Com quem o Sberbank trabalha?

O Banco colabora com várias universidades: Instituto de Física e Tecnologia de Moscou, HSE, Universidade Estadual de Moscou. Agora, ao ouvir iPavlov, um projeto conjunto com o MIPT. Este é um projeto para desenvolver sistemas de diálogo para comunicação com um computador em uma linguagem natural. Também há atividades muito interessantes com outras universidades, desde a solução de problemas complexos de otimização até desenvolvimentos fundamentais para melhorar os algoritmos de aprendizado profundo. Ainda existem muitas atividades para aprender e promover o conhecimento - por exemplo, palestras sobre IA para estudantes.

Qual é a especificidade dos algoritmos Sberbank AI?

Há uma seção bancária clássica. Por exemplo, pontuação é uma avaliação da capacidade creditícia de um cliente. Em todos os países, é regulamentado pelos bancos centrais e, portanto, é amplamente baseado em métodos bem interpretados - regressão logística e árvores de decisão. Esses métodos clássicos são confiáveis ​​e estáveis. No futuro, esperamos que o regulador permita o uso de métodos mais complexos. Para fazer isso, é necessário provar que os novos métodos são confiáveis ​​o suficiente.

No laboratório de IA do Sberbank, lidamos com métodos mais complexos, principalmente redes neurais profundas e algoritmos de IA para dados típicos de bancos. Um tipo típico de dados para bancos é uma série temporal: por exemplo, o preço de um produto (preço ontem, dia anterior, etc.).

Em 19 de abril, você falará como palestrante na Conferência da AI . Sobre o que você diz aos visitantes?

Nos últimos anos, os métodos de aprendizado profundo mostraram um tremendo sucesso. Eles já estão resolvendo problemas que eles tinham medo de abordar antes. Por exemplo, eles alcançaram um nível de qualidade humana no reconhecimento de imagem e conversão de texto em fala. Mas eles têm suas próprias limitações que os impedem de seguir em frente. Quero falar sobre isso, bem como sobre abordagens pelas quais elas podem ser contornadas. Em muitos aspectos, essa ainda é uma área de pesquisa, e não soluções prontas para uso no trabalho cotidiano. No entanto, existem expectativas razoáveis ​​para o futuro com tecnologias de IA ainda mais eficazes.

Source: https://habr.com/ru/post/pt411431/


All Articles