
Las redes neuronales no solo entretienen a Prisma y FindFace. Hoy en día, el aprendizaje automático y Big Data son capaces de resolver problemas comerciales reales. Dmitry Babaev, ex jefe de la división de Ciencia de Datos en MTS, el desarrollador del algoritmo para completar consultas en el motor de búsqueda Yandex, conoce las nuevas tecnologías en el sector B2B.
Ahora trabaja como investigador en el laboratorio de inteligencia artificial en Sberbank. Desafortunadamente, la mayoría de los desarrollos del banco son un secreto comercial, pero el especialista contó con entusiasmo todo lo que estaba permitido.
Entrevistador: Daria Kozlova
Demandada: Dmitry Babaev
¿Qué compañías rusas tienen su propio laboratorio de IA y Big Data?En Rusia, pocas compañías tienen laboratorios similares, ya que esto es en gran parte una historia académica. Yandex definitivamente tiene una unidad de investigación. También están disponibles en empresas extranjeras, por ejemplo, Google, Microsoft, Facebook. Las grandes y algunas medianas empresas tienen divisiones de ciencia de datos, pero generalmente no prestan mucha atención a la investigación teórica.
¿Qué tareas crees que están tratando de resolver?Las divisiones de Data Science abordan los desafíos que las empresas necesitan. Antes de emprender una tarea, evalúan el efecto económico de su implementación, sobre la base de la cual deciden si hacer algo o no. Pero en los departamentos de investigación esto es más fácil: los beneficios potenciales de resolver problemas de investigación ya se consideran bastante altos.
¿Darás algunos ejemplos?La tarea habitual de Data Science se puede mostrar con un ejemplo del campo de las telecomunicaciones: encontrar personas interesadas en la nueva tarifa. Otro ejemplo: optimización del surtido de productos en cadenas minoristas. A menudo, las empresas logran ahorrar grandes cantidades simplemente llevando el surtido correcto a las tiendas correctas, por ejemplo, enviando productos caros a la tienda donde se comprarán, y no a la que acumularán polvo en los estantes.
Las tareas de investigación pueden verse diferentes. Un ejemplo de tal tarea es comprender por qué una red neuronal proporciona uno u otro pronóstico, para uno u otro dato de entrada. Pero en general, las tareas de RnD son muy diversas.
¿Qué cantidades se invierten en desarrollos relacionados con IA y aprendizaje automático?Depende de la empresa. En las grandes corporaciones, están listas para gastar más dinero en esto, en las pequeñas, menos. En telecomunicaciones, según mis observaciones, un gran proyecto, donde los volúmenes de datos son cientos de terabytes, necesita de decenas a cientos de millones de rublos. Por otro lado, no hay límite para la perfección
(sonrisas - aprox. Ed.) .
En Yandex, ha desarrollado un mecanismo para completar automáticamente las consultas de búsqueda. ¿Se puede considerar esto la tecnología de red neuronal? ¿Cómo funciona el algoritmo?No, era un enfoque clásico de aprendizaje automático (ML) basado en estadísticas de consulta de búsqueda. Dependiendo del inicio ingresado de la consulta y las consultas típicas de los usuarios, se seleccionaron las opciones más adecuadas para la adición automática de la base de datos de las consultas de búsqueda más frecuentes. Esto fue antes de las redes neuronales, cuando todos las consideraban una tecnología sin salida. Entonces seguían siendo inferiores a los algoritmos de ML clásico.
Cuéntanos sobre los logros más importantes de Rusia en el campo de la IA.El ejemplo más famoso es Prisma. La compañía no está registrada en Rusia, pero, sin embargo, la columna vertebral del estado son los especialistas nacionales. Por cierto, los científicos que desarrollaron el método de procesamiento de imágenes que se usa en Prism también son de Rusia (grupo de Victor Lempitsky).
En Yandex, los algoritmos de IA están en el corazón de la clasificación de los resultados de búsqueda. El algoritmo de clasificación para la proximidad del texto de consulta y el sitio que usa la red neuronal se llama Palekh.
Otro ejemplo bien conocido es el FindFace de NTechLab. Estas son demostraciones del funcionamiento de su algoritmo de reconocimiento facial, que vende como producto comercial.
Las empresas rusas que se dedican a tecnologías de voz, por ejemplo, el Centro de Tecnologías de Voz, también son conocidas en el mercado mundial.
En Sberbank, por cierto, la tecnología de biometría facial de una de las compañías rusas se ha utilizado durante varios años. Se utiliza para combatir el robo de identidad en préstamos minoristas. El laboratorio emplea a las personas que participaron en este proyecto.
La transición a nuevas tecnologías requiere el reemplazo de hardware y software, que el usuario final siente en sí mismo en forma de fallas y errores de red. ¿Cómo hacer que la fase de transición sea lo más discreta posible para el cliente?De hecho, esta es una tarea clásica en desarrollo; han podido resolverla durante mucho tiempo. Un método es la prueba. Antes de presentar la nueva versión, se prueba durante mucho tiempo: comprueban los casos límite, así como si el software puede soportar la carga requerida, y luego abren la nueva versión para un pequeño grupo de usuarios. En este caso, si algo sale mal, el menor porcentaje de usuarios sufrirá.
¿Es capaz la IA de corregir de forma independiente errores y bloqueos en el sistema?Hay algoritmos que están diseñados para tales situaciones. Pero su tarea no es detectar o corregir la falla, sino predecir que sucederá pronto: ver patrones anormales en el sistema. Por lo general, en un sistema complejo hay muchos indicadores de en qué estado se encuentra ahora. Después de descubrir un patrón anormal, la inteligencia artificial puede enviar un mensaje a los administradores: algo va mal, mira qué, hay que hacer algo. Por ejemplo, la carga ha aumentado, es necesario agregar capacidades inactivas para que el sistema pueda soportarla.
Hoy, la IA tiene un carácter de observación y una función de detección "por adelantado" (por ejemplo, dos horas). Pero para solucionar el problema, todavía se necesita una persona.
¿En qué están trabajando ahora en el laboratorio de AI Sberbank?Sberbank AI Laboratory fue creado para desarrollar la competencia de AI en la organización. Ahora, con el advenimiento de métodos de enseñanza efectivos para redes neuronales profundas, esta área ha hecho un gran progreso. Las grandes empresas necesitan personas que estén familiarizadas con las nuevas tecnologías de inteligencia artificial para mantenerse al día con el rápido progreso. También es importante comprender en qué áreas la IA tiene sentido invertir esfuerzo y dinero. El laboratorio lo ayudará a averiguarlo.
Otra misión importante del laboratorio es su propia investigación en esta área, así como la creación de nuevas tecnologías que beneficiarán al banco. Por supuesto, estamos involucrados en investigaciones que se pueden aplicar en el banco, pero también intentamos garantizar que nuestros resultados sean útiles no solo en el campo financiero. Por ejemplo, estamos interesados en la dirección del análisis de series de tiempo; Hay muchos datos con dicha estructura (transaccional y otros) en la banca. De los trabajos con un componente científico más amplio, se puede recordar la investigación sobre la creación de nuevos métodos para interpretar los resultados del trabajo de la red neuronal.
¿Con quién trabaja Sberbank?El Banco colabora con varias universidades: Instituto de Física y Tecnología de Moscú, HSE, Universidad Estatal de Moscú. Ahora al escuchar iPavlov, un proyecto conjunto con MIPT. Este es un proyecto para desarrollar sistemas de diálogo para comunicarse con una computadora en un lenguaje natural. También hay actividades muy interesantes con otras universidades, desde la resolución de problemas complejos de optimización hasta desarrollos fundamentales para mejorar los algoritmos de aprendizaje profundo. Todavía hay muchas actividades para aprender y promover el conocimiento, por ejemplo, conferencias de inteligencia artificial para estudiantes.
¿Cuál es la especificidad de los algoritmos de inteligencia artificial de Sberbank?Hay una sección bancaria clásica. Por ejemplo, la calificación es una evaluación de la solvencia de un cliente. En todos los países, está regulado por los bancos centrales y, por lo tanto, se basa en gran medida en métodos bien interpretados: regresión logística y árboles de decisión. Estos métodos clásicos son confiables y estables. En el futuro, esperamos que el regulador permita el uso de métodos más complejos. Para hacer esto, es necesario demostrar que los nuevos métodos son lo suficientemente confiables.
En el laboratorio de IA de Sberbank, tratamos con métodos más complejos, principalmente redes neuronales profundas y algoritmos de IA para datos típicos de los bancos. Un tipo de datos típico para los bancos es una serie de tiempo: por ejemplo, el precio de un producto (precio de ayer, el día anterior, etc.).
El 19 de abril, hablarás como orador en la Conferencia de AI . ¿De qué les cuentas a los visitantes?En los últimos años, los métodos de aprendizaje profundo han demostrado un enorme éxito. Ya están resolviendo problemas que antes temían abordar. Por ejemplo, han alcanzado un nivel de calidad humana en el reconocimiento de imágenes de voz a texto y de texto a voz. Pero tienen sus propias limitaciones que les impiden seguir adelante. Quiero hablar sobre esto, así como acerca de los enfoques debido a los cuales posiblemente se pueden eludir. En muchos aspectos, esto sigue siendo un área de investigación, y no soluciones listas para usar en el trabajo diario. Sin embargo, existen expectativas razonables para el futuro con tecnologías de IA aún más efectivas.