Graduado del curso de Netología “Data Science” sobre su trabajo en el sector bancario.

En Netología, la dirección de Data Science apareció en 2016. Cuando comenzamos, había temores: el campo es nuevo, la demanda de fechas de los científicos para las empresas, aunque decente, pero no había un gran flujo de personas que desearan ingresar a la esfera, y también hay muchos recursos gratuitos en idioma inglés para auto entrenamiento en la red, por lo que tomamos riesgos.

Pero hoy, ya hay 10 cursos en diversas especializaciones en el trabajo con datos, y el número de graduados es más de 800. Decidimos preguntarle a uno de esos graduados sobre su trabajo con datos, cómo llegó al campo, cómo se desarrolla Machine Learning en Loco Bank y qué tipo de personas está buscando en su equipo.

Vyacheslav Potapov, Jefe de Análisis de Datos y Aprendizaje Automático en Loko Bank y graduado del curso de Científico de Datos :

Me gradué de la Universidad Técnica del Estado de Moscú. Bauman en la especialidad "Spacecraft" y etapas superiores en 2011. Después de eso, trabajó durante 7 años en varios lugares como analista, desarrollador de bases de datos y arquitecto de almacenes. Durante este tiempo aprendí mucho sobre el procesamiento y almacenamiento de datos, pero en algún momento quise profundizar más en el análisis, para comprender qué significan todos estos números, qué almaceno y proceso.

Comencé a buscar direcciones para el crecimiento: estudié puestos relacionados en TI, miré qué nivel de salarios en la industria y qué es más demandado. Hubo muchos artículos sobre Habr y videos en Youtube, hasta cierto punto me ayudaron a comprender la esencia de trabajar con datos y cómo mis habilidades existentes en ese momento podrían ser útiles.

Luego me reuní con Data Science (DS) y Machine Learning (ML), pero la base fundamental no era suficiente. El campo es muy amplio y cuando ves algunos videos o artículos, solo obtienes conocimiento fragmentario, pero en general no se comprende cuál es la esencia de la especialidad, cuáles son las instrucciones, métodos, herramientas. Así es como se lee un grueso libro de texto sobre matemáticas para las universidades, pero sin explicación y práctica, será difícil aplicar el conocimiento adquirido.

Un colega me habló de Netologiya, donde había un gran programa de tiempo completo en Data Science, y no conocí ofertas tan adecuadas en el mercado de habla rusa. Como resultado, desaprendió con éxito y defendió su tesis sobre el tema "Reconocimiento de imágenes usando redes neuronales". Como recuerdo ahora, fue muy difícil, no tenía la práctica de resolver tareas completas, y realmente quería hacer no solo un trabajo educativo, sino un proyecto totalmente funcional.

Paralelamente a sus estudios, intentó resolver problemas con Kaggle y hacer proyectos de trabajo.
Y justo después del curso, comencé a buscar un lugar donde pudiera participar plenamente en el análisis de datos, ya que es difícil combinar el trabajo del arquitecto del sistema de BI y la práctica en DS.

Después de una serie de entrevistas, eligió Loko-Bank y la dirección de DS.

Me parece que Data Science, como un análogo del instituto de investigación, necesita confianza, paciencia y comprensión de las perspectivas de la gerencia.

En Loko-Bank, vieron estas perspectivas, así que comencé a trabajar en el bloque de negocios digitales, que está desarrollando la dirección de análisis.

¿Qué están haciendo los analistas y Data Scientist en Loko Bank?


Ahora el banco tiene un departamento de TI clásico que es responsable de la infraestructura y el almacenamiento de datos, otros departamentos usan estas fuentes de datos y establecen requisitos para la integración de otras nuevas. En total, unos 40 empleados trabajan en la empresa con análisis.

En Loko Bank, la automatización de procesos, el análisis de datos y la creación de una economía basada en datos se están convirtiendo en las prioridades de la empresa. Espero que, con base en la información, podamos construir más correctamente las ventas, realizar evaluaciones de riesgos y todo el negocio.

En la unidad de negocios, el trabajo con análisis se divide en dos áreas: análisis clásico: BI, cuyos especialistas analizan los indicadores planificados y reales de la empresa, preparan informes sobre ventas, saldos, ingresos y gastos y dirección de LD.

Machine Learning se enfoca en crear algoritmos que hagan predicciones basadas en evidencia de analistas clásicos, generen nuevos datos y busquen dependencias y anomalías ocultas. Este es el departamento del que estoy a cargo.

El ML en el banco apenas comienza a desarrollarse. Pero tengo un objetivo: construir un sistema para que ayude al negocio y le permita utilizar todos los enfoques modernos para aumentar los ingresos y reducir los costos. Tenemos que cambiar completamente los procesos de negocio y buscar formas de implementar herramientas de aprendizaje automático en la arquitectura de TI existente. Puede ser difícil con esto, ya que la arquitectura no fue diseñada ayer, y algunos de los requisitos simplemente no se establecieron en ella.

Por ejemplo, los requisitos para recopilar registros para que los clientes ingresen a un banco móvil. Para el análisis clásico, no son necesarios, por lo que nunca se recopilaron ni almacenaron. Le expliqué que, sobre la base de estos registros, podemos entrenar el modelo para hacer predicciones sobre la carga de la plataforma y ver la relación entre el uso de un banco móvil y la rentabilidad del cliente. Y si no fuera por el desarrollo de ML, tales análisis simplemente no existirían, porque nadie se ocuparía de este problema. Lo que se necesitaba era un conductor que explicara por qué y por qué, dar instrucciones, cómo construir arquitectura, cómo recopilar datos, cómo construir modelos, dónde aplicarlos.

Con la introducción del aprendizaje automático, quiero construir una cultura de trabajo con datos en el banco en su conjunto: su recopilación, procesamiento, así como la integración de nuevas fuentes. Al mismo tiempo, ya estamos resolviendo las tareas de análisis predictivo para los clientes, estamos comprometidos en su segmentación para luego optimizar las tarifas y aumentar las ventas de la empresa.

También nos dedicamos al monitoreo financiero, analizamos clientes sospechosos y transacciones. Ahora la compañía gasta una gran cantidad de recursos humanos y financieros en esta tarea. Y queremos simplificar y hacer que estos procesos sean más eficientes.

Si hablamos de lo que ya se ha hecho, entonces comenzamos a recopilar y almacenar datos, en particular registros de usuarios, sobre los cuales escribí anteriormente. Ahora almacenamos información sobre el historial de cambios en la tarjeta del cliente en el Servicio de Impuestos Federales.

En este momento, estamos desarrollando un modelo para determinar el comportamiento negativo de los clientes (personas jurídicas y empresarios individuales) y ya hemos recibido los primeros buenos resultados. El puntaje para una de las métricas populares es 0.86. De los algoritmos usamos el aumento de gradiente. En un futuro cercano, planeamos lograr estabilidad en su trabajo, incluso mediante la conexión de fuentes adicionales. Este modelo debería ayudar a reducir los riesgos de la empresa y optimizar los costos de encontrar clientes deshonestos.

¿Qué tipo de especialistas se necesitan para la dirección ML?


Nuestro equipo solo se está formando, así que ahora trato de llevar a los generalistas. Por supuesto, una persona puede estar más inclinada a desarrollar o, por el contrario, al análisis de negocios, pero, sin embargo, debe comprender el proceso de creación de una solución en su conjunto, comprender su papel en él. Esta es una buena opción para aquellos que quieren probarse en diferentes roles.

Es importante que una persona sepa cómo resolver problemas prácticos reales, al menos puede explicar el enfoque y el conjunto de pasos. En las entrevistas, trato de dar problemas lógicos, y pido una comprensión general de los algoritmos y las técnicas, sin matemáticas.

Como yo mismo soy ingeniero, trato de buscar personas con experiencia en ingeniería en mi equipo, aunque esto no es un tabú. Conozco ejemplos cuando las personas ingresan a la profesión sin educación técnica.

Crear una solución ML está lejos de ser una tarea trivial, por lo que no es suficiente tomar todos los datos, arrojarlos al algoritmo y esperar un milagro. Debe poder sumergirse en el área temática, poder comunicarse, preguntar y escuchar, en algún lugar estas habilidades pueden resultar aún más valiosas que las técnicas.

Más específicamente, el departamento ahora está principalmente interesado en los ingenieros de Big Data. Las redes neuronales y los xgboosts son buenos, pero primero debe encontrar especialistas que puedan recopilar los datos correctos y preparados en grandes cantidades. Sin ellos, ningún aprendizaje automático funcionará. Necesito al menos dos personas en esta dirección. Pero la compañía tiene muchos requisitos para ellos: deben conocer las herramientas ETL, SQL y tener experiencia en la construcción de escaparates y almacenes de datos, así como ser capaces de resolver problemas de optimización.

También sería bueno complementar el personal con dos analistas, preferiblemente con experiencia en el sector bancario. Y aunque Data Science es una prioridad, el campo puede ser cualquiera.

El principal problema del mercado es la falta de personas que puedan traducir las necesidades del negocio en una tarea significativa de LD y, a veces, proponer una solución de manera proactiva.

Para resolver este problema, debe comprender el negocio en sí y las herramientas existentes, así como tener buenas habilidades blandas para presentar correctamente la solución al problema. Y es extremadamente difícil encontrarlos.

Donde desarrollar


Dado que solo estamos introduciendo el LD en las empresas comerciales, necesitamos implementar una serie de decisiones de las que dependerá una mayor confianza en toda el área. Estas decisiones están relacionadas con la justificación de la existencia de un departamento para negocios. El aprendizaje automático ahora es bien conocido por todos, por lo que es de particular interés.

Después de la implementación exitosa de las herramientas de ML dentro de mi departamento, planeamos expandir el grupo de tareas y el personal de especialistas en todo el banco.

Un banco es, en primer lugar, grandes flujos de datos, una gran base de clientes y, en consecuencia, una gran responsabilidad.

Por un lado, hay clientes que desean obtener un buen servicio y guardar sus datos, y por otro lado, siempre hay personas que desean acceder a las instalaciones de almacenamiento para obtener información confidencial.

En mi opinión, con la creciente carga de trabajo y la complejidad de los procesos, la delegación de algunas responsabilidades y funciones a las máquinas es la única condición posible para el crecimiento estable de la empresa.

Y una persona que quiera ir en la dirección de Machine Learning en el sector bancario debe ser capaz de correlacionar las tareas de ML con los objetivos principales del banco en primer lugar.

Consejos para quienes desean ingresar al campo de Machine Learning


En primer lugar, vale la pena responderte la pregunta de qué es exactamente lo que quieres hacer, y solo después de eso, mira lo que se necesita para esto. DS es un área enorme para el desarrollo y, por un lado, es bueno, pero por otro lado, puede deambular durante mucho tiempo y no llegar a algo específico.

Al principio, no recomendaría profundizar en las matemáticas. Concéntrese en resolver problemas y herramientas prácticas (bibliotecas, métodos). Me ayudó mucho la experiencia de desarrollar bases de datos, limpiar y procesar datos, y el análisis inicial. En el trabajo real, es la recopilación y preparación de datos la que ocupa la mayor parte del tiempo, y el trabajo de alta calidad en esta dirección mejorará significativamente la calidad de las soluciones de LD en el futuro.

Es genial que vivamos en un momento en que cualquier información se pueda encontrar fácilmente. La red tiene muchos cursos en varios campos, comunidades (SAO), conferencias y talleres se llevan a cabo periódicamente. Pero debe comprender que ML es una disciplina joven, solo se está formando y no hay un enfoque fundamental para el aprendizaje. Por lo tanto, las rutas de desarrollo deben elegirse cuidadosamente: para estudiar diferentes programas de capacitación, para establecer los acentos adecuados para usted. Tuve suerte: elegí un curso que cumplía mis requisitos y expectativas, y me llevó al desarrollo de una dirección enorme y prometedora en Loko-Bank.

De los editores



Source: https://habr.com/ru/post/455517/


All Articles