Entrenamiento de Data Science en la empresa y mitap temático en Voronezh



El 25 de mayo, la segunda reunión de Metaconf se llevará a cabo en Voronezh, esta vez dedicada al aprendizaje automático. Hay cinco informes en el programa mitap, el registro gratuito está disponible aquí . En particular, Anton Dolgikh, experto en DataArt en proyectos de IA en el campo de la salud, hablará sobre el "Modelo probabilístico de la red neuronal del lenguaje natural". Hoy le pedimos a Anton que hablara sobre la experiencia de sistematizar el conocimiento del aprendizaje automático dentro de DataArt.

El alcance de ML se expande constantemente (desde la atención médica hasta la industria de viajes). Dentro de DataArt, en algún momento, el número de solicitudes de desarrollo de ML superó un valor crítico. Antes de esto, pudimos resolver estos problemas por los ingenieros que trabajaban en la empresa.

Cuando se hizo difícil administrar con nuestros propios recursos, aparecieron dos caminos de desarrollo: contratar nuevos empleados o capacitar especialistas dentro de la empresa. En el primer caso, enfrentamos el riesgo de que el desarrollador de ML que contratamos después no caiga inmediatamente en un nuevo proyecto de nuestro campo profesional. Al mismo tiempo, las personas que se dedican estrechamente al aprendizaje automático generalmente no están listas para participar, por ejemplo, en el desarrollo completo. Por lo tanto, confiamos en los ingenieros de DataArt que están interesados ​​en desarrollar hacia ML, pero que pueden regresar a su trabajo anterior si es necesario.

El proceso de preparación necesita ser sistematizado. Puede parecer que Internet está lleno de toneladas de cursos en línea y en video. Pero para desarrollarse de manera productiva, una persona necesita un vector de desarrollo; de escuchar al azar cualquier curso, es de poca utilidad.

Que hemos hecho:

  1. En primer lugar, formaron el núcleo: un grupo de colegas de iniciativa con la mayor experiencia y experiencia en diversas áreas del aprendizaje automático. Prepararon una serie de presentaciones, hicieron una descripción general de los cursos existentes y formularon recomendaciones: qué cursos debe tomar para adquirir habilidades relevantes para las tareas que DataArt resuelve.
  2. Organizamos cursos de matemáticas. Obviamente, ML es inherentemente estadística matemática y métodos de optimización. Para comprender y utilizar correctamente los métodos de aprendizaje automático, se necesitan ciertos conocimientos matemáticos. A primera vista, los especialistas que han recibido una educación técnica siempre conocen bien las matemáticas. Pero en la práctica, resulta que las habilidades se olvidan muy rápidamente. Esto impone una restricción en el curso: una empresa, a diferencia de una universidad, no puede proporcionar conocimiento fundamental, pero el conocimiento debe ser adecuado y lo suficientemente profundo. Invitamos a un maestro del exterior a leer el curso (nuestros colegas estaban demasiado ocupados). El programa se centró en áreas directamente relacionadas con el aprendizaje automático: álgebra lineal, análisis, teoría de probabilidad, métodos de optimización. El curso se complementa con clases regulares con expertos, donde, en base a la teoría, consideramos problemas prácticos de proyectos con aprendizaje automático.
  3. Todos los meses, nuestros especialistas en ML realizan seminarios educativos sobre los últimos logros en este campo. La grabación de seminarios está disponible para todos los empleados de la empresa.
  4. Además de los seminarios, los especialistas de DataArt ML publican regularmente un resumen de materiales interesantes (métodos, artículos, libros) con breves anotaciones y comentarios.

La compañía apoya estas iniciativas, se asigna un presupuesto para la compra de literatura y la participación de colegas en conferencias, para programas de hierro y tutoría. El resultado de la capacitación de mentoría individual es un prototipo listo para usar que se puede utilizar en conferencias o reuniones con clientes potenciales. Como ejemplo, podemos citar el resultado del trabajo de nuestro experto Andrei Sorokin, un modelo que detecta y clasifica las lesiones cutáneas ( arxiv.org/pdf/1807.05979.pdf ). Para optimizar el modelo resultante para su uso en dispositivos móviles, el empleado solo ayudó en el marco del programa de tutoría. El modelo ocupó el 12 ° lugar en la competencia internacional ISIC 2018 , superando no solo a los participantes individuales, sino también a los equipos universitarios.

La sistematización anterior del proceso nos permitió procesar de manera rápida y experta todas las solicitudes del campo de aprendizaje automático que llegan a DataArt de clientes potenciales. Hemos preparado materiales de marketing y los equipos de ventas siempre son expertos disponibles que pueden responder las preguntas de los clientes. Varios proyectos ya se han completado con éxito.

Al igual que muchas grandes empresas de tecnología, DataArt escala la experiencia y los programas educativos a un público externo. El 25 de mayo, Voronezh organiza una reunión abierta de Machine Learning , cuyos participantes aprenden sobre las tendencias en tecnologías de aprendizaje automático , problemas y tareas que pueden resolverse con su ayuda, sobre proyectos de la vida real que utilizan métodos de aprendizaje automático e inteligencia artificial.

Source: https://habr.com/ru/post/452996/


All Articles