Herramientas para desarrolladores de software: Open Framework y bibliotecas de aprendizaje automático

Continuando con nuestra serie de herramientas de desarrollo de código abierto. Hoy hablamos de marcos y bibliotecas para MO: Transformers, Accord.NET y MLflow.


Fotos - Franck V. - Unsplash


Transformadores



Esta es una biblioteca de modelos de lenguaje natural en TensorFlow 2.0 y PyTorch. Contiene más de 32 modelos previamente entrenados: BERT, DistilBert, XLM, GPT-2, XLNet y otros.

Los autores de la biblioteca eran ingenieros de la compañía HuggingFace, que desarrollaban algoritmos de PNL. Fueron ellos quienes introdujeron el modelo de aprendizaje automático jerárquico de tareas múltiples (HMTL), que dio un paso más hacia la solución del problema del " olvido catastrófico ". HMTL se mostró en AAAI 2019, una conferencia académica internacional sobre sistemas de inteligencia artificial.

Una característica clave de Transformers es la capacidad de intercambiar modelos entrenados y convertirlos de un marco a otro: TF2.0 o PyTorch. Los desarrolladores notan que su solución nos permite describir el procedimiento para entrenar el modelo con tres líneas de código.

Se ha formado una extensa comunidad alrededor de la biblioteca: casi 15 mil estrellas en GitHub . Puede evaluar las capacidades de Transformers usted mismo en el sitio web del proyecto : los desarrolladores le enseñaron a la red neuronal a agregar propuestas para usted.


Accord.NET



Un marco mejorado por C # que proporciona herramientas básicas para el análisis de datos y el aprendizaje automático: desde probar hipótesis estadísticas hasta construir modelos de visión por computadora y procesamiento de imágenes. Accord.NET es una de las soluciones MO más populares en el ecosistema .NET. Inicialmente, era una extensión de la biblioteca AForge.NET , pero luego la absorbió.

La herramienta ofrece distribuciones de probabilidad, funciones básicas y puntos de referencia para evaluar el rendimiento de los modelos. Accord.NET se divide en bibliotecas disponibles como módulos ejecutables, archivos comprimidos o paquetes NuGet . Entre ellos se encuentran: Matemáticas para trabajar con matrices, Imágenes para procesamiento de imágenes y Audio con funciones de sonido. También puede resaltar Neuro con Levenberg - Marquardt y algoritmos de aprendizaje profundo.

Accord.NET fue utilizado para la investigación por ingenieros de universidades del Reino Unido , Egipto , China y otros países. Y, en general, el marco utiliza un número bastante grande de desarrolladores: tiene más de 3.5 mil estrellas en GitHub .

Entre las deficiencias se pueden distinguir documentos confusos, difíciles para principiantes. Aunque la situación se simplifica ligeramente por la disponibilidad de una guía de inicio rápido y comentarios detallados en el código. También se puede encontrar más información sobre Accord.NET en la literatura. Los propios desarrolladores recomiendan Proyectos de aprendizaje automático para desarrolladores de .NET , F # para Machine Learning Essentials y un par de otros .


Fotos - Franck V. - Unsplash


MLflow



Es una plataforma para el ciclo completo de aprendizaje automático, que simplifica el desarrollo, la implementación y el intercambio de modelos. Ofrece un conjunto de API que funcionan con cualquier biblioteca (TensorFlow, PyTorch, XGBoost, etc.) y en cualquier entorno, incluida la nube. Los desarrolladores de MLflow son programadores de Databricks, una startup fundada por personas de Apache Spark.

MLflow tiene integraciones integradas con Docker, TensorFlow, PyTorch, Kubernetes, Java, Spark y otros proyectos de código abierto. Al mismo tiempo, MLflow es utilizado por organizaciones como Microsoft, Accenture, SK Telecom e incluso la Universidad de Washington.

Entre las deficiencias de MLflow, se puede destacar la falta de soporte para R y Java, a pesar de su popularidad en el aprendizaje automático. Pero el punto aquí es la juventud relativa del proyecto, y los desarrolladores prometen agregar API apropiadas en el futuro. La juventud del instrumento deja otra huella: hay errores en su trabajo.

Si desea evaluar independientemente MLflow en el trabajo, puede comenzar a familiarizarse con la documentación oficial . Si tiene preguntas, una comunidad relativamente pequeña pero activa en StackOverflow o Grupos de Google ayudará con su solución.

Nuestras otras colecciones:

Ahorre tiempo al trabajar con la línea de comando
Benchmarks para servidores en Linux: una selección de herramientas abiertas

Lo que escribimos en Habré:

Lo que se sabe sobre VMworld 2019
Comprender las políticas de privacidad de aplicaciones y servicios ayudará a las redes neuronales
El tribunal de la UE se opone a las cookies de forma predeterminada: no debe haber casillas de verificación previamente marcadas


Ofrecemos un servicio de almacenamiento de instalaciones en la nube . Para copia de seguridad, archivo y uso compartido de documentos.

Source: https://habr.com/ru/post/471320/


All Articles