适用于软件开发人员的工具:开放框架和机器学习库

继续我们的一系列开源开发人员工具。 今天,我们讨论用于MO的框架和库-变形金刚,Accord.NET和MLflow。


照片-Franck V.-不飞溅


变形金刚



这是TensorFlow 2.0和PyTorch上的自然语言模型库。 它包含32个以上的预训练模型-BERT,DistilBert,XLM,GPT-2,XLNet等。

该库的作者是HuggingFace公司的工程师,他们正在开发NLP算法。 正是他们介绍了机器学习的分层多任务学习 (HMTL)模型,朝着解决“ 灾难性健忘 ”问题迈出了又一步。 HMTL在AAAI 2019上展出,AAAI是人工智能系统的国际学术会议。

变形金刚的主要特征是能够交换训练好的模型并将其从一个框架转换为另一个框架:TF2.0或PyTorch。 开发人员注意到,他们的解决方案使我们可以用三行代码来描述训练模型的过程。

在图书馆周围形成了一个广泛的社区-GitHub上有近1.5万个星 。 您可以在项目网站上自己评估Transformers的功能:开发人员教过神经网络为您添加提案。


雅阁



C#完善的框架提供了用于数据分析和机器学习的基本工具:从测试统计假设到建立计算机视觉和图像处理模型。 Accord.NET是.NET生态系统中最受欢迎的MO解决方案之一。 最初,它是AForge.NET库的扩展,但后来吸收了它。

该工具提供了概率分布,核心功能和用于评估模型性能的基准。 Accord.NET分为可作为可执行模块,压缩档案或NuGet包提供的库 。 其中包括:用于矩阵运算的数学 ,用于图像处理的图像处理以及具有声音功能的音频 。 您还可以使用Levenberg-Marquardt和深度学习算法突出显示Neuro

来自英国埃及 ,中国和其他国家/地区的大学的工程师使用Accord.NET进行研究。 总体而言,该框架使用了大量开发人员-GitHub上有超过3.5千颗星

其中的缺点是可以区分出令人困惑的文档,这对于初学者来说很困难。 尽管通过快速入门指南和代码中的详细注释可以稍微简化这种情况。 关于Accord.NET的更多信息也可以在文献中找到。 开发人员自己为.NET开发人员推荐了机器学习项目为机器学习基础知识推荐了F#以及其他几个项目


照片-Franck V.-不飞溅


流量



它是整个机器学习周期的平台,可简化模型的开发,部署和交换。 它提供了一组API,可与任何库(TensorFlow,PyTorch,XGBoost等)以及任何环境(包括云)一起使用。 MLflow开发人员是Databricks的程序员,Databricks是由Apache Spark的人创办的创业公司。

MLflow具有与Docker,TensorFlow,PyTorch,Kubernetes,Java,Spark和其他开源项目的内置集成。 同时,Microsoft,埃森哲,SK Telecom甚至华盛顿大学等组织都使用MLflow。

在MLflow的缺点中,尽管它们在机器学习中很受欢迎,但可以指出缺少对R和Java 支持。 但是这里的重点是该项目相对年轻,开发人员承诺将来会添加适当的API。 乐器的青春留下了另一个烙印-它的工作中有很多错误

如果您想在工作中独立评估MLflow,则可以开始熟悉官方文档 。 如有疑问, StackOverflowGoogle网上论坛 相对较小但活跃的社区将为他们的解决方案提供帮助。

我们的其他收藏:

使用命令行节省时间
Linux上服务器基准:一系列开放工具

我们在哈布雷(Habré)上写道:

关于VMworld 2019的了解
了解应用程序和服务隐私策略将有助于神经网络
欧盟法院默认情况下反对Cookie-不应预先选中复选框


我们提供云设施存储服务 。 用于备份,归档和文档共享。

Source: https://habr.com/ru/post/zh-CN471320/


All Articles