
(
c )
Github不仅是托管和联合开发IT项目的平台,还是由数百位专家汇集而成的庞大知识库。 幸运的是,该服务不仅提供了使用开放源代码的工具,还提供了高质量的培训材料。 我们选择了一些受欢迎的存储库,并按星数降序对它们进行了排序。
如果您对使用数据和深入培训感兴趣,此合集将帮助您确定应该注意哪些存储库。
数据科学
开源数据科学大师星星:11,227,叉子:4,737
数据科学硕士课程的官方资源库,是
数据科学领域中正规教育的开源替代品。 该资料库是几年来收集的培训材料的集合。
很棒的数据科学星星:9,240,叉子:2,761
功能强大的集合可回答以下问题:“什么是数据科学?” 和“您需要了解什么才能精通本科学?”。 方便地分为几类。 例如,
在Facebook上有关于数据科学
的书籍清单, 大量的信息图表甚至主题
小组 。
Jupyter交互式笔记本星星:5,242,叉子:2,331
该存储库的
前身是一个平台,用于处理40种编程语言
Data Science iPython Notebook的脚本,该脚本具有14,000多颗星星和4,000个分叉。 数据处理和机器学习专家已将其积极地用于科学计算。
今天,Jupyter Notebook是一组方便的笔记本文件集,其中包含在其中编写和执行请求的段落。 使用内置的可视化工具,带有一组查询的记事本将变成功能完善的数据仪表板。
数据科学博客星星:4510,叉子:1178
一个简单但内容广泛的培训材料清单,按字母顺序排序。 在这里,您会找到所有流行的博客以及许多有用的信息的小型站点(总共列出了251个资源)。
数据科学专业星:3114,前叉:27184
约翰·霍普金斯大学的数据科学
教育资源库是罗杰·彭,杰夫·里克和布莱恩·库福非常受欢迎的课程。 更准确地说,Coursera的“数据科学”专业中的培训计划包括几个与数据分析的各个方面相关的,与各个主题(例如,R编程)相关的相互关联的课程,并且集合中提供的存储库结合了所有课程中使用的信息。
Spark笔记本星:2677,叉:587
Spark Notebook是一个开源记事本,提供了一个交互式Web编辑器,该编辑器可以将Scala代码,SQL查询,标记和JavaScript组合在一起以一起分析和浏览数据。
学习数据科学星:2129,叉:1210
一组iPython笔记本,着重于面向初学者的基本机器学习概念。
命令行中的数据科学星:2057,叉:503
该存储库包含
命令行中“
数据科学”中使用的文本,数据,脚本和控制台用户工具。 该使用方法指南演示了如何组合小型但功能强大的命令行工具,以快速检索,清理,研究和建模数据。
数据科学专业社区站点星:1395,福克斯:2661
在约翰·霍普金斯大学完成课程的几名学生创造了如此高品质的内容,大学工作人员可以共享这些内容,并且还为社区创建的所有有趣内容制作了目录。
网络数据可视化
D3星:81837,福克斯:20282
D3是用于HTML和SVG的JavaScript数据可视化库。 在D3中,重点是Web标准,因此您可以使用现代浏览器的所有功能,而不必将自己束缚在专有结构上,而是结合了强大的可视化组件,受控方法以及与
文档对象模型(DOM)的交互。 这是GitHub上最受欢迎的数据可视化项目。
Chart.js星星:41,393,叉子:9,294
Chart.js是一个HTML5库,可通过<canvas>元素创建可视化效果。 Chart.js将自己定位为一个简单而灵活的工具,具有交互性,支持六种不同类型的图表。
har星:32204,福克斯:9,369
ECharts是基于浏览器的图形和可视化库。 易于使用,直观且易于配置。
单张星星:23,810,叉子:3,937
JavaScript库,用于创建专注于移动应用程序的交互式地图。 库代码非常小-设计用于简单,快速和方便地使用。 可以通过一组插件来扩展传单功能。
Sigma.js星星:8,348,叉子:1,305
面向图的JS库。 Sigma允许您在网页上开发图形表示并将其集成到Web应用程序中。
维加星星:6,559,叉子:702
Vega是用于创建,保存和共享交互式可视化项目的说明性语言。 使用它,您可以以JSON格式描述可视化的外观和交互行为,以及使用Canvas或SVG创建Web视图。 Vega为广泛的可视化项目提供了基本的构建基块:加载和转换数据,缩放,地图投影,图例,图形标签等。
DC.js星星:6,458,叉子:1,734
DC.js是基于D3.js构建的多维图,用于使用
交叉过滤器 。 DC.js以与CSS兼容的SVG格式呈现。 专为在浏览器和移动设备上进行强大的数据分析而设计。
时代星星:4,949,叉子:290
通用实时可视化库。 它着重于两个不同方面:用于创建历史报告的基本图表和用于显示频繁更新的时间序列数据的实时图表。
深度学习
凯拉斯星星:37,611,叉子:14,344
Keras是TensorFlow和Theano都使用的Python深度学习库(是的,您可以在
TensorFlow ,
Theano和
CNTK库的顶部运行它)。 Keras专为快速实验而设计,因为进行出色研究的关键在于能够以最小的延迟从想法转变为结果。 得益于详尽且易于访问的文档,Keras在我们的选择中正确地占据了位置。
咖啡星星:26,892,叉子:16,276
Caffe(用于特征提取的卷积体系结构)是链接Python和MATLAB的深度学习库。 实际上,它是一个通用库,旨在部署卷积网络以及识别图像,语音或多媒体。
还有一个Caffe2项目,其中包括新功能,特别是循环神经网络。 在2018年5月,Caffe2和PyTorch团队合并,将Caffe2代码转移到
PyTorch存储库 (星级:
24,075 ,分支:
5,707 )。
MXNet星星:16,157,叉子:5,824
轻巧,紧凑,灵活分布的深度学习环境,适用于Python,R,Julia,Scala,Go,JavaScript等。为了提高性能,MXNet允许您混合命令式和符号编程方法。 该项目还包含创建其他深度学习系统的指南。
数据科学IPython笔记本星星:14,747,叉子:4,410
iPython笔记本的集合,包括大数据,Hadoop,scikit学习,为科学计算而设计的库等。如果我们谈论深度学习,则涵盖TensorFlow,Theano,Caffe和其他工具。
Convnetjs星星:9,510,叉子:1,982
ConvNetJS是神经网络及其通用JavaScript模块的实现。 该项目目前不受支持,但仍值得关注。 使您可以直接在浏览器中学习卷积(或常规)网络。
深度学习4j星星:10,227,叉子:4,570
Java和Scala的深度学习库。 与Hadoop和Spark集成。 Deeplearning4j还允许启用CUDA的GPU计算。 此外,还有一些用于在Python中使用该库的工具。 该存储库包含所有必要的文档和教程。
LISA实验室深度学习教程星星:3,673,叉子:2,045
蒙特利尔大学的教科书集。 本文介绍的材料介绍了一些最重要的深度学习算法,还演示了使用Theano的原理。 Theano是一个Python库,可简化深度学习模型的编写,并使其可以在GPU上进行训练。
使用此列表,Github上有趣的事物的数量不受限制。 下次,我们将讨论机器学习项目和开放数据集。 如果您有自己的有趣存储库示例,请在评论中共享它们。