Notas sobre inteligencia artificial, aprendizaje automático, aprendizaje profundo y Big Data



Durante varios meses hemos estado recopilando notas sobre inteligencia artificial, que compartíamos periódicamente con amigos y colegas. Recientemente, se ha desarrollado una colección completa, y hemos agregado descripciones y / o citas a los memos para que sea más interesante de leer. Y al final, encontrará una selección de complejidad "O big" (Big-O). Disfrútalo.

UPD Muchas imágenes serán más legibles si las abre en pestañas separadas o las guarda en el disco.

Redes neuronales



Memo de red neuronal

Gráficos de redes neuronales



Memo sobre las gráficas de redes neuronales


Memo de red neuronal

Descripción general del aprendizaje automático



Guía de aprendizaje automático

Algoritmo de aprendizaje de Scikit


Esta guía de aprendizaje automático lo ayudará a encontrar el algoritmo adecuado para calificar, que es la parte más difícil del trabajo. El diagrama de flujo lo ayudará a verificar la documentación y establecer una dirección general para cada algoritmo. Esto lo ayudará a comprender mejor los problemas que enfrenta y cómo resolverlos.

Scikit-learn (anteriormente conocido como scikits.learn ) es una biblioteca gratuita de aprendizaje automático para Python. Incluye varios tipos de algoritmos de clasificación , regresión y agrupación , incluido el método de vector de soporte , el algoritmo de bosque aleatorio ("bosque aleatorio"), el aumento de gradiente , el método k- means y DBSCAN . Scikit-learn está diseñado para interactuar con las bibliotecas informáticas y científicas Python NumPy y SciPy .




Nota de aprendizaje de Scikit

Guía de algoritmo de aprendizaje automático


Este memo de Microsoft Azure lo ayudará a elegir los algoritmos de aprendizaje automático adecuados para su solución analítica predictiva. Primero, la nota pregunta sobre la naturaleza de los datos y luego aconseja el mejor algoritmo.



Python para ciencia de datos



Memo de Python para ciencia de datos


Memo de Big Data

Tensorflow


En mayo de 2017, Google anunció el TPU de segunda generación, así como su disponibilidad en Google Compute Engine . Los TPU de segunda generación tienen un rendimiento de hasta 180 teraflops, y con un agrupamiento de 64 TPU que agrupa hasta 11.5 petaflops.


Memorando TensorFlow

Keras


En 2017, el equipo de TensorFlow en Google decidió integrar el soporte de Keras en la biblioteca central de TensorFlow. Chollet explicó que Keras es una interfaz en lugar de un sistema de aprendizaje automático de extremo a extremo. Proporciona un conjunto de abstracciones de nivel más alto e intuitivo que simplifica la configuración de las redes neuronales, independientemente de la biblioteca de computación científica utilizada en el backend.



Numpy


NumPy es para Cpython , una implementación de Python de referencia que es un intérprete de bytecode no optimizador. Los algoritmos matemáticos escritos para esta versión de Python a menudo funcionan mucho más lentamente que sus homólogos compilados. La biblioteca NumPy resuelve parcialmente el problema de velocidad debido a las matrices multidimensionales, así como a las funciones y operadores optimizados para trabajar con matrices. Será necesario reescribir parte del código usando NumPy, en su mayoría bucles internos.


Memo de Numpy

Pandas


El nombre "Pandas" proviene del término econométrico " datos de panel ", que se utiliza para conjuntos de datos estructurados multidimensionales.


Pandas Memo

Disputa de datos


Disputa de datos (datos de "pastoreo", procesamiento de datos primarios ): este término comienza a penetrar en la cultura pop. En la película de 2017 Kong: Skull Island, uno de los personajes es presentado como Steve Woodward, nuestro experto en datos.


Memo de disputa de datos


Memorando de disputas de datos de pandas

Lucha de datos con dplyr y tidyr



Memo de disputa de datos con dplyr y tidyr


Memo de disputa de datos con dplyr y tidyr

Scipy


SciPy se basa en un objeto de matriz NumPy. Esta biblioteca es parte de la pila NumPy, que incluye herramientas como Matplotlib , Pandas y SymPy , así como un conjunto de bibliotecas en expansión para la computación científica. La pila NumPy y las aplicaciones MATLAB , GNU Octave y Scilab tienen la misma audiencia de usuarios. La pila NumPy también a veces se llama la pila SciPy.


Scipy Memo

Matplotlib


Matplotlib es una biblioteca gráfica para Python y su extensión matemática computacional NumPy. Proporciona una API orientada a objetos para incrustar gráficos en aplicaciones que utilizan herramientas GUI universales como Tkinter , wxPython , Qt o GTK + . También hay una interfaz de procedimiento pylab basada en máquina de estado (como OpenGL) diseñada para parecerse a MATLAB , aunque no se recomienda su uso. SciPy usa matplotlib.

Pyplot es un módulo matplotlib que proporciona una interfaz como MATLAB. Matplotlib se usa de la misma manera que MATLAB, le permite usar Python y también es gratis.


Memo de Matplotlib

Visualización de datos



Memo de visualización de datos


Memorando de Ggplot

Pyspark



Memo de PySpark

"Oh Big" (Big-O)



Memo de la complejidad del algoritmo


Memo de la complejidad del algoritmo


Una nota sobre la complejidad de las operaciones con estructuras de datos en algoritmos


Una nota sobre la complejidad de los algoritmos de ordenación de matrices

Fuentes


Memo de la complejidad del algoritmo
Bokeh Memo
Memo de ciencia de datos
Memo de disputa de datos
Memorando Ggplot
Keras Memo
Guía de aprendizaje automático
Guía de aprendizaje automático
Guía de aprendizaje automático
Memo de Matplotlib
Memo de red neuronal
Memo sobre las gráficas de redes neuronales
Redes neuronales
Memo de Numpy
Pandas Memo
Pandas Memo
Memo de Pyspark
Memo Scikit
Nota de aprendizaje de Scikit
Scipy Memo
Memorando TensorFlow

Source: https://habr.com/ru/post/es417935/


All Articles