✍️ 🍜 🎋 Aprendizaje automático de Python con demostraciones interactivas de Jupyter 🚝 😑 ✋

imagen

Hola lectores!

Recientemente lancé el repositorio Homemade Machine Learning , que contiene ejemplos de algoritmos y enfoques populares de aprendizaje automático, como la regresión lineal, la regresión logística, el método K-means y la red neuronal (perceptrón multicapa). Cada algoritmo contiene páginas de demostración interactivas lanzadas en Jupyter NBViewer-e o Binder-e. Por lo tanto, todos tienen la oportunidad de cambiar los datos de entrenamiento, los parámetros de entrenamiento e inmediatamente ver el resultado del entrenamiento, la visualización y la predicción del modelo en su navegador sin instalar Jupyter localmente.

El propósito de este repositorio es implementar algoritmos ~~casi~~ desde cero, para tener una comprensión más detallada de los modelos matemáticos que se encuentran detrás de cada uno de los algoritmos. Las principales bibliotecas utilizadas fueron NumPy y Pandas . Estas bibliotecas se utilizan para operaciones eficientes en matrices, así como para cargar y analizar datos CSV. En las páginas de demostración para trazar gráficos y visualizar datos de entrenamiento, también se utilizan las bibliotecas Matplotlib y Plotly . En el caso de la regresión logística, la biblioteca SciPy se usa para minimizar la función de pérdida, pero en otros casos, el descenso de gradiente se implementa en NumPy / Python puro. El uso de bibliotecas como PyTorch o TensorFlow se evita debido al propósito de enseñanza del repositorio.

Por el momento, los siguientes algoritmos están implementados en el repositorio ...

Regresión Regresión lineal.

En los problemas asociados con la regresión, tratamos de predecir el número real en función de los datos entrantes. De hecho, estamos construyendo una línea / plano / plano n-dimensional a lo largo de los datos de entrenamiento para poder hacer una predicción para los datos de entrada que no están en el conjunto de entrenamiento. Esto sucede, por ejemplo, si queremos predecir el costo de un apartamento de 2 habitaciones, en el centro de N, en el séptimo piso.

∑ Modelo matemático : teoría y referencias para lecturas adicionales.
✎ Ejemplo de implementación en Python .
➤ Demostración de regresión lineal con un parámetro : pronosticar el "nivel de felicidad" en la cadena dependiendo del PIB.
➤ Demostración de regresión lineal con varios parámetros : pronosticar el "nivel de felicidad" en una cadena dependiendo del PIB y el indicador de libertad.
➤ Demostración de regresión no lineal : un ejemplo de expansión polinómica / sinusoidal de parámetros de entrada para predecir dependencias no lineales.

Clasificación Regresión logística

En problemas relacionados con la clasificación, dividimos los datos en clases según los parámetros de estos datos. Un ejemplo de una tarea de clasificación es el reconocimiento de spam. Dependiendo del texto de la carta (datos entrantes) asignamos cada letra a una de dos clases ("spam" o "no spam").

∑ Modelo matemático : teoría y referencias para lecturas adicionales.
✎ Ejemplo de implementación de Python
➤ Demostración de regresión logística con bordes lineales : clasificación de colores según el ancho y el largo de sus pétalos.
➤ Demostración de regresión logística con límites no lineales : clasificación de microchips (en funcionamiento / defectuoso) de acuerdo con dos parámetros.
➤ Demostración de regresión logística con muchos parámetros : reconocimiento de dígitos escritos a mano.

Agrupación Método K-means.

En las tareas de agrupación, dividimos nuestros datos en agrupaciones que no conocemos de antemano. Estos algoritmos se pueden utilizar para la segmentación del mercado, el análisis de redes sociales y no solo.

∑ Modelo matemático : teoría y referencias para lecturas adicionales.
✎ Ejemplo de implementación en Python .
➤ Demostración del método K-means : agrupar los colores en grupos según la longitud y el ancho de sus pétalos.

Redes neuronales Perceptrón multicapa (MLP).

Es más probable que las redes neuronales no sean un algoritmo, sino un "patrón" o "marco" para organizar diferentes algoritmos de aprendizaje automático en un sistema para un análisis posterior de datos de entrada complejos.

∑ Modelo matemático : teoría y referencias para lecturas adicionales.
✎ Ejemplo de implementación en Python .
➤ Demostración de un perceptrón multicapa : reconocimiento de números escritos a mano.

Buscar anomalías utilizando la distribución gaussiana

En los problemas asociados con la búsqueda de anomalías, tratamos de aislar aquellas instancias de datos que parecen "sospechosas" en comparación con la mayoría de las otras instancias. Por ejemplo, la definición de transacciones atípicas (sospechosas) con tarjeta de crédito.

∑ Modelo matemático : teoría y referencias para lecturas adicionales.

Espero que encuentre útil el repositorio , ya sea experimentando con demostraciones de cada algoritmo, o leyendo sobre los modelos matemáticos detrás de ellos, o analizando los detalles de implementación de cada uno de ellos.

Codificación exitosa!

Aprendizaje automático de Python con demostraciones interactivas de Jupyter

Regresión Regresión lineal.

Clasificación Regresión logística

Agrupación Método K-means.

Redes neuronales Perceptrón multicapa (MLP).

Buscar anomalías utilizando la distribución gaussiana

More articles: