Hola lector
Siguiendo los pasos de mi
primera publicación de una selección de conjuntos de datos para el aprendizaje automático, haré una selección de conjuntos de datos relativamente recientes con ejemplos funcionales de procesamiento de datos. Después de todo, para nadie es un secreto que aprender con buenos ejemplos es más efectivo y más rápido. Veamos lo que nos interesa, podremos mostrar algunos de los mejores ejemplos de procesamiento de datos.
El esquema de trabajo con la publicación actual se heredará de mi publicación sobre los
mejores cuadernos en ML y DS , a saber, guardado en marcadores → transferido a un colega.
+ bonificación al final del artículo: un curso genial de FPMI MIPT.

Entonces comencemos.
Una selección de conjuntos de datos con ejemplos funcionales de procesamiento de datos:
Resumen de las tasas de suicidio 1985 a 2016 - Comparación de la información socioeconómica con las tasas de suicidio por año y país.
Ejemplos de procesamiento:
Spotify's Worldwide Daily Song Ranking es una clasificación diaria de las 200 canciones más escuchadas en 53 países entre 2017 y 2018 por los usuarios de Spotify.
Ejemplo de procesamiento:
Delitos en Boston : registros del sistema de notificación de incidentes delictivos de Boston, que incluye incidentes e información sobre cuándo y dónde sucedió.
Ejemplo de procesamiento:
Aplicaciones de Google Play Store : categorías, clasificaciones, tamaño de todas las aplicaciones de Google Play.
Ejemplo de procesamiento:
Pokémon para minería de datos y aprendizaje automático : estadísticas y características de Pokémon;
Ejemplo de procesamiento:
Un millón de titulares de noticias : datos de titulares de noticias publicados en los últimos 15 años.
Ejemplo de procesamiento:
Accidentes aéreos
desde 1908 : una historia completa de accidentes aéreos en todo el mundo, desde 1908 hasta el presente.
Ejemplo de procesamiento:
News Headlines Dataset For Sarcasm Detection es un conjunto de datos de alta calidad para la detección de sarcasmos.
Ejemplo de procesamiento:
Calidad histórica del aire : datos de
calidad del aire recopilados en monitores exteriores en todo Estados Unidos.
Ejemplo de procesamiento:
Datos nutricionales para el menú de McDonald's : datos
nutricionales para cada elemento del menú en McDonald's EE. UU.
Ejemplo de procesamiento:
Base de datos LEGO : detalles / conjuntos / colores y existencias de cada conjunto LEGO oficial en la base de datos Rebrickable.
Ejemplo de procesamiento:
Estadísticas mundiales del comercio de productos básicos : volúmenes de importación y exportación de 5.000 productos en la mayoría de los países del mundo durante los últimos 30 años.
Ejemplo de procesamiento:
Crimen en India : información completa sobre varios aspectos de los crímenes cometidos en India desde 2001.
Ejemplo de procesamiento:
Predicción de una estrella Pulsar : datos de púlsar recopilados durante una encuesta del universo.
Ejemplos de procesamiento:
Empleo francés, salarios, población por ciudad : datos que muestran la igualdad y la desigualdad en Francia.
Ejemplo de procesamiento:
Censo de los Estados Unidos -
Censo de los Estados Unidos.
Ejemplo de procesamiento:
Precios de la vivienda en California: el precio de la vivienda en California.
Ejemplo de procesamiento:
Tasa de desempleo de EE. UU. Por condado, 1990-2016 - Datos de desempleo del Departamento de Trabajo de EE. UU.
Ejemplo de procesamiento:
Historial de avatar de World of Warcraft : un conjunto de registros que detallan información sobre los personajes del jugador en el juego a lo largo del tiempo.
Ejemplo de procesamiento:
Datos de descubrimiento de ondas gravitacionales : datos sobre eventos de ondas gravitacionales GW150914.
Ejemplo de procesamiento:
Bonus!
Y la bonificación de hoy será un
excelente curso de aprendizaje profundo para estudiantes de secundaria interesados en programación y matemáticas, así como para estudiantes que desean comenzar el aprendizaje profundo.
El objetivo del curso es presentar los principios básicos del aprendizaje profundo (redes neuronales) en un formato interactivo y en el ejemplo de tareas prácticas.
Programa del curso
- Python: conceptos básicos, Google Colab;
- Introducción al álgebra lineal. Vectores Matrices y operaciones con ellos. Biblioteca NumPy;
- Pandas y MatPlotlib Libraries. Los fundamentos del aprendizaje automático;
- Elementos de la teoría de la optimización. Gradiente Descenso de gradiente. Modelos lineales;
- Introducción al aprendizaje profundo. Perceptrón Una neurona con un sigmoide (y otras funciones de activación). Conceptos básicos de OOP en Python;
- Biblioteca PyTorch. Redes neuronales multicapa;
- Entrenamiento de redes neuronales en la práctica. Cifar10, noMNIST;
- Redes neuronales convolucionales. Capa convolucional. Capa de agrupación;
- La práctica de entrenar redes neuronales. Clasificación de señales de tráfico;
- Transferencia Dearning. Popular en Arquitectura de Visión por Computador;
- Segmentación de imagen. U-Net;
- Competencia en Kaggle;
- Detección de objetos YOLOv3;
- GAN clásico. Transferencia de estilo neural;
- Métodos básicos de procesamiento de texto;
- Incrustaciones de palabras;
- Redes neuronales recurrentes;
- LSTM, células GRU;
- Modelos de lenguaje;
- Traducción automática
- Text2Speech;
- Superresolución.
También puedes echar un vistazo al
canal de Youtube de Deep Learning School. Hay muchos videos geniales;)
Con esto, nuestra corta selección de ejemplos de procesamiento de datos ha llegado a su fin. Espero que hayas aprendido algo nuevo por ti mismo. Como es habitual en Habré, me gustó la publicación: poner un plus. No te olvides de compartir con colegas. Además, si tiene algo que puede compartir, escriba en los comentarios. Más información sobre aprendizaje automático y ciencia de datos en
Habré y en el canal de telegramas
Neuron (@neurondata).
Todo el conocimiento!