Olá leitor.
Seguindo os passos do meu
primeiro post de uma seleção de conjuntos de dados para aprendizado de máquina - farei uma seleção de conjuntos de dados relativamente recentes com exemplos úteis de processamento de dados. Afinal, não é segredo para ninguém que aprender com bons exemplos é mais eficaz e mais rápido. Vamos ver o que é interessante para nós, poderemos mostrar alguns dos melhores exemplos de processamento de dados.
O esquema de trabalho com a publicação atual será herdado da publicação sobre os
melhores notebooks no ML e no DS , ou seja, salvos em marcadores → transferidos para um colega.
+ bônus no final do artigo - um curso interessante do FPMI MIPT.

Então, vamos começar.
Uma seleção de conjuntos de dados com exemplos funcionais de processamento de dados:
Visão geral das taxas de suicídio 1985 a 2016 - Comparação de informações socioeconômicas com taxas de suicídio por ano e país.
Exemplos de processamento:
O Ranking Diário Mundial de Músicas do Spotify é um ranking diário das 200 músicas mais ouvidas em 53 países entre 2017 e 2018 pelos usuários do Spotify.
Exemplo de processamento:
Crimes em Boston - registros do sistema de denúncia de incidentes criminais de Boston, que inclui incidentes e informações sobre quando e onde aconteceu.
Exemplo de processamento:
Aplicativos da Google Play Store - categorias, classificações, tamanho de todos os aplicativos do Google Play.
Exemplo de processamento:
Pokémon para mineração de dados e aprendizado de máquina - estatísticas e recursos de Pokemon;
Exemplo de processamento:
Um milhão de notícias - Dados de notícias publicados nos últimos 15 anos.
Exemplo de processamento:
Aviões caem desde 1908 - Uma história completa de acidentes aéreos em todo o mundo, de 1908 até o presente.
Exemplo de processamento:
Conjunto de dados de notícias para detecção de sarcasmo é um conjunto de dados de alta qualidade para detecção de sarcasmo.
Exemplo de processamento:
Qualidade Histórica do Ar - Dados da
qualidade do ar coletados em monitores externos nos Estados Unidos.
Exemplo de processamento:
Informações nutricionais para o menu do McDonald's -
Informações nutricionais para cada item do menu no McDonald's EUA.
Exemplo de processamento:
Banco de dados LEGO - detalhes / conjuntos / cores e estoques de cada conjunto oficial LEGO no banco de dados Rebrickable.
Exemplo de processamento:
Estatísticas Globais do Comércio de Commodities - volumes de importação e exportação de 5.000 produtos na maioria dos países do mundo nos últimos 30 anos.
Exemplo de processamento:
Crime na Índia - informações completas sobre vários aspectos dos crimes cometidos na Índia desde 2001.
Exemplo de processamento:
Prevendo uma estrela pulsar - dados pulsares coletados durante uma pesquisa do universo.
Exemplos de processamento:
Emprego francês, salários, população por cidade - dados mostrando igualdade e desigualdade na França.
Exemplo de processamento:
Censo dos Estados Unidos - Censo dos EUA.
Exemplo de processamento:
Preços da Habitação na Califórnia - o preço da habitação na Califórnia.
Exemplo de processamento:
Taxa de desemprego dos EUA por município, 1990-2016 - Dados de desemprego do Departamento de Trabalho dos EUA.
Exemplo de processamento:
World of Warcraft Avatar History - Um conjunto de registros que detalham informações sobre os personagens do jogador no jogo ao longo do tempo.
Exemplo de processamento:
Dados de descoberta de ondas gravitacionais - dados sobre eventos de ondas gravitacionais GW150914.
Exemplo de processamento:
Bônus!
E o bônus hoje será um
maravilhoso curso de Aprendizado Profundo para estudantes do ensino médio interessados em programação e matemática, bem como para estudantes que desejam iniciar um aprendizado profundo.
O objetivo do curso é introduzir os princípios básicos da aprendizagem profunda (redes neurais) em um formato interativo e no exemplo de tarefas práticas.
Programa do curso
- Python: básico, Google Colab;
- Introdução à álgebra linear. Vetores. Matrizes e operações com elas. Biblioteca NumPy;
- Bibliotecas Pandas e MatPlotlib. Noções básicas de aprendizado de máquina;
- Elementos da teoria da otimização. Gradiente Descida de gradiente. Modelos lineares;
- Introdução à aprendizagem profunda. Perceptron. Um neurônio com um sigmóide (e outras funções de ativação). Noções básicas de POO em Python;
- Biblioteca PyTorch. Redes neurais multicamadas;
- Treinar redes neurais na prática. Cifar10, nãoMNIST;
- Redes neurais convolucionais. Camada convolucional. Camada de pool;
- A prática de treinar redes neurais. Classificação dos sinais de trânsito;
- Transferir aprendizado. Popular em arquitetura de visão computacional;
- Segmentação de imagem. Rede U;
- Competição no Kaggle;
- Detecção de Objetos YOLOv3;
- GAN clássico. Transferência de estilo neural;
- Métodos básicos de processamento de texto;
- Incorporação de palavras;
- Redes neurais recorrentes;
- Células LSTM, GRU;
- Modelos de linguagem;
- Tradução automática
- Text2Speech;
- SuperResolução.
Você também pode dar uma olhada no
canal do YouTube da Deep Learning School. Existem muitos vídeos ótimos;)
Com isso, nossa pequena seleção de exemplos de processamento de dados chegou ao fim. Espero que você tenha aprendido algo novo para si mesmo. Como é habitual em Habré, gostei do post - coloque um plus. Não se esqueça de compartilhar com os colegas. Além disso, se você tiver algo que possa compartilhar, escreva nos comentários. Mais informações sobre aprendizado de máquina e ciência de dados em
Habré e no canal de telegrama
Neuron (@neurondata).
Todo conhecimento!