Uma seleção de exemplos de trabalho de processamento de dados

Olá leitor.

Seguindo os passos do meu primeiro post de uma seleção de conjuntos de dados para aprendizado de máquina - farei uma seleção de conjuntos de dados relativamente recentes com exemplos úteis de processamento de dados. Afinal, não é segredo para ninguém que aprender com bons exemplos é mais eficaz e mais rápido. Vamos ver o que é interessante para nós, poderemos mostrar alguns dos melhores exemplos de processamento de dados.

O esquema de trabalho com a publicação atual será herdado da publicação sobre os melhores notebooks no ML e no DS , ou seja, salvos em marcadores → transferidos para um colega.

+ bônus no final do artigo - um curso interessante do FPMI MIPT.

imagem

Então, vamos começar.

Uma seleção de conjuntos de dados com exemplos funcionais de processamento de dados:


Visão geral das taxas de suicídio 1985 a 2016 - Comparação de informações socioeconômicas com taxas de suicídio por ano e país.

Exemplos de processamento:


O Ranking Diário Mundial de Músicas do Spotify é um ranking diário das 200 músicas mais ouvidas em 53 países entre 2017 e 2018 pelos usuários do Spotify.

Exemplo de processamento:


Crimes em Boston - registros do sistema de denúncia de incidentes criminais de Boston, que inclui incidentes e informações sobre quando e onde aconteceu.

Exemplo de processamento:


Aplicativos da Google Play Store - categorias, classificações, tamanho de todos os aplicativos do Google Play.

Exemplo de processamento:


Pokémon para mineração de dados e aprendizado de máquina - estatísticas e recursos de Pokemon;

Exemplo de processamento:


Um milhão de notícias - Dados de notícias publicados nos últimos 15 anos.

Exemplo de processamento:


Aviões caem desde 1908 - Uma história completa de acidentes aéreos em todo o mundo, de 1908 até o presente.

Exemplo de processamento:


Conjunto de dados de notícias para detecção de sarcasmo é um conjunto de dados de alta qualidade para detecção de sarcasmo.

Exemplo de processamento:


Qualidade Histórica do Ar - Dados da qualidade do ar coletados em monitores externos nos Estados Unidos.

Exemplo de processamento:


Informações nutricionais para o menu do McDonald's - Informações nutricionais para cada item do menu no McDonald's EUA.

Exemplo de processamento:


Banco de dados LEGO - detalhes / conjuntos / cores e estoques de cada conjunto oficial LEGO no banco de dados Rebrickable.

Exemplo de processamento:


Estatísticas Globais do Comércio de Commodities - volumes de importação e exportação de 5.000 produtos na maioria dos países do mundo nos últimos 30 anos.

Exemplo de processamento:


Crime na Índia - informações completas sobre vários aspectos dos crimes cometidos na Índia desde 2001.

Exemplo de processamento:


Prevendo uma estrela pulsar - dados pulsares coletados durante uma pesquisa do universo.

Exemplos de processamento:


Emprego francês, salários, população por cidade - dados mostrando igualdade e desigualdade na França.

Exemplo de processamento:


Censo dos Estados Unidos - Censo dos EUA.

Exemplo de processamento:


Preços da Habitação na Califórnia - o preço da habitação na Califórnia.

Exemplo de processamento:


Taxa de desemprego dos EUA por município, 1990-2016 - Dados de desemprego do Departamento de Trabalho dos EUA.

Exemplo de processamento:


World of Warcraft Avatar History - Um conjunto de registros que detalham informações sobre os personagens do jogador no jogo ao longo do tempo.

Exemplo de processamento:


Dados de descoberta de ondas gravitacionais - dados sobre eventos de ondas gravitacionais GW150914.

Exemplo de processamento:


Bônus!


E o bônus hoje será um maravilhoso curso de Aprendizado Profundo para estudantes do ensino médio interessados ​​em programação e matemática, bem como para estudantes que desejam iniciar um aprendizado profundo.

O objetivo do curso é introduzir os princípios básicos da aprendizagem profunda (redes neurais) em um formato interativo e no exemplo de tarefas práticas.

Programa do curso


  1. Python: básico, Google Colab;
  2. Introdução à álgebra linear. Vetores. Matrizes e operações com elas. Biblioteca NumPy;
  3. Bibliotecas Pandas e MatPlotlib. Noções básicas de aprendizado de máquina;
  4. Elementos da teoria da otimização. Gradiente Descida de gradiente. Modelos lineares;
  5. Introdução à aprendizagem profunda. Perceptron. Um neurônio com um sigmóide (e outras funções de ativação). Noções básicas de POO em Python;
  6. Biblioteca PyTorch. Redes neurais multicamadas;
  7. Treinar redes neurais na prática. Cifar10, nãoMNIST;
  8. Redes neurais convolucionais. Camada convolucional. Camada de pool;
  9. A prática de treinar redes neurais. Classificação dos sinais de trânsito;
  10. Transferir aprendizado. Popular em arquitetura de visão computacional;
  11. Segmentação de imagem. Rede U;
  12. Competição no Kaggle;
  13. Detecção de Objetos YOLOv3;
  14. GAN clássico. Transferência de estilo neural;
  15. Métodos básicos de processamento de texto;
  16. Incorporação de palavras;
  17. Redes neurais recorrentes;
  18. Células LSTM, GRU;
  19. Modelos de linguagem;
  20. Tradução automática
  21. Text2Speech;
  22. SuperResolução.

Você também pode dar uma olhada no canal do YouTube da Deep Learning School. Existem muitos vídeos ótimos;)

Com isso, nossa pequena seleção de exemplos de processamento de dados chegou ao fim. Espero que você tenha aprendido algo novo para si mesmo. Como é habitual em Habré, gostei do post - coloque um plus. Não se esqueça de compartilhar com os colegas. Além disso, se você tiver algo que possa compartilhar, escreva nos comentários. Mais informações sobre aprendizado de máquina e ciência de dados em Habré e no canal de telegrama Neuron (@neurondata).

Todo conhecimento!

Source: https://habr.com/ru/post/pt460557/


All Articles