Ciência de dados: livros básicos

Ciência de dados - ciência de dados que surgiu no cruzamento de várias áreas amplas: programação, matemática e aprendizado de máquina. Isso se deve ao alto limiar de ingresso na profissão e à necessidade de receber constantemente novos conhecimentos.

As principais habilidades para iniciantes são:

  • capacidade de escrever código (Python);
  • capacidade de visualizar seus resultados;
  • compreensão do que está acontecendo "sob o capô".

Os livros que os especialistas da Plarium Krasnodar selecionaram para leitores com conhecimentos básicos em ciência de dados estão divididos nessas três categorias.



Python


Algumas pessoas procuram por si mesmas em R, mas o caminho da verdade está no Python. Os seguintes livros são uma ótima opção para estudar.



Truques em Python: O Livro
Dan bader

O livro trata de vários truques e utilidades que ajudam a tornar-se mais produtivo e a programar melhor.

Estamos falando dos tipos de dados básicos da linguagem Python e das abordagens para escrever código - do OOP ao trabalho com dependências. Vale a pena ler para iniciantes e para quem quiser refrescar sua memória com desenhos pitônicos típicos.



Python de alto desempenho: programação de desempenho prático para humanos
Micha Gorelick, Ian Ozsvald

O livro descreve o idioma internamente. Ele fornece explicações sobre o trabalho do intérprete e da mecânica do código, os principais tipos de dados e como eles interagem com a memória. Este guia também ajudará você a entender como aproveitar os recursos ocultos do Python.

Visualização


Cada cientista de dados enfrenta a necessidade de apresentar o resultado de seu trabalho. E como você sabe, não há melhor maneira do que a visualização de alta qualidade. É aqui que gráficos de pizza sofisticados surgem ...



Contar histórias com dados: um guia de visualização de dados para profissionais de negócios
Cole nussbaumer knaflic

Um livro maravilhoso sobre como visualizar seus resultados de maneira qualitativa. Nele, o ex-googler descreve detalhadamente todas as etapas da criação dos gráficos corretos e fornece contra-exemplos.

Você também pode visitar o site do autor, que coletou um grande número de opções para apresentar dados dos melhores especialistas. Obviamente, instruções passo a passo para criar um trabalho perfeito não podem ser encontradas aqui - e onde você o encontrará!



O grande livro de painéis. Visualizando seus dados usando cenários de negócios do mundo real
Steve Wexler, Jeffrey Shaffer e Andy Cotgreave

A visualização de dados é um trabalho minucioso, mas quando você sabe como deve ser o ideal, entende o que precisa se esforçar.

Essa é uma excelente seleção de painéis para todas as ocasiões, nas quais as soluções são recomendadas para praticamente qualquer tarefa comercial. Infelizmente, nada é dito sobre a implementação no Tableau - apenas os componentes visuais e uma explicação de qual é a melhor e por que é melhor.

Algoritmos ML


Essa é a área em que é relativamente fácil entender o que os algoritmos fazem, mas é muito difícil obter domínio.



Aprendizado prático da máquina com o Scikit-Learn e o fluxo tensor: conceitos, ferramentas e técnicas para criar sistemas inteligentes
Aurélien géron

O livro pode ser recomendado com segurança para quem quiser entender como os modelos são construídos - de lineares a árvores. Na primeira parte, os princípios da operação dos algoritmos são descritos em uma linguagem acessível. Será especialmente útil para aqueles que estão apenas entrando na profissão. A segunda parte é dedicada ao TensorFlow.



Aprendizagem profunda. Imersão no mundo das redes neurais
S. Nikolenko, A. Kadurin, E. Arkhangelskaya

Quase toda a literatura de TI no mundo moderno é publicada em inglês, e o campo da ciência de dados não é exceção. Existe até uma expressão: “Quero me tornar um programador, que idioma aprender? Aprenda inglês primeiro. ”

Este é o único livro que vale a pena sobre Deep Learning e Redes Neurais, escrito por autores russos em russo. Além disso, é muito expressivo, com vários exemplos, várias histórias da ciência e referências a fontes (uma lista de referências neste trabalho é mais útil do que muitas publicações).



Os elementos do aprendizado estatístico: mineração de dados, inferência e previsão, segunda edição
Trevor Hastie, Robert Tibshirani, Jerome Friedman

Apenas uma leitura obrigatória em qualquer coleção de ciência de dados. Trabalho fundamental em algoritmos de aprendizado de máquina que podem ser usados ​​como um manual. Requer alguma preparação, adequada para um nível avançado.

Opcional




Fundamentos estatísticos de forma sucinta
Katharine Alexis Kormanik

Na série Sucintamente, pérolas são frequentemente encontradas, e essa é uma delas. No início do livro, estão as definições básicas com fotos e comentários, e o restante é dedicado à importância dos testes (testes T e Z).

Uma linguagem acessível e um mínimo de matemática (a quantidade necessária para entender) fazem deste manual uma excelente introdução à estatística do ponto de vista prático.



Trabalho Profundo: Regras para o Sucesso Focado em um Mundo Distraído
Cal newport

O autor fala sobre sua experiência e a experiência dos colegas ao trabalhar em uma tarefa com concentração máxima. O livro é lido com bastante facilidade e consiste em uma descrição da própria abordagem, vários exemplos e regras.

A idéia principal é que esse estado do cérebro nos permita alcançar o melhor desempenho e levar os resultados a um nível totalmente novo. O limite cerebral, infelizmente, é limitado, mas treinamos. Recomendamos que todos os leiam.

Source: https://habr.com/ru/post/pt435534/


All Articles