A matemática é a pedra angular da ciência de dados. Embora alguns teoremas, axiomas e fórmulas pareçam muito abstratos e longe da prática, de fato, sem eles, é impossível analisar e sistematizar verdadeiramente grandes conjuntos de dados.
As seguintes áreas da matemática são importantes para um especialista em ciência de dados:
- estatísticas;
- teoria das probabilidades;
- análise matemática;
- álgebra linear.
Em um artigo anterior,
“Ciência de dados: livros de nível básico
”, Plarium Krasnodar recomendou literatura sobre programação em Python, além de visualização de resultados e aprendizado de máquina. Neste artigo, eles oferecem uma seleção de materiais matemáticos e livros úteis em Data Science.

Estatística e teoria das probabilidades
É difícil superestimar a importância do conhecimento de estatística para o Data Scientist em qualquer nível. Todo o aprendizado de máquina clássico é baseado no aprendizado estatístico. Além disso, os testes A / B padrão são baseados nele.
Fontes de inspiração:
Todas as estatísticas
Larry wassermanComo o próprio autor escreve: "Este livro é para pessoas que querem aprender probabilidades e estatísticas rapidamente".
O livro fornece todas as disposições básicas da teoria da probabilidade e estatística.
Noções básicas de estatística (3 partes)
Stepik Education PlatformCurso de estatística para iniciantes. Abrange todos os conceitos elementares.
Fundamentos da estatística sucintamente Katharine
Alexis Kormanik
Este livro já foi recomendado em um
artigo anterior, mas a repetição não ficará fora de lugar. :-)
As primeiras seções fornecem definições básicas com ilustrações e comentários; a última revela a importância dos testes T e Z. Os materiais são apresentados em linguagem acessível, com o aparato matemático mínimo necessário. Este guia é uma excelente introdução às estatísticas do ponto de vista prático.
Teoria da Probabilidade e Estatística Matemática
N. Sh. KremerO livro é voltado para economistas, portanto a complexidade e a profundidade dos conceitos não chocam o iniciante em Ciência de Dados. Apropriado para aprender o básico antes de mergulhar na literatura especializada.
Teoria da Probabilidade e Estatística Matemática
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. SirotinEste curso básico fornece informações mais profundas do que o anterior. Exceto
A teoria inclui exercícios práticos e materiais de referência.
Conceitos básicos de teoria das probabilidades e estatística matemática
M. Ya. Kelbert, Yu. M. SukhovUma ótima opção para quem já está familiarizado com o tópico e deseja obter um conhecimento mais profundo.
Análise matemática
À primeira vista, essa direção é necessária mais dentro dos muros das universidades, mas sem ela não será possível lidar com a retropropagação ou dominar um curso de aprendizado profundo de maneira qualitativa.
Preenchendo as lacunas nas estatísticas, é hora de começar a estudar os materiais nesta seção. E há muitos deles.
Cálculo
edXUm curso do Instituto de Tecnologia de Massachusetts, composto por 3 partes:
- Cálculo 1A: Diferenciação - um curso para encontrar uma derivada, sua interpretação geométrica e significado físico.
- Cálculo 1B: Integração - curso sobre como encontrar a integral, sua relação com a derivada e aplicação em projetos de engenharia, análise científica, teoria das probabilidades e estatística.
- Cálculo 1C: Sistemas de Coordenadas e Séries Infinitas - um curso sobre o cálculo de curvas, sistemas de coordenadas, funções de aproximação a polinômios e séries infinitas. Tudo isso é necessário para construir modelos matemáticos do mundo real.
Cálculo um
Plataforma educacional CourseraO curso é voltado para iniciantes, mas uma apresentação conveniente do material ajudará a refrescar a memória do experiente Data Scientist.
Khan academy
Plataforma educacionalUma variedade de materiais apresentados no recurso é perfeita para iniciar um estudo de matemática, programação e ciência da computação.
Cálculo
James stewartO livro é famoso por seu conteúdo cuidadosamente projetado e linguagem bastante simples.
Curso de Análise Matemática
L. D. KudryavtsevPara quem deseja obter conhecimentos mais fundamentais sobre cálculo diferencial e integral, teoria de séries, análise funcional e harmônica.
Você também pode prestar atenção a dois cursos do MIT:
- Cálculo de variável única - um curso para estudo independente de diferenciação, cálculo integral e séries infinitas.
- Cálculo multivariável é outro curso para estudo independente de diferenciação, bem como cálculo integral e vetorial de funções de várias variáveis.
Álgebra linear
Sem essa seção da matemática, não será possível desenvolver métodos de aprendizado de máquina, simular o comportamento de vários objetos ou otimizar o processo de agrupamento e reduzir a dimensionalidade das descrições de dados.
Álgebra linear
Georgi E. ShilovO livro contém um material bem desenvolvido. O livro é adequado para o estudo de um curso introdutório em álgebra linear.
Álgebra linear
V. A. Ilyin, E. G. Poznyak
Este livro foi escrito com base em palestras de professores do Departamento de Física da Universidade Estadual de Moscou. Todos os materiais são apresentados em um idioma acessível e são adequados para um estudo aprofundado das teorias básicas da álgebra linear.
E, finalmente, outra recomendação é o curso de treinamento em
Álgebra Linear do MIT. Ele revela a teoria das matrizes e as posições da álgebra linear.