Matemática para cientista de dados: seções necessárias

A matemática é a pedra angular da ciência de dados. Embora alguns teoremas, axiomas e fórmulas pareçam muito abstratos e longe da prática, de fato, sem eles, é impossível analisar e sistematizar verdadeiramente grandes conjuntos de dados.

As seguintes áreas da matemática são importantes para um especialista em ciência de dados:

  • estatísticas;
  • teoria das probabilidades;
  • análise matemática;
  • álgebra linear.

Em um artigo anterior, “Ciência de dados: livros de nível básico ”, Plarium Krasnodar recomendou literatura sobre programação em Python, além de visualização de resultados e aprendizado de máquina. Neste artigo, eles oferecem uma seleção de materiais matemáticos e livros úteis em Data Science.



Estatística e teoria das probabilidades


É difícil superestimar a importância do conhecimento de estatística para o Data Scientist em qualquer nível. Todo o aprendizado de máquina clássico é baseado no aprendizado estatístico. Além disso, os testes A / B padrão são baseados nele.

Fontes de inspiração:



Todas as estatísticas
Larry wasserman

Como o próprio autor escreve: "Este livro é para pessoas que querem aprender probabilidades e estatísticas rapidamente".

O livro fornece todas as disposições básicas da teoria da probabilidade e estatística.



Noções básicas de estatística (3 partes)
Stepik Education Platform

Curso de estatística para iniciantes. Abrange todos os conceitos elementares.



Fundamentos da estatística sucintamente Katharine
Alexis Kormanik

Este livro já foi recomendado em um artigo anterior, mas a repetição não ficará fora de lugar. :-)

As primeiras seções fornecem definições básicas com ilustrações e comentários; a última revela a importância dos testes T e Z. Os materiais são apresentados em linguagem acessível, com o aparato matemático mínimo necessário. Este guia é uma excelente introdução às estatísticas do ponto de vista prático.



Teoria da Probabilidade e Estatística Matemática
N. Sh. Kremer

O livro é voltado para economistas, portanto a complexidade e a profundidade dos conceitos não chocam o iniciante em Ciência de Dados. Apropriado para aprender o básico antes de mergulhar na literatura especializada.



Teoria da Probabilidade e Estatística Matemática
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. Sirotin

Este curso básico fornece informações mais profundas do que o anterior. Exceto
A teoria inclui exercícios práticos e materiais de referência.



Conceitos básicos de teoria das probabilidades e estatística matemática
M. Ya. Kelbert, Yu. M. Sukhov

Uma ótima opção para quem já está familiarizado com o tópico e deseja obter um conhecimento mais profundo.

Análise matemática


À primeira vista, essa direção é necessária mais dentro dos muros das universidades, mas sem ela não será possível lidar com a retropropagação ou dominar um curso de aprendizado profundo de maneira qualitativa.

Preenchendo as lacunas nas estatísticas, é hora de começar a estudar os materiais nesta seção. E há muitos deles.



Cálculo
edX

Um curso do Instituto de Tecnologia de Massachusetts, composto por 3 partes:

  • Cálculo 1A: Diferenciação - um curso para encontrar uma derivada, sua interpretação geométrica e significado físico.
  • Cálculo 1B: Integração - curso sobre como encontrar a integral, sua relação com a derivada e aplicação em projetos de engenharia, análise científica, teoria das probabilidades e estatística.
  • Cálculo 1C: Sistemas de Coordenadas e Séries Infinitas - um curso sobre o cálculo de curvas, sistemas de coordenadas, funções de aproximação a polinômios e séries infinitas. Tudo isso é necessário para construir modelos matemáticos do mundo real.



Cálculo um
Plataforma educacional Coursera

O curso é voltado para iniciantes, mas uma apresentação conveniente do material ajudará a refrescar a memória do experiente Data Scientist.



Khan academy
Plataforma educacional

Uma variedade de materiais apresentados no recurso é perfeita para iniciar um estudo de matemática, programação e ciência da computação.



Cálculo
James stewart

O livro é famoso por seu conteúdo cuidadosamente projetado e linguagem bastante simples.



Curso de Análise Matemática
L. D. Kudryavtsev

Para quem deseja obter conhecimentos mais fundamentais sobre cálculo diferencial e integral, teoria de séries, análise funcional e harmônica.

Você também pode prestar atenção a dois cursos do MIT:
  1. Cálculo de variável única - um curso para estudo independente de diferenciação, cálculo integral e séries infinitas.
  2. Cálculo multivariável é outro curso para estudo independente de diferenciação, bem como cálculo integral e vetorial de funções de várias variáveis.

Álgebra linear


Sem essa seção da matemática, não será possível desenvolver métodos de aprendizado de máquina, simular o comportamento de vários objetos ou otimizar o processo de agrupamento e reduzir a dimensionalidade das descrições de dados.



Álgebra linear
Georgi E. Shilov

O livro contém um material bem desenvolvido. O livro é adequado para o estudo de um curso introdutório em álgebra linear.



Álgebra linear
V. A. Ilyin, E. G. Poznyak

Este livro foi escrito com base em palestras de professores do Departamento de Física da Universidade Estadual de Moscou. Todos os materiais são apresentados em um idioma acessível e são adequados para um estudo aprofundado das teorias básicas da álgebra linear.

E, finalmente, outra recomendação é o curso de treinamento em Álgebra Linear do MIT. Ele revela a teoria das matrizes e as posições da álgebra linear.

Source: https://habr.com/ru/post/pt442772/


All Articles