Las matemáticas son la piedra angular de la ciencia de datos. Aunque algunos teoremas, axiomas y fórmulas parecen demasiado abstractos y distantes de la práctica, de hecho, sin ellos es imposible analizar y sistematizar realmente grandes conjuntos de datos.
Las siguientes áreas de las matemáticas son importantes para un especialista en ciencia de datos:
- estadísticas;
- teoría de probabilidad;
- análisis matemático;
- álgebra lineal
En un artículo anterior,
"Ciencia de datos: libros de nivel básico
", Plarium Krasnodar recomendó literatura sobre programación en Python, así como la visualización de resultados y el aprendizaje automático. En este artículo, ofrecen una selección de materiales matemáticos y libros útiles en Data Science.

Estadística y teoría de la probabilidad
Es difícil sobreestimar la importancia del conocimiento de las estadísticas para Data Scientist en cualquier nivel. Todo el aprendizaje automático clásico se basa en el aprendizaje estadístico. Además, las pruebas estándar A / B se basan en ello.
Fuentes de inspiración:
Todas las estadísticas
Larry wassermanComo el propio autor escribe: "Este libro es para personas que desean aprender probabilidad y estadísticas rápidamente".
El libro ofrece todas las disposiciones básicas de la teoría de la probabilidad y la estadística.
Conceptos básicos de estadística (3 partes)
Plataforma Educativa StepikCurso de estadística para principiantes. Cubre todos los conceptos elementales.
Fundamentos estadísticos sucintamente Katharine
Alexis Kormanik
Este libro ya se recomendó en un
artículo anterior, pero repetirlo no estará fuera de lugar. :-)
Las primeras secciones proporcionan definiciones básicas con ilustraciones y comentarios, la última revela la importancia de las pruebas T y Z. Los materiales se presentan en un lenguaje accesible, con el mínimo aparato matemático necesario. Esta guía es una excelente introducción a las estadísticas desde un punto de vista práctico.
Teoría de la probabilidad y estadística matemática
N. Sh. KremerEl libro de texto está dirigido a economistas, por lo que la complejidad y la profundidad de los conceptos no impactan al principiante en Data Science. Adecuado para aprender lo básico antes de sumergirse en literatura especializada.
Teoría de la probabilidad y estadística matemática
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. SirotinEste curso básico proporciona información más profunda que la anterior. Excepto
La teoría incluye ejercicios prácticos y materiales de referencia.
Conceptos básicos de teoría de probabilidad y estadística matemática.
M. Ya. Kelbert, Yu. M. SukhovUna gran opción para aquellos que ya están familiarizados con el tema y desean obtener un conocimiento más profundo.
Análisis matemático
A primera vista, esta dirección se necesita más dentro de los muros de las universidades, pero sin ella no será posible lidiar con la propagación hacia atrás o dominar un curso de aprendizaje profundo de manera cualitativa.
Llenando los vacíos en las estadísticas, es hora de comenzar a estudiar los materiales en esta sección. Y hay muchos de ellos.
Cálculo
edXUn curso del Instituto de Tecnología de Massachusetts, que consta de 3 partes:
- Cálculo 1A: Diferenciación: un curso sobre cómo encontrar una derivada, su interpretación geométrica y su significado físico.
- Cálculo 1B: Integración: un curso sobre cómo encontrar la integral, su relación con la derivada y la aplicación en diseño de ingeniería, análisis científico, teoría de probabilidad y estadística.
- Cálculo 1C: Sistemas de coordenadas y series infinitas: un curso sobre cálculo de curvas, sistemas de coordenadas, funciones aproximadas a polinomios y series infinitas. Todo esto es necesario para construir modelos matemáticos del mundo real.
Cálculo uno
Plataforma educativa CourseraEl curso está dirigido a principiantes, pero una presentación conveniente del material ayudará a refrescar la memoria de un científico de datos experimentado.
Academia Khan
Plataforma educativaUna variedad de materiales presentados en el recurso son perfectos para comenzar un estudio de matemáticas, programación y ciencias de la computación.
Cálculo
James stewartEl libro es famoso por su contenido cuidadosamente diseñado y su lenguaje bastante simple.
Curso de análisis matemático
L. D. KudryavtsevPara aquellos que desean obtener un conocimiento más fundamental sobre cálculo diferencial e integral, teoría de series, análisis funcional y armónico.
También puede prestar atención a dos cursos del MIT:
- Cálculo de variable única : un curso para el estudio independiente de diferenciación, cálculo integral y series infinitas.
- El cálculo multivariable es otro curso para el estudio independiente de la diferenciación, así como el cálculo integral y vectorial de funciones de varias variables.
Álgebra lineal
Sin esta sección de matemáticas, no será posible desarrollar métodos de aprendizaje automático, simular el comportamiento de varios objetos u optimizar el proceso de agrupación y reducir la dimensionalidad de las descripciones de datos.
Álgebra lineal
Georgi E. ShilovEl libro de texto contiene un material bien desarrollado. El libro es adecuado para estudiar un curso introductorio de álgebra lineal.
Álgebra lineal
V. A. Ilyin, E. G. Poznyak
Este libro de texto fue escrito sobre la base de conferencias de profesores del Departamento de Física de la Universidad Estatal de Moscú. Todos los materiales se presentan en un lenguaje accesible y son adecuados para el estudio en profundidad de las teorías básicas del álgebra lineal.
Y finalmente, otra recomendación es el curso de capacitación de
Álgebra Lineal del MIT. Revela la teoría de las matrices y las posiciones del álgebra lineal.