Matemáticas para el científico de datos: secciones necesarias

Las matemáticas son la piedra angular de la ciencia de datos. Aunque algunos teoremas, axiomas y fórmulas parecen demasiado abstractos y distantes de la práctica, de hecho, sin ellos es imposible analizar y sistematizar realmente grandes conjuntos de datos.

Las siguientes áreas de las matemáticas son importantes para un especialista en ciencia de datos:

  • estadísticas;
  • teoría de probabilidad;
  • análisis matemático;
  • álgebra lineal

En un artículo anterior, "Ciencia de datos: libros de nivel básico ", Plarium Krasnodar recomendó literatura sobre programación en Python, así como la visualización de resultados y el aprendizaje automático. En este artículo, ofrecen una selección de materiales matemáticos y libros útiles en Data Science.



Estadística y teoría de la probabilidad


Es difícil sobreestimar la importancia del conocimiento de las estadísticas para Data Scientist en cualquier nivel. Todo el aprendizaje automático clásico se basa en el aprendizaje estadístico. Además, las pruebas estándar A / B se basan en ello.

Fuentes de inspiración:



Todas las estadísticas
Larry wasserman

Como el propio autor escribe: "Este libro es para personas que desean aprender probabilidad y estadísticas rápidamente".

El libro ofrece todas las disposiciones básicas de la teoría de la probabilidad y la estadística.



Conceptos básicos de estadística (3 partes)
Plataforma Educativa Stepik

Curso de estadística para principiantes. Cubre todos los conceptos elementales.



Fundamentos estadísticos sucintamente Katharine
Alexis Kormanik

Este libro ya se recomendó en un artículo anterior, pero repetirlo no estará fuera de lugar. :-)

Las primeras secciones proporcionan definiciones básicas con ilustraciones y comentarios, la última revela la importancia de las pruebas T y Z. Los materiales se presentan en un lenguaje accesible, con el mínimo aparato matemático necesario. Esta guía es una excelente introducción a las estadísticas desde un punto de vista práctico.



Teoría de la probabilidad y estadística matemática
N. Sh. Kremer

El libro de texto está dirigido a economistas, por lo que la complejidad y la profundidad de los conceptos no impactan al principiante en Data Science. Adecuado para aprender lo básico antes de sumergirse en literatura especializada.



Teoría de la probabilidad y estadística matemática
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. Sirotin

Este curso básico proporciona información más profunda que la anterior. Excepto
La teoría incluye ejercicios prácticos y materiales de referencia.



Conceptos básicos de teoría de probabilidad y estadística matemática.
M. Ya. Kelbert, Yu. M. Sukhov

Una gran opción para aquellos que ya están familiarizados con el tema y desean obtener un conocimiento más profundo.

Análisis matemático


A primera vista, esta dirección se necesita más dentro de los muros de las universidades, pero sin ella no será posible lidiar con la propagación hacia atrás o dominar un curso de aprendizaje profundo de manera cualitativa.

Llenando los vacíos en las estadísticas, es hora de comenzar a estudiar los materiales en esta sección. Y hay muchos de ellos.



Cálculo
edX

Un curso del Instituto de Tecnología de Massachusetts, que consta de 3 partes:

  • Cálculo 1A: Diferenciación: un curso sobre cómo encontrar una derivada, su interpretación geométrica y su significado físico.
  • Cálculo 1B: Integración: un curso sobre cómo encontrar la integral, su relación con la derivada y la aplicación en diseño de ingeniería, análisis científico, teoría de probabilidad y estadística.
  • Cálculo 1C: Sistemas de coordenadas y series infinitas: un curso sobre cálculo de curvas, sistemas de coordenadas, funciones aproximadas a polinomios y series infinitas. Todo esto es necesario para construir modelos matemáticos del mundo real.



Cálculo uno
Plataforma educativa Coursera

El curso está dirigido a principiantes, pero una presentación conveniente del material ayudará a refrescar la memoria de un científico de datos experimentado.



Academia Khan
Plataforma educativa

Una variedad de materiales presentados en el recurso son perfectos para comenzar un estudio de matemáticas, programación y ciencias de la computación.



Cálculo
James stewart

El libro es famoso por su contenido cuidadosamente diseñado y su lenguaje bastante simple.



Curso de análisis matemático
L. D. Kudryavtsev

Para aquellos que desean obtener un conocimiento más fundamental sobre cálculo diferencial e integral, teoría de series, análisis funcional y armónico.

También puede prestar atención a dos cursos del MIT:
  1. Cálculo de variable única : un curso para el estudio independiente de diferenciación, cálculo integral y series infinitas.
  2. El cálculo multivariable es otro curso para el estudio independiente de la diferenciación, así como el cálculo integral y vectorial de funciones de varias variables.

Álgebra lineal


Sin esta sección de matemáticas, no será posible desarrollar métodos de aprendizaje automático, simular el comportamiento de varios objetos u optimizar el proceso de agrupación y reducir la dimensionalidad de las descripciones de datos.



Álgebra lineal
Georgi E. Shilov

El libro de texto contiene un material bien desarrollado. El libro es adecuado para estudiar un curso introductorio de álgebra lineal.



Álgebra lineal
V. A. Ilyin, E. G. Poznyak

Este libro de texto fue escrito sobre la base de conferencias de profesores del Departamento de Física de la Universidad Estatal de Moscú. Todos los materiales se presentan en un lenguaje accesible y son adecuados para el estudio en profundidad de las teorías básicas del álgebra lineal.

Y finalmente, otra recomendación es el curso de capacitación de Álgebra Lineal del MIT. Revela la teoría de las matrices y las posiciones del álgebra lineal.

Source: https://habr.com/ru/post/442772/


All Articles