Matemáticas para el científico de datos: secciones necesarias

Las matemáticas son la piedra angular de la ciencia de datos. Aunque algunos teoremas, axiomas y fórmulas parecen demasiado abstractos y distantes de la práctica, de hecho, sin ellos es imposible analizar y sistematizar realmente grandes conjuntos de datos.

Las siguientes √°reas de las matem√°ticas son importantes para un especialista en ciencia de datos:

  • estad√≠sticas;
  • teor√≠a de probabilidad;
  • an√°lisis matem√°tico;
  • √°lgebra lineal

En un art√≠culo anterior, "Ciencia de datos: libros de nivel b√°sico ", Plarium Krasnodar recomend√≥ literatura sobre programaci√≥n en Python, as√≠ como la visualizaci√≥n de resultados y el aprendizaje autom√°tico. En este art√≠culo, ofrecen una selecci√≥n de materiales matem√°ticos y libros √ļtiles en Data Science.



Estadística y teoría de la probabilidad


Es difícil sobreestimar la importancia del conocimiento de las estadísticas para Data Scientist en cualquier nivel. Todo el aprendizaje automático clásico se basa en el aprendizaje estadístico. Además, las pruebas estándar A / B se basan en ello.

Fuentes de inspiración:



Todas las estadísticas
Larry wasserman

Como el propio autor escribe: "Este libro es para personas que desean aprender probabilidad y estadísticas rápidamente".

El libro ofrece todas las disposiciones básicas de la teoría de la probabilidad y la estadística.



Conceptos básicos de estadística (3 partes)
Plataforma Educativa Stepik

Curso de estadística para principiantes. Cubre todos los conceptos elementales.



Fundamentos estadísticos sucintamente Katharine
Alexis Kormanik

Este libro ya se recomendó en un artículo anterior, pero repetirlo no estará fuera de lugar. :-)

Las primeras secciones proporcionan definiciones b√°sicas con ilustraciones y comentarios, la √ļltima revela la importancia de las pruebas T y Z. Los materiales se presentan en un lenguaje accesible, con el m√≠nimo aparato matem√°tico necesario. Esta gu√≠a es una excelente introducci√≥n a las estad√≠sticas desde un punto de vista pr√°ctico.



Teoría de la probabilidad y estadística matemática
N. Sh. Kremer

El libro de texto est√° dirigido a economistas, por lo que la complejidad y la profundidad de los conceptos no impactan al principiante en Data Science. Adecuado para aprender lo b√°sico antes de sumergirse en literatura especializada.



Teoría de la probabilidad y estadística matemática
A.I. Kibzun, E.R. Goryainova, A.V. Naumov, A.N. Sirotin

Este curso básico proporciona información más profunda que la anterior. Excepto
La teoría incluye ejercicios prácticos y materiales de referencia.



Conceptos básicos de teoría de probabilidad y estadística matemática.
M. Ya. Kelbert, Yu. M. Sukhov

Una gran opción para aquellos que ya están familiarizados con el tema y desean obtener un conocimiento más profundo.

An√°lisis matem√°tico


A primera vista, esta dirección se necesita más dentro de los muros de las universidades, pero sin ella no será posible lidiar con la propagación hacia atrás o dominar un curso de aprendizaje profundo de manera cualitativa.

Llenando los vacíos en las estadísticas, es hora de comenzar a estudiar los materiales en esta sección. Y hay muchos de ellos.



C√°lculo
edX

Un curso del Instituto de Tecnología de Massachusetts, que consta de 3 partes:

  • C√°lculo 1A: Diferenciaci√≥n: un curso sobre c√≥mo encontrar una derivada, su interpretaci√≥n geom√©trica y su significado f√≠sico.
  • C√°lculo 1B: Integraci√≥n: un curso sobre c√≥mo encontrar la integral, su relaci√≥n con la derivada y la aplicaci√≥n en dise√Īo de ingenier√≠a, an√°lisis cient√≠fico, teor√≠a de probabilidad y estad√≠stica.
  • C√°lculo 1C: Sistemas de coordenadas y series infinitas: un curso sobre c√°lculo de curvas, sistemas de coordenadas, funciones aproximadas a polinomios y series infinitas. Todo esto es necesario para construir modelos matem√°ticos del mundo real.



C√°lculo uno
Plataforma educativa Coursera

El curso está dirigido a principiantes, pero una presentación conveniente del material ayudará a refrescar la memoria de un científico de datos experimentado.



Academia Khan
Plataforma educativa

Una variedad de materiales presentados en el recurso son perfectos para comenzar un estudio de matemáticas, programación y ciencias de la computación.



C√°lculo
James stewart

El libro es famoso por su contenido cuidadosamente dise√Īado y su lenguaje bastante simple.



Curso de an√°lisis matem√°tico
L. D. Kudryavtsev

Para aquellos que desean obtener un conocimiento más fundamental sobre cálculo diferencial e integral, teoría de series, análisis funcional y armónico.

También puede prestar atención a dos cursos del MIT:
  1. C√°lculo de variable √ļnica : un curso para el estudio independiente de diferenciaci√≥n, c√°lculo integral y series infinitas.
  2. El cálculo multivariable es otro curso para el estudio independiente de la diferenciación, así como el cálculo integral y vectorial de funciones de varias variables.

√Ālgebra lineal


Sin esta sección de matemáticas, no será posible desarrollar métodos de aprendizaje automático, simular el comportamiento de varios objetos u optimizar el proceso de agrupación y reducir la dimensionalidad de las descripciones de datos.



√Ālgebra lineal
Georgi E. Shilov

El libro de texto contiene un material bien desarrollado. El libro es adecuado para estudiar un curso introductorio de √°lgebra lineal.



√Ālgebra lineal
V. A. Ilyin, E. G. Poznyak

Este libro de texto fue escrito sobre la base de conferencias de profesores del Departamento de F√≠sica de la Universidad Estatal de Mosc√ļ. Todos los materiales se presentan en un lenguaje accesible y son adecuados para el estudio en profundidad de las teor√≠as b√°sicas del √°lgebra lineal.

Y finalmente, otra recomendaci√≥n es el curso de capacitaci√≥n de √Ālgebra Lineal del MIT. Revela la teor√≠a de las matrices y las posiciones del √°lgebra lineal.

Source: https://habr.com/ru/post/442772/


All Articles