Hoja de ruta de disciplinas matemáticas para el aprendizaje automático, parte 1

En lugar del prólogo


Supongamos que, sentado en un cálido sillón por la noche, se le ocurrió una idea loca: "Hmm, ¿por qué no descubro por qué los hiperparámetros de la modelo se seleccionan al azar y por qué todo funciona?"

Esta es una pendiente resbaladiza: cree que un par de noches con una lectura pausada del capítulo "Aprendizaje profundo" o clips de YouTube de 5 minutos de varios MOOC son suficientes; de hecho, para crear comprensión, y no su ilusión, se requiere una cantidad de tiempo decente (bueno, ciertamente no menos de seis meses para los más fanáticos); pero lo más triste es que el beneficio de este evento no es obvio: afortunadamente (o desafortunadamente), el mundo no está organizado de acuerdo con las leyes de las matemáticas, y si eres doctor en física tres veces, algunos modelos funcionarán mejor solo si arrojas tienen más datos preprocesados ​​o crean un gran conjunto.

Considero que es mi deber advertirle que este es un camino curvo, y es posible que las inversiones en matemáticas no valgan la pena tan pronto como nos gustaría. Pero las matemáticas son interesantes en sí mismas, independientemente de las aplicaciones. Además, si está interesado y lo que sucede en esta caja negra con hiperparámetros, esto significa que las matemáticas probablemente no le sean indiferentes.

Algo más sobre mis recomendaciones: no me gusta la literatura matemática, que está repleta de índices, perlas como "a_ijk con tres guiones bajos y un sombrero conjugado". Creo que las ideas son más importantes que las conclusiones rigurosas. Al mismo tiempo, las ideas no deberían caer en "manos", todo debería ser bastante estricto. No me gustan los libros como Bourbaki y Knut. En mi opinión, estos libros están destinados a cualquier cosa, pero no para leer y no para estudiar el tema. Son buenos como enlaces y como enciclopedias.

Al final, citaré algo de Bertrand Russell:
Euclides despreciaba la utilidad práctica que introdujo Platón. Dicen que un estudiante, después de escuchar la evidencia, le preguntó qué ganó al estudiar geometría; entonces Euclides llamó a un esclavo y dijo: "Dale al joven un centavo, porque ciertamente debe beneficiarse de lo que estudia".
Ahora pasaré a la parte principal.

Prerrequisitos


  1. Supongo que estás más o menos orientado en un curso escolar de matemáticas.
  2. Supongo que no está completamente en inglés con "usted", ya que una gran cantidad de buena literatura y cursos están escritos y narrados en ese idioma. El inglés matemático no da tanto miedo como el inglés en general; Este es un vocabulario bastante limitado con oraciones estándar, sin una mezcla de tiempo, sin una explosión de colores, etc.
  3. Supongo que tienes una cuerda con la que puedes atarte a una silla.

Niveles de dificultad


No es ningún secreto que se ha escrito mucha literatura sobre cada disciplina matemática y, a veces, incluso la simple elección del libro correcto se convierte en un problema. Destacaré varios niveles de complejidad en la literatura en los que sabía dónde meterse y dónde escalar (hasta ahora) no era necesario (o a qué puede recurrir para obtener información más completa).

  1. Adelante, el caballo de batalla principal; Estos son libros que se llaman "must have".
  2. Me duele mucho : un nivel más alto, le permite mirar el nivel 1 desde una vista de pájaro, sistematiza el conocimiento, combina diferentes áreas de conocimiento.
  3. Pesadilla : para los fuertes de espíritu, el nivel de mehmat, para los amantes de las matemáticas y las torres de marfil.

Hoja de ruta




Realmente pasaré a cursos específicos.

Análisis, él es cálculo


Se le enseña de manera bastante interesante en las universidades rusas: la mayoría de ellas, varios años después del final del curso, recuerdan vagamente solo algunas integrales allí, y parece que hay algo más. Y esto a pesar del hecho de que el análisis es una disciplina, de hecho, una de las fundamentales en las matemáticas en general. Como regla, no hay puentes entre la teoría y la práctica, y este curso, como una isla voladora, flota en algún lugar de la cabeza, completamente divorciado de la vida real. Es necesario superar esto resolviendo problemas, además, no solo desde el campo de las matemáticas, sino que también es deseable algo de la "vida real".

¿Qué necesitas saber del análisis?


Lo principal que necesitaremos son los conceptos de límite, continuidad, derivada, función de muchas variables, gradiente, integral, integral con límite superior variable, integral multidimensional *.

Literatura


Vamos : todo es más o menos estándar aquí: Piskunov / Fichtenholtz .
Herirme mucho : Zorich, Volumen 1 . Amo este libro muchísimo; Este no es un libro de texto, sino una novela en fórmulas, algo así como Eugene Onegin. Desafortunadamente, es más complicado que los cursos de análisis estándar debido al hecho de que muchas cosas en él se dan de manera más general, y necesita acostumbrarse; pero debido a esta comunidad, muchas cosas dispares están unidas (ver los mismos límites en la base).
Pesadilla : Zorich Volumen 1 + Volumen 2, Rudin "Fundamentos del análisis matemático", Lviv "Conferencias sobre análisis matemático", Ramanan "Cálculo global".

En general, el resumen aquí es el siguiente: la literatura de análisis, incluso en ruso, está completa; Los libros de texto tienden a ser puramente matemáticos. Como complemento de los libros de texto de nivel 2-3, puedo aconsejar varios cursos:


No examiné los cursos de la sala de conferencias MIPT sobre análisis, pero para completar, también daré:


Practica


Practicar y aplicar los conocimientos adquiridos no solo es "opcional", sino estrictamente obligatorio, de lo contrario, toda la teoría dependerá de usted con un peso muerto, y rápidamente se hundirá hasta el fondo sin siquiera darse cuenta.

Propongo considerar las siguientes opciones: Demidovich, conjuntos de problemas de los cursos del MIT (https://ocw.mit.edu/courses/mathematics/18-01sc-single-variable-calculus-fall-2010/index.htm)

Álgebra lineal


Pan diario para Data Science y para Science en general. Desafortunadamente, las personas han aprendido a resolver bien solo ecuaciones lineales y sus sistemas; Para las ecuaciones de grado 2 y superiores, hay todo tipo de teorías muy no triviales (álgebra conmutativa, geometría algebraica y otras similares). Por lo tanto, en el análisis de datos, se utilizan principalmente modelos lineales (o modelos lineales generalizados, como regresiones logísticas, perceptrones, etc.).

Hay muchos libros sobre álgebra lineal en ruso. El problema es que están escritos para matemáticos, o hay deprimentemente muchos índices en ellos (y no hay bosque visible detrás de los árboles). A menudo, el énfasis en los cursos universitarios está en la forma de Jordan; a menudo no se mencionan otras formas estándar; hay Gauss y estúpido Kramer, pero rara vez lo que sucede con LU, con SVD.

¿Qué necesitas saber de álgebra lineal?


El concepto de vector y espacio vectorial; el concepto de un operador lineal; comunicación de operadores y matrices; descomposiciones matriciales (LU, SVD al menos); vectores propios y valores propios; operadores unitarios ortogonales; operadores simétricos y hermitianos; formas cuadráticas, reducción a los ejes principales.

Literatura


Adelante : el curso OCW-MIT de Gilbert Strang sobre álgebra lineal + su libro .
ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/index.htm

Lo mejor de este curso es la falta de teoremas "complejos" y bastante estúpidos de álgebra lineal, todo tipo de espacios duales, una gran cantidad de problemas en el libro, un enfoque orientado a la práctica (no "qué es", sino "cómo calcularlo"). Más cursos explicativos de álgebra lineal que aún no he conocido.

Herirme mucho : Axler "Álgebra lineal bien hecho"; Gelfand "Conferencias sobre álgebra lineal "; Curso MIPT lectoriy.mipt.ru/course/LinearAlgebra ; Kostrikin "Introducción al álgebra, parte 2", Tyrtyshnikov "Análisis matricial y álgebra lineal".

El problema con los libros y cursos de este nivel de complejidad es que están orientados teóricamente. Hay funciones lineales y espacios duales, pero no hay una matriz de proyección en el subespacio y métodos prácticos para calcular valores propios. Lo más probable es que los cursos de este nivel tengan que complementarse con una práctica sólida; por ejemplo, por métodos numéricos de álgebra lineal.

Sobre el último libro por separado. En mi opinión, este es uno de los libros más exitosos en ruso sobre álgebra lineal en el sentido de que no está muy divorciado de la práctica; al mismo tiempo, contiene todo tipo de temas "avanzados". Hasta cierto punto, puede reemplazar completamente las conferencias de Strang, pero debe complementarse con tareas simples para "llenar su mano". Hay problemas en este libro, pero son bastante graves.

Pesadilla : Kostrikin-Manin "Álgebra lineal y geometría", Shafarevich-Remizov "Álgebra lineal y geometría".

En general, hay mucha buena literatura en ruso, especialmente en el último nivel, pero adolece de una complejidad excesiva.

Practica


Como en el primer caso, se requiere práctica. Go SVD: aprenda la compresión de imágenes. Realice las multiplicaciones matriciales: aprenda la transformación rápida de Fourier, el algoritmo de Strassen; resolver muchos problemas (por ejemplo, de los libros de problemas de Kostrikin o Proskuryakov ); escribe tu descomposición LU, Gauss. Para los más persistentes, puedo ofrecer libros maravillosos sobre métodos numéricos de álgebra lineal, como Trefethen, Bau "NÚMERO DE ÁLGEBRA LINEAL"; Horn, Johnson "Matrix Analysis" . Estos libros serán útiles, en primer lugar, para "rellenar" sus manos; en segundo lugar, quedará claro de inmediato que muchos métodos teóricos se dividen en chips sobre la prosa de la vida (precisión de la máquina, inestabilidad de los métodos, trabajo con matrices dispersas).

Matemática discreta


Otra ballena de CS moderno. Aquí estamos interesados ​​principalmente en la combinatoria y los fundamentos de la teoría de grafos.

¿Qué necesitas saber de la teoría combinatoria y gráfica?


Coeficientes binomiales, sus asintóticos; gráficos arboles búsqueda de profundidad y amplitud; relaciones de recurrencia y sus soluciones;

Literatura


Adelante : Anderson J. "Matemática discreta y combinatoria"; Haggarti, Schlipf J., Whitesides S. "Matemáticas discretas para programadores", Ore O. "Gráficos y su aplicación" .

Los primeros dos libros, excelentes Talmuds en matemáticas discretas, cubren casi todas las preguntas que necesita saber.

Me lastimé mucho : Graham, Knut, Patashnik "Matemáticas concretas", Harari "Teoría de grafos", Mineral "Teoría de grafos".

Pesadilla : Sachkov "Introducción a los métodos combinatorios de matemática discreta", Omelchenko "Teoría de grafos".

Practica


Como regla general, se incluye una gran cantidad de problemas en los libros de texto sobre combinatoria; deben ser resueltos. De hecho, toda la combinatoria es el arte de resolver varios problemas, en lugar de una teoría única.

Source: https://habr.com/ru/post/es432670/


All Articles