Programación Probabilística y el Método Bayesiano para Hackers

Hola colegas Hoy queríamos preguntarle cómo exigió que encontrara el libro " Métodos bayesianos para hackers ", un poco anticuado, publicado en el original en 2015, pero aún no traducido al ruso.


El libro se posiciona como aplicado, tanto como sea posible deshacerse de las matemáticas y sin edad.

Debajo del corte hay una traducción ligeramente abreviada de la reseña de este libro publicada por el autor en Github.
Por favor vote

El método bayesiano es un enfoque natural para la conclusión lógica, sin embargo, en muchos libros sobre este tema, la esencia del método bayesiano se pierde por completo detrás de capítulos enteros de análisis matemáticos dolorosos. Un libro típico sobre teoría bayesiana comienza con dos o tres capítulos sobre teoría de probabilidad, después de lo cual se le dice cuál es la conclusión bayesiana. Desafortunadamente, debido a la imposibilidad de presentar la mayoría de los modelos bayesianos en un lenguaje matemático, solo se muestran ejemplos simples y artificiales al lector. Por lo tanto, una persona puede tener la impresión imaginaria de que supuestamente entendió la conclusión bayesiana, mientras que en realidad solo aprendió la interpretación del autor de este método.

Después de que los métodos bayesianos fueron claramente exitosos en las competencias de aprendizaje automático, decidí volver a explorar este tema. Incluso con mi bagaje matemático, pasé los tres días enteros estudiando ejemplos y tratando de juntar todos los fragmentos para tratar con todos los métodos. Para poner en práctica la teoría, simplemente no tenía suficiente literatura. Este malentendido surgió porque no pude cerrar la brecha entre las matemáticas bayesianas y la programación probabilística. Por lo tanto, he sufrido y quiero salvar a los lectores de ese sufrimiento. Por eso mismo escribí un libro así.

Si la conclusión bayesiana es nuestro objetivo, entonces el análisis matemático es solo uno de los caminos hacia ella. Por otro lado, la potencia informática ahora se ha vuelto mucho más barata, y podemos usar una forma alternativa, es decir, la programación probabilística. La segunda opción es mucho más conveniente, ya que no requiere recurrir a las matemáticas en todas las etapas de resolución del problema, en otras palabras, le permite prescindir del análisis matemático, que a menudo resulta ser un obstáculo insuperable para la conclusión bayesiana. Hablando en sentido figurado, en el segundo caso nos movemos de principio a fin en pequeños guiones, y en el primero, en grandes saltos, por lo que podemos aterrizar bastante lejos del objetivo. Además, sin una preparación matemática seria, el lector simplemente no podrá hacer frente al análisis desde la primera opción.

El libro Métodos bayesianos para hackers fue concebido como una introducción a la conclusión bayesiana con un enfoque en la comprensión de conceptos clave y el uso de la potencia informática (las matemáticas son secundarias). Por supuesto, este libro es introductorio, y seguirá siendo introductorio. Para aquellos que son expertos en matemáticas, simplemente puede despertar la curiosidad y luego abrirlo a otros textos escritos con el apoyo de un análisis matemático serio. Para un entusiasta interesado en la aplicación práctica de los métodos bayesianos, y no en sus conocimientos matemáticos, el libro será bastante informativo e interesante.

PyMC se elige para la programación probabilística en este libro, por dos razones. Al momento de escribir esto, no había un recurso centralizado en Internet con ejemplos y explicaciones de los métodos de trabajo en el ecosistema PyMC. La documentación oficial supone que el lector ya tiene una idea de la inferencia bayesiana y la programación probabilística. Esperamos que este libro aliente a los lectores con cualquier nivel de preparación a mirar más de cerca a PyMC.

Al trabajar con PyMC, debe tener en cuenta las dependencias, es decir, de NumPy (según la situación) de SciPy. Para no limitar al lector, los ejemplos en este libro usan solo PyMC, NumPy, SciPy y Matplotlib.

Contenido

(Los capítulos enumerados a continuación se muestran en nbviewer en nbviewer.ipython.org, son de solo lectura y se abren en tiempo real. ¡Se pueden descargar cuadernos interactivos y ejemplos clonando!)

  • Prólogo : ¿Por qué hacer esto?
  • Capítulo 1 : Introducción a los métodos bayesianos. Conocimiento de la filosofía y práctica de los métodos bayesianos, una historia sobre programación probabilística. Algunos ejemplos:

 Cambio en el comportamiento humano: una conclusión basada en la frecuencia de envío de SMS.

  • Capítulo 2 : Un poco más sobre PyMC Discutiremos el modelado de problemas bayesianos usando ejemplos que usarán la biblioteca PyMC (Python). ¿Cómo crear modelos bayesianos? Entre los ejemplos están:
  •  Cálculo de la probabilidad del accidente del transbordador espacial Challenger

  • Capítulo 3 : Apertura de la Caja negra de MCMC Hablemos sobre cómo funcionan las herramientas de diagnóstico y MCMC. Entre los ejemplos están:
  •  Agrupación bayesiana en el ejemplo de modelos mixtos

  • Capítulo 4 : El mayor teorema que nunca se te ha dicho aquí Exploraremos un teorema increíblemente útil y peligroso: la ley de los grandes números. Entre los ejemplos están:
  •  Investigación de conjuntos de datos de Kaggle y dificultades del análisis ingenuo
  •  Cómo ordenar los comentarios de Reddit de mejor a peor (no es tan simple como crees)

  • Capítulo 5 : ¿Qué preferiría renunciar, con la mano o el pie? Familiaridad con las funciones de pérdida y su aplicación (incomparable) en los métodos bayesianos. Entre los ejemplos están:
  •  Optimización de las previsiones financieras.
  •  Solución de competencia ganadora del mundo oscuro de Kaggle

  • Capítulo 6 : Aclaración de prioridades. Quizás el capítulo más importante. Aquí respondemos preguntas, recurriendo a opiniones de expertos. Entre los ejemplos están:
  •  Bandidos multi-armados y una solución bayesiana para tal problema.
  •  ¿Cuál es la relación entre el tamaño de la muestra y los datos a priori?
  •  Valoración de incógnitas financieras utilizando datos expertos a priori.
  • También aquí encontrará valiosos consejos sobre objetividad en el análisis y las trampas comunes asociadas con las probabilidades a priori.

Instalación y configuración

Si desea ejecutar el Bloc de notas de IPython en su computadora local, deberá instalar lo siguiente:

  • IPython 0.13: necesario para ver los archivos de ipynb. Puedes descargarlo aquí .
  • Los usuarios de Linux pueden instalar fácilmente Numpy, Scipy y PyMC. Para los usuarios de Windows, hay versiones precompiladas si de repente encuentra alguna dificultad.

En el directorio styles / hay una serie de archivos adaptados para trabajar con el bloc de notas. No solo están diseñados específicamente para el libro, sino que también están especialmente optimizados para trabajar con matplotlib e IPython.

Source: https://habr.com/ru/post/es413653/


All Articles