Programmation probabiliste et méthode bayésienne pour les pirates

Bonjour chers collègues. Aujourd'hui, nous voulions savoir comment vous demandiez de trouver le livre légèrement dépassé " Méthodes bayésiennes pour les pirates ", publié dans l'original en 2015, mais pas encore traduit en russe.


Le livre est positionné tel qu'appliqué, autant que possible débarrassé des mathématiques et sans âge.

Sous la coupe se trouve une traduction légèrement abrégée de la critique de ce livre publiée par l'auteur sur Github.
Veuillez voter

La méthode bayésienne est une approche naturelle de la conclusion logique, cependant, dans de nombreux livres sur ce sujet, l'essence de la méthode bayésienne est complètement perdue derrière des chapitres entiers d'une douloureuse analyse mathématique. Un livre typique sur la théorie bayésienne commence par deux ou trois chapitres sur la théorie des probabilités, après quoi il est expliqué quelle est la conclusion bayésienne. Malheureusement, en raison de l'impossibilité de présenter la majorité des modèles bayésiens dans un langage mathématique, seuls des exemples simples et artificiels sont montrés au lecteur. Ainsi, une personne peut avoir l’imagination imaginaire qu’elle aurait compris la conclusion bayésienne - alors qu’en réalité, elle n’a appris que l’interprétation de cette méthode par l’auteur.

Après que les méthodes bayésiennes ont clairement réussi dans les compétitions d'apprentissage automatique, j'ai décidé de réexaminer ce sujet. Même avec mes bagages mathématiques, j'ai passé les trois jours entiers à étudier des exemples et à essayer de rassembler tous les fragments afin de gérer toutes les méthodes. Pour mettre la théorie en pratique, je n'avais tout simplement pas assez de littérature. Ce malentendu est survenu parce que je ne pouvais pas combler le fossé entre les mathématiques bayésiennes et la programmation probabiliste. J'ai donc souffert et je veux sauver les lecteurs de telles souffrances. C'est pourquoi j'ai écrit un tel livre moi-même.

Si la conclusion bayésienne est notre objectif, alors l'analyse mathématique n'est qu'un des chemins qui y mènent. D'un autre côté, la puissance de calcul est devenue beaucoup moins chère et nous pouvons utiliser une autre méthode, à savoir la programmation probabiliste. La deuxième option est beaucoup plus pratique, car elle ne nécessite pas de recourir aux mathématiques à toutes les étapes de la résolution du problème, en d'autres termes, elle vous permet de vous passer de l'analyse mathématique, qui s'avère souvent être un obstacle insurmontable à la conclusion bayésienne. Au sens figuré, dans le deuxième cas, nous passons du début à la fin par petits tirets, et dans le premier - par d'énormes sauts, à cause desquels nous pouvons atterrir assez loin de la cible. De plus, sans préparation mathématique sérieuse, le lecteur peut tout simplement ne pas être en mesure de faire face à l'analyse de la première option.

Le livre Bayesian Methods for Hackers a été conçu comme une introduction à la conclusion bayésienne en mettant l'accent sur la compréhension des concepts clés et l'utilisation de la puissance de calcul (les mathématiques sont secondaires). Bien sûr, ce livre est une introduction, et il restera une introduction. Pour ceux qui sont avertis en mathématiques, cela peut simplement susciter la curiosité, puis l'ouvrir à d'autres textes écrits avec le soutien d'une analyse mathématique sérieuse. Pour un passionné qui s'intéresse à l'application pratique des méthodes bayésiennes, et non à leur formation mathématique, le livre sera très instructif et intéressant.

PyMC est choisi pour la programmation probabiliste dans ce livre, pour deux raisons. Au moment d'écrire ces lignes, il n'existait pas de ressource centralisée sur Internet avec des exemples et des explications des méthodes de travail dans l'écosystème PyMC. La documentation officielle suppose que le lecteur a déjà une idée de l'inférence bayésienne et de la programmation probabiliste. Nous espérons que ce livre encouragera les lecteurs de tout niveau de préparation à regarder de plus près PyMC.

Lorsque vous travaillez avec PyMC, vous devez prendre en compte les dépendances, à savoir, de NumPy (selon la situation) de SciPy. Afin de ne pas limiter le lecteur, les exemples de ce livre utilisent uniquement PyMC, NumPy, SciPy et Matplotlib.

Table des matières

(Les chapitres ci-dessous sont affichés dans nbviewer sur nbviewer.ipython.org, sont en lecture seule et ouverts en temps réel. Des cahiers interactifs et des exemples peuvent être téléchargés par clonage!)

  • Prologue : Pourquoi faire ça.
  • Chapitre 1 : Introduction aux méthodes bayésiennes. Connaissance de la philosophie et de la pratique des méthodes bayésiennes, une histoire sur la programmation probabiliste. Quelques exemples:

 Changement de comportement humain - une conclusion basée sur la fréquence d'envoi de SMS.

  • Chapitre 2 : Un peu plus sur PyMC Nous discuterons de la modélisation des problèmes bayésiens à l'aide d'exemples qui utiliseront la bibliothèque PyMC (Python). Comment créer des modèles bayésiens? Parmi les exemples:
  •  Calcul de la probabilité de crash de la navette spatiale Challenger

  • Chapitre 3 : Ouverture de la boîte noire MCMC Parlons du fonctionnement du MCMC et des outils de diagnostic. Parmi les exemples:
  •  Regroupement bayésien sur l'exemple des modèles mixtes

  • Chapitre 4 : Le plus grand théorème dont vous n'avez jamais été question ici Nous allons explorer un théorème incroyablement utile et dangereux: la loi des grands nombres. Parmi les exemples:
  •  Recherche de jeux de données Kaggle et pièges de l'analyse naïve
  •  Comment trier les commentaires de Reddit du meilleur au pire (ce n'est pas aussi simple que vous le pensez)

  • Chapitre 5 : Que préférez-vous abandonner - avec votre main ou votre pied? Connaissance des fonctions de perte et de leur application (incomparable) dans les méthodes bayésiennes. Parmi les exemples:
  •  Optimisation des prévisions financières
  •  Solution de compétition gagnante Kaggle Dark World

  • Chapitre 6 : Clarification des priorités. Peut-être le chapitre le plus important. Nous répondons ici aux questions en recourant à des avis d'experts. Parmi les exemples:
  •  Bandits multi-armés et une solution bayésienne à un tel problème.
  •  Quelle est la relation entre la taille de l'échantillon et les données a priori?
  •  Évaluation des inconnues financières à l'aide de données d'experts a priori.
  • Vous trouverez également ici de précieux conseils sur l'objectivité dans l'analyse et les pièges courants associés aux probabilités a priori.

Installation et configuration

Si vous souhaitez exécuter le Bloc-notes IPython sur votre ordinateur local, vous devrez installer les éléments suivants:

  • IPython 0.13 - requis pour afficher les fichiers ipynb. Vous pouvez le télécharger ici .
  • Les utilisateurs de Linux peuvent facilement installer Numpy, Scipy et PyMC. Pour les utilisateurs de Windows, il existe des versions précompilées si vous rencontrez soudainement des difficultés.

Dans le répertoire styles / il y a un certain nombre de fichiers adaptés pour travailler avec le bloc-notes. Ils sont non seulement conçus spécifiquement pour le livre, mais sont également spécialement optimisés pour travailler avec matplotlib et IPython.

Source: https://habr.com/ru/post/fr413653/


All Articles