Crédibilité, valeurs P et crise de reproductibilité

Ou: Comment le passage de la publication des valeurs P à la publication des fonctions de vraisemblance aide-t-il à faire face à la crise de reproductibilité: l'opinion personnelle d'Eliezer Yudkovsky.

Si Monroe a dessiné des bandes dessinées sur 75% des problèmes intéressants qui existent, et un quart de mes articles sont intéressants, alors quelle est la probabilité que tôt ou tard je doive chercher KDPV ailleurs?

Commentaire du traducteur: Yudkovsky, l'auteur de HPMOR , créateur de Lesswrong et d'autres et d'autres, a exprimé sa position sur les avantages des statistiques bayésiennes dans les sciences naturelles sous forme de dialogue. Un tel dialogue classique direct de l'Antiquité ou de la Renaissance, avec des personnages exprimant des idées, partageant des barbes entrecoupées d'arguments enchevêtrés et inévitablement stupide Simplizio. Le dialogue est assez long, une vingtaine de minutes à lire, mais à mon avis, ça vaut le coup.

Avertissements
  • Ce dialogue a été écrit par un promoteur bayésien . Les remarques du scientifique dans le dialogue ci-dessous peuvent ne pas passer le test idéologique de Turing pour le freventisme. Il est possible qu'ils ne rendent pas hommage aux arguments et contre-arguments des partisans de l'approche fréquentielle de la probabilité.
  • L'auteur ne s'attend pas à ce que les propositions décrites ci-dessous soient acceptées par la vaste communauté scientifique au cours des dix prochaines années. Cependant, cela valait la peine d'être écrit.

Si vous n'êtes pas familier avec la règle bayésienne, le site Internet d'Arbital propose une introduction détaillée .

Modérateur: Bonsoir. Aujourd'hui dans notre studio: Scientifique , praticien dans le domaine de ... la psychologie chimique ou quelque chose comme ça; son adversaire Bayesovets , qui a l'intention de prouver que la crise de la reproductibilité dans la science, peut en quelque sorte être surmontée en remplaçant les valeurs P par quelque chose des statistiques bayésiennes ...
Étudiant: Désolé, comment est-il orthographié?
Modérateur: ... et, enfin, l'étudiant Comprendre à ma droite.

Modérateur: Bayesovets , pourriez-vous d'abord me dire quelle est l'essence de votre proposition?
Bayesovets: En gros, le point est le suivant. Supposons que nous ayons une pièce. Nous le lançons six fois et observons la série «LLCOOR» (environ Per: Ci-après O - Oryol, R - Reshka) . Faut-il soupçonner que quelque chose ne va pas avec la pièce?
Scientifique: Aucun.
Bayesovets: La pièce ici n'est qu'un exemple. Supposons que nous offrons à un échantillon de volontaires une assiette avec deux biscuits: un avec des pépites vertes et un avec du rouge. Les cinq premières personnes prennent des biscuits verts et la sixième prend du rouge. Est-il vrai que les gens préfèrent les cookies avec des pépites vertes, ou un tel résultat est-il préférable d'être considéré comme aléatoire?
Étudiant: Probablement, il est possible de soupçonner que, peut-être, les gens préfèrent l'arrosage vert. Au moins, les étudiants en psychologie qui ont tendance à se porter volontaires pour des expériences étranges comme le vert arrosent davantage. Même après six observations, on peut soupçonner cela, bien que je soupçonne qu'il existe une sorte de capture.
Scientifique: Je pense que ce n'est pas suspect. De nombreuses hypothèses semblent prometteuses à N = 6, mais ne sont pas confirmées à N = 60.
Bayesovets: Personnellement, je soupçonne que nos bénévoles ne préfèrent pas la garniture rouge , ou du moins ne la préfèrent pas beaucoup. Mais en général, je suis venu avec ces exemples uniquement pour montrer comment les valeurs de P sont considérées dans les statistiques scientifiques modernes, et ce qui ne va pas avec elles du point de vue bayésien.
Scientifique: Mais vous ne pouvez pas trouver un exemple plus réaliste avec 30 volontaires?
Bayesovets: C'est possible, mais l'étudiant ne comprend déjà rien.
Étudiant: C'est sûr.
Bayesovets: Alors, chers experts: aigle, aigle, aigle, aigle, aigle, queues. Attention, la question est: appellerez-vous ce résultat «statistiquement significatif» ou non?
Scientifique: Maître, ce n'est pas significatif. Avec l'hypothèse nulle que la pièce est juste (ou avec l'hypothèse nulle similaire que la couleur des paillettes n'affecte pas le choix des cookies), le résultat même ou plus prononcé peut être obtenu dans 14 des 64 cas.
Étudiant: Ouais. Je comprends bien: c'est parce que nous considérons que les résultats de LLCOOO et RRORRR sont «identiques ou plus prononcés», il y en a 14 au total et le nombre total de résultats possibles avec 6 lancers 2 6 = 64. 14/64 est de 22%, ce qui est supérieur à 5%, donc le résultat n'est pas considéré comme significatif à un niveau de p <0,05. Alors?
Scientifique: C'est vrai. Je voudrais également noter qu'en pratique, même avec le résultat de LLCOOO, vous ne devriez pas arrêter l'expérience et écrire un article sur le fait qu'une pièce tombe toujours par un aigle.
Bayesovets: Le fait est que si vous pouvez arrêter de lancer une pièce à tout moment, vous devez vous demander: "Quelle est la probabilité que je trouve un tel moment pour arrêter l'expérience dans laquelle le nombre d'aigles regardera publiquement?" Et c'est une histoire complètement différente dans le paradigme de la valeur P.
Scientifique: Je voulais seulement dire que seulement six expériences - ce n'est pas grave, même si nous étudions la couleur des cookies. Mais oui, vous avez raison aussi.
Élève: Et pourquoi est-il important que je puisse arrêter de lancer une pièce ou non?
Bayesovets: Quelle merveilleuse question.
Scientifique: Le fait est que les valeurs P sont une chose compliquée. Vous ne pouvez pas simplement prendre les chiffres, les mettre dans le programme et publier ce que ce programme va donner. Si vous avez décidé à l'avance de lancer une pièce exactement six fois, puis de vous arrêter quel que soit le résultat, le résultat de LLCOOO ou RRRRRR sera obtenu en moyenne 2 fois sur 64, soit dans 3,1% des cas. Ceci est significatif à p <0,05. Mais supposons que vous êtes en fait un falsificateur trompeur et sans scrupules. Ou tout simplement un étudiant incompétent qui lui-même ne comprend pas ce qu'il fait. Au lieu de présélectionner le nombre de lancers, vous lancez et jetez une pièce jusqu'à ce que vous obteniez un résultat statistiquement significatif. Ce serait statistiquement significatif si vous décidiez à l'avance de lancer une pièce exactement le même nombre de fois. Mais en fait, vous n'avez pas décidé cela à l'avance. Vous avez décidé de ne vous arrêter qu'après avoir obtenu les résultats. Vous ne pouvez pas faire ça.
Élève: D'accord, je l'ai lu quelque part, mais je n'ai pas compris ce qui n'allait pas ici. Ceci est ma recherche, et je devrais mieux savoir s'il y a suffisamment de données ou non.
Scientifique: L'intérêt des valeurs P est de créer un test que l'hypothèse nulle ne peut pas réussir. Pour être sûr, en d'autres termes, que la fumée sans feu n'est pas trop courante. Pour ce faire, il est nécessaire d'organiser la recherche de manière à ne pas générer de découvertes "statistiquement significatives" en l'absence du phénomène souhaité. Si vous lancez une pièce exactement six fois (et déterminez ce nombre à l'avance), la probabilité d'obtenir six aigles ou six queues d'une pièce équitable est inférieure à 5%. Si vous lancez une pièce autant de fois que vous le souhaitez , et après chaque lancer, comptez la valeur P (en faisant comme si le nombre de rouleaux était connu à l'avance), alors tôt ou tard la chance d'obtenir moins de p <0,05 est bien plus de 5%. Par conséquent, une telle expérience détecte la fumée sans feu beaucoup plus souvent que dans 1 cas sur 20.
Bayesovets: Personnellement, j'aime formuler ce problème comme ceci: disons que vous jetez une pièce et obtenez OOOOOR. Si, en même temps, vous êtes au fond de votre cœur qui n'est connu que d'Allah (car Allah est sage, sachant) avec le nombre de lancers à l'avance , alors le résultat n'est pas significatif; p = 0,22. Si, après un jeûne de trois mois, vous avez fait le vœu à Saint-François de lancer une pièce jusqu'à ce que les queues tombent , alors le même résultat est statistiquement significatif avec un très bon p = 0,03. Parce que la chance que, avec des probabilités de 1: 1, les queues devront attendre six lancers ou plus, 1/32.
Étudiant: Quoi?
Scientifique: Cela ressemble plus à une parodie, bien sûr. Dans la pratique, personne ne lancera une pièce tant qu'une seule queue n'aura pas été tirée, puis s'arrêtera. Mais en fait, Bayesovets a raison, les valeurs P fonctionnent exactement comme ça. À strictement parler, nous essayons de découvrir à quel point le résultat est rare parmi ceux que nous pourrions obtenir. Une personne jetant une pièce avant les premières queues peut obtenir les résultats {P, OR, OOR, LLC, OOOOR, LLCOOR ...} et ainsi de suite. La classe de résultats dans laquelle six coups ou plus sont effectués est {LLCOOOR, LLCOOOR, OOOOOOOR ...}, dont la probabilité totale est de 1/64 + 1/128 + 1/256 ... = 1/32. Et une personne qui lance une pièce exactement six fois obtient l'un des résultats de la classe {RRRRRR, LLCOOR, LLCORO, OOOOORR ...}, dans laquelle il y a 64 éléments. Aux fins de notre expérience, LLCOOOR est équivalent à LLCORO, LLCOROO et similaires. Alors oui, tout cela est assez contre-intuitif. Si nous menions vraiment la première expérience, LLCOOR serait un résultat significatif, ce qui est peu probable avec une pièce honnête. Et si nous devions mener la deuxième expérience, LLCOOR ne serait pas significatif, car même avec une pièce honnête, quelque chose de similaire se produit de temps en temps.
Bayesovets: Êtes-vous dérangé par le fait que les résultats de l'expérience dépendent de ce que vous pensez?
Scientifique: C'est une question de conscience. N'importe quel type de recherche coûtera peu si vous mentez au sujet de leurs résultats, c'est-à-dire, mentez littéralement de quel côté la pièce est tombée. Si vous mentez sur le type d'expérience qui a été réalisée - l'effet sera le même. Il vous suffit donc de le prendre et de dire honnêtement exactement selon quelles règles les lancers ont été faits. Bien sûr, le contenu de la tête du scientifique est moins évident que de quel côté se trouve la pièce. Par conséquent, il est toujours possible de modifier les paramètres d'analyse, de ne pas écrire comment le nombre de sujets a été déterminé, de choisir le test statistique qui confirme votre hypothèse préférée ... Il y a beaucoup de choses auxquelles vous pouvez penser si vous le souhaitez. Et ce sera plus facile que de falsifier les données source. En anglais, cela s'appelle p-hacking. Et dans la pratique, bien sûr, des méthodes beaucoup moins évidentes sont utilisées pour créer de la fumée sans feu que l'hypothèse nulle stupide inventée après coup. Il s'agit d'un problème grave et, dans une certaine mesure, la crise de reproductibilité y est associée, bien que l'on ne sache pas lequel.
Étudiant: Est- ce que cela ... semble raisonnable? Peut-être que c'est une de ces choses que vous devez traiter pendant longtemps et trier à travers un tas d'exemples, puis tout devient clair?
Bayesovets: Aucun.
Étudiant: Je veux dire?
Bayesovets: Dans le sens de «étudiant, tu avais raison dès le début». Si ce que pense l'expérimentateur n'affecte en rien le côté de la pièce, alors ses pensées ne devraient pas affecter le fait que les résultats du lancer nous parlent de l'univers. Mon cher étudiant, les statistiques qui vous sont enseignées ne sont rien de plus qu'un tas de béquilles trop compliquées que vous n'avez même pas pris la peine de rendre cohérentes en interne. Pour l'amour du ciel, elle donne différents résultats incorrects selon ce qui se passe dans votre tête! Et c'est un problème beaucoup plus grave que la tendance de certains scientifiques à tricher légèrement dans «Matériaux et méthodes».
Scientifique: C'est ... une déclaration sérieuse, pour dire le moins. Mais dites-moi, je vous demande: que devons-nous faire, malheureux?
Bayesovets: Analysez comme suit: ce résultat LLCOOR particulier peut être obtenu avec six lancers d'une pièce parfaitement équilibrée avec une probabilité de 1/64, soit environ 1,6%. Supposons que nous soupçonnions déjà que notre pièce était imparfaitement équilibrée. Et pas seulement de façon imparfaite, mais de telle manière qu'il tombe en aigle en moyenne cinq fois sur six. Ceci, bien sûr, est une simplification sauvage, mais je passerai à des hypothèses réalistes un peu plus tard. Ainsi, cette pièce de triche hypothétique donne la séquence LLCOOR avec une probabilité de (5/6) 5 * (1/6) 1 . Cela représente environ 6,7%. Nous avons donc deux hypothèses: "La pièce est la plus courante" et "La pièce est lâchée par l'aigle dans 5/6 cas". Ce résultat spécifique dans le second cas est 4,3 fois plus probable que dans le premier. La probabilité de la séquence LLCOOR pour une autre pièce de triche hypothétique, qui dans 5 cas sur six est la queue, est de 0,01%. Donc, si quelqu'un pensait soudain que c'est la deuxième pièce devant nous, nous avons maintenant un bon argument contre son hypothèse. Ce résultat particulier est 146 fois plus probable pour une pièce équitable que pour une pièce qui n'est lâchée par l'aigle qu'une seule fois sur six. De même, nos amateurs de biscuits rouges hypothétiques seraient beaucoup moins susceptibles de manger du vert.
Étudiant: D'accord, je semble comprendre les mathématiques. Mais honnêtement, je ne sais pas quelle est sa signification.
Bayesovets: Maintenant, je vais vous expliquer, mais d'abord, faites attention à ceci: les résultats de mes calculs ne dépendent pas de la raison pour laquelle la pièce a été retournée exactement six fois. Peut-être qu'après le sixième lancer, vous avez décidé que les données étaient déjà suffisantes. Peut-être qu'après une série de cinq lancers, Namagiri Tayyar vous est apparu dans un rêve et vous a conseillé de lancer à nouveau une pièce. La monnaie s'en fiche. Le fait demeure: cette série LLCOOR particulière est quatre fois moins probable pour une pièce honnête que pour une pièce qui est lâchée par un aigle cinq fois sur six.
Scientifique: Je conviens qu'au moins une caractéristique utile de vos calculs est. Et ensuite?
Bayesovets: Et puis vous publiez les résultats dans un magazine. Il est souhaitable avec des données brutes, car alors n'importe qui peut calculer la probabilité d'une hypothèse. Supposons que quelqu'un s'intéresse de façon inattendue à l'hypothèse "Une pièce est lâchée par un aigle 9 fois sur 10, pas 5 fois sur 6". Dans ce cas, une série d'observations LLCOOR a une probabilité de 5,9%, ce qui est légèrement inférieur à notre hypothèse de cinq aigles de six lancers (6 , 7%), mais 3,7 fois l'hypothèse selon laquelle la pièce est parfaitement équilibrée (1,6%). Il est impossible, et pas nécessaire, de formuler à l'avance toutes les hypothèses possibles. Il suffit de publier des données complètes - alors toute personne ayant une hypothèse peut facilement calculer la probabilité dont elle a besoin. Le paradigme bayésien nécessite la publication de données brutes, car l'accent est mis sur un résultat spécifique , et non sur une classe de résultats supposés identiques.
Scientifique: En cela, je suis d'accord avec vous, la publication d'ensembles de données complets est l'une des étapes les plus importantes pour surmonter la crise de reproductibilité. Mais personnellement, je ne comprends pas ce que je dois faire avec tout cela "A est tellement plus probable que B".
Étudiant: Moi aussi.
Homme bayésien: Ce n'est pas tout à fait trivial ... avez-vous lu notre introduction à la règle bayésienne ?
Étudiant: Super. C'est juste le prochain manuel de statistiques de trois cents pages et je n'en avais pas assez.
Bayesovets: Vous pouvez réellement le lire en une heure . C'est juste que tout cela n'est littéralement pas trivial , c'est-à-dire qu'il nécessite une explication. Mais d'accord, faute d'une introduction complète, je vais essayer de trouver quelque chose. Très probablement, cela semblera raisonnable - et la logique est vraiment correcte - mais pas un fait, ce qui va de soi. Allons-y. Il existe un théorème qui prouve l'exactitude du raisonnement suivant:
(Bayesian gagne de l'air)
Bayesovets: Supposons que les professeurs Plume et Miss Scarlet soient soupçonnés de meurtre. Après avoir étudié les biographies des deux, nous supposons qu'il serait deux fois plus facile pour un professeur de tuer un homme que Mlle Scarlet. Nous commencerons par cette hypothèse. Il s'avère cependant que le défunt a été empoisonné. Nous savons que si le professeur Plume est sur le point de tuer quelqu'un, il utilise alors du poison avec une probabilité de 10% (et dans 9 cas sur 10, il préférera, par exemple, un revolver). Mlle Scarlet, si elle décide de tuer, utilise du poison avec une probabilité de 60%. En d'autres termes, l'utilisation de poison par un professeur est six fois moins probable que l'utilisation du poison de Miss Scarlet. Puisque nous avons de nouvelles informations, à savoir la méthode du meurtre, nous devons mettre à jour notre hypothèse et supposer que Plume est environ trois fois moins susceptible d'être un tueur: 2 * 1/6 = 1/3.
Étudiant: Je ne suis pas sûr de l'avoir compris. Que signifie l'expression «le professeur Plume est trois fois moins susceptible d'être un meurtrier que Mlle Scarlet»?
Bayesovets: Cela signifie que si nous n'avons pas d'autres suspects, la probabilité que Plume ait tué la victime est de 1/4. Les 3/4 restants sont la probabilité que le tueur soit Miss Scarlet. Par conséquent, la culpabilité du professeur est trois fois inférieure à celle de Mlle Scarlet.
Scientifique: Et maintenant, je veux savoir ce que vous entendez par «probabilité de culpabilité». Plume a commis le meurtre ou il ne l'a pas commis. Nous ne pouvons pas regarder un échantillon des meurtres et constater que Plume est vraiment responsable d'un quart d'entre eux.
Bayesovets: J'espérais ne pas y entrer, mais bon. Mon bon scientifique, je veux dire que si vous m'offriez un pari avec un pari 1: 1 pour savoir si Plume a tué la victime ou non, je parierais qu'il ne l'a pas fait. Mais si, selon les termes du pari, je vous paierais 1 $ en cas d'innocence et que vous me paieriez 5 $ en cas de culpabilité, je me ferais un plaisir de blâmer. L'élection présidentielle de 2012 n'a eu lieu qu'une seule fois et la chance de victoire d'Obama est aussi conceptuellement inarticulée que la chance de culpabilité de Plume. Mais si le 7 novembre on vous proposait de parier 10 $ sur Obama et de promettre 1000 $ s'il gagnait, alors vous refuseriez difficilement un tel pari. En général, lorsque les marchés de prédiction et les grands pools de paris liquides prennent des paris à 6: 4 pour un événement, cet événement se produit dans environ 60% des cas. Les marchés et les pools sont bien calibrés pour les probabilités dans cette gamme. S'ils étaient mal calibrés, c'est-à-dire si les événements qui prennent des paris à 6: 4 se sont produits dans 80% des cas, alors quelqu'un pourrait le remarquer et s'enrichir au détriment de ces paris. Dans le même temps, il augmenterait le prix du taux jusqu'à ce que le marché soit bien calibré. Et comme les événements avec une estimation de probabilité de marché de 70% se produisent réellement environ 7 fois sur 10, je ne comprends pas pourquoi insister sur le fait qu'une telle probabilité n'a pas de sens.
Étudiant: J'avoue, cela semble convaincant. Mais à coup sûr, cela me semble juste, et en fait il y a tout un tas d'arguments astucieux pour et contre.
Bayesovets: Il y a vraiment beaucoup d' arguments, mais la conclusion générale est que votre intuition est assez proche de la vérité.
Scientifique: D'accord, nous y reviendrons. Mais que se passe-t-il s'il y a deux agents, tous deux selon vos termes «bien calibrés», mais l'un d'eux dit «60%» et l'autre «70%»?
Bayesovets: Disons que je lance une pièce et ne regarde pas de quel côté elle est tombée. Dans ce cas, mon ignorance n'est pas une information sur une pièce, c'est une information sur moi. Il existe dans la tête et non dans le monde environnant, tout comme les taches blanches sur la carte ne signifient pas qu'il n'y a pas de territoire à cet endroit. Si vous avez regardé une pièce, mais pas moi, il est tout à fait raisonnable que vous et moi soyons dans des états d'incertitude différents à ce sujet. Étant donné que je ne suis pas sûr à cent pour cent, il est logique pour moi d'exprimer mon insécurité en termes de probabilité. Il existe environ trois cents théorèmes qui affirment que si l'expression de l'incertitude d'une personne n'est pas en fait une distribution de probabilité, alors, en général, elle en a besoin. Pour une raison quelconque, il arrive toujours que si la pensée d'un agent dans des conditions d'incertitude viole l'un des axiomes standard de la théorie des probabilités, la terre s'ouvrira, l'eau se transformera en sang, et les stratégies dominantes et évidemment les paris perdants se déverseront du ciel.
Scientifique: D'accord, j'avais tort ici. Nous y reviendrons également, mais tout d'abord, répondez à ma question: que faire de la crédibilité après les avoir reçues?
Bayesovets: Selon les lois de la théorie des probabilités, ces plausibilités sont des preuves. Ce sont eux qui nous font changer nos probabilités a priori de 2: 1 en faveur de Plume à 3: 1 en faveur de Scarlet. Si j'ai deux hypothèses et la probabilité de données pour les deux, alors je devrais changer d'avis comme décrit ci-dessus. Si je le change différemment, le ciel s'ouvre, les stratégies affluent, etc. Théorème de Bayes: ce n'est pas seulement une technique statistique, c'est la LOI.
Étudiant: Désolé, mais je ne comprends toujours pas. Supposons que nous menons une expérience. Et, disons, les résultats sont six fois plus probables si Herr Troupe a été tué par le professeur Plume qu'ils ne le seraient si elle était l'assassin de Miss Scarlet(environ. - L'étudiant, évidemment, a confondu la plausibilité de l'utilisation du poison par deux tueurs. Ensuite, ce rapport est discuté) . Nous arrêter professeur ou non?
Scientifique: Je suppose que, pour commencer, vous devez trouver une probabilité a priori plus ou moins réaliste, par exemple, " a priori, je crois que la probabilité de tuer Troupe Plume est de 20%". Ensuite, il doit être multiplié par le rapport de vraisemblance de 6: 1, et obtenir le rapport des probabilités postérieures de 3: 2, ce panache ayant tué la troupe. On peut alors affirmer que Plume est coupable avec une probabilité de 60%, et alors le parquet devrait comprendre.
Bayesovets: Aucun . Pour l'amour du ciel! Pensez-vous vraiment que les statistiques bayésiennes fonctionnent comme ça?
Scientifique:Ça marche mal? J'ai toujours cru que son principal avantage est qu'il nous donne des probabilités postérieures, ce que les valeurs P ne donnent vraiment pas, et le principal inconvénient est que des probabilités a priori sont nécessaires pour cela. Puisqu'elles doivent être prises plus ou moins au plafond, la justesse des probabilités postérieures peut être contestée jusqu'à la fin des temps.
Bayesovets: les articles doivent publier leur crédibilité . Plus précisément, nous devons publier des données brutes et calculer pour elles quelques plausibilités qui nous intéressent. Mais certainement pas des probabilités a posteriori.
Étudiant: Je suis encore confus. Quelles sont les probabilités postérieures?
Bayesovets: probabilité postérieure- Il s'agit d'une déclaration du type "Avec une probabilité de 60%, Herr Troupe a été tué par le professeur Plume." Comme mon collègue l'a déjà noté, de telles déclarations ne découlent pas des valeurs P. Et, à mon avis, ils n'ont pas leur place dans les articles expérimentaux, car ce ne sont pas les résultats d'une expérience .
Étudiant: Mais ... d'accord, scientifique, une question pour vous: disons que nous avons obtenu des résultats avec p <0,01, c'est-à-dire quelque chose avec une probabilité de moins de 1% avec l'hypothèse nulle "Le professeur Plume n'a pas tué Herr Troupe." Faut-il l'arrêter ou non?
Scientifique:Premièrement, ce n'est pas une hypothèse nulle réaliste. Très probablement, l'hypothèse nulle serait quelque chose comme "Personne n'a tué Herr Troupe" ou "tous les suspects sont également coupables". Mais même si l'hypothèse nulle décrite par vous fonctionnait, même si nous pouvions rejeter l'innocence de Plume avec p <0,01, il ne serait toujours pas possible de dire que Plume était coupable avec une probabilité de 99%. Les valeurs P ne nous le disent pas.
Étudiant: Et ce qu'ils rapportent alors?
Scientifique: Ils rapportent que les données observées font partie d'une classe de résultats possibles, et que les résultats de cette classe sont observés dans moins de 1% des cas si l'hypothèse nulle est vraie. Plus de valeur P ne veut rien dire. Vous ne pouvez pas simplement prendre et passer de p <0,01 à "Le professeur Plume est coupable avec une probabilité de 99%". Bayesian, probablement, mieux que moi pourra expliquer pourquoi. En général, en science, il est impossible d'interpréter une chose comme autre chose. Les chiffres indiquent exactement ce qu'ils signifient, ni plus ni moins.
Étudiant: Généralement excellent. Au début, je ne comprenais pas quoi faire avec la plausibilité, et maintenant je ne comprends toujours pas quoi faire avec les valeurs P. Quelle expérience est nécessaire pour finalement envoyer Plume en prison?
Scientifique: En pratique? Si quelques expériences supplémentaires dans d'autres laboratoires confirment sa culpabilité avec p <0,01, il est très probable qu'il est vraiment coupable.
Bayesovets:Et la «crise de reproductibilité», c'est quand l'affaire est soulevée plus tard et il s'avère qu'il n'a pas commis le meurtre.
Scientifique: Eh bien, oui.
Étudiant: D'une manière ou d'une autre, cela se révèle désagréable.
Scientifique: La vie est généralement une chose désagréable.
Étudiant: Alors ... Bayesovets, vous avez probablement une réponse similaire? Quelque chose comme le fait que si le rapport de vraisemblance est suffisamment grand, disons 100: 1, alors dans la pratique, l'hypothèse correspondante peut-elle être considérée comme vraie?
Bayesovets:Oui, mais c'est un peu plus compliqué. Supposons que je lance une pièce 20 fois et que j'obtienne OOOOOROOOROROROROROOOROOOROR. Le hic est que la probabilité de l'hypothèse «La pièce est garantie pour donner la séquence LLCOROOORORORROOOOOOOROROR» est plus élevée que la probabilité de l'hypothèse «La pièce est également probable par un aigle ou une queue» environ un million de fois. En pratique, si vous ne m'avez pas remis cette hypothèse dans une enveloppe scellée avant le début de l'expérience, je la considérerai comme hautement recyclée. Je vais devoir donner à cette hypothèse une pénalité de complexité d' au moins 2 20 : 1, car la description de la séquence à elle seule prend 20 bits. En d'autres termes, réduisez tellement la probabilité a priori qu'elle compense largement l'avantage de vraisemblance. Et ce n'est pas le seul écueil. Mais néanmoins, si vous comprenez comment et pourquoi la règle de Bayes fonctionne, alors dans chaque cas spécifique, vous pouvez comprendre en cours de route. Si le rapport de plausibilité pour Plume est contre tout autre suspect 1000: 1, et qu'il n'y a que six suspects, alors on peut supposer que la probabilité a priori n'était guère plus de 10: 1 contre le fait qu'il est un tueur. Si c'est le cas, nous pouvons supposer qu'il est coupable avec une probabilité de 99%.
Scientifique: Mais néanmoins, ne vaut- il pas la peine d' écrire dans l'article ?
Bayesovets: C'est vrai. Comment formuler ... La condition clé de l'analyse bayésienne est que tousinformations pertinentes. Vous ne pouvez pas exclure des données de l'analyse simplement parce que vous ne les aimez pas. Il s'agit en fait d'une condition clé de la science en tant que telle, quelles que soient les statistiques utilisées. Il y a un tas d'articles dont les conclusions n'ont été obtenues que parce qu'un facteur n'a pas été pris en compte ou que l'échantillon n'était pas représentatif dans certains paramètres. De quoi je parle? Et au fait que comment (en tant qu'expérimentateur) sais-je ce que sont «toutes les informations pertinentes»? Qui suis-je pour calculer les probabilités postérieures? Peut-être que quelqu'un a publié un article dans lequel il y a des données supplémentaires et une crédibilité supplémentaire que je devrais prendre en compte, mais je ne l'ai pas encore lu. Je publie donc mes données et mes fonctions de vraisemblance - et c'est tout! Je ne peux pas prétendre avoir tout considéréarguments et maintenant je peux offrir des probabilités postérieures fiables. Et même si je le pouvais, un autre article pourrait sortir dans une semaine, et ces probabilités deviendront obsolètes.
Étudiant: En gros, l'expérimentateur devrait simplement publier ses données, calculer pour elles quelques probabilités et tout? Et alors seulement quelqu'un d'autre décidera-t-il quoi faire avec eux?
Bayesovets: Quelqu'un devra choisir des probabilités a priori - égales, ou avec une entropie maximale, ou avec des pénalités pour la complexité, ou quoi que ce soit d'autre - puis essayer de collecter toutes les données possibles, calculer la probabilité, s'assurer que le résultat n'est pas fou , et autres et autre. Et ils doivent encore être comptés si un nouvel article est publié dans une semaine.
Etudiant:Cela semble assez long .
Bayesovets: Ce serait bien pire si nous entreprenions une méta-analyse des valeurs de P. La mise à jour des probabilités bayésiennes est beaucoup plus facile. Il suffit de multiplier simplement les anciennes probabilités postérieures par les nouvelles fonctions de vraisemblance et de normaliser. C’est tout. Si l'expérience 1 donne un rapport de vraisemblance de 4: 1 pour les hypothèses A et B, et l'expérience 2 leur donne un rapport de vraisemblance de 9: 1, alors ensemble, ils donnent un rapport de 36: 1. C’est tout.
Étudiant: ne pouvez-vous pas faire cela avec des valeurs P? Une expérience avec p = 0,05 et une autre expérience avec p = 0,01 ne signifient pas qu'en fait p <0,0005?
Scientifique: Aucun .
Bayesovets: Chers téléspectateurs, faites attention à mon sourire arrogant.
Scientifique: Mais je suis toujours inquiet de la nécessité de trouver des probabilités a priori.
Bayesovets: Et pourquoi cela vous dérange-t-il plus que le fait que tout le monde ait décidé de considérer une expérience et deux répétitions avec p <0,01 comme critère de Vérité?
Scientifique: Vous voulez dire que le choix des valeurs a priori n'est pas plus subjectif que l'interprétation des valeurs P? Hm.Je voulais dire qu'une exigence de, disons, p <0,001 devrait garantir l'objectivité. Mais alors vous répondrez que le nombre 0,001 (au lieu de 0,1 ou 1e-10) est également aspiré du doigt.
Bayesovets: Et j'ajoute à cela qu'il est moins efficace d'exiger une valeur P arbitraire que d'extraire une probabilité a priori du même doigt. Abraham Wald, en 1947, a prouvé l'un des premiers théorèmes menaçant les violateurs des axiomes de probabilité avec des punitions égyptiennes. Il a essayé de décrire toutes les stratégies acceptables , appelant la stratégie un moyen de réagir à ce que vous observez. Bien sûr, différentes stratégies dans différentes circonstances peuvent être plus ou moins rentables. Stratégie acceptableil a appelé celui qui n'est pas dominé par une autre stratégie dans toutes les conditions possibles. Ainsi, Wald a découvert que la classe des stratégies acceptables coïncide avec la classe des stratégies qui contiennent une distribution de probabilité, la met à jour en fonction des observations par la règle bayésienne et optimise la fonction d'utilité.
Étudiant: Désolé, puis-je parler le russe?
Bayesovets: Si vous faites quelque chose en rapport avec ce que vous observez et gagnez plus ou moins, par exemple, de l'argent, selon ce qu'est le monde réel, alors l'un des deux est vrai. Soit votre stratégie, dans un sens, contient une distribution de probabilité et la met à jour selon la règle bayésienne, ouil existe une autre stratégie qui ne cède jamais à la vôtre et la dépasse parfois. C'est-à-dire que vous dites par exemple: «Je ne cesserai pas de fumer avant d'avoir vu un article prouvant le lien entre le tabagisme et le cancer à p <0,0001». Au moins théoriquement, il y a une façon de dire: «À mon avis, le lien entre le tabagisme et le cancer existe avec une probabilité de 0,01%. Quelles sont vos plausibilités? », Qui ne sera pas pire que la première formulation, quelles que soient les probabilités a priori de l'existence d'une telle connexion.
Scientifique: Vraiment?
Bayesovets:Ouais. La révolution bayésienne a commencé avec ce théorème; depuis lors, il prend lentement de l'ampleur. Il convient de noter que Wald a prouvé son théorème quelques décennies après l'invention des valeurs de P. Cela, à mon avis, explique comment il s'est avéré que toute la science moderne s'est avérée liée à des statistiques manifestement inefficaces.
Scientifique: Donc, vous proposez de rejeter les valeurs P et de publier uniquement les relations de vraisemblance?
Bayesovets: En bref, oui.
Scientifique: Quelque chose que je ne crois pas vraiment aux solutions idéales, adaptées à toutes les conditions. Je soupçonne - s'il vous plaît, ne le considérez pas comme une insulte - que vous êtes un idéaliste. D'après mon expérience, dans différentes situations, différents outils sont nécessaires et il serait déraisonnable de jeter tout sauf un.
Bayesovets:Eh bien, je suis prêt à expliquer en quoi je suis idéaliste et en quoi pas. Les fonctions de vraisemblance ne résoudront pas à elles seules la crise de la reproductibilité. Il ne peut pas être complètement résolu en ordonnant simplement à tout le monde d'utiliser des statistiques plus efficaces. La popularité des magazines en libre accès ne dépend pas du choix entre la vraisemblance et les valeurs P. Les problèmes avec le système d'examen sont également indépendants de celui-ci.
Scientifique: Et tout le reste, alors ça dépend?
Bayesovets: Pas tout, mais ils ont beaucoup ce à l' aide . Comptons.
Bayesovets:Tout d'abord. Les fonctions de vraisemblance n'imposent pas de distinction entre les résultats «statistiquement significatifs» et «insignifiants». Une expérience ne peut pas avoir un résultat «positif» ou «négatif». Ce qu'on appelle l'hypothèse nulle n'est plus qu'une des hypothèses, pas différente en principe de toutes les autres. Si vous lancez une pièce et obtenez OORORRROOO, vous ne pouvez pas dire que l'expérience ne pouvait pas «rejeter l'hypothèse nulle à p <0,05» ou «reproduire le résultat précédemment obtenu». Il vient d'ajouter des données qui soutiennent l'hypothèse honnête de la pièce contre l'hypothèse «5/6 aigles» avec un rapport de vraisemblance de 3,78: 1. Donc, avec l'adoption massive des statistiques bayésiennes, les résultats de ces expériences seront moins susceptibles d'être envoyés à la table. Pas tout à fait jamaisparce que les éditeurs des magazines sont toujours plus intéressés par les pièces honnêtes, et vous devez y faire face directement. Mais les valeurs P ne sont pas seulement en difficulté avec cette approche, elles sontstimuler ! C'est grâce à lui que le p-hacking existe généralement. Ainsi, la transition vers la crédibilité n'apportera pas le bonheur à tout le monde et pour rien, mais cela aidera certainement .
Bayesovets: Deuxièmement. Le système de vraisemblance met beaucoup plus l'accent sur l'importance des données sources et stimulera leur publication dans la mesure du possible, car l'analyse bayésienne s'appuie sur la probabilité que ces résultats particuliers soient dans un modèle donné. Le système de valeurs P, au contraire, fait que le chercheur considère les données comme un seul des membres de la classe des résultats «tout aussi extrêmes». Certains scientifiques aiment garder toutes leurs précieuses données avec eux; Il ne s'agit pas uniquement de statistiques. Mais les valeurs P stimulentet ce, parce que les données elles-mêmes ne sont pas importantes pour l'article, mais si elles appartiennent à une classe particulière. Une fois cela établi, toutes les informations qu'ils contiennent semblent s'effondrer en un seul «sens» ou «insignifiance».
Bayesovets: Troisièmement. Du point de vue de la théorie des probabilités, du point de vue bayésien, différentes tailles d'effets sont des hypothèses différentes. Ceci est logique, car différentes fonctions de vraisemblance et, par conséquent, différentes probabilités des données observées leur correspondent. Si une expérience a trouvé une valeur d'effet de 0,4 et une autre expérience a trouvé une valeur «statistiquement significative» du même effet de 0,1, alors l'expérience n'a pas reproduitet nous ne savons pas ce qui est vraiment là. Cela permettra d'éviter une situation assez courante lorsque l'ampleur de l'effet «statistiquement significatif» diminue et diminue avec l'augmentation de la taille de l'échantillon.
Bayesovets: quatrième. Les fonctions de vraisemblance simplifient considérablement l'agrégation des données et la méta-analyse. Ils peuvent même nous aider à remarquer que les données sont collectées dans des conditions hétérogènes ou que nous ne considérons pas la vraie hypothèse. Dans ce cas, soit toutes les fonctions seront proches de zéro pour tous les paramètres possibles, soit la meilleure hypothèse donnera beaucoup moins de probabilité sur les données combinées qu'elle ne le prévoit elle-même . Une approche plus rigoureuse de la reproductibilité nous permettra de comprendre rapidement si une telle expérience peut être considérée comme une répétition de tel ou tel.
Bayesovets: cinquième. Les fonctions de vraisemblance ne dépendent pas de ce qu'elles en pensent. Ce sont des déclarations objectives sur les données. Si vous publiez les valeurs de vraisemblance, il n'y a qu'une seule façon de tromper le lecteur: falsifier les données elles-mêmes. Le piratage P ne fonctionnera pas.
Scientifique: Eh bien, j'en doute fortement . Supposons que je décide de vous convaincre qu'une pièce de monnaie est plus souvent lâchée par un aigle, même si en fait c'est honnête. Je vais prendre une pièce, je vais la lancer jusqu'à ce que par hasard j'obtienne un peu plus d'aigles, puis je m'arrête. Et alors?
Bayesovets: Allez-y. Si vous ne falsifiez pas les données, vous ne me tromperez pas.
Scientifique: La question était de savoir ce qui se passerait si je vérifiais le rapport de vraisemblance après chaque lancer et m'arrêtais dès qu'il soutenait ma théorie préférée.
Bayesovets: En tant qu'idéaliste , séduit par la beauté trompeuse de la théorie des probabilités, je vous réponds: pendant que vous me donnez des données brutes honnêtes, je ne peux et ne dois faire qu'une chose - multiplier selon la règle bayésienne.
Scientifique: Vraiment?
Bayesovets: Sérieusement.
Scientifique: Vous ne vous souciez donc pas que je puisse vérifier le rapport de vraisemblance jusqu'à ce que je l'aime?
Bayesovets: Allez-y.
Scientifique:Ok Ensuite, j'écrirai un script en Python qui simule un lancer de pièce honnête jusqu'à , disons, 300 fois, et je verrai à quelle fréquence je peux obtenir un ratio de 20: 1 en faveur de l'hypothèse "une pièce est lâchée par un aigle dans 55% des cas" ... Quoi?
Bayesovets: Oui, juste une drôle de coïncidence. Quand je viens de tout savoir à ce sujet et que je doutais que la relation de vraisemblance ne puisse pas être trompée de manière délicate, j'ai alors écrit le même programme en Python. Plus tard, un de mes amis a également découvert la relation de probabilité et a également écrit le même programme, également pour Python pour une raison quelconque . Il l'a lancé et a constaté que le ratio de 20: 1 pour l'hypothèse 55% Eagles a été trouvé au moins une fois dans 1,4% de la série de cast. Si vous exigez, par exemple, 30: 1 ou 50: 1, leur fréquence diminue encore plus rapidement.
Scientifique: Si vous considérez votre valeur P de un et demi pour cent, cela semble bon. Mais c'est une façon très grossière de tromper l'analyse; peut-être y a-t-il plus de complexité et d'efficacité?
Bayesovets: J'avais ... environ cinq ans, probablement, sinon moins, quand j'ai appris pour la première fois l'addition. Un de mes premiers souvenirs. Je me suis assis, j'ai ajouté 3 à 5 et j'ai continué à essayer de trouver un moyen de ne pas en obtenir 8. Ce qui, bien sûr, est une étape très agréable et généralement importante pour comprendre ce qu'est l'addition (et les mathématiques en général). Mais maintenant, c'est tellement agréable, parce que nous sommes adultes et comprenons que 5 plus 3 est inévitablement égal à 8. Un script qui vérifie constamment le rapport de vraisemblance fait la même chose que moi dans l'enfance. Comprenant la théorie, j'ai réalisé qu'il était évident d' essayer de tromper la règle de Bayescondamné. C'est comme essayer de décomposer 3 d'une manière intelligente en 2 et 1 et de les ajouter individuellement à 5, ou d'essayer d'ajouter le premier 1, puis seulement 2. Ni l'une ni l'autre ni celle de 7 ou 9 ne fonctionneront. Le résultat de l'addition est un théorème et peu importe la séquence d'opérations que nous effectuons. S'il est vraiment équivalent à ajouter 3 à 5, alors la sortie ne peut être que 8. Les théorèmes de la théorie des probabilités sont également des théorèmes. Si le script pouvait vraiment fonctionner, cela signifierait une contradiction dans la théorie des probabilités, et donc une contradiction dans l'arithmétique de Peano, sur laquelle l'analyse des probabilités utilisant des nombres rationnels est basée. Ce que vous et moi avons essayé de faire, c'est exactementaussi difficile que d'additionner 3 et 5 en axiomatique arithmétique standard et d'en obtenir 7.
Élève: E, pourquoi?
Scientifique: Je ne comprends pas non plus.
Bayésien: Soit e une observation, H une hypothèse ,! X une «non X», P ( H ) une probabilité d'une hypothèse et P ( X | Y ) une probabilité conditionnelle de X, à condition que Y soit vrai. Il y a un théorème qui montre que

P (H) = P ( H | e ) * P ( e )) + (P ( H |! e ) * P ( ! e )

Par conséquent, pour les fonctions de probabilité, il n'y a pasun analogue arbitrairement complexe du p-hacking, mis à part la falsification des données, car aucune procédure connue de l'agent bayésien ne l'obligera à mettre à jour ses probabilités a priori dans une direction délibérément incorrecte. Pour chaque changement que nous pouvons obtenir de regarder un e , il y a une variation inverse que l' on peut attendre de l'observation ! Un e .
Étudiant: Quoi?
Scientifique: Je ne comprends pas non plus.
Bayesovets: D'accord, reportons les calculs pour l'instant et voyons ... oui, la crise de reproductibilité. Le scientifique a dit qu'il se méfie des solutions universelles idéales. Mais à mon avis, la transition vers les fonctions de vraisemblance devrait vraimentrésoudre de nombreux problèmes à la fois. Supposons ... j'y pense maintenant. Supposons qu'une société ait de gros problèmes de comptabilité. Ces problèmes sont liés au fait que toute comptabilité utilise des nombres à virgule flottante; et ce serait la moitié du problème, mais trois implémentations différentes sont utilisées (environ un tiers de la société chacune), il s'avère donc que Dieu sait quoi. Quelqu'un, par exemple, prend 1,0, ajoute 0,0001 mille fois, puis soustrait 0,1 et obtient 0,999999999999989. Puis il se rend à un autre étage, répète les calculs sur leurs ordinateurs et obtient 1,000000000000004. Et tout le monde pense qu'il en est ainsi. Et l'erreur, supposons, est vraiment énorme, les trois réalisations sont le résultat d'une union contre nature de peintures rupestres et de chiffres romains. Donc, en raison des différences entre eux, vous pouvez obtenir des différences assez tangibles dans les résultats. Bien sûrtout le monde sélectionne les ventes pour avoir des rapports trimestriels. Par conséquent, il est considéré comme un bon résultat si le budget du département ne se contredit pas au moins pour lui-même, et le département de l'amorçage cognitif, très probablement, a fait faillite il y a 20 ans. Et ici je sors, tout en blanc, et je dis: «Bonjour. Mais que se passe-t-il si au lieu de vos trois réalisations, vous utilisez ce truc cool qui ne peut pas être manipulé de cette façon et qui résoudra la moitié de vos problèmes. »qui ne peut pas être manipulé de cette manière et qui résoudra la moitié de vos problèmes. »qui ne peut pas être manipulé de cette manière et qui résoudra la moitié de vos problèmes. »
( Bayesovets , dans la voix du scientifique ) : «Je me méfie de telles solutions universelles», me répond le chef comptable. «Ne considère pas cela comme une insulte, mais toi, vieil homme, tu es un idéaliste. D'après mon expérience, différentes notations à virgule flottante sont bien adaptées à différentes opérations, vous ne devez donc pas immédiatement jeter tous les outils sauf un. "
Bayesovets: À quoi je lui réponds: «Peut-être que cela semble trop gras, mais je vais vous montrer le parfaitreprésentation des fractions, dans laquelle les résultats ne dépendent pas de l'ordre dans lequel vous ajoutez les nombres ou de l'ordinateur sur lequel les calculs ont lieu. Peut-être qu'en 1920, lorsque votre système venait d'être créé, il nécessitait trop de mémoire. Mais ce n'est pas l'année 1920, vous pouvez vous permettre de ne pas économiser les ressources informatiques. D'autant plus que vous y avez, 30 millions de comptes bancaires? C'est en fait un non-sens. Oui, mon point de vue a ses inconvénients. Par exemple, les racines carrées sont beaucoup plus difficiles à prendre. Mais combien de fois, pour être honnête, avez-vous besoin de prendre la racine carrée du salaire de quelqu'un d'autre? Pour la plupart des tâches du monde réel, ce système n'est pas inférieur au vôtre et, en outre, il ne peut pas être dupe sans truquer les valeurs d'entrée. » Après quoi je leur expliquecomment représenter un entier de longueur arbitraire en mémoire et comment représenter un nombre rationnel comme un rapport de deux entiers. Autrement dit, ce que nous appellerions maintenant la manière évidente de représenterde vrais nombres rationnels dans la mémoire de l'ordinateur. Le seul et unique système de théorèmes sur les nombres rationnels pour lesquels les nombres à virgule flottante ne sont qu'une approximation. Et si vous gérez les malheureux 30 millions de factures; si, dans la pratique, vos approximations ne coïncident pas entre elles, ni avec vous-même; s'ils permettent également à tout le monde de voler votre argent; enfin, si la cour n'est pas 1920 et vous pouvez vous permettre un ordinateur normal - la nécessité de comptes de transfert aux vrais nombres rationnels est assez évidente. De la même façon, la règle de Bayes et ses conséquences sont le seul système de théorèmes de probabilité basé sur des axiomes et strictement prouvé. Et donc le p-hacking ne fonctionne pas.
Scientifique: C'est ... audacieux. Même si tout ce que vous dites est vrai, il reste des difficultés pratiques. Les statistiques que nous utilisons maintenant prennent forme depuis plus d'une décennie; elle a prouvé sa valeur. Comment votre brillant parcours bayésien s'est-il révélé être mis en pratique?
Bayesovets: Dans les sciences naturelles, il n'a presque jamais été utilisé. Dans le machine learning, où, comme il est plus modeste à dire, il est assez facile de remarquer que le modèle est incorrect - parce que l'IA basée sur cela ne fonctionne pas - et donc, dans le machine learning, j'ai vu pour la dernière fois une approche fréquentielle de la probabilité il y a une dizaine d'années. Et je ne me souviens pas d' un seultravail dans lequel l'IA considérerait la valeur P d'une hypothèse. Si la probabilité apparaît au moins d'une manière ou d'une autre dans l'étude, elle est presque certainement bayésienne. Si quelque chose est classé selon des codes unitaires, alors l'entropie croisée est minimisée, et non ... Je ne sais même pas ce qui pourrait être un analogue des valeurs P dans l'IA. Je vais oser suggérer que c'est le point. Les statistiques de l'apprentissage automatique fonctionnent ou non, et c'est immédiatement évident: l'IA fait ce qu'elle devrait, ou elle plante. Et dans les sciences naturelles, tout le monde a d'abord besoin de publications. Puisqu'il se trouve qu'il est habituel d'indiquer les valeurs P dans les articles, mais ne punissez pas les résultats irréparables, nous avons ce que nous avons.
Scientifique:Autrement dit, vous êtes plutôt un mathématicien ou un programmeur qu'un naturaliste-expérimentateur? Pour une raison quelconque, cela ne me surprend pas. Je ne doute pas qu'un appareil statistique plus performant puisse exister, mais l'expérience de l'utilisation des valeurs P vaut également quelque chose. Oui, maintenant ils sont souvent tordus d'une manière ou d'une autre, mais nous savons comment le faire et nous commençons à comprendre comment y faire face. Les écueils sont au moins connus. Dans tout nouveau système, ils le seront également. Mais où exactement - cela ne deviendra clair qu'après des décennies. Peut-être seront-ils encore plus dangereux que les actuels.
Bayesovets:Oui, les comptables voleurs trouveront probablement de nouvelles manipulations passionnantes avec des nombres rationnels. Surtout dans les cas où les opérations exactes s'avèrent encore trop coûteuses en termes de calcul et doivent être approximées d'une manière ou d'une autre. Mais je crois toujours que si la même psychologie expérimentale est maintenant déchirée par une crise de reproductibilité, et si cette crise est clairement associée à l'utilisation des valeurs P, qui, franchement, ne sont rien d'autre qu'un tas de béquilles conflictuelles, alors essayez au moins d' utiliser plus méthode rationnelle. Bien que je n'encourage pas non plus à tout démolir et à tout reconstruire. En pratique, pour commencer, vous pouvez abandonner les valeurs P dans n'importe quel domaine (même en psychologie) et voir ce qui se passe.
Scientifique:Et comment allez-vous faire participer les psychologues à une telle expérience?
Bayesovets: Je n'en ai aucune idée. Franchement, je n'espère pas vraiment que quelqu'un changera vraiment quoi que ce soit. Très probablement, les gens utiliseront simplement les valeurs P jusqu'à la fin des temps. De telles choses. Mais il y a une chance que l'idée reste populaire. J'ai été agréablement surpris de la rapidité avec laquelle Open Access a pris racine. J'ai été agréablement surpris de constater que la crise de la reproductibilité était généralement constatée et que les gens s'en soucient d'ailleurs. Peut-être que les valeurs P seront encore retirées sur le marché et retournées avec une grande foule de personnes ( environ Per: au moins un journal psychologique en 2015 a refusé de tester des hypothèses nulles) Si c'est le cas, je serai agréablement surpris. Dans ce cas, il s'avère que mon travail sur la vulgarisation des règles Bayes et la vraisemblance n'a pas été vain.
Scientifique: Il peut également s'avérer que personne n'aime la vraisemblance en science expérimentale , et tout le monde considère que les valeurs P sont pratiques et utiles.
Bayesovets: Si le cours universitaire de statistique était si monstrueux qu'à la pensée même de la théorie des probabilités, ils ont des tremblements - alors oui, les changements devront venir de l'extérieur. J'espère personnellement que notre cher étudiant lira une introduction courte et plutôt fascinante à la théorie des probabilités bayésienne., le comparera avec son impressionnant manuel de statistiques et vous suppliera pour les six prochains mois "Eh bien, s'il vous plaît, puis-je simplement calculer la crédibilité et c'est tout, s'il vous plaît, permettez-moi."
Étudiant: Euh ... eh bien, je l'ai lu en premier, d'accord?
Bayesovets: Cher étudiant, réfléchis à ton choix. Certains changements dans la science ne se produisent que parce que les élèves grandissent entourés d'idées différentes et choisissent parmi eux les bonnes. C'est un célèbre aphorisme de Max Planck, et Max Planck ne dira pas de bêtises. Ergo, la capacité de la science à distinguer les mauvaises des bonnes idées dépend entièrement de l'intelligence des étudiants.
Scientifique: Eh bien, c'est déjà ...
Modérateur: Et c'est là que nous terminons notre transfert. Merci de votre attention!

Source: https://habr.com/ru/post/fr430190/


All Articles