O teorema de Bayes é chamado de um método poderoso de criação de novos conhecimentos, mas também pode ser usado para anunciar superstições e pseudociências.

O teorema de Bayes tornou-se tão popular que até foi exibido no programa de televisão The Big Bang Theory. Mas, como qualquer ferramenta, pode ser usada para o bem ou para o mal.
Não sei exatamente quando ouvi falar dela pela primeira vez. Mas, na verdade, comecei a mostrar interesse por ela apenas nos últimos dez anos, depois que vários dos maiores nerds de meus alunos começaram a fazer propaganda dela como um guia mágico na vida.
A palestra dos alunos foi confusa para mim, assim como as explicações do teorema na Wikipedia e em outros sites - elas eram completamente burras ou muito complicadas. Decidi que Bayes era uma moda passageira, e não havia sentido em pesquisas profundas. Mas agora, a febre bayesiana se tornou muito irritante para ignorar.
Segundo o The New York Times, as estatísticas bayesianas "penetram em todos os lugares, da física à pesquisa do câncer, da ecologia à psicologia". Os físicos propuseram interpretações bayesianas da mecânica quântica e as defesas bayesianas da teoria das cordas e da teoria do multiverso. Os filósofos argumentam que toda a ciência pode ser vista como um processo bayesiano e que Bayes ajuda a distinguir a ciência da pseudociência melhor do que o método de
falsificabilidade popularizado por
Karl Popper .
Pesquisadores de inteligência artificial, incluindo os desenvolvedores de robôs do Google, estão usando o software bayesiano para ajudar as máquinas a reconhecer padrões e tomar decisões. Os programas bayesianos, de acordo com Sharon Bertsch McGrayne, autor da história popular do teorema de Bayes, "classificam email e spam, avaliam riscos médicos e segurança do estado, descriptografam DNA etc." No Edge.org, o físico John Mater está preocupado com o fato de as máquinas bayesianas se tornarem tão inteligentes que estão expulsando as pessoas.
Cientistas cognitivos sugerem que os algoritmos de Bayes funcionam em nosso cérebro quando detecta, reflete e toma decisões. Em novembro, estudiosos e filósofos estudaram essa possibilidade em uma conferência na Universidade de Nova York chamada "O cérebro funciona em Bayes?"
Os fanáticos insistem que se mais pessoas adotassem o método de pensamento de Bayes (em vez de o trabalho inconsciente de Bayes, que supostamente ocorre no cérebro), o mundo seria muito melhor. No artigo, “Uma explicação intuitiva do teorema de Bayes”, o teórico da IA Elizer Yudkovsky fala sobre a adoração de Bayes:
“Por que o conceito matemático desperta um entusiasmo tão estranho entre seus alunos? Qual é o chamado “Revolução bayesiana”, que varre vários campos da ciência, declarando a absorção de métodos experimentais como casos especiais? Que segredo é conhecido pelos seguidores de Bayes? Que luz eles viram? Você descobrirá em breve. Em breve você será um de nós. Yudkovsky está brincando. Ou não?
Por causa de todo esse hype, tentei de uma vez por todas lidar com Bayes. Encontrei as melhores explicações do teorema entre a miríade na Internet de Yudkovsky, Wikipedia, e os trabalhos do filósofo Curtis Brown e dos cientistas da computação Oscar Bonill e Kalid Azad. Agora vou tentar, principalmente para mim, explicar qual é a essência do teorema.
Teorema de Bayes, em homenagem ao padre presbiteriano do século XVIII Thomas Bayes [
transcrição correta - Bayes
/ aprox. perev. ] É um método de calcular a validade de crenças (hipóteses, declarações, sugestões) com base nas evidências disponíveis (observações, dados, informações). A versão mais simples é:
fé original + nova evidência = fé nova e melhorada
Se mais: a probabilidade de uma crença ser verdadeira com novas evidências é igual à probabilidade de que a crença seja verdadeira sem essas evidências, multiplicada pela probabilidade de que a evidência seja verdadeira no caso da verdade da crença e dividida pela probabilidade de que a evidência seja verdadeira independentemente a verdade da convicção. Ta bom
Uma fórmula matemática simples é assim:
P (B | E) = P (B) * P (E | B) / P (E)
Onde P é probabilidade, B é crença, E é evidência. P (B) é a probabilidade de que B seja verdadeiro, P (E) é a probabilidade de que E seja verdadeiro. P (B | E) é a probabilidade B no caso da verdade E, e P (E | B) é a probabilidade E no caso da verdade B.
Para demonstrar como as fórmulas funcionam, um exemplo com exames médicos é frequentemente usado. Suponha que você faça um teste de câncer, que aparece em 1% das pessoas da sua idade. Se o teste é 100% confiável, você não precisa do teorema de Bayes para entender o que significa um resultado positivo - mas vamos ver uma situação como um exemplo.
Para calcular o valor de P (B | E), você precisa colocar os dados no lado direito da equação. P (B), a chance de você ter câncer antes do teste é de 1% ou 0,01. O mesmo acontece com P (E), a probabilidade de o resultado do teste ser positivo. Como eles estão no numerador e denominador, eles são reduzidos e P (B | E) = P (E | B) = 1. Se o resultado do teste for positivo, você terá câncer e vice-versa.
No mundo real, a confiabilidade do teste raramente chega a 100%. Digamos que seu teste seja 99% confiável. Ou seja, 99 em cada 100 pessoas com câncer obterão um resultado positivo e 99 em cada 100 pessoas saudáveis obterão um resultado negativo. E ainda será um teste incrivelmente confiável. Pergunta: Se o seu teste for positivo, qual a probabilidade de você ter câncer?
Agora o teorema de Bayes mostra todo o poder. A maioria das pessoas vai achar que a resposta é 99%, ou algo assim. Afinal, o teste é tão confiável, certo? Mas a resposta correta será - apenas 50%.
Cole os dados no lado direito da equação para descobrir o porquê. P (B) ainda é 0,01. P (E | B), a probabilidade de obter um teste positivo em caso de câncer é de 0,99. P (B) * P (E | B) = 0,01 * 0,99 = 0,0099. Essa é a probabilidade de você fazer um teste positivo mostrando que está doente.
E o denominador, P (E)? Há um pequeno truque. P (E) - a probabilidade de obter um teste positivo, independentemente de você estar doente. Em outras palavras, inclui falsos positivos e verdadeiros positivos.
Para calcular a probabilidade de um falso positivo, você precisa multiplicar o número de falsos positivos, 1% ou 0,01, pela porcentagem de pessoas sem câncer - 0,99. Acontece 0,0099. Sim, seu excelente teste com precisão de 99% produz tantos falsos positivos quanto os verdadeiros.
Termine os cálculos. Para obter P (E), adicione os positivos verdadeiro e falso, obtenha 0,0198, divida por 0,0099 e obtenha 0,5. Então, P (B | E), a probabilidade de você ter câncer no caso de um teste positivo é de 50%.
Se você passar no teste novamente, poderá reduzir drasticamente a incerteza, pois a probabilidade de ter seu câncer P (B) já será de 50% em vez de 1. Se o segundo teste também for positivo, pelo teorema de Bayes, a probabilidade de ter seu câncer será de 99%, ou 0,99. Como mostra este exemplo, repetir o teorema pode dar uma resposta muito precisa.
Mas se a confiabilidade do teste é de 90%, o que não é nada ruim, as chances de você ter câncer, mesmo no caso de duas vezes receberem resultados positivos, ainda são menos de 50%.
A maioria das pessoas, incluindo médicos, tem dificuldade em entender essa distribuição de chances, o que explica o número excessivo de diagnósticos e tratamentos para câncer e outras doenças. Este exemplo sugere que os bayesianos estão certos: o mundo seria melhor se mais pessoas - ainda mais pacientes e médicos - aceitassem a lógica bayesiana.
O teorema de Bayes, por outro lado, é apenas uma compilação de bom senso em um código. Como Yudkovsky escreve no final de seu material de treinamento: “Nesse ponto, o teorema de Bayes pode parecer completamente óbvio e se assemelhar a uma tautologia, em vez de ser surpreendente e novo. Nesse caso, esta introdução atingiu seu objetivo. ”
Voltando ao exemplo do câncer: o teorema de Bayes diz que a probabilidade de ter câncer em caso de resultados positivos é igual à probabilidade de obter um verdadeiro resultado positivo dividido pela probabilidade de todos os resultados positivos, verdadeiro e falso. Em geral, cuidado com os falsos positivos.
Aqui está minha generalização desse princípio: a credibilidade de sua crença depende de quão fortemente ela explica os fatos. Quanto mais opções para explicar os fatos, menos confiável será sua crença pessoal. Do meu ponto de vista, essa é a essência do teorema.
"Explicações alternativas" podem incluir muitas coisas. Seus fatos podem ser falsos, obtidos com a ajuda de uma ferramenta que funcionou incorretamente, com análises incorretas, com uma tendência a obter o resultado desejado e até falsificados. Seus fatos podem ser precisos, mas muitas outras crenças ou hipóteses podem explicá-los.
Em outras palavras, não há mágica no teorema de Bayes. Tudo se resume ao fato de que suas crenças são tão confiáveis quanto as evidências a favor delas. Se você tiver boas evidências, o teorema produz resultados válidos. Se a evidência for positiva, o teorema não o ajudará. Lixo na entrada, lixo na saída.
Os problemas com o teorema podem começar com o valor de P (B), a suposição inicial sobre a probabilidade de suas crenças, geralmente chamada de probabilidade a priori. No exemplo acima, tivemos uma probabilidade a priori bonita e precisa de 0,01. No mundo real, especialistas discutem sobre como diagnosticar e explicar o câncer. Sua probabilidade a priori provavelmente consistirá em um intervalo, não em um único número.
Em muitos casos, a estimativa de probabilidade a priori é baseada apenas em conjecturas e permite que fatores subjetivos entrem nos cálculos. Pode-se adivinhar que a probabilidade da existência de algo - diferente do mesmo câncer - é simplesmente zero, por exemplo, cordas, multiverso, inflação ou Deus. Você pode se referir a evidências duvidosas de fé duvidosa. Nesses casos, o teorema de Bayes pode anunciar pseudociência e superstição, além de bom senso.
O teorema contém um aviso: se você não estiver procurando escrupulosamente explicações alternativas para a evidência, ela só confirmará o que você já acredita. Os cientistas geralmente ignoram isso, o que explica por que um número tão grande de declarações científicas está incorreto. Os bayesianos argumentam que seus métodos podem ajudar os cientistas a superar a tendência de procurar fatos que apóiem sua fé e produzam resultados mais confiáveis - mas duvido.
Como mencionei, alguns entusiastas da teoria das cordas e do multiverso usam a análise bayesiana. Porque Porque os entusiastas estão cansados de ouvir que a teoria das cordas e a teoria do multiverso não são falsificáveis e, portanto, não são científicas. O teorema de Bayes permite que eles apresentem essas teorias de uma maneira melhor. Nesses casos, o teorema não elimina o viés, mas o satisfaz.
De acordo com Faye Flam, jornalista que trabalha com tópicos populares da ciência no The New York Times, as estatísticas bayesianas "não podem nos salvar da má ciência". O teorema de Bayes é universal e pode servir a qualquer propósito. O ilustre especialista em estatística bayesiano Donald Rubin trabalhou como consultor de empresas de tabaco em litígios relacionados a doenças relacionadas ao fumo.
E ainda assim admiro o teorema de Bayes. Isso me lembra a teoria da evolução, outra idéia que parecia para a tautologia simples ou deprimente profunda, dependendo do ponto de vista, e da mesma forma inspirou as pessoas, tanto por qualquer absurdo quanto por descobertas surpreendentes.
Talvez porque meu cérebro funcione de acordo com Bayes, alusões a esse teorema estejam começando a ser vistas em toda parte. Percorrendo as obras coletadas de Edgar Allan Poe no meu Kindle, deparei-me com a seguinte frase de "O conto das aventuras de Arthur Gordon Pym": "Devido a nossos preconceitos ou preconceitos, não somos capazes de aprender uma lição nem das coisas mais óbvias" [
per. George Pavlovich Zlobin ].
Lembre-se disso antes de se inscrever para os adeptos da Bayes.