El teorema de Bayes se llama un método poderoso para crear nuevos conocimientos, pero también se puede usar para anunciar la superstición y la pseudociencia.

El teorema de Bayes se hizo tan popular que incluso se mostró en el programa de televisión The Big Bang Theory. Pero, como cualquier herramienta, se puede usar para bien o para mal.
No sé exactamente cuándo escuché por primera vez sobre ella. Pero realmente, comencé a mostrar interés en ella solo en los últimos diez años, después de que varios de los más grandes nerds de mis estudiantes comenzaron a publicitarla como una guía mágica en la vida.
La charla de los estudiantes fue confusa para mí, al igual que las explicaciones del teorema en Wikipedia y otros sitios: eran completamente tontos o demasiado complicados. Decidí que Bayes era una moda pasajera, y que no tenía sentido investigar a fondo. Pero ahora, la fiebre bayesiana se ha vuelto demasiado molesta para ignorarla.
Según The New York Times, las estadísticas bayesianas "penetran en todas partes, desde la física hasta la investigación del cáncer, desde la ecología hasta la psicología". Los físicos han propuesto interpretaciones bayesianas de la mecánica cuántica y las defensas bayesianas de la teoría de cuerdas y la teoría del multiverso. Los filósofos sostienen que toda la ciencia puede verse como un proceso bayesiano, y que Bayes ayuda a distinguir la ciencia de la pseudociencia mejor que el método de
falsabilidad popularizado por
Karl Popper .
Los investigadores de inteligencia artificial, incluidos los desarrolladores de robots robóticos de Google, están utilizando el software bayesiano para ayudar a las máquinas a reconocer patrones y tomar decisiones. Los programas bayesianos, según Sharon Bertsch McGrayne, autor de la historia popular del teorema de Bayes, "clasifican el correo electrónico y el correo no deseado, evalúan los riesgos médicos y la seguridad del estado, descifran el ADN, etc." En Edge.org, el físico John Mater está preocupado de que las máquinas bayesianas puedan volverse tan inteligentes que desplacen a las personas.
Los científicos cognitivos sugieren que los algoritmos de Bayes funcionan en nuestro cerebro cuando detecta, refleja y toma decisiones. En noviembre, académicos y filósofos estudiaron esta posibilidad en una conferencia en la Universidad de Nueva York llamada "¿Funciona el cerebro en Bayes?"
Los fanáticos insisten en que si más personas adoptaran el método de pensamiento de Bayes (en lugar del trabajo inconsciente de Bayes, que supuestamente entra en el cerebro), el mundo sería mucho mejor. En el artículo, "Una explicación intuitiva del teorema de Bayes", el teórico de IA Elizer Yudkovsky habla sobre la adoración de Bayes:
“¿Por qué el concepto matemático despierta un entusiasmo tan extraño entre sus estudiantes? ¿Qué es el llamado ¿La "revolución bayesiana", que se extiende por varios campos de la ciencia, declarando la absorción de incluso métodos experimentales como casos especiales? ¿Qué secreto conocen los seguidores de Bayes? ¿Qué luz vieron? Lo descubrirás pronto. Pronto serás uno de nosotros. Yudkovsky está bromeando. O no?
Debido a todo este alboroto, intenté de una vez por todas tratar con Bayes. Encontré la mejor de las explicaciones del teorema entre su miríada en Internet de Yudkovsky, en Wikipedia, y en el trabajo del filósofo Curtis Brown y los científicos informáticos Oscar Bonill y Kalid Azad. Ahora intentaré, principalmente por mí mismo, explicar cuál es la esencia del teorema.
Teorema de Bayes, llamado así por el sacerdote presbiteriano del siglo XVIII Thomas Bayes [
transcripción correcta - Bayes
/ aprox. perev. ] Es un método para calcular la validez de las creencias (hipótesis, afirmaciones, sugerencias) basado en la evidencia disponible (observaciones, datos, información). La versión más simple es:
fe original + nueva evidencia = nueva fe mejorada
Si es más: la probabilidad de que una creencia sea verdadera con nueva evidencia es igual a la probabilidad de que la creencia sea verdadera sin esta evidencia, multiplicada por la probabilidad de que la evidencia sea verdadera en el caso de la verdad de la creencia, y dividida por la probabilidad de que la evidencia sea verdadera independientemente La verdad de la convicción. Ok?
Una fórmula matemática simple se ve así:
P (B | E) = P (B) * P (E | B) / P (E)
Donde P es probabilidad, B es creencia, E es evidencia. P (B) es la probabilidad de que B sea verdadero, P (E) es la probabilidad de que E sea verdadero. P (B | E) es probabilidad B en caso de verdad E, y P (E | B) es probabilidad E en caso de verdad B.
Para demostrar cómo funcionan las fórmulas, a menudo se usa un ejemplo con pruebas médicas. Supongamos que se le realiza una prueba de cáncer, que aparece en el 1% de las personas de su edad. Si la prueba es 100% confiable, entonces no necesita el teorema de Bayes para comprender lo que significa un resultado positivo, pero veamos tal situación como un ejemplo.
Para calcular el valor de P (B | E), debe colocar los datos en el lado derecho de la ecuación. P (B), la probabilidad de que tenga cáncer antes de la prueba es del 1%, o 0.01. También lo es P (E), la probabilidad de que el resultado de la prueba sea positivo. Como están en el numerador y en el denominador, se reducen y queda P (B | E) = P (E | B) = 1. Si el resultado de la prueba es positivo, usted tiene cáncer y viceversa.
En el mundo real, la fiabilidad de la prueba rara vez alcanza el 100%. Digamos que su prueba es 99% confiable. Es decir, 99 de cada 100 personas con cáncer obtendrán un resultado positivo, y 99 de cada 100 personas sanas obtendrán un resultado negativo. Y seguirá siendo una prueba increíblemente confiable. Pregunta: Si su prueba es positiva, ¿cuál es la probabilidad de que tenga cáncer?
Ahora el teorema de Bayes muestra todo el poder. La mayoría de las personas descubrirán que la respuesta es del 99%, o algo así. Después de todo, la prueba es tan confiable, ¿verdad? Pero la respuesta correcta será: solo el 50%.
Pegue los datos en el lado derecho de la ecuación para averiguar por qué. P (B) sigue siendo 0.01. P (E | B), la probabilidad de obtener una prueba positiva en caso de cáncer es de 0,99. P (B) * P (E | B) = 0.01 * 0.99 = 0.0099. Esta es la probabilidad de que obtenga una prueba positiva que demuestre que está enfermo.
¿Qué pasa con el denominador, P (E)? Hay un pequeño truco. P (E): la probabilidad de obtener una prueba positiva, independientemente de si está enfermo. En otras palabras, incluye falsos positivos y verdaderos positivos.
Para calcular la probabilidad de un falso positivo, debe multiplicar el número de falsos positivos, 1% o 0.01, por el porcentaje de personas sin cáncer - 0.99. Resulta 0.0099. Sí, su excelente prueba con una precisión del 99% produce tantos falsos positivos como verdaderos.
Termina los cálculos. Para obtener P (E), sume los positivos verdaderos y los falsos, obtenga 0.0198, divida entre 0.0099 y obtenga 0.5. Entonces, P (B | E), la probabilidad de que tenga cáncer en el caso de una prueba positiva es del 50%.
Si pasa la prueba nuevamente, puede reducir drásticamente la incertidumbre, ya que la probabilidad de tener su cáncer P (B) ya será del 50% en lugar de 1. Si la segunda prueba también es positiva, según el teorema de Bayes, la probabilidad de tener su cáncer será del 99%, o 0,99. Como muestra este ejemplo, repetir el teorema puede dar una respuesta muy precisa.
Pero si la confiabilidad de la prueba es del 90%, lo que no es malo en absoluto, las posibilidades de que tenga cáncer, incluso en el caso de que haya recibido dos veces resultados positivos, aún son inferiores al 50%.
La mayoría de las personas, incluidos los médicos, tienen dificultades para comprender esta distribución de posibilidades, lo que explica el número excesivo de diagnósticos y tratamientos para el cáncer y otras enfermedades. Este ejemplo sugiere que los bayesianos tienen razón: el mundo sería mejor si más personas, incluso más pacientes y médicos, aceptaran la lógica bayesiana.
El teorema de Bayes, por otro lado, es solo una compilación de sentido común en un código. Como Yudkovsky escribe al final de su material de capacitación: “En este punto, el teorema de Bayes puede parecer completamente obvio y parecerse a una tautología, en lugar de ser sorprendente y nuevo. En este caso, esta introducción ha alcanzado su objetivo ".
Volviendo al ejemplo del cáncer: el teorema de Bayes dice que la probabilidad de tener cáncer en caso de resultados positivos de la prueba es igual a la probabilidad de obtener un resultado positivo verdadero dividido por la probabilidad de todos los resultados positivos, verdadero y falso. En general, tenga cuidado con los falsos positivos.
Aquí está mi generalización de este principio: la credibilidad de su creencia depende de cuán fuertemente su creencia explique los hechos. Cuantas más opciones para explicar los hechos, menos confiable será su creencia personal. Desde mi punto de vista, esta es la esencia del teorema.
Las "explicaciones alternativas" pueden incluir muchas cosas. Sus hechos pueden ser falsos, obtenidos con la ayuda de una herramienta que funcionó incorrectamente, análisis incorrectos, una tendencia a obtener el resultado deseado e incluso falsificados. Sus hechos pueden ser precisos, pero muchas otras creencias o hipótesis pueden explicarlos.
En otras palabras, no hay magia en el teorema de Bayes. Todo se reduce al hecho de que sus creencias son tan confiables como la evidencia a su favor es cierta. Si tiene buena evidencia, el teorema produce resultados válidos. Si la evidencia es regular, el teorema no lo ayudará. Basura en la entrada, basura en la salida.
Los problemas con el teorema pueden comenzar con el valor de P (B), la suposición inicial sobre la probabilidad de sus creencias, a menudo llamada probabilidad a priori. En el ejemplo anterior, tuvimos una probabilidad a priori hermosa y precisa de 0.01. En el mundo real, los expertos discuten sobre cómo diagnosticar y explicar el cáncer. Su probabilidad a priori probablemente consistirá en un rango, no un solo número.
En muchos casos, la estimación de la probabilidad a priori se basa solo en conjeturas y permite que factores subjetivos se cuelen en los cálculos. Uno puede adivinar que la probabilidad de la existencia de algo, a diferencia del mismo cáncer, es simplemente cero, por ejemplo, cadenas, multiverso, inflación o Dios. Puede referirse a la evidencia dudosa de la fe dudosa. En tales casos, el teorema de Bayes puede anunciar pseudociencia y superstición, junto con el sentido común.
El teorema contiene una advertencia: si no está buscando escrupulosamente explicaciones alternativas para la evidencia, entonces la evidencia solo confirmará lo que ya cree. Los científicos a menudo pasan por alto esto, lo que explica por qué una cantidad tan grande de afirmaciones científicas son incorrectas. Los bayesianos sostienen que sus métodos pueden ayudar a los científicos a superar la tendencia a buscar hechos que respalden su fe y produzcan resultados más confiables, pero lo dudo.
Como mencioné, algunos entusiastas de la teoría de cuerdas y multiverso utilizan el análisis bayesiano. Por qué Porque los entusiastas están cansados de escuchar que la teoría de cuerdas y la teoría del multiverso no son falsificables y, por lo tanto, no científicas. El teorema de Bayes les permite presentar estas teorías de una mejor manera. En estos casos, el teorema no elimina el sesgo, sino que lo satisface.
Según Faye Flam, periodista que trabaja con temas científicos populares en The New York Times, las estadísticas bayesianas "no pueden salvarnos de la mala ciencia". El teorema de Bayes es universal y puede servir para cualquier propósito. El distinguido especialista en estadísticas bayesianas Donald Rubin trabajó como consultor para compañías tabacaleras en litigios relacionados con enfermedades relacionadas con el tabaquismo.
Y, sin embargo, admiro el teorema de Bayes. Me recuerda a la teoría de la evolución, otra idea que a la tautología le parecía simple o deprimentemente profunda, dependiendo del punto de vista, y de la misma manera inspiraba a las personas tanto para cualquier tontería como para descubrimientos asombrosos.
Quizás porque mi cerebro funciona de acuerdo con Bayes, las alusiones a este teorema comienzan a verse en todas partes. Al desplazarme por los trabajos recopilados de Edgar Allan Poe en mi Kindle, me encontré con la siguiente oración de El cuento de las aventuras de Arthur Gordon Pym: "Debido a nuestras adicciones o prejuicios, no podemos aprender una lección, incluso de las cosas más obvias" [
por. George Pavlovich Zlobin ].
Tenga esto en cuenta antes de inscribirse en los seguidores de Bayes.