Teorema Bayes disebut sebagai metode yang kuat untuk menciptakan pengetahuan baru, tetapi juga dapat digunakan untuk mengiklankan takhayul dan pseudosains.

Teorema Bayes menjadi begitu populer sehingga bahkan ditampilkan di acara televisi The Big Bang Theory. Tetapi, seperti alat apa pun, alat itu dapat digunakan untuk kebaikan atau bahaya.
Saya tidak tahu persis kapan saya pertama kali mendengar tentang dia. Tapi sungguh, saya mulai menunjukkan minat padanya hanya dalam sepuluh tahun terakhir, setelah beberapa kutu buku terbesar dari siswa saya mulai mengiklankannya sebagai panduan ajaib dalam kehidupan.
Pembicaraan mahasiswa itu membingungkan saya, seperti juga penjelasan teorema di Wikipedia dan situs lainnya - mereka benar-benar bodoh atau terlalu rumit. Saya memutuskan bahwa Bayes adalah tren yang lewat, dan tidak ada gunanya dalam penelitian mendalam. Tapi sekarang, demam Bayesian menjadi terlalu menjengkelkan untuk diabaikan.
Menurut The New York Times, statistik Bayesian "menembus di mana-mana, dari fisika ke penelitian kanker, dari ekologi ke psikologi." Fisikawan telah mengusulkan interpretasi Bayesian tentang mekanika kuantum dan pertahanan Bayesian tentang teori string dan teori multiverse. Para filsuf berpendapat bahwa keseluruhan sains dapat dilihat sebagai proses Bayesian, dan bahwa Bayes membantu membedakan sains dari pseudosain lebih baik daripada metode
pemalsuan yang dipopulerkan oleh
Karl Popper .
Peneliti kecerdasan buatan, termasuk pengembang robomobile Google, menggunakan perangkat lunak Bayesian untuk membantu mesin mengenali pola dan membuat keputusan. Program Bayesian, menurut Sharon Bertsch McGrayne, penulis sejarah populer teorema Bayes, "mengurutkan email dan spam, mengevaluasi risiko medis dan keamanan negara, mendekripsi DNA, dll." Di Edge.org, fisikawan John Mater khawatir bahwa mesin Bayesian bisa menjadi sangat pintar sehingga membuat orang berkerumun.
Ilmuwan kognitif menyarankan bahwa algoritma Bayes bekerja di otak kita ketika merasakan, merefleksikan, dan membuat keputusan. Pada bulan November, para sarjana dan filsuf mempelajari kemungkinan ini pada sebuah konferensi di Universitas New York yang disebut "Apakah otak bekerja di Bayes?"
Fanatik bersikeras bahwa jika lebih banyak orang mengadopsi metode berpikir Bayes (bukan karya Bayes yang tidak disadari, yang seharusnya masuk ke otak), dunia akan jauh lebih baik. Dalam artikel tersebut, “Penjelasan Intuitif Bayor Theorem,” teoretikus AI Elizer Yudkovsky berbicara tentang pemujaan Bayes:
“Mengapa konsep matematika membangkitkan antusiasme yang aneh di kalangan siswa? Apa yang disebut "Revolusi Bayesian", yang menyapu berbagai bidang ilmu pengetahuan, menyatakan penyerapan metode eksperimental bahkan sebagai kasus khusus? Rahasia apa yang diketahui oleh pengikut Bayes? Cahaya apa yang mereka lihat? Anda akan segera tahu. Segera Anda akan menjadi salah satu dari kami. " Yudkovsky bercanda. Atau tidak?
Karena semua hype ini, saya mencoba sekali dan untuk semua berurusan dengan Bayes. Saya menemukan yang terbaik dari penjelasan teorema di antara segudang mereka di Internet dari Yudkovsky, di Wikipedia, dan dalam karya filsuf Curtis Brown dan ilmuwan komputer Oscar Bonill dan Kalid Azad. Sekarang saya akan mencoba, terutama untuk diri saya sendiri, untuk menjelaskan apa inti dari teorema itu.
Teorema Bayes, dinamai setelah imam Presbiterian abad ke-18 Thomas Bayes [
transkripsi yang benar - Bayes
/ kira-kira. perev. ] Adalah metode penghitungan validitas keyakinan (hipotesis, pernyataan, saran) berdasarkan bukti yang tersedia (pengamatan, data, informasi). Versi paling sederhana adalah:
iman asli + bukti baru = iman baru yang ditingkatkan
Jika lebih: probabilitas bahwa kepercayaan itu benar dengan bukti baru sama dengan probabilitas bahwa keyakinan itu benar tanpa bukti-bukti ini, dikalikan dengan probabilitas bahwa bukti itu benar dalam kasus kebenaran keyakinan, dan dibagi dengan probabilitas bahwa bukti itu benar terlepas dari kebenaran keyakinan. Oke
Rumus matematika sederhana terlihat seperti ini:
P (B | E) = P (B) * P (E | B) / P (E)
Di mana P adalah probabilitas, B adalah keyakinan, E adalah bukti. P (B) adalah probabilitas bahwa B benar, P (E) adalah probabilitas bahwa E benar. P (B | E) adalah probabilitas B dalam hal kebenaran E, dan P (E | B) adalah probabilitas E dalam kasus kebenaran B.
Untuk mendemonstrasikan cara kerja formula, contoh dengan tes medis sering digunakan. Misalkan Anda diuji untuk kanker, yang muncul pada 1% orang seusia Anda. Jika tes ini 100% dapat diandalkan, maka Anda tidak perlu teorema Bayes untuk memahami apa arti hasil positif - tetapi mari kita lihat situasi seperti ini sebagai contoh.
Untuk menghitung nilai P (B | E), Anda perlu menempatkan data di sisi kanan persamaan. P (B), kemungkinan Anda menderita kanker sebelum pengujian adalah 1%, atau 0,01. Begitu juga P (E), kemungkinan hasil tes akan positif. Karena mereka berada di pembilang dan penyebut, mereka berkurang, dan P (B | E) = P (E | B) tetap 1. Jika hasil tes positif, Anda menderita kanker, dan sebaliknya.
Di dunia nyata, reliabilitas tes jarang mencapai 100%. Katakanlah pengujian Anda 99% andal. Artinya, 99 dari 100 orang dengan kanker akan mendapatkan hasil positif, dan 99 dari 100 orang sehat akan mendapatkan hasil negatif. Dan itu masih akan menjadi tes yang luar biasa andal. Pertanyaan: Jika hasil tes Anda positif, apa kemungkinan Anda terkena kanker?
Teorema Bayes menunjukkan semua kekuatan. Kebanyakan orang akan menemukan bahwa jawabannya adalah 99%, atau sesuatu seperti itu. Lagi pula, tes ini sangat andal, bukan? Tetapi jawaban yang benar adalah - hanya 50%.
Tempel data di sisi kanan persamaan untuk mencari tahu alasannya. P (B) masih 0,01. P (E | B), probabilitas mendapatkan tes positif jika kanker adalah 0,99. P (B) * P (E | B) = 0,01 * 0,99 = 0,0099. Ini adalah kemungkinan bahwa Anda akan mendapatkan tes positif yang menunjukkan bahwa Anda sakit.
Bagaimana dengan penyebutnya, P (E)? Ada sedikit trik. P (E) - kemungkinan mendapatkan tes positif, terlepas dari apakah Anda sakit. Dengan kata lain, itu termasuk positif palsu dan positif sejati.
Untuk menghitung probabilitas positif palsu, Anda perlu mengalikan jumlah positif palsu, 1% atau 0,01, dengan persentase orang tanpa kanker - 0,99. Ternyata 0,0099. Ya, pengujian luar biasa Anda dengan akurasi 99% menghasilkan positif palsu sebanyak yang benar.
Selesaikan perhitungan. Untuk mendapatkan P (E), tambahkan positif benar dan salah, dapatkan 0,0198, bagi dengan 0,0099, dan dapatkan 0,5. Jadi, P (B | E), kemungkinan Anda menderita kanker dalam hal tes positif adalah 50%.
Jika Anda lulus tes lagi, Anda dapat secara drastis mengurangi ketidakpastian, karena kemungkinan kanker Anda P (B) akan menjadi 50% daripada 1. Jika tes kedua juga positif, oleh teorema Bayes, probabilitas memiliki kanker Anda akan menjadi 99%, atau 0,99. Seperti yang ditunjukkan contoh ini, pengulangan teorema dapat memberikan jawaban yang sangat akurat.
Tetapi jika reliabilitas tes adalah 90%, yang tidak buruk sama sekali, kemungkinan menderita kanker, bahkan dalam kasus dua kali menerima hasil positif, masih kurang dari 50%.
Sebagian besar orang, termasuk dokter, mengalami kesulitan memahami distribusi peluang ini, yang menjelaskan banyaknya diagnosis dan perawatan untuk kanker dan penyakit lainnya. Contoh ini menunjukkan bahwa orang Bayesian benar: dunia akan lebih baik jika lebih banyak orang - bahkan lebih banyak pasien dan dokter - yang akan menerima logika Bayesian.
Teorema Bayes, di sisi lain, hanyalah kompilasi akal sehat menjadi sebuah kode. Seperti yang ditulis Yudkovsky di akhir materi pelatihannya: “Pada titik ini, teorema Bayes mungkin tampak sangat jelas dan menyerupai tautologi, bukannya mengejutkan dan baru. Dalam hal ini, pengantar ini telah mencapai tujuannya. "
Kembali ke contoh kanker: Teorema Bayes mengatakan bahwa probabilitas terkena kanker jika hasil tes positif sama dengan probabilitas mendapatkan hasil positif sejati dibagi dengan probabilitas semua hasil positif, benar dan salah. Secara umum, waspadai positif palsu.
Inilah generalisasi prinsip ini: kredibilitas keyakinan Anda bergantung pada seberapa kuat keyakinan Anda menjelaskan fakta. Semakin banyak opsi untuk menjelaskan fakta, semakin tidak dapat dipercaya keyakinan pribadi Anda. Dari sudut pandang saya, ini adalah inti dari teorema.
"Penjelasan alternatif" dapat mencakup banyak hal. Fakta Anda mungkin salah, diperoleh dengan bantuan alat yang berfungsi tidak benar, analisis salah, kecenderungan untuk mendapatkan hasil yang diinginkan, dan bahkan dipalsukan. Fakta Anda mungkin akurat, tetapi banyak keyakinan atau hipotesis lain mungkin menjelaskannya.
Dengan kata lain, tidak ada sihir dalam teorema Bayes. Itu semua bermuara pada fakta bahwa kepercayaan Anda sama andalnya dengan bukti yang mendukungnya benar. Jika Anda memiliki bukti yang baik, teorema tersebut menghasilkan hasil yang valid. Jika buktinya begitu-begitu, teorema tidak akan membantu Anda. Sampah di pintu masuk, sampah di pintu keluar.
Masalah dengan teorema dapat dimulai dengan nilai P (B), asumsi awal tentang probabilitas kepercayaan Anda, sering disebut probabilitas apriori. Dalam contoh di atas, kami memiliki probabilitas apriori yang indah dan akurat 0,01. Di dunia nyata, para ahli berdebat tentang cara mendiagnosis dan menjelaskan kanker. Peluang a priori Anda kemungkinan besar terdiri dari kisaran, bukan angka tunggal.
Dalam banyak kasus, estimasi probabilitas apriori hanya didasarkan pada dugaan, dan memungkinkan faktor subyektif untuk masuk ke dalam perhitungan. Orang dapat menebak bahwa probabilitas keberadaan sesuatu - tidak seperti kanker yang sama - hanyalah nol, misalnya, string, multiverse, inflasi atau Tuhan. Anda bisa merujuk pada bukti keraguan tentang iman yang meragukan. Dalam kasus seperti itu, teorema Bayes dapat mengiklankan pseudosain dan takhayul, bersama dengan akal sehat.
Teorema tersebut berisi peringatan: jika Anda tidak dengan cermat mencari penjelasan alternatif untuk bukti, maka bukti hanya akan mengkonfirmasi apa yang sudah Anda yakini. Para ilmuwan sering mengabaikan hal ini, yang menjelaskan mengapa begitu banyak pernyataan ilmiah yang salah. Bayesians berpendapat bahwa metode mereka dapat membantu para ilmuwan mengatasi kecenderungan untuk mencari fakta yang mendukung iman mereka dan menghasilkan hasil yang lebih dapat diandalkan - tetapi saya meragukannya.
Seperti yang saya sebutkan, beberapa penggemar teori string dan multiverse menggunakan analisis Bayesian. Mengapa Karena penggemar lelah mendengar bahwa teori string dan teori multiverse tidak dapat dipalsukan, dan karenanya tidak ilmiah. Teorema Bayes memungkinkan mereka untuk menyajikan teori-teori ini dengan lebih baik. Dalam kasus ini, teorema tidak menghilangkan bias, tetapi menurutinya.
Menurut Faye Flam, seorang jurnalis yang bekerja dengan topik sains populer di The New York Times, statistik Bayesian "tidak dapat menyelamatkan kita dari sains yang buruk." Teorema Bayes bersifat universal dan dapat melayani tujuan apa pun. Pakar statistik Bayesian yang terhormat Donald Rubin bekerja sebagai konsultan untuk perusahaan-perusahaan tembakau dalam litigasi terkait penyakit yang berkaitan dengan merokok.
Namun saya mengagumi teorema Bayes. Ini mengingatkan saya pada teori evolusi, gagasan lain yang tampak dalam tautologi sederhana atau mendalam, tergantung pada sudut pandangnya, dan dengan cara yang sama mengilhami orang-orang baik untuk omong kosong apa pun dan untuk penemuan menakjubkan.
Mungkin karena otak saya bekerja menurut Bayes, kiasan pada teorema ini mulai terlihat di mana-mana. Menggulir melalui karya-karya Edgar Allan Poe yang dikumpulkan di Kindle saya, saya menemukan kalimat berikut dari The Tale of the Adventures of Arthur Gordon Pym: “Karena kecanduan atau prasangka kami, kami tidak dapat belajar pelajaran bahkan dari hal-hal yang paling jelas” [
per. George Pavlovich Zlobin ].
Ingatlah hal ini sebelum mendaftar untuk pengikut Bayes.