Bagaimana kecerdasan buatan mengubah ilmu pengetahuan

Algoritma AI terbaru memahami evolusi galaksi, menghitung fungsi gelombang kuantum, menemukan senyawa kimia baru, dan sebagainya. Apakah ada sesuatu dalam karya ilmuwan yang tidak dapat diotomatisasi?




Tidak ada orang atau bahkan sekelompok orang dapat mengikuti informasi air terjun yang dihasilkan oleh sejumlah besar percobaan dalam fisika dan astronomi. Beberapa dari mereka meninggalkan data terabyte setiap hari, dan aliran ini hanya meningkat. Array antena Square Kilometer, sebuah teleskop radio yang rencananya akan diaktifkan pada pertengahan 2020-an, akan menghasilkan setiap tahun volume data yang sebanding dengan seluruh Internet.

Banjir data ini telah menyebabkan banyak ilmuwan beralih ke kecerdasan buatan (AI) untuk meminta bantuan. Dengan keterlibatan manusia yang minimal, sistem AI seperti jaringan saraf - jaringan neuron yang disimulasikan komputer yang meniru fungsi otak - dapat mengarungi kumpulan data, menemukan anomali, dan mengenali urutan yang tidak akan pernah dilihat orang.

Tentu saja, bantuan komputer dalam penelitian ilmiah telah digunakan selama sekitar 75 tahun, dan metode pengurutan data secara manual untuk mencari urutan yang bermakna ditemukan ribuan tahun yang lalu. Tetapi beberapa sarjana berpendapat bahwa teknologi terbaru dalam pembelajaran mesin dan AI mewakili cara baru yang fundamental dalam melakukan sains. Salah satu pendekatan ini, pemodelan generatif (GM), dapat membantu menentukan teori yang paling mungkin di antara penjelasan bersaing dari data yang diamati, berdasarkan hanya pada data ini, dan tanpa pengetahuan yang diprogram tentang proses fisik apa yang dapat terjadi dalam sistem yang diteliti. . Para pendukung GM menganggapnya cukup inovatif untuk dilihat sebagai "cara ketiga" yang potensial untuk mempelajari alam semesta.

Biasanya kita memperoleh pengetahuan tentang alam melalui pengamatan. Bagaimana Johannes Kepler mempelajari tabel-tabel posisi planet-planet Tycho Brahe, mencoba menemukan pola yang mendasarinya (ia akhirnya menyadari bahwa planet-planet bergerak dalam orbit elips). Ilmu pengetahuan juga telah bergerak maju melalui simulasi. Seorang astronom dapat mensimulasikan pergerakan Bimasakti dan galaksi yang berdekatan, Andromeda, dan meramalkan bahwa mereka akan bertabrakan dalam beberapa miliar tahun. Pengamatan dan simulasi membantu para ilmuwan membuat hipotesis yang dapat diverifikasi menggunakan pengamatan di masa depan. GM berbeda dari kedua pendekatan ini.

"Pada dasarnya, ini adalah pendekatan ketiga, antara pengamatan dan simulasi," kata Kevin Shavinsky , seorang astrofisika dan salah satu pendukung pro-GM, yang hingga saat ini bekerja di Institut Teknologi Federal Swiss. "Ini adalah cara berbeda untuk menyerang tugas."

Beberapa ilmuwan menganggap GM dan teknologi lainnya hanya sebagai alat yang ampuh untuk mempraktikkan sains tradisional. Tetapi sebagian besar setuju bahwa AI akan secara signifikan mempengaruhi proses ini, dan perannya dalam sains hanya akan tumbuh. Brian Nord , ahli astrofisika di Fermi National Accelerator Laboratory, yang menggunakan jaringan saraf tiruan untuk mempelajari ruang angkasa, adalah salah satu dari mereka yang takut bahwa tidak ada satu ilmuwan manusia pun yang akan lolos dari otomatisasi. "Pikiran itu sangat menakutkan," katanya.

Penemuan generasi


Bahkan di institut itu, Shavinsky mulai membangun reputasi dalam sains berdasarkan data. Saat bekerja pada doktornya, ia bertemu dengan tugas mengklasifikasikan ribuan galaksi berdasarkan penampilan mereka. Tidak ada program siap pakai untuk tugas ini, jadi dia memutuskan untuk mengatur crowdsourcing untuk tujuan ini - begitulah lahirnya proyek Kebun Binatang Galactic . Sejak 2007, pengguna biasa dapat membantu para astronom membuat asumsi tentang galaksi mana yang termasuk dalam kategori mana, dan biasanya sebagian besar suara dengan benar mengklasifikasikan galaksi. Proyek ini berhasil, bagaimanapun, seperti yang dicatat Shavinsky, AI membuatnya menjadi sia-sia: "Hari ini, seorang ilmuwan berbakat dengan pengalaman di Wilayah Moskow dan akses ke komputasi awan dapat membuat proyek seperti itu dalam setengah hari."

Shavinsky beralih ke alat kuat baru GM pada tahun 2016. Faktanya, GM mengajukan pertanyaan: seberapa besar kemungkinan bahwa dalam kondisi X kita mendapatkan hasil Y? Pendekatan ini telah terbukti sangat efektif dan universal. Sebagai contoh, katakanlah Anda memberi makan GM serangkaian gambar wajah manusia, dan untuk setiap orang seusianya ditempelkan. Program menyisir data pelatihan ini dan mulai menemukan hubungan antara wajah-wajah lama dan meningkatnya kemungkinan kerutan muncul pada mereka. Sebagai hasilnya, ia dapat memberi tahu usia orang tertentu - yaitu, untuk memprediksi perubahan fisik apa yang mungkin dialami orang dari segala usia.


Tak satu pun dari orang-orang ini nyata. Baris atas (A) dan kolom kiri (B) dibuat oleh jaringan generatif-permusuhan (GSS) menggunakan blok bangunan yang berasal dari elemen orang nyata. Kemudian GSS menggabungkan fitur wajah utama dari seri A, termasuk jenis kelamin, tumbuh dan bentuk wajah, dengan fitur wajah yang lebih kecil dari kolom B, misalnya, warna rambut dan mata, dan membuat wajah di seluruh meja.

Dari sistem GM, jaringan permusuhan generatif (GSS) paling dikenal. Setelah memproses data pelatihan yang memadai, GSS dapat mengembalikan gambar dengan piksel yang hilang atau rusak atau membuat foto buram menjadi jelas. GSS dilatih untuk mengekstraksi informasi yang hilang berdasarkan kompetisi (maka dari itu "permusuhan"): satu bagian dari jaringan, generator, menghasilkan data palsu, dan yang kedua, diskriminator, mencoba untuk membedakan data palsu dari yang asli. Saat program sedang berjalan, kedua bagiannya secara bertahap bekerja lebih baik. Anda mungkin telah melihat beberapa "wajah" super-realistis yang dibuat oleh GSS - gambar "orang-orang yang sangat realistis yang tidak ada dalam kenyataan," seperti yang mereka tulis di salah satu tajuk utama.

Dalam kasus yang lebih umum, GM mengambil kumpulan data (biasanya gambar, tetapi tidak perlu), dan memecahnya menjadi himpunan bagian dari blok bangunan abstrak dasar - para ilmuwan menyebutnya "ruang tersembunyi" dari data. Algoritme memanipulasi elemen ruang tersembunyi untuk melihat bagaimana hal ini akan memengaruhi data awal, yang membantu mengungkapkan proses fisik yang memastikan pengoperasian sistem.

Gagasan tentang ruang tersembunyi itu abstrak dan sulit dibayangkan, tetapi sebagai analogi yang kasar, pikirkan apa yang dapat dilakukan otak Anda ketika Anda mencoba menentukan jenis kelamin seseorang secara langsung. Mungkin Anda memperhatikan gaya rambut, bentuk hidung, dan sebagainya, serta pola-pola yang tidak mudah digambarkan dengan kata-kata. Sebuah program komputer juga mencari tanda-tanda tersembunyi dalam data: meskipun tidak tahu apa kumis atau jenis kelamin, jika dilatih tentang kumpulan data di mana beberapa gambar diberi label "pria" atau "wanita", dan beberapa memiliki label "kumis" ", Dia akan dengan cepat memahami hubungannya.


Kevin Shavinsky, astrofisikawan, kepala Modulos perusahaan-AI

Dalam sebuah makalah yang diterbitkan pada bulan Desember di jurnal Astronomi & Astrofisika, Shavinsky dan rekan-rekannya, Denis Tharp dan Che Zhen, menggunakan GM untuk mempelajari perubahan fisik dalam galaksi selama evolusi (perangkat lunak yang mereka gunakan menghitung ruang tersembunyi sedikit berbeda dari GSS, sehingga secara teknis tidak mungkin panggil GSS, meskipun propertinya cukup dekat). Model mereka menciptakan set data buatan untuk menguji hipotesis tentang proses fisik. Mereka, misalnya, bertanya bagaimana "pelemahan" formasi bintang - penurunan tajam dalam kecepatan formasi mereka - dikaitkan dengan peningkatan kepadatan galaksi.

Bagi Shavinsky, pertanyaan kuncinya adalah seberapa banyak informasi tentang proses bintang dan galaksi dapat diekstraksi hanya berdasarkan satu data. "Kecualikan semua yang kita ketahui tentang astrofisika," katanya. "Sejauh mana kita bisa menemukan kembali pengetahuan ini hanya dengan menggunakan data?"

Pertama, gambar galaksi direduksi menjadi ruang tersembunyi; kemudian Shavinsky dapat mengoreksi satu elemen ruang ini sehingga sesuai dengan perubahan tertentu dalam lingkungan galaksi - misalnya, kepadatan lingkungannya. Kemudian dia bisa membuat ulang galaksi dan melihat perbedaan apa yang akan muncul kali ini. "Dan sekarang saya memiliki mesin untuk menghasilkan hipotesis," jelasnya. "Saya bisa mengambil banyak galaksi yang awalnya dikelilingi oleh kepadatan rendah, dan membuatnya tampak seperti kepadatan mereka tinggi." Shavinsky, Tarp dan Zhen menemukan bahwa bergerak dari yang lebih rendah ke kepadatan yang lebih tinggi dari lingkungan mereka menjadi lebih merah, dan bintang-bintang mereka terkonsentrasi lebih padat. Ini konsisten dengan pengamatan galaksi yang ada, kata Shavinsky. Satu-satunya pertanyaan adalah mengapa.

Langkah selanjutnya, kata Shavinsky, belum otomatis. "Aku, kawan, perlu turun tangan dan berkata: Yah, fisika macam apa yang bisa menjelaskan efek ini?" Ada dua penjelasan yang mungkin untuk proses ini: ada kemungkinan bahwa galaksi menjadi lebih merah di lingkungan yang lebih padat karena mengandung lebih banyak debu, atau karena ada penurunan pembentukan bintang (dengan kata lain, bintang-bintang mereka biasanya lebih tua). Dengan menggunakan model generatif, kita dapat menguji kedua ide tersebut. Kami mengubah elemen ruang tersembunyi yang terkait dengan debu dan kecepatan pembentukan bintang, dan melihat bagaimana ini memengaruhi warna galaksi. "Dan jawabannya jelas," kata Shavinsky. Galaksi merah adalah galaksi "di mana kecepatan pembentukan bintang telah jatuh, dan bukan galaksi yang memiliki lebih banyak debu. Karena itu, kami cenderung mendukung penjelasan pertama. "


Baris atas adalah galaksi nyata di daerah dengan kepadatan rendah.
Baris kedua - rekonstruksi berdasarkan ruang tersembunyi.
Berikutnya adalah transformasi yang dibuat oleh jaringan, dan di bawah ini adalah galaksi yang dihasilkan di daerah kepadatan tinggi.

Pendekatan ini dikaitkan dengan simulasi tradisional, tetapi memiliki perbedaan kardinal. Simulasi, pada kenyataannya, "didasarkan pada asumsi," kata Shavinsky. "Yang ini sama dengan mengatakan:" Saya pikir saya mengerti apa dasar fisik yang mendasari semua yang saya amati dalam sistem. " Saya punya resep untuk membentuk bintang, untuk perilaku materi gelap, dan sebagainya. Saya menempatkan semua hipotesis saya dan memulai simulasi. Dan kemudian saya bertanya: Apakah ini terlihat seperti kenyataan? " Dan dengan pemodelan generatif, ini, katanya, terlihat "dalam arti, kebalikan dari simulasi." Kami tidak tahu apa-apa, kami tidak mau berasumsi apa-apa. Kami ingin data memberi tahu kami apa yang bisa terjadi. "

Keberhasilan nyata pemodelan generatif dalam studi seperti itu, jelas, tidak berarti bahwa astronom dan mahasiswa pascasarjana menjadi tidak perlu - tetapi tampaknya menunjukkan pergeseran sejauh mana AI dapat belajar apa pun tentang objek dan proses astrofisika, memiliki hampir hanya sejumlah besar data. "Ini bukan ilmu yang sepenuhnya otomatis, tetapi ini menunjukkan bahwa kami dapat membuat alat yang mengotomatisasikan kemajuan ilmiah setidaknya sebagian," kata Shavinsky.

Pemodelan generatif jelas mampu banyak - tetapi apakah itu benar-benar mewakili pendekatan baru untuk sains, ini adalah poin yang bisa diperdebatkan. Bagi David Hogg , seorang kosmologis di New York University dan Flatiron Institute, teknologi ini, meskipun mengesankan, sebenarnya merupakan cara yang sangat kompleks untuk mengekstrak sekuens dari data - dan para astronom telah melakukan ini selama berabad-abad. Dengan kata lain, ini adalah metode observasi dan analisis tingkat lanjut. Pekerjaan Hogg, seperti Shavinsky, sangat bergantung pada AI; ia menggunakan jaringan saraf untuk mengklasifikasikan bintang berdasarkan spektrum dan menarik kesimpulan tentang sifat fisik bintang lainnya menggunakan model berbasis data. Tetapi dia menganggap karyanya, dan karya Shavinsky, sebagai metode ilmiah yang tua, baik, dan telah terbukti. "Saya tidak berpikir ini adalah cara ketiga," katanya baru-baru ini. “Saya hanya berpikir bahwa kita, sebagai komunitas, semakin menggunakan data kami. Secara khusus, kami jauh lebih baik dalam membandingkan data. Tetapi dari sudut pandang saya, pekerjaan saya sangat cocok dengan kerangka kerja rezim pengamatan. ”

Asisten bergairah


Apakah AI dan jaringan saraf adalah alat baru secara konseptual atau tidak, jelas bahwa mereka mulai memainkan peran penting dalam astronomi modern dan penelitian fisik. Di Institut Heidelberg untuk Penelitian Teoritis, fisikawan Kai Polsterer memimpin kelompok astroinformatika - tim peneliti yang bekerja dengan metode baru dalam astrofisika berdasarkan pemrosesan data. Mereka baru-baru ini menggunakan algoritma dengan MOs untuk mengekstrak informasi pergeseran merah dari kumpulan data galaksi - sebuah tugas yang dulunya melemahkan.

Polsterer menganggap sistem berbasis AI baru ini sebagai "asisten yang bersemangat," yang mampu menyisir data selama berjam-jam tanpa merasa bosan dan mengeluh tentang kondisi kerja. Sistem ini dapat melakukan semua pekerjaan yang monoton dan sulit, katanya, meninggalkan kita dengan "ilmu yang menarik dan keren."

Tetapi mereka tidak sempurna. Secara khusus, Polsterer memperingatkan, algoritma hanya dapat melakukan apa yang telah mereka latih. Sistem acuh tak acuh terhadap input. Beri dia galaksi dan dia akan bisa menghargai pergeseran merah dan usianya. Tapi beri selfie atau foto ikan busuk, dia akan menghargai usianya (secara alami, salah). Pada akhirnya, katanya, pengawasan orang tetap diperlukan. “Semuanya tertutup bagi kita, para peneliti. Kami bertanggung jawab atas interpretasi. ”

Sementara itu, Nord dari Fermilab memperingatkan bahwa penting bahwa jaringan saraf tidak hanya menghasilkan hasil, tetapi juga kesalahan pekerjaan, seperti yang biasa dilakukan siswa mana pun. Sangat diterima dalam sains bahwa jika Anda melakukan pengukuran tetapi tidak memberikan kesalahan, tidak ada yang akan menganggap hasil Anda dengan serius.

Seperti banyak peneliti AI, Nord juga khawatir bahwa hasil dari jaringan saraf sulit dipahami; jaringan saraf memberikan jawaban tanpa memberikan cara yang jelas untuk mendapatkannya.

Namun, tidak semua orang percaya bahwa kurangnya transparansi adalah masalah. Lenka Zdeborova, seorang peneliti di Institute of Theoretical Physics di Prancis, menunjukkan bahwa intuisi manusia juga terkadang mustahil untuk dipahami. Anda melihat foto dan mengetahui bahwa kucing itu digambarkan di atasnya - “tetapi Anda tidak tahu bagaimana Anda mengetahui hal ini,” katanya. "Otakmu, bagaimanapun juga, adalah kotak hitam."

Tidak hanya astrofisikawan dan kosmologis bermigrasi ke sisi ilmu pengetahuan menggunakan AI dan pemrosesan data. Spesialis fisika kuantum Roger Melko dari Institut Fisika Teoritis Perimeter dan Universitas Waterloo menggunakan jaringan saraf untuk menyelesaikan beberapa masalah paling kompleks dan penting di bidang ini, misalnya, yang mewakili fungsi gelombang yang menggambarkan sistem banyak partikel. AI diperlukan karena apa yang Melko sebut sebagai "kutukan dimensi eksponensial". Yaitu, jumlah kemungkinan bentuk fungsi gelombang meningkat secara eksponensial dengan peningkatan jumlah partikel dalam sistem yang dijelaskan. Kesulitannya mirip dengan mencoba untuk memilih langkah terbaik dalam permainan seperti catur atau pergi: Anda mencoba untuk menghitung langkah selanjutnya, membayangkan bagaimana lawan Anda akan pergi, dan memilih jawaban terbaik, tetapi dengan setiap gerakan jumlah peluang meningkat.

Tentu saja, AI menguasai kedua game ini, belajar bermain catur beberapa dekade yang lalu, dan mengalahkan pemain go terbaik di 2016 - ini dilakukan oleh sistem AlphaGo. Dia dengan halus mengatakan bahwa mereka juga beradaptasi dengan baik dengan masalah fisika kuantum.

Pikiran mesin


Apakah Shavinsky benar dalam menyatakan bahwa ia telah menemukan "cara ketiga" untuk terlibat dalam sains, atau, seperti yang dikatakan Hogg, ini hanyalah pengamatan tradisional dan analisis data "pada steroid," jelas bahwa AI mengubah esensi dari penemuan ilmiah dan dengan jelas mempercepatnya. Seberapa jauh revolusi AI akan berkembang dalam sains?

Pernyataan-pernyataan keras yang dibuat secara berkala tentang pencapaian "para ilmuwan robo." Sepuluh tahun yang lalu, ahli kimia robot Adam memeriksa genom ragi dan menentukan gen mana yang bertanggung jawab untuk produksi asam amino tertentu. Dia melakukan ini dengan mengamati strain ragi yang tidak memiliki gen tertentu dan membandingkan hasil perilaku mereka satu sama lain. Majalah Wired menulis, " Robot membuat penemuan ilmiah sendiri ."

Beberapa saat kemudian, Lee Cronin, seorang ahli kimia di Universitas Glazko, menggunakan robot untuk secara acak mencampurkan bahan kimia untuk melihat apakah ada senyawa baru yang muncul. Dengan melacak reaksi secara real time menggunakan spektrometer massa, mesin resonansi magnetik nuklir, dan spektrometer inframerah, sistem akhirnya belajar memprediksi kombinasi yang paling reaktif. Meskipun ini tidak mengarah pada penemuan, kata Cronin, sistem robot dapat memungkinkan ahli kimia mempercepat penelitian mereka hingga 90%.

Tahun lalu, tim ilmuwan lain dari Zurich menggunakan jaringan saraf untuk menurunkan hukum fisik berdasarkan set data. Sistem mereka, semacam robot Kepler, menemukan kembali model heliosentris tata surya, berdasarkan catatan lokasi Matahari dan Mars di langit yang terlihat dari Bumi, dan juga menyimpulkan hukum kekekalan momentum dari pengamatan tabrakan bola. Karena hukum fisik seringkali dapat diungkapkan dalam beberapa cara, peneliti tertarik pada apakah sistem ini dapat menawarkan cara-cara baru, dan mungkin lebih sederhana untuk bekerja dengan hukum yang dikenal.

Semua ini adalah contoh bagaimana AI mempercepat penemuan ilmiah, meskipun dalam setiap kasus dapat diperdebatkan seberapa revolusioner pendekatan baru itu.Mungkin yang paling kontroversial adalah pertanyaan tentang seberapa banyak informasi dapat diperoleh dari data saja - masalah penting di era gunung data yang luas dan terus berkembang. Dalam The Book of Why, 2018, pakar ilmu komputer Jadi Pearl dan penulis sains populer Dana Mackenzie mengemukakan bahwa data adalah hal yang “sangat bodoh”. Pertanyaan tentang sebab-akibat "tidak pernah bisa dijawab hanya berdasarkan data," tulis mereka. "Setiap kali Anda melihat sebuah karya atau studi menganalisis data tanpa memperhitungkan model, Anda dapat yakin bahwa output dari karya ini merangkum, dan mungkin berubah, tetapi tidak menafsirkan data." Shavinsky bersimpati dengan posisi Pearl, tetapi menggambarkan gagasan bekerja hanya dengan data sebagai sesuatu seperti "orang kecil yang putus asa". Dia mengatakan bahwa dia tidak pernah menyatakan kemungkinan menurunkan sebab dan akibat dari data."Aku baru saja mengatakan bahwa kita bisa melakukan lebih banyak hal dengan data daripada biasanya."

Argumen umum lainnya adalah bahwa kreativitas diperlukan untuk sains, dan setidaknya untuk saat ini, kami tidak tahu bagaimana memprogramnya. Pencacahan sederhana dari semua kemungkinan, seperti yang dilakukan oleh ahli kimia robot Cronin, tidak terlihat kreatif. "Saya pikir untuk menghasilkan teori, konstruksi logis, kreativitas diperlukan," kata Polsterer. "Setiap kali Anda membutuhkan kreativitas, Anda membutuhkan seseorang." Dan dari mana kreativitas berasal? Polsterer mencurigai bahwa itu berhubungan dengan kebosanan - fakta bahwa, menurutnya, mobil itu tidak diberikan untuk diuji. “Untuk menjadi kreatif, seseorang tidak boleh mencintai kebosanan. Dan saya tidak berpikir bahwa komputer akan bosan. " Di sisi lain, kata-kata seperti "kreativitas" dan "inspirasi" sering digunakan untuk menggambarkan program-program seperti Deep Blue dan AlphaGo. Dan upaya yang sia-sia untuk menggambarkanapa yang terjadi di dalam pikiran mesin sangat mirip dengan kesulitan yang kita hadapi ketika mempelajari proses pemikiran kita sendiri.

Shavinsky baru-baru ini meninggalkan akademisi demi sektor komersial; Dia sekarang menjalankan startup Modulos, di mana banyak ilmuwan dari Swiss Technical Institute bekerja, dan, menurut situs web mereka, "bekerja di mata badai perkembangan di bidang AI dan pembelajaran mesin." Apa pun hambatan terletak antara AI modern dan kecerdasan buatan penuh, ia dan para ahli lainnya percaya bahwa mesin ditakdirkan untuk melakukan lebih banyak pekerjaan ilmuwan. Apakah ada batasan untuk ini, kita hanya perlu mencari tahu.

“Akankah mungkin di masa mendatang untuk membuat mesin yang mampu membuat penemuan dalam fisika atau matematika yang tidak mampu dilakukan oleh orang-orang terpandai yang menggunakan peralatan biologis? - Berpikir Shavinsky. - Akankah ilmu masa depan berkembang berkat mesin yang beroperasi pada tingkat yang tidak dapat diakses oleh kami? Saya tidak tahu. Itu pertanyaan yang bagus. ”

Source: https://habr.com/ru/post/id445806/


All Articles