Mengapa kita pergi ke konferensi ilmiah?

Hai, ini Smart Engine. Pihak pendaratan dari 28 pengembang sistem pengenalan kecerdasan buatan baru saja kembali dari Amsterdam, di mana kami mengambil bagian dalam konferensi ilmiah internasional ICMV tentang visi komputer. Dalam artikel ini kami akan mencoba menjelaskan mengapa kami mencurahkan begitu banyak waktu untuk sains dan pergi ke konferensi ilmiah.



Saat ini di dunia pengembangan sains dan teknologi tinggi telah terjadi substitusi konsep yang sangat berbahaya: untuk sains dikeluarkan yang bukan sains dalam pendekatan apa pun, ilmuwan menyebut pemrogram dan insinyur, sains menyebut solusi untuk masalah teknik paling sederhana. Di ruang informasi, peran sains mendasar dalam pengembangan teknologi jelas diremehkan. Banyak orang lupa bahwa layar sentuh iPhone bukanlah layar sentuh iPhone itu sendiri, tetapi penerapan ide-ide penelitian mendasar tentang heterostruktur semikonduktor dari rekan senegaranya, pemenang hadiah Nobel J.I. Alferova. Peta Google (atau Yandex) bukan hanya peta di ponsel, tetapi perwujudan penelitian mendasar di bidang geometri komputasi. Dan omong-omong, film "Avatar" juga 99% geometri komputasi. Visi mesin, jaringan saraf, dan kecerdasan buatan tidak terkecuali: seluruh kompleks ini bekerja dengan baik dan benar hanya karena penelitian mendasar adalah dasar. Pendekatan fundamental untuk pengembangan, di satu sisi, adalah kunci untuk vektor yang tepat untuk pengembangan industri, dan di sisi lain, itu menunjukkan berbagai startup garasi yang membanjiri pasar, yang sains fundamental selalu memberikan keuntungan yang jelas.

Kita adalah ilmuwan. Kami adalah ilmuwan dan tidak ragu sama sekali. Startup kami (yang sebenarnya bukan startup untuk waktu yang lama, tetapi bisnis yang berfungsi dengan baik, dikenal baik di Rusia maupun di luar negeri, dikembangkan secara eksklusif karena teknologi yang dikembangkan tanpa investasi dari negara atau dana) adalah tentang hal yang sangat hype , yang semua orang dengar hari ini: visi komputer, pembelajaran mesin, kecerdasan buatan, jaringan saraf - secara umum, seluruh rangkaian kata bingo omong kosong, penggunaannya, yang menurut banyak startup, membuat proyek ini jelas berhasil. Tentu saja tidak demikian. Penting apakah Anda memahami esensi masalah ini. Itulah mengapa banyak yang memulai dari posisi naik dengan sangat cepat menemukan diri mereka di posisi bawah , dan kemudian dalam posisi keluar . Karena bukan ilmuwan.

Kami jarang pergi ke pertemuan startup, visioner, dan penginjil di bidang kecerdasan buatan. Faktanya adalah bahwa sekarang semua orang telah belajar membuat presentasi yang indah. Siapa yang tidak belajar - menemukan kontraktor. Sumber daya besar diinvestasikan dalam promosi dan promosi solusi teknologi (pertama untuk menarik investasi, dan kemudian untuk membenarkan kegiatan tim yang lemah), yang tidak ada hal baru atau efisiensi. Dalam bungkus yang indah untuk presentasi, infografis dan animasi, terutama ketika istilah-istilah ilmiah dan teknologi yang modis dan tidak jelas dijalin ke dalamnya, Anda selalu dapat menyembunyikan kurangnya rasa aktivitas yang sesungguhnya. Untuk banyak presentasi tidak ada sains. Ini adalah kekosongan yang dibungkus dengan kulit yang indah. Ini adalah umpan bagi investor yang mematuk (atau berpura-pura mematuk) pada kaca mengkilap dan memberikan uang untuk beberapa alasan. Pada kenyataannya, sedikit orang yang ingin memahami komponen ilmiah, sebagian besar lebih suka memperhatikan bagian luar dari "pitching". Apa yang harus dilakukan - ekonomi presentasi dalam tindakan. Dan kita tidak membicarakan hal itu. Kami adalah tentang sains.

Kami pergi ke konferensi ilmiah. Misalnya, kami baru-baru ini mengunjungi Australia pada konferensi pengenalan dokumen. Rusia - dan bukan hanya itu - adalah negara dengan tingkat perkembangan birokrasi yang meningkat. Beberapa, menderita, mengumpulkan selembar kertas, yang lain tidak kurang menderita bekerja dengan mereka. Kementerian mengumumkan tender untuk digitalisasi dan otomatisasi proses rutin, perusahaan pelaksana yang cukup serius muncul, menawarkan pendekatan mereka di bidang ini. Dari tribun tinggi dijelaskan bahwa kali ini saatnya untuk mengganti tidak hanya mata dan tangan, bahwa kita berbicara tentang kecerdasan buatan yang dapat memahami dokumen dengan cara yang bermakna. Dan dalam konteks ini sangat aneh bahwa hanya Abbyy dan kami berada di konferensi profil terkemuka dari Rusia. Kami tidak melihat perwakilan dari flagships transformasi digital dan peserta dalam program negara untuk pengembangan kecerdasan buatan. Ternyata di bidang dokumen pemahaman di Rusia tidak ada lagi ilmuwan?



Kami baru saja kembali dari Amsterdam, di mana ICMV , sebuah konferensi ilmiah tentang visi komputer, diadakan. Di sana, kami sama sekali tidak menetapkan tujuan untuk mempromosikan keberhasilan perusahaan kami sebagai struktur bisnis. Kami memberi tahu komunitas profesional apa masalah mendasar yang sedang dilakukan oleh tim peneliti kami. Bagi para ilmuwan muda kita (justru karyawan muda yang menawarkan dan mengembangkan ide-ide berani di bidang kita yang bertindak sebagai pembicara utama di konferensi) ini adalah kesempatan untuk melibatkan diri dalam kegiatan ilmiah, untuk mengembangkan diri secara ilmiah dan profesional.

Kami yakin bahwa untuk startup untuk "lepas landas" dan menjadi bisnis yang berkembang, itu harus didasarkan pada ilmu pengetahuan, dari mana teknologi yang bekerja akan tumbuh, yang merupakan "mesin" dari layanan atau produk yang diminati oleh pasar dan memenuhi persyaratannya.
Di wilayah kami - bidang pengakuan (ini adalah dokumen identifikasi, berbagai profil, kartu bank, tabel, barcode, gambar) - teknologi dan ilmu yang mendasari adalah fondasinya. Harga kesalahan sangat tinggi, dan itulah sebabnya kami memiliki persyaratan yang sangat tinggi untuk algoritme. Ini seperti pesawat - terbang atau tidak terbang, tidak ada yang ketiga. Jika terbang dengan buruk, itu berarti ia tidak terbang sama sekali. Dan seperti dalam pembuatan pesawat terbang, algoritme ini didasarkan pada sains, ilmu fundamental yang serius yang tumbuh dari simpanan rekan-rekan kami yang berada di garis depan rumah kami, kecerdasan buatan. Banyak sekarang terlibat dalam pengakuan, menciptakan pasar untuk layanan ini, yang masih dalam masa pertumbuhan. Ini tidak sepenuhnya terbentuk, meskipun fakta bahwa analis memprediksi volume global pasar ini menjadi 16-17 miliar dolar pada tahun 2024. Tetapi kami melihat sangat sedikit rekan di konferensi ilmiah. Bahkan lebih sedikit lagi yang diterbitkan dalam jurnal ilmiah. Sekarang kita bisa mendengar bagaimana sandal dari startups marah marah kepada kita, yang pasti yakin akan kesia-siaan riset dan menulis artikel. "Kami melakukan bisnis, bukan semacam ilmu teoritis!" Inilah mengapa banyak sistem pengakuan di pasar bekerja dengan sangat buruk (meskipun video presentasi yang indah dan slogan iklan), mereka keliru, mereka memerlukan partisipasi dari operator manusia (atau seluruh pabrik dari operator ini) , Yang akan memeriksa gambar fuzzy dan menyesuaikan keputusan mesin dengan pegangan lelah sendiri. Tetapi tugasnya adalah membuatnya sehingga proses pengenalan benar-benar otomatis. Dalam kasus kami, ini tidak berarti untuk menghilangkan kesalahan sepenuhnya, tetapi untuk membuat mesin melakukan kesalahan berkali-kali, puluhan dan ratusan kali lebih jarang daripada manusia.

Kami terus berupaya meningkatkan teknologi kami sendiri. Ini adalah proses yang terkait dengan banyak pekerjaan teoretis dan penelitian serius. Dalam teknologi, kami meningkatkan akurasi, kecepatan, fleksibilitas, membuat teknologi lebih "ringan", kurang menuntut pada perangkat keras, kurang intensif energi. Ini adalah "AI hijau" kami (hijau bukan dalam arti "belum matang", tetapi dalam arti "hijau"). Kami memahami bahwa teknologi lingkungan adalah tren. Dan pelanggan potensial di dunia akan berpegang teguh pada tren ini. Dan kami mendapatkan pemahaman tentang tren ini tepatnya dari partisipasi dalam konferensi ilmiah. Seperti pepatah Skandinavia mengatakan, "ketika Anda memotong hutan, jangan lupa untuk mengasah kapak pada waktunya." Partisipasi dalam konferensi ilmiah bagi kita hanyalah proses mengasah kapak. Teknologi tidak dapat tumbuh dari awal, memahami bagaimana hal itu dapat ditingkatkan tidak segera muncul. Komunitas ilmiah diatur dengan cara yang secara fundamental berbeda dari komunitas pemula, investor, analis blockchain, dan visioner teknologi. Itu tidak cukup untuk menunjukkan presentasi yang indah. Jika tidak ada pemikiran dan kebaruan di dalamnya, mereka akan mematuk. Mereka akan makan dan mengubur. Ya, dan diatur di konferensi ilmiah, semuanya sedikit berbeda. Kami menunjukkan di sana bukan hasil akhirnya, tetapi apa yang mengarah ke sana, menggambarkan metode dan pendekatan, menginjak-injak glade untuk diri kita sendiri, menyajikan kepada dunia hasil penelitian kita sendiri. Tidak cukup untuk menunjukkan apa yang telah Anda lakukan, perlu untuk menjelaskan cara kerjanya.

Sekarang, banyak startup di bidang AI adalah bengkel mobil yang unik di mana mereka tidak memperbaiki mobil, tetapi mengganti node yang salah. Sesuatu tidak berfungsi - kami tidak memperbaikinya, kami segera mengganti modul. Ini lebih mudah, terutama ketika Anda tidak tahu cara kerjanya, dan apa yang perlu Anda lakukan untuk memperbaikinya.

Kami adalah ilmuwan, dan cukup percaya diri menunjukkan: teknologi yang didasarkan pada sains fundamental yang dalam bekerja lebih baik, lebih cepat, lebih percaya diri, lebih andal daripada yang di mana dari semua teknologi hanya ada presentasi yang indah. Itu kurang istirahat, lebih sedikit energi, bekerja di salju, di panas, di malam hari dan di pagi hari, karena kita tahu apa jenis neon di "dalam" nya , di mana tempat itu perlu untuk " menarik gadis kecil " dan menabrak rebana.

Perusahaan kami mempekerjakan lebih dari 50 pengembang, yang masing-masing menghancurkan tesis tentang kurangnya permintaan akan karya ilmiah. Tim kami mencakup ilmuwan mapan dan mereka yang baru memulai karir mereka dalam karier ilmiah. Kami menekankan bahwa ini bukan hanya programmer yang berurusan secara eksklusif dengan kode. Masing-masing dari mereka adalah unit ilmiah independen, dari mana tim ilmiah dibentuk, fleksibilitas dan variabilitas dari solusi yang digunakan dipastikan.

Dan semua itu karena kita pergi ke konferensi ilmiah.



Pada konferensi internasional tentang visi komputer (ICMV) di Amsterdam, kami mengusulkan pendekatan baru kami yang mendasar untuk pengembangan jaringan saraf dan teknologi pengenalan, yang bertujuan mengurangi jejak karbon dan meminimalkan kerusakan lingkungan dari penggunaan teknologi baru. Penekanan utama ditempatkan pada optimalisasi algoritma komputasi yang digunakan dalam sistem perangkat keras dan perangkat lunak, yang harus mengurangi konsumsi energi untuk pelatihan dan berfungsinya jaringan saraf pada skala global.

Hari ini, pembangunan berkelanjutan planet kita menjadi agenda utama dalam laporan organisasi dunia yang peduli tentang masa depan Bumi. Dan ini bukan hanya Greta Tunberg. Tempat seseorang di planet ini dalam banyak hal tergantung pada seberapa banyak kita dapat mencapai keseimbangan antara pengembangan teknologi, meningkatnya selera perusahaan global, dan sikap bertanggung jawab terhadap lingkungan. Kemungkinan cara untuk meminimalkan kerugian dari teknologi yang berkembang pesat pada dekade terakhir sebagian besar terkait dengan pengurangan konsumsi energi dan menemukan alat yang paling optimal dan hemat energi untuk menyelesaikan masalah teknologi modern.

Gudang senjata kami memiliki jaringan saraf dan itu adalah tanggung jawab kami, para ilmuwan, untuk membuatnya bekerja dengan cepat, efisien, dan dengan benar menyelesaikan tugas yang diberikan kepadanya. Dari sudut pandang "kecerdasan buatan hijau", masalah terobosan bukanlah untuk menciptakan jaringan saraf yang besar, kuat, besar - semacam paus biru dengan jaringan saraf besar yang mengejutkan, tetapi seekor lalat, dengan kemampuan "komputasi" yang sangat sederhana, tetapi kemampuannya untuk dengan cepat dan energi secara efisien menyelesaikan tugas-tugas yang diperlukan. Jaringan saraf seperti itu harus memiliki produktivitas spesifik setinggi langit. Pilihan algoritma yang tepat memungkinkan Anda menghabiskan sumber daya 1000 kali lebih sedikit untuk tugas pengenalan gambar daripada yang diklaim oleh beberapa produsen peralatan saat ini.



Hari ini kami memahami bahwa di wilayah kami, meningkatkan kapasitas perangkat untuk melakukan operasi adalah tiket satu arah. Dan tugas ilmuwan saat ini (dengan sikap bertanggung jawab terhadap pengembangan) adalah membuat teknologi sehingga memuat perangkat sesedikit mungkin, tidak memaksa prosesor untuk menghangatkan suhu boiler, tidak memakan energi, seperti "mayat yang tidak puas dengan gastro". Dan kemudian teknologi ini menjadi ramah pengguna dan sekaligus teknologi tinggi.

Agar ini menjadi kenyataan, diperlukan "kumpulan" yang sama sekali tidak jelas dari bidang ilmu yang sama sekali berbeda. Apakah jelas bagi banyak orang bahwa pergeseran teknologi pembelajaran yang dalam ke aljabar tropis dapat secara dramatis mengurangi jumlah transistor dalam neuroprosesor sambil mempertahankan daya ekspresif? Atau bahwa kehadiran lapisan Radon dalam jaringan saraf memungkinkannya untuk menggambarkan invarian proyektif secara ekonomis, yang, pada gilirannya, menentukan struktur internal gambar dunia nyata?

Partisipasi dalam konferensi ilmiah adalah, pertama-tama, kesempatan untuk membandingkan jam tangan dengan para pemimpin dunia, untuk melihat pesaing nyata mereka (ya, pesaing nyata juga pergi ke konferensi ilmiah karena mereka juga ilmuwan), untuk melihat di mana teknologi bergerak secara langsung, dan tidak dalam menceritakan kembali para visioner dan penginjil, yang sebagian besar tidak ada hubungannya dengan sains nyata, tetapi hanya belajar untuk menempatkan kata-kata yang modis ke dalam kalimat yang relatif kompeten. Tanpa pemahaman tentang tren dan tren dalam ilmu dasar ini, tidak ada gerakan ke depan yang mungkin. Teknologi tanpa ilmu "tidak akan lepas landas," atau itu sudah usang sebelumnya.

Source: https://habr.com/ru/post/id477016/


All Articles