Digitalisasi Warisan Buku Dunia Menggunakan Ponsel Cerdas
Ada lebih dari dua setengah miliar pengguna smartphone di planet ini. Jika masing-masing mendigitalkan setidaknya satu buku, kita hanya perlu satu hari untuk semua karya yang pernah ditulis. Kalev Litaru, seorang spesialis dalam sistem pemrosesan data dengan pengalaman dua puluh tahun, menawarkan cara baru untuk mendigitalkan buku berdasarkan crowdsourcing dan smartphone konvensional. Pada Januari 2015, kebakaran merusak 15% dana
perpustakaan ilmiah INION di Moskow. Kemudian 2.000 meter persegi terbakar dan sebagian atapnya runtuh. Perpustakaan menampung 14 juta buku dan dokumen, termasuk edisi langka abad ke-16 - awal 20. Menurut direktur perpustakaan, Yuri Pivovarov, hampir tidak ada uang yang dialokasikan untuk digitalisasi. Masalah digitalisasi lengkap buku, dokumen, manuskrip belum terpecahkan secara global, walaupun ada proyek yang menangani hal ini, dan perpustakaan itu sendiri di Rusia dan negara-negara lain berusaha untuk mengubah salinan yang ada ke bentuk digital.Untuk mendigitalkan buku menggunakan pemindai besar bernilai lebih dari sepuluh ribu dolar. Untuk pemindai ini adalah operator profesional yang waktunya menghabiskan uang. Operator membalik halaman buku, dan pemindai memotret dua halaman sekaligus. Kecepatan kerja biasanya hingga lima ratus halaman per jam, yaitu, dalam satu jam karyawan akan memindai satu atau dua buku.Kalev Litaru menawarkan untuk memanggil para penggemar bantuan dari seluruh dunia dengan smartphone mereka. Sebagai contoh efektivitas crowdsourcing, ia berbicara tentang proyek eBird , yang melacak migrasi burung. Selama tiga belas tahun, lebih dari seratus ribu sukarelawan telah mengerjakan proyek ini, yang memungkinkan untuk mencatat 275 juta pengamatan dari 2,87 juta lokasi unik. Sekarang pada orang-orang di planet ini2,6 miliar smartphone , pada 2020 jumlah mereka akan meningkat menjadi 6,1 miliar, termasuk karena negara-negara berkembang.
Karyawan perusahaan Rusia "Elar" sedang mengerjakan digitalisasi buku yangdiusulkan Litar untuk membagi proyek menjadi dua bagian. Pada tahap pertama, Anda perlu membuat daftar buku yang akan didigitalkan. Untuk melakukan ini, gunakan katalog WorldCat dan alat-alat lain: daftar awal akan mencakup semua buku yang ada di perpustakaan dan yang belum didigitalkan. Salinan rapuh dan buku-buku yang dilindungi oleh hak cipta akan dikeluarkan dari daftar ini. Kompilasi daftar sebagian dapat diberikan kepada crowdsourcing - perpustakaan akan menerbitkan daftar buku yang statusnya mengenai perlindungan hak cipta tidak diketahui, dan sukarelawan akan memeriksa halaman pertama buku dan mengirimkan informasi ini ke perpustakaan.Hanya tahap pertama yang akan memungkinkan Anda untuk memahami berapa persentase buku digital di dunia. Menurut data Google sendiri, perusahaan telah mendigitalkan 6% dari semua buku yang diterbitkan dalam kerangka kerja proyek Ngram , tetapi daftar pastinya tidak diketahui.Setelah menyusun daftar lengkap karya non-digital, bagian crowdsourcing utama dari proyek dimulai. Relawan akan datang ke perpustakaan, mengambil buku, mengambil smartphone dan memotret sampulnya. Pengenalan karakter optis seperti Google, akan menentukan penulis dan judul buku dan membandingkannya dengan daftar di server, setelah itu akan memberi tahu Anda tentang kebutuhan untuk mendigitalkan salinan atau bahwa pekerjaan ini telah dilakukan. Jika buku ini akan didigitalkan, relawan akan mengambil gambar dari beberapa halaman pertama: pada tahap ini, sistem harus menentukan bagaimana foto-foto berkualitas tinggi diperoleh, apakah semuanya baik-baik saja dengan cahaya, apakah karakter dapat dikenali, atau jika tangan fotografer terlalu gemetar. Kemudian pengguna menerima perintah untuk terus bekerja atau mengambil buku lain.Litaru melakukan beberapa tes dan menemukan bahwa dengan cara ini satu pengguna, setelah beradaptasi sendiri, akan dapat mendigitalkan buku 600 halaman dalam lima hingga sepuluh menit. Pada tahun 2004, untuk pekerjaan diploma, ia sendiri secara manual mendigitalkan tiga puluh ribu halaman materi dari lebih dari tujuh ratus dokumen menggunakan kamera digital biasa dan lampu meja murah. Litaru menyelesaikan sebagian besar pekerjaan ini dalam waktu lima belas jam pada satu akhir pekan.Gambar dari telepon pintar tidak akan memiliki kualitas yang sama dengan yang dicapai menggunakan teknologi profesional. Tetapi akan ada cukup untuk membacanya , dan sistem pengenalan karakter optik akan membuat teks dapat dicari. Halaman - halaman iniMereka difoto sepuluh tahun yang lalu, dan hari ini smartphone memiliki kamera dan LED flash yang lebih baik.Perpustakaan dapat mengizinkan relawan untuk menggunakan pemindai dokumen yang tersedia di lembaga untuk pekerjaan ini. Semua hasil akan dikirim ke server pusat proyek, di mana mereka akan diterjemahkan ke dalam format PDF dan lainnya untuk membaca buku-buku elektronik, dan di mana teks akan diproses dan tersedia untuk pencarian.Faktor gamifikasi dapat dimasukkan dalam proses digitalisasi. Relawan akan menerima poin untuk karya digital, dan organisasi akan dapat mengatur "hari digitalisasi" dan memberikan hadiah kepada peserta terbaik dalam proyek. Bahkan anak sekolah dapat bergabung dengan pekerjaan itu. Perpustakaan akan menerima umpan balik dari pengguna tentang halaman-halaman yang tidak terdigitalkan. Relawan akan menjadi sesuatu seperti editor Wikipedia, dan perpustakaan akan mengoordinasikan pekerjaan mereka.Wikipedia dan proyek crowdsourcing lainnyatelah menunjukkan keefektifannya. Dan crowdsourcing sekali lagi dapat menunjukkan keefektifannya dalam mendigitalkan warisan buku, Kalev Litaru yakin. Alih-alih mengambil foto narsis dan foto makanan di Instagram, pengguna dua setengah miliar smartphone dapat membantu menghemat banyak pekerjaan dan membuat basis data besar dari semua buku yang pernah diterbitkan untuk menyerahkannya kepada keturunan kami. Source: https://habr.com/ru/post/id386581/
All Articles