[BENCI] Nyeri. Format RusMARC

Peringatan Posting itu berisi kebencian yang luar biasa! Hapus anak-anak hamil yang sedang sakit menyusui dengan mental yang lemah dari monitor. Meskipun di mana Anda menemukan anak-anak seperti itu?

Hari baik untuk semua
Biarkan saya mulai dengan kutipan dari Wikipedia.
UNIMARC (Akronim untuk Universal Machine Readable Cataloging) adalah format yang dikembangkan dengan bantuan Federasi Internasional Asosiasi dan Lembaga Perpustakaan (IFLA) pada tahun 1977 untuk menyelesaikan masalah ketidakcocokan antara berbagai format MARK nasional. Tujuan utamanya adalah untuk menciptakan format MARK internasional, yang dapat mengakomodasi catatan bibliografi dari semua jenis format MARK. Catatan tersebut dapat dikonversi ke UNIMARC, yang akan menjadi format dasar, dan dari itu, jika perlu, ke format MARK lainnya. Format UNIMARC memfasilitasi pertukaran informasi bibliografi internasional dalam bentuk yang dapat dibaca mesin.


untuk menyelesaikan masalah ketidakcocokan antara berbagai format MARK nasional

, yaitu format ini dikembangkan untuk menyatukan catatan bibliografi dan menjauh dari negara ketika masing-masing negara memiliki format MARC sendiri yang tidak kompatibel dengan yang lain. Orang-orang berkumpul, berpikir, dan mengembangkan satu format. Sampai waktu tertentu, semua orang menggunakannya, dan semua orang senang (well, kecuali untuk pengembang yang perlu menulis fungsi impor / ekspor yang bekerja dengan format ini).

Tapi, kami tidak mencari cara mudah ...


Apa masalah UNIMARC dari sudut pandang programmer?
Mari kita mulai.
  • Penyimpanan semua offset dan panjang rekaman dengan string 5 byte
  • Menyimpan angka bidang dan indeks subbidang dengan string (sebenarnya bukan masalah serius, tapi tetap saja)
  • Kemampuan untuk menggunakan dua opsi pengkodean - MARC8 dan UTF8 (pada kenyataannya, Anda dapat menggunakan apa saja, tetapi hanya keduanya yang dinegosiasikan oleh standar, dan karenanya bendera pengkodean bendera hanya untuk mereka). MARC8, pengkodean tidak begitu umum


Untuk sisanya, cukup format yang nyaman, di mana catatan disimpan satu demi satu, kehadiran segel dan rekaman format seperti ini:
Pemimpin (merekam informasi yang diperlukan untuk membaca catatan)
PeremennoePole1
-PeremennoePodPole1
- ...
-PeremennoePodPoleN
...
PeremennoePoleM

Ada meja khusus, yang menunjukkan field \ subfield bertanggung jawab untuk apa yang dapat Anda gunakan untuk keperluan Anda sendiri, dan sebagainya.

Tampaknya - idilis, bukan tanpa masalah, tetapi Anda bisa hidup.

Dan kemudian RusMARC meledak ke tempat kejadian
1. 1.

LIBNET . :

.
.
.

, , , . , , .

1. 4. UNIMARC

, UNIMARC, . , .
Format komunikatif Rusia adalah versi Rusia dari Format Komunikatif Internasional UNIMARC, dalam interpretasi dan kategori GOST dan Aturan Katalogisasi yang berlaku di Rusia, berdasarkan pemilihan skema yang paling umum untuk mewakili elemen data.
Dari sudut pandang praktis, ini berarti bahwa setiap catatan yang dikirimkan dalam format komunikatif Rusia harus diterima secara memadai oleh perangkat lunak apa pun yang dinyatakan kompatibel dengan format UNIMARC.


Pikiran yang indah apa ...
Apa yang kita miliki dalam praktek dalam format RusMARC?
  • Kebun binatang pengkodean, ya, di sini Anda dapat menggunakan utf8 \ marc8 \ cp1251 \ ibm866 dan bahkan standar tidak akan memberi tahu Anda "ata!"
  • Kurangnya flag yang mengindikasikan encoding
  • Nah, dan bonus, ketidakcocokan tujuan bidang dan subbidang dengan format UNIMARC
  • Oh ya, isi "pemimpin rekaman" tidak mematuhi UNIMARC, meskipun, ya, perangkat lunak yang dapat membaca UNIMARC akan diuraikan


Jumlah pekerjaan yang dilakukan luar biasa, hampir semua bidang dan subbidang dicampur, "pemimpin rekaman" diubah, karena kita tidak memerlukan bendera penyandian, untuk itu kita perlu mengetahui kontrol arsip atau tidak, apa bedanya bagi kita, bagaimana pengkodean akan ditentukan?

Tuan-tuan juri, saya tidak perlu menambahkan.

Source: https://habr.com/ru/post/id394097/


All Articles