[HAINE] La douleur. Format RusMARC

Avertissement Le message contient une quantité écrasante de haine! Retirez du moniteur les enfants enceintes allaitants malades ayant une mentalité faible. Mais où avez-vous trouvé ces enfants?

Bonne journée à tous.
Permettez-moi de commencer par une citation de Wikipedia.
UNIMARC (Acronyme de Universal Machine Readable Cataloging) est un format développé avec l'aide de la Fédération internationale des associations de bibliothécaires et des bibliothèques (IFLA) en 1977 pour résoudre le problème d'incompatibilité entre les différents formats MARK nationaux. L'objectif principal était de créer un format MARK international, qui pourrait contenir des notices bibliographiques de tous les types de formats MARK. Ces enregistrements pourraient être convertis au format UNIMARC, qui serait le format de base et, si nécessaire, à partir de tout autre format MARK. Le format UNIMARC a facilité l'échange international d'informations bibliographiques sous forme lisible par machine.


pour résoudre le problème d'incompatibilité entre les différents formats MARK nationaux.

C'est-à-dire que ce format a été développé afin d'unifier les notices bibliographiques et de s'éloigner de l'État lorsque chaque pays avait son propre format MARC qui n'est pas compatible avec les autres. Les gens se sont réunis, ont pensé et développé un format unique. Jusqu'à un certain temps, tout le monde l'a utilisé, et tout le monde était content (enfin, sauf pour les développeurs qui avaient besoin d'écrire des fonctions d'import / export fonctionnant avec ce format).

Mais nous ne cherchons pas de moyens faciles ...


Quels sont les problèmes d'UNIMARC du point de vue du programmeur?
Commençons dans l'ordre.
  • Stockage de tous les décalages et longueurs d'enregistrement avec une chaîne de 5 octets
  • Stockage des numéros de champ et des index de sous-champ avec une chaîne (en fait ce n'est pas un problème si grave, mais quand même)
  • La possibilité d'utiliser deux options d'encodage - MARC8 et UTF8 (en fait, vous pouvez utiliser n'importe laquelle, mais seules ces deux sont négociées par la norme, et en conséquence, l'indicateur d'encodage est uniquement pour elles). MARC8, encodage pas si commun


Pour le reste, il est le format très pratique, où les enregistrements sont stockés un après l'autre, la présence de joints et le format d' enregistrement comme celui - ci:
Le chef (d'enregistrer les informations nécessaires pour lire le procès-verbal)
PeremennoePole1
-PeremennoePodPole1
- ...
-PeremennoePodPoleN
...
PeremennoePoleM

Il y a des tables spéciales, ce qui indique une le champ \ sous-champ est responsable de ce que vous pouvez utiliser à vos propres fins, etc.

Il semblerait - idylle, non sans problèmes, mais vous pouvez vivre.

Et puis RusMARC fait irruption sur la scène
1. 1.

LIBNET . :

.
.
.

, , , . , , .

1. 4. UNIMARC

, UNIMARC, . , .
Le format de communication russe est la version russe du format de communication international UNIMARC, dans l'interprétation et les catégories des GOST et des règles de catalogage en vigueur en Russie, basée sur la sélection des schémas de présentation des éléments de données les plus généraux.
D'un point de vue pratique, cela signifie que tout enregistrement transmis au format de communication russe doit être correctement perçu par tout logiciel qui est déclaré compatible avec le format UNIMARC.


Quelles belles pensées ...
Qu'avons-nous en pratique au format RusMARC?
  • Le zoo d'encodage, oui, ici, vous pouvez utiliser utf8 \ marc8 \ cp1251 \ ibm866 et même la norme ne vous dira pas "ata!"
  • Absence d'indicateur indiquant le codage
  • Eh bien, et en prime, l'inadéquation de l'objectif des champs et sous-champs avec le format UNIMARC
  • Oh oui, le contenu du «leader de l'enregistrement» n'est pas conforme à UNIMARC, bien que, oui, un logiciel capable de lire UNIMARC analysera


La quantité de travail effectuée est incroyable, presque tous les champs et sous-champs sont mélangés, le "leader d'enregistrement" est changé, car nous n'avons pas besoin du drapeau de codage, pour cela nous devons connaître le contrôle des archives ou non, quelle est la différence pour nous, comment le codage sera-t-il déterminé?

Messieurs les jurés, je n'ai rien à ajouter.

Source: https://habr.com/ru/post/fr394097/


All Articles