[ODIO] Dolor. Format RusMARC

Advertencia ¡La publicación contiene una cantidad abrumadora de odio! Retire del monitor a las embarazadas enfermas y lactantes con una mentalidad débil. Aunque ¿dónde encontraste a esos niños?

Buen dia a todos.
Permítanme comenzar con una cita de Wikipedia.
UNIMARC (Acrónimo de Universal Machine Readable Cataloging) es un formato desarrollado con la asistencia de la Federación Internacional de Asociaciones e Instituciones de Bibliotecas (IFLA) en 1977 para resolver el problema de incompatibilidad entre diferentes formatos nacionales de MARK. El objetivo principal era crear un formato MARK internacional, que pudiera acomodar registros bibliográficos de todo tipo de formatos MARK. Dichos registros podrían convertirse a UNIMARC, que sería el formato base, y desde allí, si es necesario, a cualquier otro formato MARK. El formato UNIMARC facilitó el intercambio internacional de información bibliográfica en forma legible por máquina.


para resolver el problema de incompatibilidad entre diferentes formatos MARK nacionales.

Es decir, este formato se desarrolló para unificar registros bibliográficos y alejarse del estado cuando cada país tenía su propio formato MARC que no es compatible con los demás. La gente se reunió, pensó y desarrolló un único formato. Hasta cierto momento, todos lo usaban y todos estaban contentos (bueno, excepto los desarrolladores que necesitaban escribir funciones de importación / exportación que funcionaran con este formato).

Pero, no estamos buscando formas fáciles ...


¿Cuáles son los problemas de UNIMARC desde el punto de vista del programador?
Comencemos en orden.
  • Almacenamiento de todos los desplazamientos y longitudes de registro con una cadena de 5 bytes
  • Almacenar números de campo e índices de subcampo con una cadena (en realidad no es un problema tan grave, pero aún así)
  • La capacidad de usar dos opciones de codificación: MARC8 y UTF8 (de hecho, puede usar cualquiera, pero solo estos dos son negociados por el estándar y, en consecuencia, el indicador de codificación es solo para ellos). MARC8, codificación no tan común


De lo contrario, este es un formato muy conveniente donde los registros se almacenan uno tras otro, hay separadores y el formato de grabación es aproximadamente el siguiente:
Líder (información sobre el registro necesario para leer el registro) Campo
variable1 - Subcampo variable1 ... ... -Campo variableVN ... Campo variableM Hay tablas especiales que indican qué El campo \ subcampo es responsable de lo que puede utilizar para sus propios fines, y así sucesivamente. Parecería: idilio, no sin problemas, pero puedes vivir. Y luego RusMARC irrumpe en la escena











1. 1.

LIBNET . :

.
.
.

, , , . , , .

1. 4. UNIMARC

, UNIMARC, . , .
El formato comunicativo ruso es la versión rusa del Formato Comunicativo Internacional UNIMARC, en la interpretación y categorías de GOST y Reglas de Catalogación vigentes en Rusia, basado en la selección de los esquemas de presentación de elementos de datos más generales.
Desde un punto de vista práctico, esto significa que cualquier registro transmitido en el formato comunicativo ruso debe ser percibido adecuadamente por cualquier software que se considere compatible con el formato UNIMARC.


Qué hermosos pensamientos ...
¿Qué tenemos en la práctica en el formato RusMARC?
  • El zoológico de codificación, sí, aquí puede usar utf8 \ marc8 \ cp1251 \ ibm866 e incluso el estándar no le dirá "ata!"
  • Falta de bandera que indica codificación
  • Bueno, y una ventaja adicional, la falta de coincidencia del propósito de los campos y subcampos con el formato UNIMARC
  • Ah, sí, el contenido del "líder de registro" no cumple con UNIMARC, aunque sí, el software que puede leer UNIMARC analizará


La cantidad de trabajo realizado es sorprendente, casi todos los campos y subcampos se mezclan, se cambia el "líder de registro", porque no necesitamos el indicador de codificación, para ello necesitamos conocer el control de archivo o no, ¿qué diferencia hay para nosotros? ¿Cómo se determinará la codificación?

Señores del jurado, no tengo nada que agregar.

Source: https://habr.com/ru/post/es394097/


All Articles