Dor. Formato RusMARC
Advertência O post contém uma enorme quantidade de ódio! Remova as crianças grávidas doentes com uma mentalidade fraca do monitor. Embora onde você encontrou essas crianças?Bom dia a todos.Deixe-me começar com uma citação da Wikipedia.O UNIMARC (sigla para catalogação legível por máquina universal) é um formato desenvolvido com a assistência da Federação Internacional de Associações e Instituições de Bibliotecas (IFLA) em 1977 para solucionar o problema de incompatibilidade entre os diferentes formatos nacionais de MARCA. O objetivo principal era criar um formato MARK internacional, que pudesse acomodar registros bibliográficos de todos os tipos de formatos MARK. Esses registros podem ser convertidos para UNIMARC, que seria o formato base e, se necessário, para qualquer outro formato MARK. O formato UNIMARC facilitou o intercâmbio internacional de informações bibliográficas em formato legível por máquina.
resolver o problema de incompatibilidade entre os diferentes formatos nacionais de MARK,ou seja, esse formato foi desenvolvido para unificar registros bibliográficos e afastar-se do estado em que cada país tinha seu próprio formato MARC, incompatível com os demais. As pessoas se reuniram, pensaram e desenvolveram um único formato. Até um certo momento, todos o usavam e todos ficavam felizes (bem, exceto pelos desenvolvedores que precisavam escrever funções de importação / exportação trabalhando com esse formato).Mas, não estamos procurando maneiras fáceis ...Quais são os problemas da UNIMARC do ponto de vista do programador?Vamos começar em ordem.- Armazenamento de todos os desvios e comprimentos de registros com cadeia de 5 bytes
- Armazenando números de campo e índices de subcampo com uma string (na verdade, não é um problema tão sério, mas ainda assim)
- A capacidade de usar duas opções de codificação - MARC8 e UTF8 (na verdade, você pode usar qualquer uma, mas apenas essas duas são negociadas pelo padrão e, portanto, a flag de codificação de flag é apenas para elas). MARC8, codificação não tão comum
Para o resto, é formato bastante conveniente, onde os registros são armazenados um após o outro, a presença de focas e formato de gravação como esta:O líder (de gravar as informações necessárias para ler o registro)PeremennoePole1-PeremennoePodPole1- ...-PeremennoePodPoleN...PeremennoePoleMHá mesas especiais, o que indica um o campo \ subcampo é responsável pelo que você pode usar para seus próprios fins e assim por diante.Parece - idílio, não sem problemas, mas você pode viver.E então RusMARC explode em cena1. 1.
LIBNET . :
.
.
.
, , , . , , .
1. 4. UNIMARC
, UNIMARC, . , .
O formato comunicativo russo é a versão russa do Formato Comunicativo Internacional UNIMARC, na interpretação e nas categorias de GOSTs e Regras de Catalogação em vigor na Rússia, com base na seleção dos esquemas mais comuns para representar elementos de dados.
Do ponto de vista prático, isso significa que qualquer registro transmitido no formato comunicativo russo deve ser percebido adequadamente por qualquer software declarado compatível com o formato UNIMARC.
Que pensamentos bonitos ...O que temos na prática no formato RusMARC?- O zoológico de codificação, sim, aqui você pode usar utf8 \ marc8 \ cp1251 \ ibm866 e até o padrão não informará "ata!"
- Falta de sinalizador indicando codificação
- Bem, e um bônus, a incompatibilidade da finalidade de campos e subcampos com o formato UNIMARC
- Ah, sim, o conteúdo do "líder de registro" não está em conformidade com o UNIMARC, embora sim, o software que pode ler o UNIMARC analise
A quantidade de trabalho realizado é incrível, quase todos os campos e subcampos são misturados, o "líder do registro" é alterado, porque não precisamos do sinalizador de codificação, pois precisamos conhecer ou não o controle do arquivo, que diferença isso faz para nós, como será determinada a codificação?Senhores do júri, não tenho nada a acrescentar. Source: https://habr.com/ru/post/pt394097/
All Articles