[讨厌]痛苦。格式RusMARC
警告 该帖子包含大量仇恨!从监护仪中取出心态较弱的生病怀孕哺乳期儿童。虽然您在哪里找到这样的孩子?祝大家有美好的一天。让我从维基百科的报价开始。UNIMARC(通用机器可读目录的缩写)是在1977年国际图书馆协会联合会(IFLA)的协助下开发的一种格式,用于解决不同国家MARK格式之间的不兼容问题。主要目标是创建一种国际标记格式,可以容纳所有类型标记格式的书目记录。可以将此类记录转换为UNIMARC(这是基本格式),并在必要时将其转换成任何其他MARK格式。 UNIMARC格式促进了机器可读形式的书目信息的国际交流。
为了解决不同国家MARK格式之间的不兼容问题,即开发该格式是为了统一书目记录,并在每个国家拥有自己的MARC格式与其他国家不兼容时退出该州。人们聚集,思考并开发了一种格式。直到某个时间,每个人都使用它,每个人都很高兴(好吧,除了需要编写使用这种格式的导入/导出功能的开发人员)。但是,我们不是在寻找简单的方法...从程序员的角度来看,UNIMARC有什么问题?让我们按顺序开始。- 使用5字节字符串存储所有偏移量和记录长度
- 用字符串存储字段号和子字段索引(实际上不是一个严重的问题,但是仍然)
- 使用两种编码选项的功能-MARC8和UTF8(实际上,您可以使用任何一种,但标准只能协商这两种,因此,flag-encoding标志仅适用于它们)。MARC8,不太常见的编码
对于剩下的,还是比较方便的格式,其中记录被相继存储一个,海豹的存在和记录格式是这样的:领导者(记录必要的信息,读取记录的)PeremennoePole1-PeremennoePodPole1- ...-PeremennoePodPoleN......PeremennoePoleM有特殊的表格,这表明字段\子字段负责您可以用于自己的目的,依此类推。看起来-田园诗,并非没有问题,但您可以生活。然后RusMARC突然出现1. 1.
LIBNET . :
.
.
.
, , , . , , .
1. 4. UNIMARC
, UNIMARC, . , .
俄语的通信格式是UNIMARC国际通信格式的俄语版本,它基于对表示数据元素的最常用方案的选择,对俄罗斯现行的GOST和编目规则进行了解释和分类。
从实用的角度来看,这意味着任何以俄语通信格式传输的记录都应被声明与UNIMARC格式兼容的任何软件充分感知。
有什么美丽的想法...我们在RusMARC格式中实际上有什么想法?- 编码动物园,是的,在这里您可以使用utf8 \ marc8 \ cp1251 \ ibm866,甚至标准也不会告诉您“ ata!”。
- 缺少指示编码的标志
- 恩,还有一个好处是,UNIMARC格式的字段和子字段的目的不匹配
- 哦,是的,“记录负责人”的内容不符合UNIMARC,尽管是的,可以读取UNIMARC的软件会解析
完成的工作量惊人,几乎所有字段和子字段都混合在一起,更改了“记录领导者”,因为我们不需要编码标记,因为它不需要知道存档控件,这对我们有什么影响,如何确定编码?陪审团的先生们,我无话可说。 Source: https://habr.com/ru/post/zh-CN394097/
All Articles