家谱研究-公制书籍,人口普查,档案,开放式数据库

我多年来一直喜欢族谱。 这种爱好没有实际的好处,但是有很多有趣的事情。 在这里,我想分享我的经验,一些有趣的信息,而不必过多地沉浸在个人故事中。 为了使文本不会膨胀太多,我只告诉您两种情况:基于在线数据库的军事档案搜索以及对十九世纪末至二十世纪初来自一个村庄的公制书籍的长期审查和分析。 直到革命和内战结束。

学习公制书籍,通过常规和电子邮件查询远处的档案,个人访问档案,在Internet上研究开放式数据库以及其他类型的搜索可提供丰富的资料。 有时搜索和发现就像一个真实的侦探故事,只有所有事件都过去了。

我意识到,对于某些人来说,发布的主题似乎与IT无关,但是在此过程中我进行了编程,VBA脚本,SQL,并且我希望ML \ DS \ AI能够领先。


公制书籍的页面,生于1898年。婚姻和死亡也被记录在册中-在1920年代初注册处问世之前

基本上,有关家谱的主要知识和答案的主要来源是IOP论坛,但还有许多其他地方。 由于忙于解决现实生活中的问题或由于僵局,缺乏进一步搜索的信息,我的活动有时会逐渐消失。 有时生活本身会产生新的冲动。 重要的重要事件之一是“ 人们记忆”门户的出现以及许多其他打开的数据库,这些是本文结尾处的链接。

在线数据库和档案机构


人民记忆-一个了不起的项目! 他还活着,基地在不断更新。 如果您一个月前没有找到祖先,今天可能会出现。 多亏了他,我才知道了曾祖父生活的重要细节,我已经和他一起去过TsAMO。 TsAMO-国防部中央档案馆,莫斯科附近波多利斯克的庞大文件资料库。 档案是一个独立的复杂世界,有其自己的规则,而对于普通人而言,这些规则并不总是显而易见的。 TsAMO是一个更为具体的地方,因为它是一个活跃的军事单位。 它存储着有关伟大卫国战争的主要文件,军官的个人档案,师的军事记录等等。 一个简单的对祖先官感兴趣的人可以收集确认亲戚关系的文件副本(一连串的出生证明和婚姻,并更改姓氏),在接待日的早晨来到TsAMO,说出这样的话:我想查看该官的个人档案和他的证书( CPC),他的姓名,职称,职位,在某某城市的某某年出生。 这是确认亲戚关系的文件副本,这是我的护照。

这些文档极有可能存储在此处,您可能会在同一天收到它们。 即使军官失踪,或者该司的总部文件被包围了,但从红军开始服役以来所有升职和调动的个人档案和《刑事诉讼法》的副本也很可能被保留并保存在TsAMO中。 无法拍摄文档(它们将被捕获在相机中,并被永久驱逐),但是您可以根据需要订购影印或数字副本(再访问一次),然后将它们捡起(再访问一次)。 这仅适用于军官,私人和中士,很可能不在那儿。 对于此类搜索,您必须认真研究单位事务,度过一个愉快的假期并在波多利斯克(Podolsk)租房。 或订购专业人士,价格既不便宜也不便宜。

在我的情况下,进行了3​​次这样的迭代旅行,以获取曾祖父大队司令的个人档案,但有些运气。 通常,需要进行4次乘车才能进行复制。 为此,我设法在午餐前抽出一些时间在工作上,并仅在第一次旅行时放假。


直到清楚地表明,对列宁-斯大林党和社会主义家园的热爱还不够,几乎所有事情都是美好的。

结果,我设法获得了很多关于我曾祖父的生活的信息,而这些亲戚都不为亲戚所知:征服,训练,服务,自传,提及亲戚的问卷调查,军队的职业发展,1938年由于醉酒造成的负面影响,在KUKS从事教学工作等方面的跌宕起伏。随着工兵营指挥官的职位的恢复,并作为战争的前三个月向乌克兰西部的最后派遣,在一个新成立的师中指挥一个新的轻工营...


CPC的最后一页

新文档和信息的每次打开都像是一扇有新关门的房间的门。 新数据为新的研究领域提供了机会,尤其是在Internet,开放数据库和论坛中。 一两年后,在消化了大量信息并将其系统化之后,我成熟了,然后才去莫斯科的另一个军事档案馆-俄罗斯国家档案馆。 它包含从革命结束到战争爆发的档案,但还包括芬兰战争和其他一些时期。 我将不作详细描述,我只能说在俄罗斯国家艺术家图书馆工作更容易,他在莫斯科,复杂的不便命令也更少。 我在那里也发现了很多有趣的东西,但是却没有像波多利斯克这样的破坏性影响。 在莫斯科,仍然有一个有趣的档案-RGASPI 。 如果某人是聚会的成员,则可以通过电子邮件订购聚会卡,只知道其编号(按名称,将不起作用)。 在银行支付服务收据,通过电子邮件再次发送她的照片,并作为响应收到两张派对卡的照片。 这很酷,非常方便-所有档案馆都应该在人们的舒适度上正常工作。

在转到档案库之前,您应该研究阵列和文章以及一些有用的技巧,这些技巧最初是在相应的IOP分支上,或者是来自其链接。

从仍然非常有用的角度,我想介绍一下Vitaly Semenov的youtube频道。 一个人从事商业家谱研究,撰写有关档案搜索,俄罗斯和独联体档案问题的资料。 他有成千上万的观点,但是对我来说,第一次访问TsAMO之前最好看一些问题,尤其是直到开始在度量标准书中进行搜索的那一刻之前。

公制书


公制书籍先于注册处的杂志。 直到1920年代初,这里都是教堂,而不是登记处,祭司在书中记录了出生,婚姻和死亡,并举行了所有应有的教堂仪式。 父亲为婴儿洗礼,按照圣历给他起名字,在书中写上序列号,日期,父母和教父母(收件人)。 在本文的开头是带有洗礼的页面。 姓氏以父亲的名字突出,教父和母亲的全名。 我母亲当然为丈夫姓。 我碰到一本书,在20世纪初,乌拉尔人民就没有姓氏,只有姓氏和名字,尽管到那时,几乎每个人都已经有了姓氏。 所有名称都用Church Slavonic拼写和改革前的拼写形式写成:Julitta是Julia,John是Ivan,Simeon,Iakov等等,很多名字已经不再使用。

如果孩子是通过登记婚姻出生的,请在大写字母UNLAWFUL大写字母上方的名称栏中。 如今,如此流行的公证婚姻并没有发生,尤其是在乡村。 审稿人注:教会规定禁止写“私生子”,但只能“非婚生”。 但是在地面上,他们仍然像这样写……民事婚姻主要发生在城市,但教会受到的鼓励并不多。

同样,婚姻记录表明新娘和新郎的年龄。 一本书中婚姻记录的一个例子,埃列诺夫卡村,1907年。

死亡 父亲被埋葬,写下了年龄-确切地,大约在什么时候,用肉眼写下,并且用同样的方式,他在没有任何医生的情况下用肉眼写下了死亡原因。 如果同一座教堂没有出生记录,或者没有时间,年龄的错误可能会持续数十年。 “从高龄开始”,从衰老,肺炎,进食,破碎的心脏,感冒引起的瘫痪-最主要的是十几种感染。 一个例子

在年底,我总结并绘制了一个统计表-几岁,几岁,多少人死亡,以及谁死亡。

我分析书籍的第一种方法是尝试确定祖父母来自的一个村庄中的所有人。 因此,叶卡捷琳诺斯拉夫省Mariupol区Elenovka村。 据报道,它成立于1840年。

数字化图书从何而来? 这是一个漫长而宏大的故事,但我将简短地复述一下。 在90年代,美国摩门教派的代表来到了乌克兰和俄罗斯联邦的地区档案馆,并免费提供了缩微胶片度量标准书籍的高质量设备。 由此产生的电影被带到他们在犹他州的中心,但副本仍保留在档案中。 从数字化书籍的数量可以看出,雇用的庞大工人干了很多工作。 在21世纪,电影被数字化并发布在网站上,并且能够按教堂名称,地点和年份进行搜索。

摩门教徒需要这样做的原因尚不清楚,但显然与此宗教有关。
在俄罗斯,由于抗议作为版权拥有者的俄罗斯档案馆而无法使用其数据库搜索网站,但是当然可以找到书籍。

除了公制书籍,还有所谓的 修订故事-农民普查、,悔名单-在教堂里供认的人名单。 还有“婚姻搜索”-教父对亲戚关系的检查结果。 有时,此类文档可直接在网络上获得,主要阵列存储在档案中,但是所有此类文档对我们来说比公制书籍要少得多。

审阅者注意:婚姻调查-结婚前检查新娘和新郎有权结婚。 实行禁令的原因可能很多,其中之一是精神上的亲属关系(它们之间由教父或教父与教母的关系相互联系),但还有许多其他原因,例如教会允许的婚姻数量过多。

分析Elenovka度量标准书时做出的一般假设:

1.在一个人口约为1000人的村庄里,只有一个教堂,一个姓氏不常见的人的名字和姓氏都带有一行,这是唯一的标识符。 如果突然有两个相同的名字-他们必须出生并且在时间上相距很远。

2.在可用书籍的年份范围内,有些书籍不完整,有时唱片之间的差距很大。 这很不好,但这只是一个起点,仅此而已:

1883-1900
1907-1918年
1919年


我们认为,应该在可供学习的书籍的公制记录中至少找到一次通缉的人-至少在教父的角色中。 实际上,事实并非如此,最有趣的时期是1901-1906年。 如果这些书不见了或者它们之间有空隙,您可以完全脱离历史。

俄罗斯和乌克兰的地区档案馆已在21世纪或90年代后期被烧毁。 我读到有关Poltava档案的信息,该档案在战争期间损失了80..90%的资金。 他们在撤退期间没有时间撤离或躲藏,然后在饥饿和冷战的冬天,火或公制书籍继续燃烧。


我开发的Excel表单用于在一个村庄中建立姓氏相同的各种人群

过了一会儿我来到了这样的桌子。 首先,将其提取到笔记本中,然后过一会儿,搜索至少一个具有所需姓氏的记录将变得更加技术化。
我在大型平板电脑上查看pdf图书,当我遇到一个姓氏时,同时按下Power和Volume-Down进行截图。 屏幕截图落入我的文件夹,然后我将其收集。 在屏幕截图中,始终可以在表格标题,月份和记录编号中手动看到年份记录。 从屏幕快照中传递所有书籍后,数据将传输到Excel。

为了方便起见,表格的填充由背景颜色的条件格式设置和某些列的下拉列表来补充,其中的值来自一组枚举的值(角色,事件等)。 实际上,在Excel中,实际上只使用了几十种背景色。

几种VBA程序使用Name-Patronymic对单元进行着色,从字符串中计算出整数哈希值,然后通过对颜色数取模来进行截止。 您还需要从会干扰文本的颜色列表中删除太深的颜色,并从其余的颜色中查找新的哈希码。 然后离开那些见面不止一次的人。

以这种形式构建的表首先允许使用Excel工具获取一些统计信息,其次它可以轻松地传输到任何DBMS。 我使用MS SQL。 分层的SQL查询会提取出较短的父子树,有时还会提取三级祖父。

像这样
;WITH Parent AS ( SELECT DISTINCT [#], [  ], cast( [()] as nvarchar(510) ) AS Path, cast( '' as nvarchar(510) ) as Child, 0 AS Level FROM dbo.[$] EV WHERE [  ] IS NULL and EV. = '' UNION ALL SELECT EV2.[#], EV2.[  ], cast( Parent.Path + '/' + EV2.[()] as nvarchar(510) ) AS Path, cast( EV2.[()] as nvarchar(510) ) as Child, Level + 1 FROM dbo.[$] EV2 INNER JOIN Parent ON Parent.[#] = EV2.[  ] ) SELECT distinct Path, Child , CASE IsNull(Parent.Child,'') WHEN '' THEN IsNull( evBP.[ ], '') ELSE IsNull( evB.[ ],'') END as ' ', CASE IsNull(Parent.Child,'') WHEN '' THEN IsNull(evDP.[ ], '') ELSE IsNull( evD.[ ] , '') END as ' ' --, Level --, evB.* FROM Parent LEFT JOIN dbo.[$] evB ON Parent.Child = evB.[()] AND evB.[] = '' AND evB.[] = '' LEFT JOIN dbo.[$] evBP ON Parent.Child = evBP.[()] AND evBP.[] = '' AND evBP.[] = '' LEFT JOIN dbo.[$] evD ON Parent.Child = evD.[()] AND evD.[] = '' AND evD.[] = '' LEFT JOIN dbo.[$] evDP ON Parent.Path = evD.[()] AND evDP.[] = '' AND evD.[] = '' ORDER BY 1, 2 


但是,大多数记录是单记录。 考虑到一个人可能会在其他地方出生,多年以来都没有书籍,一个很大的时期已经完全丧失,一个人在所有可用的书籍中只能见一次面。 在某些书籍中,某些事件没有幸存;例如,分娩可能要花费几个月。 此外,即使我们撇开了孩子出生或死亡时的死亡率,也可以在一个人的婚礼上扮演一个教父(旧名字的接受者)或担保人的角色,仅此而已。

在50至60岁之后,也有少数同龄人死于老年,
在未经确认的1840年村庄成立基础上,我们可以假定它们可以属于第一批定居者。 在这里,一定的Peter和Yakov Stefanovich在村庄成立之前就出生了,如果他们后来没有赶上的话,很可能是村庄的创始人之一。 但是,从历史本身精简的公制书中,这不再是可识别的。



一些观察


经过数小时的阅读,眼睛很快适应了革命前的写作。 可以识别特征词和短语,其中80%都存在,但是很难适应这种疯狂的风格。 不时地允许初学者记录。 然后,例如,在大写字母“ a”,“ d”,“ o”中未画出顶部的圆圈,并且它们与字母“ and”,“ y”变得难以区分。 因此,眼睛无法快速执行全扫描,就变成了眼科全扫描+蛋白质OCR / HTR。 幸运的是,这不是很常见。

每月和每年的死亡中,有三分之一至一半以下是1岁以下至3岁的婴儿。 我已经在书的前言中写道,父亲在“他死于什么”领域中用肉眼写下了原因,没有人可以检查。 审阅者注意:如果有剧烈死亡的迹象,则应致电医生进行诊断。 俄罗斯帝国有护照,但显然不是每个人都拥有,也没有照片。 对于儿童来说,最常见的死亡原因是“因婴儿[弱点]”或“弱势出生”,其次是传染病:因麻疹,百日咳,白喉,伤寒和“因腹泻”。 那些能够存活长达3年,长达6-7年的人也经常死于天花,霍乱和相同的儿童期感染-所有这些都是针对DTP和其他疫苗的,直至一年。 从这些书的书页上,现代反底漆大打招呼-达尔文奖的集体提名!

注意事项 审稿人:印古什共和国的护照主要是为了旅行,一段时间,在首都居住和长途旅行而发行的。 “来自婴儿的虚弱”和“弱势出生”-不同的诊断。 第一个-出生后几乎立即死亡,第二个-SIDS,只是梦中的婴儿死亡。 原因尚不确定。 最初的疫苗接种(针对天花)始于18世纪,但是当然没有像革命后那样广泛。

通常,几乎没有暴力死亡事件。 一到两次有“打架中被杀”之类的原因,一个不知名人士的尸体也被埋葬在村子附近道路的叉子上。 人数略有增加,但总的来说,人们很少因事故丧生:在18岁时被蒸汽机车杀死,被闪电杀死,被马杀死。

30..50%的儿童死亡率是每天发生的事情,显然不被视为是上帝赋予的悲剧。 但是有时在页面上会播放真实的戏剧,而他们的目光将它们从一系列事件中夺走。 例如,寡妇生下双胞胎男孩。 他们被记录为非法,有教父母-第二年,他们都死于感染,相差数月之久。

地理。 有必要记录成人书籍中点灯的起源。 除了最自然的叶列诺夫斯基家族外,邻近的村庄和马里乌波尔·乌耶兹(Mariupol Uyezd)和马里乌波尔(Mariupol)农场,“原生”叶卡捷琳诺斯拉夫·古贝尼耶(Yekaterinslav guberniya)的乌伊兹兹(Uyezds),此外还有广泛的乌克兰省份,甚至有时从西部-沃西尼亚(Volhynia),以及当时的东顿(Don),奥匈帝国(Oung-Hungarian) ,俄罗斯和白俄罗斯的省。 特别引人注目的是奥廖尔和库尔斯克,有时是斯摩棱斯克和莫斯科地区。 杰出的事物很少见:来自哈萨克斯坦的人,然后是贵妇的婚姻(!)-我不记得与任何人,商人甚至农民的婚姻(这意味着所有君主和贵族权利都会被立即剥夺),这完全与众不同意大利公民与当地人一起...

评论者的笔记:到19世纪末,一切都不再那么严格,特权也没有被剥夺,没有人成为农奴制(就像废除农奴制之前一样),但是从这样的婚姻中获得的孩子并没有获得崇高的头衔。

书中没有以任何方式反映1917年的革命,离中心太远了。 但是在1918-1919年。 每个人都有很大的变化和大问题。 自1918年9月以来,“农民”或“商人”的阶级特征被放弃,每个人都成为公民。 某些出生页面块不再包含有关教父的信息,并且记录在整个页面上从左到右,而没有分成多个字段。 由于某些原因,他们在1918年初结婚了很多,并生育了许多孩子,他们的结婚人数比往年和1919年更加可怕。 1919年春天,在叶列诺夫卡发生了大规模的天花流行病(5月多达38人)和伤寒,即使按照革命前的非疫苗接种标准,婴儿的死亡率也很高。 从墨水记录到几乎看不见的简单铅笔。 牧师经常更换;在过去的几年中,自19世纪末以来,一两个便已更换。 也许他们身上发生了可悲的事情,或者他们不得不逃走了。 同年,大批士兵被埋葬。 在顿巴斯(Donbass)领土上,定居点的权力经常在大型组织者(红色,白色,马赫诺夫主义者)和小帮派之间传递。 但这并没有反映在公制书中,只是杀死了很多人。 一些来自遥远地方的士兵(“阿穆尔团”的士兵)造成死亡的原因:在战斗中丧生,被伤口炸死,被布尔什维克杀害,等等。

我正在准备一个续集,更多有关IT的问题,但我不能保证它将很快准备就绪。 仍然有一些案例可以成功搜索,但现在让它们成为空白。 如果您对该主题感兴趣,请在评论中写:首先,您是否认为值得在这里写,其次,具体问题-我将尽力回答。

主要连结


我故意不给很多链接,只留下最重要的。 有很多有用的方法,但是起初最好不要弄乱。

0.全俄罗斯家谱-IOP。 forum.vgd.ru-有用的巨大仓库。 许多人在家谱研究和档案搜索中闲逛并回答问题。 有时您甚至可以回答一个问题,即存档文件的照片扫描。

1.人民的记忆。 pamyat-naroda.ru基于OBD纪念馆 (维基百科文章)
2.有关第一次世界大战的门户。 基础gwar.mil.ru/heroes
3.在Geni之前,主要的和更广泛的服务是MyHeritageGeni是一个包含数亿个帐户和数千万个家谱的站点。 复杂的搜索功能是付费的,但免费的基本搜索功能也有很多。
4. 生命 -俄罗斯最著名和最广泛的族谱程序。 有偿,但显然值一千卢布。
5. FamilySearch.org-一个摩门教徒的网站,可以搜索在俄罗斯和乌克兰的档案中被数字化的公制书籍的电影。
6.在英国的FutureLearn中有一个有趣的有关族谱的在线课程,但是总的来说,最好是从IOP开始,看看RuNet。 在此过程中,许多地方细节。

UPD我将添加更多提示

7.纪念数据库的压抑。
8.一些区域档案馆本身将数字化并开放了部分资金。 一个对我有用的例子-巴什基尔档案馆(Bashkir Archive)打开了其改版故事,并在该村庄进行了简单搜索。
9. dokst-第二次世界大战中苏联战俘和凶手的德国在线数据库。
10etomesto.ru俄罗斯,印古什共和国城市,省份等的旧地图。 -到古人。 仍然有retromap.ru
11.乌克兰一个好的家谱论坛forum.genoua.name

UPD2在审查了专家之后,对文本进行了一些评论。

Source: https://habr.com/ru/post/zh-CN482930/


All Articles