
大家好,我叫Igor Tyukachev,我是业务连续性顾问。 在今天的帖子中,
我们将冗长而乏味地讨论常见的真理,我想分享我的经验,并讨论公司在制定确保活动连续性的计划时所犯的主要错误。
1. RTO和RPO随机
我遇到的最重要的错误是恢复时间(RTO)是从上限开始的。 嗯,从天花板上来看-例如,两年前从SLA获得的一些数字是有人从以前的工作地点带来的。 他们为什么要这样做? 毕竟,根据所有技术,您首先需要分析业务流程的后果,然后根据此分析计算目标恢复时间和允许的数据丢失。 但是进行这样的分析有时很长,有时很昂贵,有时不清楚如何强调必要的内容。 首先想到的是:
“我们都是成年人,我们了解业务运作方式。 我们不会浪费时间和金钱! 让我们按应有的加号或减号。 从头开始,运用无产阶级的创造力! 让RTO等于两个小时。”这会导致什么? 当您向管理层寻求活动经费以确保所需的RTO / RPO有一定数量时,总是需要证明其合理性。 如果没有理由,就会出现问题:您从哪里得到的? 而且没有任何答案。 结果,失去了对工作的信任。
此外,有时这两个小时的恢复价值一百万美元。 RTO期限的理由是金钱问题,而且非常大。
最后,当您带着表演者的BCP和/或DR计划(在事故发生时,他们会直接奔跑并挥舞手臂)时,他们会问一个类似的问题:这两个小时从何而来? 而且,如果您不能清楚地解释这一点,那么他们将不会对您或您的文档产生信任。
为了一张纸,结果是一张纸,没有订阅。 顺便说一下,有些人故意这样做是为了简单地满足调节器的要求。
你懂吗2.治愈一切
有些人认为BCP计划旨在保护所有业务流程免受任何威胁。 最近,有一个问题“我们想为自己辩护什么?” 我听到了答案:“来自一切,还有更多。”

但是事实是,该计划旨在保护公司的
特定关键业务流程免受
特定威胁的侵害。 因此,在制定计划之前,有必要评估风险的发生并分析其对业务的后果。 为了了解公司所担心的威胁,需要进行风险评估。 在建筑物遭到破坏的情况下,将有一个计划来确保连续性,在制裁压力下;而另一个计划,在洪水泛滥的情况下;另一个计划。 即使在不同城市中的两个相同站点,计划也可能有很大差异。
您不能用一个BCP保护整个公司,尤其是大型BCP。 例如,庞大的X5零售集团开始提供两个关键业务流程的连续性(我们
在此处进行了介绍 )。 并且用一个计划将整个公司封闭起来完全是不现实的,这是从“集体责任”这一类别开始的,每个人都有责任而没有人负责。
在ISO 22301标准中,存在一种策略的概念,事实上,该策略开始于公司的连续性过程。 它描述了我们将保护什么以及保护什么。 如果人们跑来跑去并要求添加它,例如:
-让我们向BCP添加被黑客入侵的风险吗?或
-最近我们在这里下了雨,淹没了最后一楼-让我们添加一个脚本,如果发生洪水该怎么办?然后立即将其发送给该政策,并说我们保护特定的公司资产,并且仅针对特定的,预先约定的威胁,因为它们现在处于优先地位。
即使变更建议确实合适,也要在下一版政策中考虑到这些建议。 因为保护公司是很多钱。 因此,对BCP计划的所有更改都必须通过预算委员会和计划。 我们建议您每年一次或在公司结构或外部环境发生重大变化后立即修改公司的业务连续性政策(请读者注意这些用语)。
3.幻想与现实
在制定BCP计划时,作者经常描述世界的一些理想情况。 例如,“我们没有第二个数据中心,但是我们将像拥有它一样编写该计划。” 或企业尚没有基础架构的任何部分,但员工仍会将其纳入计划中,以期将来出现。 然后,该公司将现实纳入计划:建立第二个数据中心,描述其他变化。
左侧是符合BCP的基础架构,右侧是实际基础架构
这一切都是错误的。 编写BCP计划意味着花钱。 如果您编写的计划目前无法使用,那么您将需要购买非常昂贵的纸张。 无法从中恢复,也无法对其进行测试。 事实证明工作是为了工作。
您可以非常迅速地制定计划,建立备份基础架构,花钱购买所有保护解决方案是一个漫长而昂贵的过程。 这可能需要一年以上的时间。 结果可能是您已经有了一个计划,并且计划的基础架构将在两年内出现。 我们为什么需要这样的计划? 他将保护您免受什么侵害?
从幻想的角度来看,BCP开发团队何时开始为专家考虑他们应该做什么以及持续多长时间。 结果是:“当您在针叶林中看到一只熊时,您需要以与熊相反的方向转动,并以超过熊速度的速度行驶。 在冬季,有必要遮盖铁轨。”
4.根与根
第四个最重要的错误是计划过于肤浅或过于详尽。 需要一个中间立场。 该计划
对于白痴来说不应该太详细,但是它不应该太笼统,这样就不会发生这种情况:
容易的5.致凯撒-剖腹产,锁匠-锁匠
以下错误源于上一个错误:不能将用于所有管理级别的所有操作集成到一个计划中。 BCP计划通常是针对资金流量大的大型公司制定的(顺便说一下,根据我们的
研究 ,平均而言,俄罗斯48%的大型公司面临着导致重大财务损失的突发事件)和多级管理系统。 对于此类公司,您不应尝试将所有内容放在一个文档中。 如果公司规模庞大且结构合理,则该计划应具有三个单独的级别:
- 战略层面-用于高级管理层;
- 战术级别-适用于中层管理人员;
- 和操作级别-适用于现场的直接表演者。
例如,如果要恢复已损坏的基础架构,则需要在战略层面上决定启动恢复计划,可以在战术层面上描述处理程序,并在操作层面上说明如何调试特定设备。
没有预算的BCP每个人都看到了自己的责任范围以及与其他员工的沟通。 事故发生时,每个人都打开一个计划,迅速找到自己的一部分并遵守。 理想情况下,您需要牢记要打开哪些页面,因为这种情况会持续数分钟。
6.角色扮演
编制BCP计划的另一个错误是:您无需在计划中规定特定的姓名,邮件地址和其他联系信息。 在文档本身的文本中,仅应指明非人格化的角色,应将负责特定任务的人员的角色分配给这些角色,并在计划附录中列出他们的联系方式。
怎么了
今天,大多数人每两到三年更换工作。 而且,如果您在计划文本中写下所有负责人及其联系方式,则必须不断对其进行更改。 在大型公司中,甚至在大型公司中,对任何文档的每次更改都需要大量的批准。
更不用说如果发生紧急情况,并且您必须疯狂地浏览计划并寻找所需的联系人,那么宝贵的时间将会丢失。
黑客:当您更改应用程序时,通常甚至不需要批准它。 还有一个提示:您可以使用自动化系统来更新计划。
7.缺乏版本控制
通常,他们创建1.0版的计划,然后进行所有更改而无需编辑,也无需更改文件名。 但是,与以前的版本相比,通常不清楚发生了什么变化。 在没有版本控制的情况下,该计划可以维持其自身的生命,无论如何都无法跟踪。 任何BCP计划的第二页都应包括版本,更改的作者以及更改本身的列表。
没有人能弄清楚
8.谁问?
公司通常没有负责任的BCP,也没有单独的业务连续性部门。 这位光荣的职责分配给首席信息官,副局长或“您从事信息安全,这里还有BCP”原则。 结果,每个人都从上到下制定,同意并批准了该计划。
谁负责存储计划,更新和查看计划中的信息? 可能没有规定。 雇用一个单独的员工是很浪费的,并且有可能使现有员工中的一个承担额外的责任,因为每个人现在都在为提高效率而努力:“让它挂上手电筒,使其可以在晚上割草,”但这是必要的吗?
我们正在寻找BCP建立两年后对BCP负责的人因此,它经常是这样发生的:制定了一个计划,并将其放在一个长满灰尘的长盒子中。 没有人对其进行测试,不支持其相关性。 当我拜访客户时,我听到的最常见的说法是:“有一个计划,但是它已经开发了很长时间;不知道它是否经过测试,怀疑它是行不通的。”
9.水过多
在计划中,将介绍五个页面,包括场所描述以及该项目的所有参与者的感谢,并提供有关公司正在做什么的信息。 当您将页面翻至第十个有用信息时,您已经充满了数据中心。
当您试图读取数据中心泛滥时的处理方法时
在单独的文件中取出所有公司“水”。 计划本身应该非常具体:负责此任务的人员会这样做,依此类推。
10.宴会费用由谁承担?
通常,计划的创建者没有公司最高管理层的支持。 但是,中层管理人员会提供支持,他们没有管理或没有必要的预算和资源来组织业务连续性。 例如,IT部门在预算范围内创建了BCP计划,但CIO看不到公司的整体情况。 我最喜欢的示例是视频会议。 如果常规视频会议不起作用,他会毁了谁? “没有提供”的CIO。 因此,从首席信息官的角度来看,公司最重要的事情是什么? 他一直被“喜欢”的是:视频会议,该会议立即变成了关键业务系统。 从业务的角度来看-嗯,没有VKS,我们会像在勃列日涅夫一样打电话。
此外,IT部门通常认为,发生灾难时其主要任务是恢复公司IT系统的功能。 但是有时候这是没有必要的! 如果存在以非常昂贵的打印机打印纸片形式的业务流程,则您不应购买第二台这样的打印机作为备用打印机,以防出现故障。 手动对纸张进行临时上色可能就足够了。
如果我们在IT内部建立持续的保护,则我们必须争取高级管理层和业务代表的支持。 否则,经过IT部门内部的调查,您可以解决某些问题,但不是必须解决的所有问题。
只有IT部门具有灾难恢复计划时,就是这种情况11.未经测试
如果您有一个计划,则需要对其进行测试。 对于那些不熟悉标准的人来说,这是完全不明显的。 例如,到处都有“紧急出口”标志。 但是告诉我,您的消防桶,吊钩,铲子在哪里? 消防栓在哪里? 灭火器应放在哪里? 但是每个人都应该知道这一点。 在办公室门口找灭火器的眼睛对我们来说似乎不合逻辑。
也许应该在他中提到测试计划的需要,但这是一个有争议的决定。 无论如何,只有经过至少一次测试的计划才能被视为工作人员。 如上所述,我经常听到:“有一个计划,所有基础设施都已准备好,但事实并非如此,因为一切都可以按计划中的内容编写。 因为它们尚未经过测试。 永远不会。”
总结
一些公司可能会分析其历史记录,以便了解可能出现的问题和发生的可能性。 研究和经验表明,我们不能为所有事情辩护。 任何公司迟早都会发生这种行为。 另一件事是您将为这种情况或类似情况做好多少准备,以及是否可以按时恢复业务。
有人认为连续性是关于如何消除各种风险,使它们不会实现。 不,这是关于已意识到风险的事实,我们将为此做好准备。 士兵训练不是为了思考,而是为了战斗。 BCP计划也是如此:它将使您尽快重建业务。
唯一不需要BCP的设备伊格(Igor Tyukachev),
业务连续性顾问
计算机综合设计中心
喷气信息系统