在数字经济中,业务连续性与科技密不可分。从零售和旅游业,到金融和公共事务领域,从服务转移到线上和员工远程办公,都意味着企业比以往任何时候都更加依赖其数字基础设施。虽然组织可以采取措施,保护其数字服务免受诸如用户操作失误、系统故障或网络攻击等事件的影响,但总有些天灾人祸是超出任何企业所能控制范围的,例如极端天气事件、自然灾害或区域性断电等可能导致的停机和服务中断的情况。 当此类事件发生时,如何让服务和员工快速恢复联机至关重要。 因此,企业必须具备一套健全的、有据可查的、并且经过测试的预案,方案中须有明确的负责人、角色和职责、紧急联系人和行动规则。 但是,光有预案是不够的,企业还需要技术能力以恢复到事故前状态。这意味着企业需在既定时间范畴内完整恢复数据、应用程序和服务,并最大限度地减少任何影响。 从业务连续性和技术恢复的角度来看,所有这些都构成了一套稳健的流程,企业必须确保在灾难发生时做好充分准备。
让团队严阵以待
预测和行动的能力是区分成功者与失败者的关键。当涉及到从不可预测的技术灾难中恢复时,能够准确预测事发第一时间的情况和执行应对措施变得至关重要。IT 管理者必须将自身置身于此等情况下,从而了解应对措施,而非等待灾难发生才想对策。各种情况可能会非常不同,因此在事情发生之前从头到尾地模拟一遍至关重要。 最终,企业都将依靠其自身的数据系统和基础设施,以在充足的时间范围内完全恢复其关键任务的应用程序。但在进入到恢复阶段之前,企业必须培养团队以做好准备。届时他们将采取关键操作来启动恢复,这可以根据企业的需求分为几个阶段。一般来讲,企业首先要确保拥有一套在当前业务中部署的应用程序及服务的完整且最新的清单。其次,在确保以上措施后,企业可考虑按其重要性划分优先级——与企业内部最关键的职能一致。在此,企业须考虑哪些应用程序需优先恢复联机。例如,在线零售商可能会优先考虑恢复其库存和供应链功能后,才考虑恢复其电商平台功能。而律师和市场营销等服务性行业可能会优先考虑其电子邮件和协作应用程序的恢复以实现其公司的通信功能。 一旦企业考虑好了需要优先联机的应用程序,便可开始制定行动计划,并将其记录下来,集中存储并备份至少在两种其他形式的媒介(异地和离线)。此行动计划需尽量详细和具体,并且还必须做好最坏的打算,比如假设您的系统管理员主管在休假或因病请假了,团队需在没有主管指导的情况下恢复数据系统。为了应对此类情况所制定的计划,除关键行动和指令外,还应详列联系电话,以重新恢复整个企业的沟通。诸如“谁需要立即被通知?”、“ IT 团队需要致电谁来获取重要信息?”等类似问题都必须在计划中,以及考虑实用性。“管理员团队是否需要夜以继日地恢复数据中心的服务器?”、“他们吃和住如何解决?”,最详细的灾难恢复 (DR) 计划总是尽心尽力,甚至包括了从披萨外卖公司到出租车公司和酒店的信息。
自动恢复
除根据优先恢复的关键业务功能制定恢复计划外,企业还须确保其数据系统在所有形式的存储中都受到备份和灾难恢复的全面保护。其中,异地和离线数据备份有助于减轻灾难性事件的影响。在此,Veeam 提倡 3-2-1-1-0 备份原则。每个企业应至少在不少于两种不同类型的介质上保存至少三个重要数据副本,其中至少一个异地与一个离线,没有未经验证的备份,或备份完成时无误。 当然,备份和灾难恢复是两个密不可分的解决方案,但我们不应该将两者混为一谈。 灾难恢复是指一连串旨在确保公司数据存活的举措和流程,无论灾难或危机的范围如何,重点是为了尽快恢复 IT 服务。 使用第三方灾难恢复提供商提供的灾难恢复即服务 (DRaaS),企业只需单击一下即可自动测试、记录和执行灾难恢复计划,从而实现从单个应用程序到整个站点的恢复。回到规划过程,企业可以根据他们需要的服务水平协议 (SLA) 选择最佳保护方法。灾难恢复计划背后的基本问题和目标需要是:业务需要多快的速度恢复?无论是指让关键任务应用程序重新上线,还是完全恢复之前的数据。借助 DRaaS,客户可以利用一种可完全掌控的、受监控的和安全的方法来保护关键数据,而无需维护异地存储库。总而言之,灾难恢复最佳实践结合了以业务为主导和以 IT 为中心的战略,以确保整个业务的业务连续性。唇亡齿寒,考虑到企业对其数字基础设施的依赖,他们需要一个强有力的计划以及能够充分保护业务的现代数据保护解决方案。
转载请注明:IT运维空间 » 安全防护 » 未雨绸缪,为灾难恢复提前做好准备
发表评论