提高 IT 连续性的 7 个技巧


编辑导语:在当今的 IT 世界中,业务连续性意味着能够在不中断业务的情况下处理中断,同时提供用户期望从其技术中获得的体验。

大部分时间里,IT业务连续性一直专注于系统正常运行时间,确保系统不会出现故障,如果发生故障,则尽快将其恢复在线。

如今,IT 业务连续性意味着更多内容。

业务连续性包括两个层面:一个是实现业务不间断;第二是关于具有调整、处理变化和处理意外的能力。同时,业务连续性意味着做所有这些事情的同时,不断提供用户期望的体验。

十年前,如果发生停电,用户会自行度过难关。但是,今天的用户和商业领袖希望技术始终有效,并成为一种惊人的体验。现在的期望要高得多,因为IT是一个推动者,它变得更加重要。用户可能不要求完美,但他们的标准真的非常非常高。

这反过来又促使人们采用一种更广泛的方法来确保当今的IT业务连续性。在这里,CIOBOK 提供了 CIO 应采用的七种最佳实践,以确保他们满足当前对IT业务连续性的期望。

1、与业务需求保持一致

一般,IT业务连续性被定义为确保技术始终可用 —— 即使这种完美是不可能的。所以你必须计划这样一个事实,即事情会在某个时候消失。

CIO 可以通过明确哪些系统对业务最重要的方式,为这种必然性做好最充分的准备;这种清晰度让IT知道在任何类型的中断期间首先要关注什么。

毫无疑问,您要做的第一件事就是与业务保持一致,他们需要什么以及他们愿意为获得他们期望的东西付费。业务影响分析可以帮助IT和业务实现这种一致性。一旦你了解了业务的要求,那么它就是关于你如何规划你拥有的服务和功能,以及哪些应用程序被哪些团队使用,所以如果出现问题,你知道把你的优先事项放在哪里,让他们提前准备。

2、化解运营孤岛

也有人认为,IT业务连续性是“一种从管理运营风险中延伸出来的新兴资产”。

为了做到这一点,IT运营和网络安全应该与监督业务连续性/灾难恢复计划的领导者合作。然而,这并不总是会发生。这些活动往往是孤立的,因此每个学科在不同的风险假设和场景下运作,而实际上它们必须融合并协同工作。

例如,一个组织的网络安全团队可能专注于创建一个出色的纵深防御策略,以最好地确保它可以防止入侵,在入侵发生时检测到入侵,并在入侵发生时做出响应。但是,如果网络安全没有与风险和IT密切合作,那么该团队可能不会那么擅长计划“尽快恢复到正常运行状态,并将后果降至最低”。

如果他们不是一起交谈,他们可能会计划或量化不同的风险。他们必须一起规划和运行场景。如果你从影响方面看待风险,并能够设想可能发生什么样的后果,你就可以开始量化风险,然后你就可以知道把下一块钱花在哪里,是把它放在预防方面,还是花在减少影响的做法上。

3、完善运营指标

随着IT业务连续性的发展,CIO 应该调整他们用来衡量和管理运营的指标,以确保他们实现正确的目标。

传统上,如果我们回到十年前,它将是关于正常运行时间,应用程序的可用性以及恢复的平均时间。但如今,随着应用程序变得更加面向微服务,我们远离单体架构系统,我们需要以更细致入微的方式进行衡量。

衡量重点放在执行关键交易的能力上,例如从用户角度衡量客户交互中的失败,用户视角的应用体验或服务水平目标。

这是企业围绕这个应用程序或这个客户旅程关心什么,你需要衡量企业想要衡量的东西。

4、进行业务连续性演练

IT业务连续性意味着成功处理意外情况。为此,需要确保IT部门不会毫无准备。这意味着通过模拟进行演练和测试。

进行演练,将某个集群停机,而不告诉每个人,看看人们如何回应。这几乎就像一个实际模拟。你必须在正确的时间小心翼翼地做到这一点,但这必须是你演练节奏的一部分。你必须有这些标准的操作程序,通过并完善它们。你必须愿意让你的员工感到不舒服,挑战他们。这给了他们一些友情,因为他们知道他们可以度过难关。

这样的演练让CIO和IT经理有机会对运行良好、建立肌肉记忆的流程建立信心,并有助于发现流程弱点——比如接受过关键技术培训的员工缺乏冗余,或者在特定应用程序失败时缺乏备份程序等。

5、将业务连续性融入架构

将业务连续性构建到架构本身非常重要,例如,通过跨地理位置分布实例和有效负载。

确保系统业务连续性的一种方法是“简化你所做的事情,这样你就可以很好地满足期望”,并指出这种方法也有助于防止团队过度扩张。

混合使用事件、问题和变更管理的自动化也有助于建立弹性。

建议采用站点可靠性工程(SRE),这是一套旨在创建可扩展,可靠系统的基础设施和运营的原则和实践。SRE以及那些接受过其原则培训的人专注于构建这样的 IT系统——不仅在蓝天中正常工作,也可以在暴风雨的天空中工作。

大型传统组织越来越多地采用数字原生组织使用的原则、技术和方法来构建更具业务连续性的 IT 系统。这使企业能够提高其对破坏性业务事件的弹性,从而变得更具竞争力。

为此,IT 领导者强调速度和敏捷性,以数据为中心和分散化,以及持续集成和交付、SRE和微服务,以更加模块化和可组合的方式提供未来组织所需的业务功能。

从传统的基于瀑布的 IT 项目交付转向更以产品为中心的 IT 交付和运营,这倾向于考虑支持 IT 业务连续性的更广泛的更具战略性的需求。几乎所有组织都有一部分 IT 资产在云中,但关键是要考虑可以利用哪些独特的云功能来提高组织变得更加敏捷和弹性的能力。

6、时刻保持警惕

专家表示,组织、风险、业务需求和技术都将不断发展,围绕 IT 业务连续性的实践也应该如此。

与业务部门合作,了解他们在哪里看到业务中断的风险,风险的规模,以及至关重要的是,他们如何量化这种风险,从而了解潜在的价值。通过清楚地了解技术环境的当前状态,您可以更好地了解组织如何应对这种中断,以及关键风险区域所在的位置。

确认需要采取的具体干预措施,以最大限度地降低风险,并制定路线图来实现变革。只有当每个人都在业务风险上保持一致时,才能执行该路线图。

7、让业务团队分担责任

业务团队在 IT 业务连续性方面也可以发挥作用,因此业务部门领导者也应该对此负责。

你必须有一个问责制模型,它应该与企业共享。所以无论谁构建应用程序都应该分担责任。它不应该只是CIO的角色。

我们并不倡导业务部门接管IT运营以及应用程序和系统的日常管理;相反,业务部门应该明白,他们的需求和优先事项会影响业务连续性。

例如,如果业务部门领导者不断优先考虑上市时间和价值创造速度,那么他们需要对是否以及在多大程度上可能影响业务连续性承担共同责任。


最近更新于 2022-07-17 猿小六2022-07-13 发布, 已阅 1787 次。