打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
案例分享丨基于共享数据中心的容灾体系建设

信息系统面临的威胁

近年来,随着网络攻击技术的泛滥,不少单位的信息系统会遭到黑客的攻击和信息的篡改。

针对网络信息系统攻击的各种犯罪活动已经严重危害到社会的发展和企业的安全,给全球带来了巨大的经济损失。

当前信息系统所面临的威胁共分为以下几种:

人为因素:整个系统最薄弱的环节就是系统使用者。误操作会导致数据的丢失或损坏,工作压力和恐慌以及疲劳都会增加误操作的发生概率。

硬件故障:任何高性能的机器都不能长久地运行下去,这也包括计算机部件。磁盘故障是计算机运行过程中最常见的故障之―。当磁盘损坏时,磁盘失去读写功能导致数据无法被继续使用,进而造成数据的丢失。

环境因素:环境因素对系统的可靠性有着重要的影响。在温度、湿度、冲击、震动、电磁波等的作用下,系统会产生不同程度的故障,从而降低系统的可靠性。

设计错误:系统软件是功能描述整理设计出来的,由于不正确的逻辑设计可能使预定的功能产生偏差。这种逻辑设计上的错误可能会导致数据不可逆的丢失。

网络故障:网络故障往往会导致服务的中断,对整个校园信息化运作的连续性产生巨大的影响。网络故障还会导致数据包的丢失,造成数据不一致,降低系统稳定性。

自然灾害:自然灾害往往在毫无防备的情况下突然袭来,地震、火灾、洪水等一系列自然灾害都会导致所有系统连同数据顷刻损毁。数据的完整性受到了严峻挑战。

根据国际IT风险评估数据统计,引起业务系统中断的原因占比分布如图1所示。

图1 信息系统威胁

信息系统

数据安全的四个指标

各种无法预知的挑战都会导致大型核心数据库的损坏,进而导致整个数据中心的崩溃。衡量一个数据中心的容灾备份能力,至少应该有以下四个关键指标:

RPO(Recovery Point Objective)

恢复的数据丢失目标,即业务系统所能容忍的数据丢失率目标。RPO针对的是数据丢失,一般由数据中心数据备份系统的能力决定。

RTO(Recovery Time Objective)

恢复的时间目标,RTO针对的是服务丢失时间长短,主要指的是所能容忍的业务停止服务的最长时间,即从灾难发生到业务系统恢复服务功能所需要的最短时间周期。

RCO(Recovery Continuity Objective)

恢复的数据一致性目标,即由于人为的删改、恶意篡改、人为的误操作等因素造成的逻辑数据错误。

ROI(Return of Investment)

综合的系统建设运维成本和收益比,即系统建设投入成本与系统所面临风险的综合评估系数。

容灾备份系统的综合评价指标即RTO(=0)、RPO(=0)和RCO(=100%)时,达到优良的ROI投资收益指标。

容灾等级建设目标

容灾按其容灾能力的高低可分为多个层次,国际标准SHARE78定义的容灾系统建设的技术目标有七个层次:

0级:仅在本地进行磁带备份。

1级:将备份的磁带存储在异地。

2级:建立异地数据热备系统,支持异地或本地数据恢复,时间可从几个小时到几天。

0级到2级,是技术最简单和投资最少的容灾解决方案,即将业务系统每日的备份数据制作成一个相同的拷贝并保存在容灾备份中心,这是数据级容灾。

当机房发生火灾或者地震时,利用相关备份数据恢复数据,同时启用容灾中心备用业务系统。

这种容灾技术在数据恢复前需要准备相应的软硬件环境,这将导致业务中断时间变长,因此满足不了业务系统对中断时间的要求,RTO指标比较差。

3级:建立异地数据热备、设立异地应用系统,数据和应用可在数天或数小时内异地恢复。

4级:建立异地数据热备、设立异地应用系统,实现有目标的异地远程业务应用系统的实时切换。

3级到4级,就是采用BCV.SRDF等智能盘阵镜像复制容灾技术,或者存储卷复制技术。此类技术的RTO和RPO指标比较好,一般能够实现1~3小时内的容灾切换。

但是,此类技术对两点间的网络带宽有较大的要求,且限制有效距离。由于软硬件必须同构,并且容灾端系统利用率非常低,导致数据中心成本过高,同时此类技术的容灾演练操作复杂,性价比不高。

5级:实时数据备份,异地远程双活中心,数据在两个站点之间相互镜像,由远程异步提交来同步,恢复时间被降低到分钟级或秒级,即容灾端实现高可用、迅速切换、数据一致性保证。

6级:零数据丢失,是灾难恢复的最高级别,利用专用的存储网络将关键数据同步镜像至备份中心,数据不仅在本地进行确认,而且需要在异地进行确认,实现0中断、数据0丢失、自动切换等。

共享数据中心数据安全

高校共享数据中心现状

校园共享数据中心是统一的数据资源共享与交换应用服务平台,是对数字化校园中的各种结构化数据进行统一管理的平台,是实现数字化校园数据共享,提供深层次数据挖掘、数据分析的重要基础,承载了可视化数据采集、DCI数据清洗整合、数据同步交换、决策支持数据分析等信息系统。

目前,各高校由于资源情况不同,具体的服务器大致分为两种,X86架构机架式服务器和VMware搭建的虚拟化集群服务器。硬件资源条件较好的高校,共享数据中心核心业务服务器均为机架式服务器,构成Oracle RAC高可用集群,其他业务系统服务器通过虚拟化平台承载,这样就构成了低风险数据中心架构,如图2所示。

图2 低风险数据中心

硬件资源条件相对较差的高校,所有的应用,不论是数据处理、数据库还是业务系统都部署在虚拟化平台上,不论是性能还是安全性上都存在着极大的风险,并且核心数据库与关键业务系统数据均存放在现有单节点生产存储上,整个业务系统未进行高可用保护,业务系统存在单点故障风险。如图3所示。

图3 高风险数据中心

一旦现有生产存储系统出现故障,部署在其上的业务系统和数据库系统都将停止运行,甚至存在数据丢失风险。

随着数据中心的相关业务系统不断增加,数据量不断增大,数据中心承载的压力也随之增大,为了使整个校园信息系统的稳定运行得到保证,修改数据中心的物理架构,并且制定相应的备份容灾策略是唯一途径。

数据中心容灾需求

根据数据中心业务特点和建设现状,以保障全校各业务系统稳定性为目的,从故障场景、容灾方式、建设成本等多方面考虑

梳理容灾体系设计需求如下:

第一,通过现有资源整合,以最大限度利用现有资源为前提,扩容FC-SAN存储网络,建设以存储系统高可用性为核心的存储双活平台,消除存储系统单点故障隐患。

第二,持续备份业务系统数据,记录业务系统环境中的数据变化,对变化的数据生成增量快照进行保护,Oracle生产数据库系统本地逻辑备份,并通过技术手段实现异地数据实时同步,保证数据高可用,以应对由于系统病毒破坏、误删除、逻辑错误以及磁盘故障造成的数据损坏丢失等问题。

第三,采用虚拟化技术构建一套与核心业务系统运行环境架构一致的灾备环境,以实现数据中心发生故障时,切换至灾备环境,做到系统服务快速恢复。

数据中心容灾体系设计

数据中心高可用容灾体系设计

通过对数据中心的整体架构进行分析,设计出了一套基于共享数据中心的数据容灾架构。具体实现步骤如下:

第一,生产数据中心结构优化,存储分级隔离,将数据库服务器分离出来,分别建立关系型数据库集群和非关系型数据库集群,并搭载到单独的磁盘存储上,避免其他业务系统的影响;

业务分级隔离,将数据中心核心业务系统分离出来,部署到单独的应用系统服务器中,提高核心业务系统的稳定性;

数据处理分级隔离,将DCI数据清洗整合平台服务器分离,部署到单独的服务中,提高数据处理平台的性能。

第二,搭建本地备份中心,在本地构建一整套与生产环境结构一致的数据中心体系,当生产环境发生故障时,可以实现对应业务系统的点对点的快速切换恢复。

第三,搭建异地灾备中心,通过专线网络在异地搭建小规模的数据中心,只保留数据中心核心业务系统和数据库服务,当本地环境出现断网、断电等不可逆的自然灾害时,实现业务系统服务的快速恢复。

数据备份

通过在本地灾备中心部署两台备份一体机,进行虚拟化部署,搭建与生产端对应的备份服务器及一台集中备份服务器。

第一,通过应用级容灾高可用产品实现生产中心与灾备中心业务系统一对一的应用级应急接管保护,当生产端出现问题,灾备服务器可以自动/手动接管生产端业务系统,继续提供服务,保证业务系统的可持续性。

产品底层通过对主、备两端数据进行实时数据同步,保证两端数据始终保持一致,上层对主、备两端的网络、应用及服务进行监控,当主端业务系统出现故障导致业务系统宕机,备端业务系统会在几秒内启动接管生产业务,保证业务系统的可持续性。通过应用级应急接管保护,可以保证RTO(业务系统恢复时间)≈0,保证业务系统持续运行。

第二,通过数据级实时备份产品实现生产中心业务系统核心业务数据实时备份保护,统一备份到容灾备份一体机内的集中备份服务器内。

数据级实时备份保护产品对业务系统数据进行持续的、不间断的I/O操作进行记录,通过实时捕获增量数据,将增量数据传输到备份端,始终保证主、备两端数据的一致性,并且可以根据需要将数据恢复到之前的任意时间点,防止核心数据或数据库数据的逻辑错误、误删除及病毒等问题,实现对数据的可追溯性。

第三,通过无代理整机备份产品对运行在VMware虚拟化平台内的非核心业务系统进行无代理整机备份保护,统一备份到容灾备份一体机内的集中备份服务器内。

只需部署一台备份节点服务器,无需在VMware虚拟化平台内的每个虚拟节点安装代理,即可对VMware虚拟化平台内的虚拟服务器,进行整机的备份保护,并可根据需要,进行恢复。

数据容灾

通过在异地灾备中心部署一台备份一体机,进行虚拟化部署,一台集中备份服务器,通过数据级实时备份产品实现生产数据中心核心数据异地备份保护。

在备份时,传输的为源端生产数据的增量数据,采用字节级备份,最大限度地节省备份时所需的网络带宽,并且可以根据需要进行细粒度的网络带宽控制。

实时备份分为两种模式,第一种针对核心数据库数据进行实时备份,可以根据需要将数据恢复到之前的任意时间点,防止核心数据或数据库数据的逻辑错误、误删除及病毒等问题,实现对数据的可追溯性。

第二种针对非核心数据进行实时备份,始终保持主、备两端数据一致,备份数据为原格式备份,备端数据可直接使用,无需恢复。

通过实时备份保护,可以保证RPO(业务数据丢失量)≈0,避免数据丢失。

本文通过对高校现有应用系统结构进行分析,结合信息系统所面临的威胁,提出了一种基于共享数据中心的数据容灾架构,该数据容灾架构可以最大限度地保证数据的连续性和业务的连续性,具有恢复速度快、安全稳定高的特点,充分利用了生产数据中心现有设备,可以满足高校数据中心的容灾要求。

参考文献

[1]将数据纳入安全管理首要目标[J].郑先伟.中国教育网络.2019(01)

[2]智慧校园建设背景下高校数据安全管理的研究[J].刘蓁蓁.网络安全技术与应用.2021(01)

[3]基于公共物品属性的数据安全管理研究[J].王政坤.网络空间安全.2020(04)

[4]企业信息化中的数据安全管理[J].李同霞.中国信息界.2021(04)

[5]试论计算机数据安全管理[J].刘晓芸,张岩,马玉洁,宿媛媛.科技风.2018(14)

[6]新的基于云计算环境的数据容灾策略[J].项菲,刘川意,方滨兴,王春露,钟睿明.通信学报.2013(06)

[7]数据中心容灾系统研究[J].徐鹏,薛建峰.计算机工程与设计.2007(11)

作者:王鹏、王玉(沈阳工业大学信息技术与数据管理中心)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
云数据中心容灾备份方案
什么是数据中心容灾?
浅谈数据中心灾备和多活的过去、现在、未来
直播软件搭建,你的直播系统是第几级别的容灾性
微信支付刚崩溃,又有人想搞支付宝??
数据中心解决方案之灾备方案设计(上)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服