• 统一热线:4008-1212-86
    专业的服务器和存储解决方案商
您现在的位置:首页 > 解决方案

双机容错方案
发布日期:2013-5-24

前言

  
随着计算机技术的发展,信息已成为企业系统日常活动中十分重要的一个组成部分,同时,由于系统的复杂性和开放性以及应用环境的多样化,也给应用系统的运行带来了许多不确定因素。这些因素也导致对服务器的安全性也提出了更高的要求,基于该平台业务系统的安全,稳定可靠和系统的持续运行成为系统的关键。

  在一般情况下,当系统不能正常运行时,我们需要用人工的方法进行故障的认定、分析、恢复及测试。这些都需要花费很长的时间。在这段时间内,系统必须停顿下来以等待恢复,从而给企业带来难以估计的经济损失。

  双机容错是计算机应用系统稳定、可靠、有效、持续运行的重要保证。五舟HA系统是一个高可靠性的容错系统,它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。当一台主机出现故障,该软件可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行。


  可以说,在目前各行业,信息系统的可用性和可伸缩性已成为衡量其资源利用率的最重要的尺度。

 

三、双机容错基本架构介绍


  双机容错的目的在于保证数据永不丢失和系统永不停机。采用智能型磁盘阵列柜可保证数据永不丢失,采用双机容错软件可保证系统永不停机。它的基本架构共分两种模式:双机互备援(Dual Active)模式和双机热备份(Hot Standby)模式。

  1、双机互备援(Dual Active)基本简介

  所谓双机互备援就是两台主机均为工作机,在正常情况下,两台工作机均为信息系统提供支持,并互相监视对方的运行情况。当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over)异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop),但正常运行主机的负载(Loading)会有所增加。此时必须尽快将异常机修复以缩短正常机所接管的工作切换回修复的异常机。

  切换时机(Take Over

  
①系统软件或应用软件造成服务器宕机
  ②服务器没有宕机,但系统软件或应用软件工作不正常
  ③SCSI卡损坏,造成服务器与磁盘阵列无法存取数据
  ④服务器内硬件损坏,造成服务器宕机
  ⑤服务器不正常关机

  2、双机热备份(Hot Standby)基本简介

  所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机会及时通知系统管理员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop)。宕工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将备份机的工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机。

  切换时机(Take Over
  
①系统软件或应用软件造成服务器宕机
  ②服务器没有宕机,但系统软件或应用软件工作不正常
  ③SCSI卡损坏,造成服务器与磁盘阵列无法存取数据
  ④服务器内硬件损坏,造成服务器宕机
  ⑤服务器不正常关机由于服务器的性能与等级不断的提升,但硬盘的技术并未随着变化作快速调整,致使硬盘及其内含的资料屡受威胁,成为服务器系统最大的弱点。


  3、磁盘阵列系统的要求


 
 在一般性的应用上,单一服务器在遇到问题造成停顿或当机时,通常作业都必须停止一段时间,以便进行整理或维修,这样的情况在大部分的单位里是不被允许的(根据统计,服务器上最易损坏的配件是硬盘),因此而有了双服务器的应用方案,但双服务器方案容易造成原配置的数据通道不够,或资料IN/OUT的时间,位置不统一的状况,此时磁盘阵列柜将可以把上述的问题迎刃而解,因为磁盘阵列大多配备了多个通道,提供给二个以上的服务器使用,同时RAID透过控制器的切割,可以切割出多个区间提供给不同服务器的需要。

  在双机集群系统中,磁盘存储系统就硬件而言,可以成为服务器的得力助手, 因为它提供了以下几个功能:

  1. 足够的扩容空间
  2. 安全的资料保护(服务器当机或硬盘损毁,资料不流失)
  3. 降低服务器的维护率
  4. 维护作业简便

  就硬件结构而言,磁盘阵列被视为一个外设装置,并且各自对应一个或多个储存区间,因此其结构性是相当简单的,如此的设计方式有几项好处:
  1. 简化服务器系统的结构以减少对服务器的影响
  2. 所有复杂的储存,备份,侦错,检查工作,完全由RAID的控制器负责,不占用服务器的资源,使服务器达到最高的可利用率
  3. 完全独立的硬件结构相连接,不需要再另外加装任何驱动程序
  4. 标准接口,安装容易

  磁盘阵列系统除了对硬件及内含资料的保护之外,另外还必须具备的一项功能是容错切换,它是透过一套具有监控,管理服务器和存储资源的功能软件,在存储系统和主机的连接或存储系统部件出现任何故障时,自动将数据链路切换到备用链路或系统部件上,这也是实现双机集群的基础,即存储系统的绝对安全可靠。

 

  四、五舟四核高可用性解决方案

   

1、系统介绍

 

根据目前行业用户的需求情况和未来的发展性考虑,五舟推出了基于服务器、磁盘阵列和双机容错群集为平台的高可用、高可伸缩性系统解决方案。通过软、硬件的紧密结合为用户提供了具有单点故障容错能力的系统平台,可迅速处理企业系统在运作过程中产生的大量数据;同时在服务器发生故障时它们的数据和应用系统依靠容错能力,实现在线故障自动切换,实现系统7*24小时不间断运行,避免停机造成的损失。

 

五舟高可用双机系统由2SF5203B四核服务器,1台五舟 S608磁盘阵列系统,1WZHA双机软件组成。两台SF5203B四核服务器, 软、硬配置完全相同,工作于双机互备模式。共同对外提供一个唯一的IP地址、计算机名以及其它的共享资源,互相监控及互为备援。

 

2系统网络拓扑图

 

 

1、 系统分析

 

      双机系统。本方案除最大限度地保证数据的安全性外,也同时需要承担整个网站的数据查找删除及修改的任务。其工作量极其巨大。所以本系统使用双路C双路双核INTELXEON处理器、大容量内存及高性能的RAID5来保证系统的高性能与容错能力。

双机系统通过安装运行五舟HA容错软件,达到使数据中心具有容错保护能力的目的。在系统中,两台四核服务器数据库系统工作在“双机互备缓”的工作模式下;即同为工作机,在双机软件的控制下,同时处理来自客户端的数据请求及相关服务。相对而言,其信息处理能力提高了一倍,可充分满足来自整个系统的数据处理的要求。同时,两台工作机利用心跳机制进行互相监控,在一主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over)异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop)。

               

      高可伸缩性的存储系统。基于数据传输速度、最大可用容量和可扩充性的考虑,我们公司使用次数最高、表现最好的五舟 存储阵列柜,具体型号为同方S608。该阵列柜最高可支持RAID 6的容错方式,为数据的充分的保障;选择该机型的另一个最原因则在于未来存储容量的扩容及SQL服务器群的扩充方面的考虑,因为采用高达2Gb FC通道在充分满足数据传输带宽的同时可以组成SAN网络存储架构为日后的系统扩容(动态添加多台阵列柜)和多台服务器对阵列柜的访问提供可行性。

 

这种相对独立的数据存储方式,有利于另一台主机接管服务及应用后,可以正常访问数据内容。同时也有利于分配仲裁文件存放区域,这样使用得本方案使用不同的HA软件成为可能。此外,对于影视流服务、FTP下载及远程教学等用户,阵列柜的采用可以充分满足他们对于存储空间与数据传输速度的苛刻要求。

4、系统方案软件介绍:

  • 双机容错系统软件

本系统使用五舟HA双机软件。其优点如下:

1. 不用增加任何额外硬件投资,纯软件方式实现双机容错,且对备机无硬件配置要求。

2. 可支持NotesExcClusterngeSQL ServerSybaseInformixOracle SAP等多种系统的应用层热恢复。

3. 支持远程灾难备份。

4. 支持共享磁盘阵列柜和镜像两种方式,给用户提供了选择上的灵活性,同时也能适应各种机型、网络结构、软件平台及应用系统。

5. 五舟HA Cluster容错软件在镜像或共享磁盘阵列任意方式下,均能实现两台服务器各自运行不同应用且相互热备份,即实现双Active运转模式。

6. 最大限度地保护用户端的应用连续性。用户的硬件资源(如网卡,软件资源如NT操作系统、数据库管理系统、数据库应用系统、电子邮件系统等)均能处于五舟HA Cluster容错软件的保护之下,当这些被保护资源出现技术故障时,五舟HA Cluster容错软件可随时实施系统资源切换。如此,五舟HA Cluster容错软件真正实现了用户硬件或是软件资源发生故障时系统及应用层上的在线热切换。

7. 五舟HA Cluster容错软件占用系统资源极少,不增加网络负荷,且不打扰任何具体应用系统的任何操作。

8. 五舟HA Cluster容错软件真正实现无人值守,全自动地实现应用资源切换,且图形界面操作,简单方便。

9. 自投入使用以来,已经历了大量交易高峰的实际考验,其执行效率很高且运行十分稳定可靠。

11. 目前五舟HA Cluster容错软件有Windows NT/2000/2003SCO UNIX两种版本。

全部软硬件产品由五舟统一开发、测试,并提供完善的售前、售中、售后服务,帮助客户减少采购和维护成本。

五、方案实施

 

1、系统安装

㈠、交换机组冗余系统的安装。

      待其它服务系统正常后进行相关测试。

㈡、高可用双机系统安装。

①准备工作。

安装并检查心跳连接,包括RS232连线,心跳专用的以太网线;安装并检查阵列柜,将阵列柜通过SCSI线缆连接服务器;安装硬盘并创建罗辑卷。

      安装WINDOWS操作系统,并根据HA软件的要求对系统各项参数进行初始设置。

      安装HA软件。请参考HA软件安装手册。

      安装数据库软件及各种应用软件。请参考数据库软件安装手册。

      创建系统资源,如虚拟IP地址、计算机名及磁盘空间等。