用户管理  |   用户注册                                                                                    首 页软件下载教程中心办公指南flash动画文档下载办公公文

www.4oa.com - 中科软件园

投递文章 用户管理 投稿指南 资讯通告 :
站内搜索: 您的位置中科软件园 > 教程中心 > 操作系统 > Linux > 解决方案 > 教程内容

X0;linux高可用性服务器集群方案LATCH HA

2005-5-25 7:24:20  来源:本站整理  作者:不详 【 投递文章
内容提要:LATCHHA是X0;linuxLatch系列的高可靠性的服务器集群系统解决方案。今天各行业的顺利运转都依赖于计算机系统。商品的订货、配送、客户服务、财务结算、保险及预约都需要高度可靠的信息服务系统。...
LATCH HA 是X0;linux Latch 系列的高可靠性的服务器集群系统解决方案。

今天各行业的顺利运转都依赖于计算机系统。商品的订货、配送、客户服务、财务结算、保险及预约都需要高度可靠的信息服务系统。这自然要求计算机的宕机时间越短越好。LATCH HA能够自动检测系统的故障。同时,一旦发现计算机出现故障,LATCH HA将把该计算机上的所有进程转移到备份计算机上,从而为客户提供不间断的服务。

一旦计算机宕机,LATCH HA能够将宕机时间缩短到几分钟甚至几秒钟。而且能够将系统恢复到宕机以前的状态,从而保证计算机的稳定运行。在LATCH HA的保护下,计算机系统再也不用因为硬件故障或日常性的维护而中断运行。LATCH HA就是利用这些方法来提供最佳的服务可靠性,将计算机的宕机时间减少到最低程度。要知道,一分钟的宕机时间也许会给银行,铁路,航空等行业的运营带来不可估量的损失。

还具有系统崩溃的智能检测与处理系统。她利用各种手段来检测硬件、存储设备、网络及系统软件的故障。同时,一旦发现计算机出现故障, LATCH HA将把该计算机上的所有进程转移到备份计算机上,从而为客户提供不间断的服务。

高可用性的实现的另一大关键就是的冗余策略,简言之就是对主机,网络设备,备份设备的多台备份(当然不只是简单的备份机):LATCH HA拥有多种冗余模式,其中包括双机在线待机模式、双机就绪模式及三机模式。所有的模式都提供了对各种备份资源-如文件系统、数据库、网络IP地址、系统进程、SCSI设备及NFS-的支持。

此外,高可用性的实现还要有丰富的应用程序支持: LATCH HA能够应用在各种集中式、客户机-服务器模式或OLTP系统中。同时其与市场上各种主流的数据库系统与OLTP软件-如Oracle、 SYBASE、 Informix与Tuxedo-也都保持兼容。LATCH HA同时提供了各种应用程序接口。因此,客户能够在其私有软件中集成各种功能来保证系统的高可靠性,这样也保护了客户的投资。


正文

1. 系统架构



上图是典型的LATCH HA解决方案系统结构:两台主机A,B共享一个磁盘阵列,A为工作机,B为备份机。它们之间以一根心跳线来连接,这被称为“心跳检测”,主要通过一条RS232检测链路来完成。LATCH HA也采用了网络ping检测来验证系统宕机检测的准确性。安装在主机上的HA软件通过心跳线来实时监测对方的运行状态,一旦正在工作的主机A因为各种硬件故障-如电源失效、主要部件失效或者启动盘失效等导致系统发生故障,主机B立即投入工作。

LATCH HA实现了“高可靠性共享存储”架构。该架构由两个或三个冗余服务器、一个共享冗余磁盘阵列、一个可选DBMS及LATCH HA系统软件构成。在LATCH HA的保护下,企业的计算机系统能够提供不间断的信息服务,避免由于硬件故障或日常维护所带来的宕机,因而能够首先最佳的可靠性及最大程度地减少宕机时间。


共享存储设备故障的检测

LATCH HA能够判断由于下列原因所带来的共享存储设备故障:SCSI适配卡失效、SCSI连线失效或RAID控制器失效。共享存储设备故障同时也会造成访问这些设备的软件的误操作或甚至系统宕机。

网络失效检测

LATCH HA能够判断由于下列原因所带来的网络联接故障:网络适配器失效或网络连线的失效。这些故障将使得所有依赖于网络的操作都无法进行。

进程终止检测

LATCH HA能够检测软件进程是否是正常退出。这意味着,随着某一进程的结束状态的不同,可以采取不同的行动。

可调整的检测超时设定

系统宕机检测及网络检测的超时设定都是可以调整的。更短的超时设定意味着能更快地发现故障与进行服务器切换;但是,这可能会导致检测的可靠性下降。

2. 服务器切换模式

自动或手动切换

一般LATCH HA自动对系统故障进行检测,并将服务从失效的服务器转移到备份服务器上。当然,管理员同样也能够手动地切换到备份服务器以进行某些日常维护工作。

切换的自动恢复

一旦失效的服务器修复完毕,你可以让服务切换到原来的计算机上。这项功能也能自动完成。
3. 可靠性

网络可靠性

LATCH HA能够实现高可靠性的TCP/IP网络。当一个服务器上的网络联接失效时,备份服务器将以同样的IP向用户提供服务。举例来说,NFS服务的切换对用户来说就是完全透明的。

共享RAID的可靠性

共享RAID可以拥有两个或三个联接端口与冗余磁盘。这些特性保证了LATCH HA不会因为某一SCSI硬盘的故障而失效。

共享文件系统的可靠性

当一个服务器宕机后,共享存储设备上的文件系统可能会不完整。在服务器进行切换后,备份服务器能自动修复共享文件系统。

进程可靠性

LATCH HA将所需要的进程放置在共享文件系统中,并且在两个服务器上都加以记录。这样,在两个服务器切换时就可以启动同一组进程了

数据库可靠性

LATCH HA可以与一系列的DBMS协作。当然数据库必须创建在共享存储设备上。当数据库服务器宕机时,LATCH HA就将DBMS切换到备份数据库服务器上。对共享数据库的回溯操作(rollback recovery )可以保证该数据库数据的完整性。

4. 应用

LATCH HA能够应用在各种集中式、客户机-服务器模式或OLTP系统中。同时其与市场上各种主流的数据库系统与OLTP软件-如Oracle、 SYBASE、 Informix与Tuxedo-也都保持兼容。LATCH HA同时提供了各种应用程序接口。因此,客户能够在其私有软件中集成各种功能来保证系统的高可靠性。

a) LATCH HA/HS2000 在线待机模式



在这种模式下,一个服务器作为主服务器。正常情况下其承当所有的服务。另外一台服务器作为待机服务器,正常情况下除了监控主服务器的状态,不进行其他的操作。一旦主服务器宕机,待机服务器就接手工作,成为新的主服务器。客户仍然可以拥有同样的服务器IP地址、NFS、数据、数据库及其他……这种应用模式近似于上面介绍的典型应用模式—A与B实际上是在完成同一个功能应用,安装在主机上的HA软件通过心跳线来实时监测对方的运行状态,一旦正在工作的主机A因为各种硬件故障-如电源失效、主要部件失效或者启动盘失效等导致系统发生故障,主机B立即投入工作。

b) LATCH HA/DA2000双机就绪模式



在这种模式下,两个主机都作为主

[1] [2]  下一页

(评论内容只代表网友观点,与本站立场无关!)[ 全部评论 ]

网友评论:

    用户名:

    评   分:100分 85分 70分 55分 40分 25分 10分 0分

    内 容:

                 (注“”为必填内容。) 验证码: 验证码,看不清楚?请点击刷新验证码

关于本站 - 网站帮助 - 广告合作 - 下载声明 - 友情连接 - 网站地图 -有事点这里