发表于:2007-11-16 09:04:00
楼主
一、方案概述
企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。
而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。
蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。
蓝科泰达双机容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。
蓝科泰达提供的打包方案(一)主要包括以下设备:
*磁盘阵列 TechSys TS6308 一台
*阵列电览 SCSI电览 两条
*SCSI卡 阵列与服务器连接 2块
*阵列硬盘 Seagate 160GB 3块
*双机软件 PlusWell HA 一套
*心跳线 HA专用心跳线 一条
一、用户需求及拓扑结构图
1、用户需求
2台数据库服务器,其中server1为主服务器,server2为备服务器,实现24小时*7小时不停机的一个高可用的集群环境。
 多节点集群, 2台server上分别安装plwell软件,软件之间的心跳检测机制合理的为每台服务器建立好备份关系、接管策略。
2、拓扑图
二、方案特点
 性价比高
 安全性稳定性较高 (可以对用户的操作系统,网络,及应用程序等进行全方位的热备,服务器的故障切换。磁盘阵列的设备冗余。硬盘容错。RAID功能)
 占用系统资源较低,阵列柜本身不占系统资源
 提供第三方应用程序的检测监控,默认进程检测,需要定制开发程序的可提供开发。
 界面友好,支持中英文,维护方便,人工维护量少
 支持大容量数据,支持在线扩容
 及时的故障报警机制,声音邮件通知、短信通知。
 服务器支持多样性,可以支持市场上以Intel架构的服务器系统
 保护用户投资
 高可用,硬件和软件故障,都会自动由备机接管。
三、双机热备份(Hot Active) 模式
在正常情况下,一台为主机处于工作作态,另一台为从机,作为备份机,并时刻监视主机的运行情况。当主台主机出现异常时,不能支持信息系统正常运营,从机则主动接管(Take Over)主机的作业及IP地址,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop),当主机恢复后,自动接管原来的作业,从机则将为备份机,并时刻监视主机的运行情况。
四、软件容错原理
(一) PlusWell Cluster容错软件提供了一个完全容错的软件解决方案,并提供数据、应用程序和通信资源的高度可用性。PlusWell Cluster容错软件不需要任何特别的容错硬件,并访问特定节点的配置数据。PlusWell Cluster容错软件会自动地提供错误检测和现场恢复。
在出现故障的情况下,PlusWell Cluster容错软件会将保护资源自动转换到一个根据预先设定好优先权的系统。在实际进行切换用户时, 会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,PlusWell Cluster容错软件会在所选择的节点上自动地恢复操作。
可以被PlusWell Cluster容错软件保护起来的资源是:
卷(Volume)
IP 地址
共享文件
管理器服务器名称
应用程序
定义的用户
2、心跳故障检测Heartbeat
PlusWell Cluster容错软件在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,PlusWell Cluster 容错软件就把这条路径标示为失效(红色)。
如果你只定义了一条通信路径,当PlusWell Cluster 容错软件把这唯一的一条通信路径标为失效时, PlusWell Cluster容错软件便立即开始恢复过程。然而,如果你有冗余路径, PlusWell Cluster容错软件能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果PlusWell Cluster 容错软件开启优先级第二的通信路径并收到了心跳信号,它就不开始failover恢复,只需要把第一条通信路径标成红色(失效),作为信号告诉你需要修复有故障的路径。
一般情况下PlusWell Cluster容错软件 只在下列事件发生时,启动系统恢复功能:
所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效, PlusWell Clus