扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:付新 2007年6月7日
关键字: DM数据库 双机热备 数据安全 付新专栏 SQL Server
工作原理
DataWare软件同时安装在两台主机上,监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的故障,及时进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。在正常的运作情形之下,主机之间透过冗余侦测机制互相侦测,当任一主机有错误产生时,DataWare提供严谨的判断与分析,确认主机出错之后,才完全启动备援接管动作。容错软件在服务器节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。
即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,DataWare容错软件就把这条路径标示为失效(红色)。一般情况下DataWare容错软件为了避免不必要的失效切换,通常建立两条独立的心跳检测径,即至少使用两种心跳检测方法:
1> 在共享磁盘阵列上开辟一个裸设备区(>10M),两台机器上运行的DataWare软件负责按照一定时间间隙向这个共享的裸设备区写入自身的运行状态。并读取对方机器的运行状态。以达到相互检测的目的。
2> TCP/IP Socket Private Net,即两台服务器的网卡通过LAN建立一条通讯路径。如果共享磁盘阵列裸设备区检测模式失效,服务器仍然可以用公用网侦测对方服务器的可用性。如果对方服务器仍然可用,则不触发接管动作;如果对方服务器不可用,则立即接管动作。
DataWare接管动作包括:
1>文件系统(File Systern);
2>数据库(Database);
3>网络虚拟地址(Virtual IP Address);
DataWare容错备援运作过程:
a.自动侦测(Auto—Detect)阶段。由主机上的软件通过冗余侦测机制,经由复杂的监听程序、逻辑判断,来相互侦测对方运行的情况。
b.自动切换(Auto—Switch)阶段。某一主机如果确认对方故障,则正常主机除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后续的数据库服务。
d.自动恢复(Auto—Recovery)阶段。在正常主机代替故障主机工作后,故障主机可离线进行修复工作。在故障主机修复后,透过冗余通讯检测机制与原正常主机连接,切换回修复完成的主机上。整个回复过程需要技术人员利用DataWare软件提供的命令进行切换。
双机热备系统选用DataWare的单工工作模式,系统结构如图1所示:
图1 结构示意图
图1中:双服务器通过一条TCP/IP网络线连接到LAN;双服务器各自通过一条SCSI电缆线与RAID磁盘阵列相联;一台服务器作为主机运行DM 数据库服务器,另一台作为备机。当服务器1故障后,服务器2自动接管服务器1运行,这时,服务器1的作业将在服务器2上自动运行。当服务器1修复后,服务器2将把1的作业手动交还服务器1。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者