1 月 052013
 

计划停机和非计划停机(计划外停机)会对业务连续性产生影响,同时,传统高可用性解决方案开销大,难以实施和管理。

减少计划停机时间
由于 VMware 环境中的工作负载无需中断服务即可动态移动到不同的物理服务器或基础存储器,所以,通过vSphere 中的 VMware vMotion 和 Storage vMotion 功能,组织可以减少计划的停机时间。管理员可以快速而完整地执行透明的维护操作,无需强制调度不方便的维护时间段。

防止非计划停机时间

vSphere 中内置的关键容错功能可以避免出现硬件或应用程序故障所导致的非计划停机时间。

共享存储器
通过在共享存储器(如光纤通道、iSCSI SAN 或 NAS)上存储虚拟机文件来消除单一故障点。可以使用 SAN 镜像和复制功能将虚拟磁盘的更新副本保留在灾难恢复站点。
网络接口绑定
允许单个网卡发生故障。
存储多路径
允许存储路径发生故障。

HA提供快速的中断恢复
VMware HA 通过在主机出现故障时重新启动虚拟机来为虚拟机提供基本级别的保护。

VMware HA 利用配置为群集的多台 ESX/ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具有成本效益的高可用性。在将主机添加到 VMware HA 群集时,代理将上载到主机,并配置为与群集内的其他代理通信。

故障检测

代理会相互通信,并监控群集内各台主机的活跃度。默认情况下,此通信通过每秒交换一次检测信号来完成。如果15 秒过去后仍未收到检测信号,而且 ping 不到该主机,则系统会声明该主机发生故障。如果出现了主机故障,则在该主机上运行的虚拟机将进行故障切换,即在备用主机上重新启动。

主机网络隔离

主机网络隔离在主机仍在运行但已经无法再与群集内的其他主机通信时发生。在默认设置中,如果主机停止接收群集内所有其他主机的检测信号的时间超过 12 秒钟,则将尝试 ping 其隔离地址。如果仍然失败,主机将声明自己已与网络隔离。只有在未从群集中的其他任何主机收到检测信号时,才 ping 隔离地址。

如果在 15 秒或更长的时间内隔离主机的网络连接仍未恢复,则群集内的其他主机将认定已隔离主机出现了故障,并会尝试对其虚拟机进行故障切换。但是,如果隔离主机保留对共享存储器的访问权限,则它也会保留虚拟机文件上的磁盘锁。为避免潜在数据损坏,VMFS 磁盘锁定会阻止对虚拟机磁盘文件同时进行写操作,并尝试故障切换隔离主机的虚拟机故障。默认情况下,隔离主机将关闭其虚拟机。

修改主机隔离响应为保持启动或关闭电源

vsphere-ha-01

确保网络基础结构具有足够的冗余度且至少有一个网络路径始终可用,可以有效避免主机网络隔离的出现。

Fault Tolerance 提供连续可用性

保障应用的业务连续性
提供更高级别的可用性,允许用户对任何虚拟机进行保护以防止主机发生数据、事务或连接丢失等故障。

容错使用 ESX/ESXi 主机平台上的 VMware vLockstep 技术以提供连续可用性。通过确保主虚拟机和辅助虚拟机的状态在虚拟机的指令执行的任何时间点均相同来提供连续可用性。vLockstep 通过使主虚拟机和辅助虚拟机执行相同的 x86 指令序列来达到此要求。主虚拟机捕获所有输入和事件(从处理器到虚拟 I/O 设备),并在辅助虚拟机上进行重放。辅助虚拟机执行与主虚拟机相同的指令序列,而仅单个虚拟机映像(主虚拟机)执行工作负载。

如果运行主虚拟机的主机或运行辅助虚拟机的主机发生故障,则会发生透明故障切换。正常运行的 ESX/ESXi主机将无缝变成主虚拟机的主机,而不会断开网络连接或中断正在处理的事务。使用透明故障切换,不会有数据损失,并且可以维护网络连接。 在进行透明故障切换之后,将重新生成新的辅助虚拟机,并将重新建立冗余。整个过程是透明且全自动的,并且即使 vCenter Server 不可用,也会发生。

VMware容错配置建议

①除了非容错虚拟机以外,任何一台主机上不得有超过四个的容错虚拟机(主虚拟机或辅助虚拟机)。每台主机上可以安全运行的容错虚拟机数目依据 ESX/ESXi 主机和虚拟机的大小以及工作负载而有所不同,所有的这些数目均会根据情况发生变化。

②如果要使用 NFS 访问共享存储器,请使用至少具有 1 千兆位网卡的专用 NAS 硬件,以获取为了使容错功能正常工作所需的网络性能。

③确保包含容错虚拟机的资源池内存大于虚拟机内存。在打开容错功能后,容错虚拟机的保留内存设置为虚拟机的内存大小。如果资源池中没有额外内存,则可能没有内存可用作开销内存。

④每个容错虚拟机最多使用 16 个虚拟磁盘。

⑤为确保冗余和最大容错保护,群集中应至少有三台主机。如果发生故障切换情况,这可确保有主机可容纳所创建的新辅助虚拟机。

内容引用:
(1)vSphere 可用性指南 v4.1

 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(required)

(required)

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据