本发明公开了一种云环境下的分布式系统多级故障容错方法, 包括:基于虚拟机磁盘快照的分布式应用协同备份算法,能够对 I/O 状态以及所依赖的操作系统环境进行备份;分层故障检测和恢复机制, 能够实时地检测物理层、虚拟化层、云平台层、虚拟机 OS 层和应用 层故障,针对不同的故障采用相匹配的故障恢复方法。使得故障检测 和恢复细化到模块,采用自顶向下逐级恢复的策略,做到恢复开销最 小化;基于模板的虚拟容错集群服务部署策略,用