一种基于 MPI 高性能计算分层回卷恢复协议的动态分组系统
本发明公开了一种基于 MPI 高性能计算分层回卷恢复协议的动 态分组系统,包括消息监测模块、消息分析模块、进程迁移模块,属 于高性能计算和系统容错领域。消息监测模块用于监测 MPI 高性能计 算应用程序中各个进程间的消息传递记录,并将该记录以三元组(源进 程、目的进程、消息大小)的格式保存,最后将该消息传递记录提交给 消息分析模块;消息分析模块用于对消息监测模块收集到的消息传递 记录进行分析,分析出当前应用程序的消息
华中科技大学
2021-04-14