并行程序性能监测工具包
针对集群和多核服务器平台,该软件工具集可以对系统资源和并行程序性能进行在线监测和性能分析展示,帮助用户监测系统资源和发现并行程序瓶颈,辅助进行程序优化。性能数据的采集主要是通过对被监测进程的插桩和包装库的结合实现,可对MPI程序、OpenMP程序和CUDA程序进行性能监测。 本项目主要特点如下。 1.合理的数据采集方式,可以对混合结构高性能计算系统进行性能监测,较少的监测扰动; 2.基于MRnet的树形数据汇聚和类库,保证了大量性能监测数据的快速高效汇集,并提供同步,汇总等功能接口; 3.多种数据分析统计方法,高效的分析和多视角可视化图形展示,辅助用户分析瓶颈进行优化。该成果在国家863计划支持下,已在多个计算中心应用,获得国家专利3项。
北京航空航天大学
2021-04-13