1.负责分布式深度学习框架的功能研发和性能优化
2.利用深度学习的分布式训练算法解决实际业务对大规模训练的需求,落地相应的解决方案
3.工作内容包括但不限于GPU分布式训练性能优化,异构设备的分布式训练、通用模型并行训练和大规模参数服务器的算法研发、算法迭代闭环的建立
4.负责相应方向技术难点攻关、前瞻研究、解决技术难题
1.负责分布式深度学习框架的功能研发和性能优化
2.利用深度学习的分布式训练算法解决实际业务对大规模训练的需求,落地相应的解决方案
3.工作内容包括但不限于GPU分布式训练性能优化,异构设备的分布式训练、通用模型并行训练和大规模参数服务器的算法研发、算法迭代闭环的建立
4.负责相应方向技术难点攻关、前瞻研究、解决技术难题
1.熟练掌握深度学习分布式训练的基本方法
1种深度学习框架实现分布式训练算法
5.优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情
6.有较强的研究能力者优先,例如在国际顶尖会议或期刊(包括但不限CVPRICCVECCVNIPSICMLAAAITPAMIIJCV等)上发表过论文优先