提出了无线缓存网络中的一种新颖的资源调度方法。无线缓存是当前无线通信领域的一个研究热点,使用无线缓存技术可以节约基站的资源消耗,从而有望提升系统整体吞吐量并降低移动通信的资费。资源调度是发掘无线缓存网络性能的关键,同时也是设计的难点。 在研究过程中,他们发现在有限的文件生命周期内,无线缓存网络中的资源调度是一个复杂的动态规划问题,很难直接求解。在王锐老师的帮助下,两位同学把复杂的动态规划问题与马尔科夫决策过程问题相类比,并利用强化学习方法解决了这一问题。