机器人运动避障与虚拟形象合成技术

1.痛点问题

拟人化的智能体，在人类生活中开始起到越来越重要的辅助工作、提升生产力和情感交流等作用。具体形式包括实体化的机器人和虚拟的数字人形象两种形式。

在实体化的机器人技术中，由于各行业场景范围的多样性，移动机器人的避障问题是阻碍机器人广泛应用的一大痛点。

（1）基于视觉信息和深度强化学习来解决移动机器人避障问题，会因为仿真数据与真实数据的较大差别而导致泛化性能不足，使得真实场景下的避障的成功率下降。

（2）目前避障问题中的深度强化学习往往需要针对不同复杂程度的场景重新训练或者再训练模型，难以训练出适用各种密度场景的通用模型。

（3）基于雷达的深度强化学习避障方法受限于成本、功耗和仿真的难度等，往往使用单线雷达。但单线雷达仅能对某个固定的平面进行检测，如果移动机器人具有较高的高度，只对某个平面检测无法实现完美的避障。

此外，随着虚拟形象在金融、文旅、医疗、零售等领域的推广与应用，数字虚拟形象产业应用路线逐渐清晰，但仍存在产业链相对割裂、产品与需求匹配度低、生产成本高效率低、虚拟形象交互能力弱的问题。

2.解决方案

针对现有技术存在的问题，本成果的解决方案从两方面入手。首先，在移动机器人避障方面，本成果设计了一种同时结合单线雷达与单目相机的避障方法框架，并设计了新的更有效的深度强化学习模型。其次，本成果还提供一种虚拟形象说话视频生成方法及系统，使用深度学习方法，基于训练好的深度神经网络语音模型,对预设音频文件进行预测处理,通过在说话视频生成过程中引入三维人脸信息,并结合神经网络模型生成头部姿势自然转动且具有个性化说话习惯的说话视频。上述算法可搭载于通用硬件平台，构建低成本高效的虚拟形象视频生成系统。

基于以上科研成果，本项目将致力于国民经济各主流行业的数字化转型，在人工智能、机器学习、计算机视觉技术等领域持续积累智能场景应用创新技术，结合优秀的前沿技术整合与应用开发融合能力和深厚的市场推广能力，全力打造智能巡检/服务/协作机器人和虚拟人平台等软硬件一体化解决方案。以实体机器人并搭载虚拟说话人虚体，通过实体、虚体相结合的方式打造独一无二、具有全新体验的智能巡检/服务/协作机器人，提高智能巡检/服务/协作过程中交互的效率与质量。

合作需求

寻求在清洁能源、储能、新能源等行业智能运维部门和相关企业合作，对相关技术进行推广应用，在清洁能源、储能、新能源等行业中部署巡检/服务/协作机器人以及虚拟人服务平台，打造无人值守范例，赋能智能化运维，共同推动行业进步。

本成果可以用于国民经济开展数字化转型的各主流行业，为这些行业提供智能巡检/服务/协作机器人以及虚拟人平台，通过实体、虚体相结合的方式提高机器人巡检过程交互的效率与质量。未来10年伴随着国家对于碳达峰及碳中和的承诺，将带来在清洁能源、储能、新能源等行业数万亿规模的市场机会，为了推动行业发展，这类行业数字化转型带来的市场机会将超过万亿级。

现阶段，国民经济各主流行业纷纷开展数字化转型，“双碳”市场蓬勃发展，以电网系统为例，面对行业智能化转型要求，智能化运维需求迫切。针对行业痛点，本项目拟开发巡检/服务/协作机器人和虚拟人服务平台，通过研发实体机器人并搭载虚拟说话人虚体，通过实体、虚体相结合的方式赋能行业智能化运维，以微服务化模式实现产品敏捷化迭代，持续提升市场影响力。

本成果在虚拟形象上的竞争优势：

（1）通用性强：本成果所提出系统可搭载于通用硬件平台，与通用的机器人平台结合度高、可扩展性强；

（2）与专业场景的需求匹配度高：输入语音可根据不同场景设定，专有知识适应能力强；

（3）生产成本低效率高：用户在系统上传一段十秒左右的视频，就能快速生成一个可被语音驱动的自定义虚拟说话人，对输入视频的要求降低，同时将生成视频的时间由原始的几天压缩至几分钟，效率大大提升；

（4）交互能力强：实现输入任意一段普通话语音，能自动地合成该用户与语音同步的说话视频，并包含自然的头部运动，模拟用户与虚拟形象的交互过程。

移动机器人避障竞争优势：

（1）在性能方面，本成果的技术路线可以使得机器人避障效率明显高于单独的单线雷达，同时本成果的深度强化学习模型准确率更高，对不同密度环境的适应性更好；

（2）在成本方面，本成果所设计的传感器方案成本远低于使用多线雷达传感器的方案。