本研究成果是基于 AI 的语音质量自动评估技术,通过引入检索增强、质量对比学习、不确定性等方面的创新方法,显著提升语音质量评测的可解释性、准确性和实用性。在评测准确性方面,通过实验验证,基于检索增强和质量对比学习的评测方法在多种语音数据集上的评测准确性均显著高于传统方法。在计算效率方面,优化算法以确保评测过程的高效性和实时性,保障了在保证高准确性的同时,实现高效的评测。在鲁棒性方面,评估方法在不同类型和质量的语音数据上均表现出良好的鲁棒性,适用于多种实际应用场景。两项相关核心技术已申请专利并进入实审阶段,确保了技术的原创性和独特性。最近,在由 SLT 2024(IEEE Spoken Language TechnologyWorkshop 2024)主办的 VoiceMOS2024 挑战赛的多个赛道的比赛中取得了第一名。
该技术在语音助手、智能客服、等领域具有广泛前景。有望为相关企业带来显著的经济效益和市场竞争力。重点应用领域包括,1.在线教育系统:可以用于自动评估语音发音质量,提升学生的学习体验和效果;2. 电信和呼叫中心客服系统:可以用于通话质量的自动监测,确保服务的QoS,增强企业的品牌形象和客户忠诚度。3.与发音质量自动评估相关的其他领域。
非侵入式语音质量自动评估系统在技术进步和产业结构调整、优化、升级方面具有重要影响。该系统不仅可以推动语音技术的整体进步,还将通过提升用户体验、降低运营成本、支持新兴产业发展等多方面的作用,促进相 关 产 业 的 升 级 和 优 化 。商业化前景广阔,ROI高。
扫码关注,查看更多科技成果