高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
应用于移动平台的语音情感识别系统
结合模式识别及语音情感感知算法,开发了应用于移动平台的语音情感识别系统,该技术具有自主知识产权。该系统能够通过移动终端采集用户的语音信号,经情感建模和识别算法处理后,实时感知用户语音中包含的六种基本情感信息(高兴、悲伤、惊讶、害怕、生气、嫌恶)。系统特点:1、融合说话人无关和说话人相关两种语音情感模型,用以弥补单一模型无法兼顾算法普适性和准确性的不足;2、具备在线及离线两种工作模式,在线模式下,移动设备可以借助服务器获得更为准确的识别结果,并且节省运算资源;3、对移动设备使用环境中的低采样率与低信噪比环境作了针对性优化,保障了识别算法在一般环境下的鲁棒性。 本系统基于北京航空航天大学模式识别与人工智能实验室的多模型融合语音情感识别技术,在移动平台上实现了对说话人情感表达的识别。其能够对说话人相关和说话人无关情形进行相应优化,对于未在系统注册的一般用户,识别准确率为76%;对于已在系统注册的用户,识别准确率可达83%,属于国内外领先水平。对于长度为2s的语音,本系统离线模式下识别时间小于0.5s,在线模式下识别时间小于0.2s。
北京航空航天大学 2021-04-13
汉语普通话语音可视化技术(技术)
成果简介:语音是人们之间进行交流最为重要的手段之一,在人们的日常生活中是不可或缺的。然而,对于听力受损人群来说,生理上的缺陷导致他们无法通过听觉来有效地感知语音,给学习和生活带来了极大的不便。本技术为一种汉语语音的可视化方法,将语音以某种视觉图像显示,从而达到使人们能够通过观察视图来有效感知语音的目的,为听力受损人群理解语音、练习正确的发音提供帮助。 项目来源:自行开发 技术领域:信息技术 应用范围: (1)聋儿的言语训练,帮助聋哑儿童练习发
北京理工大学 2021-04-14
基于变异语音识别的防金融诈骗解决方案
电信诈骗是指犯罪分子通过电话、网络方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人给犯罪分子打款或转账的犯罪行为。本项目针对广义电信诈骗提出解决方案,即针对通话语音、网络语音等形式进行金融诈骗。诈骗受害方包括个人客户及银行、保险、网贷公司和潜在的网络银行等企业客户。
河海大学 2021-04-14
人工智能专业建设即AI语音实验套件平台
人工智能语音交互实验套件是一款用于人工智能语音方向的AI实验套件。开发板搭建Linux系统,可自主进行嵌入式生态系统的应用软件开发,支持深度的语音识别、语音唤醒、语音合成等诸多人工智能领域的应用开发。通过这套设备的学习,可以认识了解 AI 人工智能嵌入式设备的架构、硬件部署、软件在 AI 领域中语音识别、语音合成等应用上的实现,是一套 AI 前端实践性极强的学习套件。        套件配套实验清单(含知识点),由资深工程师编写,全面涵盖语音交互技术的实验过程。并提供教学指导、实验视频、实验手册、实验PPT等,便于师生更好的理解实验项目,是高职、本科院校相关专业在 AI 智能语音方向课题的专用教学实验套件。 
慧言科技(天津)有限公司 2022-06-01
立即开启实验室升级计划
实验室装修施工服务流程透明可控
北京航天科恩实验室装备工程技术有限公司 2025-02-11
一种基于伪Zernike矩的语音内容认证方法
本发明公开了一种基于伪Zernike矩的语音内容认证方法,水印嵌入时将原始语音信号A分为P帧,每帧分为N段。然后,由每帧前N/2段DCT低频系数的n阶伪Zernike矩幅值的平均值生成水印W,并通过量化每帧的后N/2段DCT低频系数的伪Zernike矩来嵌入水印,得到含水印语音A′。本发明充分利用了语音信号DCT低频系数的伪Zernike矩幅值与语音内容紧密相关的特性,以及对常规语音信号处理的鲁棒性,既保证了对恶意篡改攻击的敏感性,又保证了良好的容忍一定常规语音信号处理能力。
西南交通大学 2016-10-20
语音识别集成电路 IP 与协处理器
1 成果简介语音识别在嵌入式芯片上实现的主要矛盾是算法实现的性能精度与芯片功耗、速度之间的矛盾,一个性能较好的 800 条典型汉语普通话语音识别算法以纯粹软件嵌入方案实现通常需要 200MIPS 以上 ARM( Advanced Risc Machine) MCU 处理速度,因此我们提出语音识别集成电路 IP 与协处理器来克服以上的问题,通过关键运算的硬件化映射来大幅提高语音识别计算的功耗和处理速度。该设计可作为语音识别集成电路 IP 放入客户的 SoC 芯片中,也可作为协处理器放在片外。 关键性能指标如下: *工艺:苏州 HJTC 0.18um 1P6M 标准 CMOS 工艺 *管芯面积: 1.5 x 2mm *逻辑规模: 3 万等效门(标准二输入与非门,不含 SRAM) *I/O 数: 52 封装: CQFP64 *存储规模:片上集成 1 片单口 SRAM,共 4K×16 比特 *供电电压:核心部分->1.8V, IO 部分->3.3V *正常工作频率: 20MHz(最高工作频率 100MHz) *功耗: 80uW/MHz *速度: 4us/帧(特征维数取 27,时钟频率取 20MHz) 图 1 语音识别集成电路版图图 2 ARM+语音识别协处理的测试系统表 1 与其他语音识别芯片的对比2 应用说明语音识别 IP 或协处理器基于对高斯混合模型计算的优化,适合于各种 HMM 模型的模式识别计算,在语音识别、说话人识别、说话人确认、语音合成等方面均可以广泛应用。 语音识别 IP 或协处理器以加速 ASIC 的模式工作,相同时钟主频下计算性能是 TI C54x系列 16bit DSP 的 5.5 倍以上,对主系统计算性能提升可以达到 4~8 倍。 语音识别 IP 或协处理器对于性能要求型场合和功耗限制型场合都十分适合,芯片支持16bit 并行总线接口,适合于各种 32 位/16 位 MCU 系统,迅速为系统集成高性能语音处理能力。3 应用范围车载导航, GPS 手机,支持大规模识别词表(例如万条以上的地名)支持模糊语音检索;低端手机平台,支持语音拨号、语音控制,支持用户身份确认、声纹密码。4 效益分析语音识别 IP 或协处理器芯片可应用拓展到个人移动信息终端的全市场空间,以 GPS 产品为例,细分的预装 GPS、个人导航设备( Portable Navigation Device, PND), GPS 手机三种产品,根据 CCID( Consulting China Research Center)咨询公司预测 2008 年这三者分别约占到全球市场总量的 15%、 35%和 50%。快速增长的 GPS 市场,对语音识别功能有着非常迫切而又实际的需求, GPS 应用提出的超大规模词表、高混淆度和高环境复杂度这一系列语音识别的技术难题,也只能由语音识别芯片解决。语音识别加快了人机交互与地名等信息的检索,可提高驾驶期间操作 GPS 的行车安全性,同时可以反过来进一步促进 GPS 产品的销售增长。 语音识别技术通过芯片在性能得到大幅提升后,将摆脱传统的人名拨号功能,可用于菜单控制、地名、信息、多媒体内容的检索等等。而语音识别芯片使得低功耗和低成本的要求得以满足,有望成为手机人机交互界面( Man-Machine Interface, MMI)发展的新技术增长点,移动通信领域的市场潜力特别巨大。
清华大学 2021-04-13
聚焦高校实验室规划与设计 共话新时代高校实验室建设与管理
第62届中国高等教育博览会——新时代高校实验室建设与管理学术活动-高校实验室科学规划与设计论坛
中国高等教育博览会 2024-11-01
实验室通风橱-通风柜
ASKN通风柜-标准型通风柜尺寸为1.2m、1.5m、1.8m,通风柜高度一般为2.35m(行业标准小于2.4m),深0.85m(行业标准0.8~0.9m)。柜内背部导流板分上中下三段排风,可根据柜内的冷、热操作及污染气溶胶的密度调节导流板以消除排气死角,*大限度限制污染的逸出。通风柜柜门完全开启是*大高度为600~800mm,通风柜顶部排风接口口径一般为φ250
北京航天科恩实验室装备工程技术有限公司 2025-03-10
实验室功能室设备
广东广视通科教设备有限公司 2021-08-23
首页 上一页 1 2
  • ...
  • 5 6 7
  • ...
  • 94 95 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    63届高博会于5月23日在长春举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1