高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
声纹识别
声纹是对语音中所蕴含的、能唯一表征和标识说话人身份的语音特征参数及基于这些特征参数所建立的语音模型的总称。声纹是人的生物个性特征,很难找到两个声纹完全一样的 人。声纹识别技术属于生物识别技术的一种,是一项根据语音波形中所蕴涵的说话人信息, 自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人 信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音 信号中的言语内容,并不考虑说话人是谁,它强调共性。声纹识别根据应用的范畴,可分为两类:(1)声纹辨认(说话人辨认):用以判断某段 语音是若干人中的哪一个所说的,是“多选一”问题;(2)声纹确认(说话人确认):用以 确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。截止到 2009 年初,声纹识别产品在生物识别市场的占有率为 15.8%,仅次于指纹识别 和掌形识别。目前,我国生物识别行业内厂商有 200 多家,其中 96%从事指纹识别技术相 关产品的研究和开发,产品趋同化明显。国内声纹识别市场已经启动,其发展空间更为广阔, 在金融、证券、社保、公安、军队及其他民用安全认证等行业和部门有着广泛的需求。
清华大学 2021-04-11
声纹识别
声纹是对语音中所蕴含的、能唯一表征和标识说话人身份的语音特征参数及基于这些特 征参数所建立的语音模型的总称。声纹是人的生物个性特征,很难找到两个声纹完全一样的人。 声纹识别技术属于生物识别技术的一种,是一项根据语音波形中所蕴涵的说话人信息, 自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人 信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音 信号中的言语内容,并不考虑说话人是谁,它强调共性。 声纹识别根据应用的范畴,可分为两类:(1)声纹辨认(说话人辨认):用以判断某段 语音是若干人中的哪一个所说的,是“多选一”问题;(2)声纹确认(说话人确认):用以 确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。 声纹识别与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,除具有 不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性: l 用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍; l 利用语音进行身份识别可能是最自然和最经济的方法之一。声音输入设备造价低廉, 甚至无费用(电话),而其他生物识别技术的输入设备往往造价昂贵; l 在基于电信网络的身份识别应用中,如电话银行、电话炒股、电子购物等,与其他 生物识别技术相比,声纹识别更为擅长,得天独厚。
清华大学 2021-05-08
声纹识别
项目成果/简介:声纹是对语音中所蕴含的、能唯一表征和标识说话人身份的语音特征参数及基于这些特 征参数所建立的语音模型的总称。声纹是人的生物个性特征,很难找到两个声纹完全一样的人。声纹识别技术属于生物识别技术的一种,是一项根据语音波形中所蕴涵的说话人信息, 自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人 信息
清华大学 2021-01-12
智能声纹识别系统
一、项目简介 声纹识别是人工智能的核心技术,可广泛应用于司法、社保、银行等领域的身份认证,但还存在跨信道、噪声、短语音等技术瓶颈,需要持续研发改进。 二、前期研究基础 有超过15年的研究积累(实验室网址:speech.xmu.edu.cn),已研发dnn i-vector, x-vector等核心算法,达到国际一流水平,应用开发也积累了丰富的经验,在STEW-1、POATi、OLR2017等国内外评测名列前茅。 三、应用技术成果 课题组研发的文本相关说话人识别系统,已应用到全国10个省市的司法社区矫正平台。课题组与合作企业研发的文本无关声纹采集与辅警系统,应用到厦门110接处警系统。课题组研发的基于i-vector的大规模声纹检索系统,应用到市场调查电话录音的筛查中,处理语音超过50万条,有效降低人工成本,受到客户的好评。 四、合作企业 厦门天聪智能软件有限公司是一家成立于2005年的高新技术企业、公安部声纹识别行业标准制定单位,专业从声纹识别、语音技术和人工智能软件的研发和销售。经过13年的发展,天聪公司已成为国内领先的语音声纹识别技术开发商。天聪公司被认定为“高新技术企业”和“软件企业”,获得软件著作权6项、授权和受理专利9项、科技鉴定成果1项、制定声纹标准1项。天聪声纹识别技术及产品已成功应用于司法鉴定、社区矫正、市场调查、公安刑侦、社保养老等领域,其中社区矫正声纹识别系统市场占有率第一。
厦门大学 2021-04-11
智能声纹识别系统(开源工具ASV-Subtools)
ASV-Subtools的设计理念在于代码高度复用的同时保持模块分化和开发自由,因此具有高效性、可读性、通用性、灵活性四大特性。使用者可以轻松上手并只需通过简单的编辑配置文件就能探索不同的网络架构,实现最优异的性能。 一、项目分类 关键核心技术突破 二、成果简介 声纹识别是指从说话人的语音信号中提取声纹特征,并通过有效的分类识别模型,对说话人的身份进行校验和鉴别。声纹识别广泛应用于刑侦、人机交互声纹口令验证、银行声纹身份验证等领域。得益于深度学习的发展,声纹识别的性能在不断提升,但落地难度也相应提高。 ASV-Subtools是厦门大学智能语音实验室(XMUSPEECH)于2020年6月推出的一套高效、易于扩展的声纹识别开源工具,该工具是基于Kaldi与Pytorch开发的,充分结合了Kaldi 在语音信号和后端处理的高效性以及PyTorch 开发和训练神经网络的便捷灵活性。自开源以来,ASV-Subtools就以卓越的性能和灵活便捷的框架受到国内外重点科研院所和研发人员的青睐。 ASV-Subtools的设计理念在于代码高度复用的同时保持模块分化和开发自由,因此具有高效性、可读性、通用性、灵活性四大特性。使用者可以轻松上手并只需通过简单的编辑配置文件就能探索不同的网络架构,实现最优异的性能。 相较于语音领域的其他开源工具,ASV-Subtools专注于声纹领域的研究,不仅先后为东方语种、CNSRC等国内外知名竞赛中提供基线系统和技术支持,同时在声纹领域公开的VoxCeleb数据集上也在不断刷新着SOTA的结果。 为了加快声纹产品的落地,厦门大学智能语音实验室(XMUSPEECH)与厦门天聪智能软件有限公司(TalentedSoft)合作,共同为ASV-Subtools的开发与更新做出贡献。目前ASV-Subtools已打通声纹识别从算法研究到产品落地的全流程,技术成熟度已达到可以量产的水平。     GitHub:https://github.com/Snowdar/asv-subtools
厦门大学 2022-07-28
极低功耗AI语音(声纹)识别芯片
成果介绍在微瓦级极低功耗的情况下,芯片可以应用至智能手机、可穿戴智能设备、小家电、大家电、玩具及车载等众多场景中。技术创新点及参数神经网络拓扑/计算精度动态自适应的系统架构,基于事件驱动的精度可控数模混合近似计算电路,实现面向各种背景噪声的场景自适应低功耗智能计算。基于22nm工艺,实现微瓦级(< 10uW)极低功耗下的高精度关键词语音识别样片验证,相比目前最新研究成果,硬件能效提高近3倍,且支持各种噪声下的高精度识别(Noise-robust recognition),相关研究成果已发表在电路与系统领域顶刊IEEE Transactions on Circuits and Systems I: Regular Papers。市场前景可集成和使用在对手机、可穿戴设备、智能家居等多种应用场景的智能终端产品。产品当前已经在实验室完成样品测试,各项功能都处于行业优秀水平;芯片目前技术参数可以达到支持离线语音唤醒功能,支持5个唤醒词和10个命令词,还支持声纹识别。它支持3-5m的远场语音唤醒和识别,工作频率为50MHz,延迟不到10ms。
东南大学 2021-04-13
AI心理情绪识别系统
AI心理情绪识别系统1.多模态信号采集:人脸动态图像、脑电信号采集、语音情感检测。2.功能模块包含:情绪检测、情绪档案、数据统计、用户管理、系统设置功能模块。3.系统基于情绪心理学相关理论,结合面部表情的二维情感空间分析技术、脑电信号的状态分析、语音的三维情感空间分析三种模态相互融合叠加技术,检测人心理情绪状态,提高其检测准确度。3.    基于摄像头面部情绪识别技术,可以实时分析人体面部所包含的情绪状态。通过非接触式的实时视采用 AI 人工智能学习技术,结合心理学,通过对被测试人员 60秒的测试,能够获取相关心理/心理指标。帮助被测试人员了解自己的心理健康状况,并且引起人们重视心理健康,从而在工作、学习、生活当中提高身心健康。并且通过定期测试,能够获取个体、准确的进行心理危机预警,显示被测人员心理危机测试报告,提醒心理医生重点关注。用户在进行注册登录后,根据语音提示可直接进入测试界面进行情绪识别。点击测试按钮,调整好站立位置,脸部朝向屏幕,人脸录入即可完成测试,测试完成即可生成测试报告并能打印报告。4    基于脑电生物传感器状态检测、实时展示人体脑波原始状态指标以及Delta、Theta、Alpha、Beta、Gamma等8个EEG参数。5.    采用任务态模式进行语音情感分析,测试者按照系统设定的特定语境信息进行朗读来进行情感分析。6.    检测结束后可实时出具“心理生理状态分析结果报告”,其中包括被测试人员信息、检测时间、12维度心理生理情绪数据,包含正面情绪(平衡、自信心、活力、调节水平),负面情绪(攻击性、压力、紧张、可疑),生理参数(抑制、神经质、消沉、幸福指数),以及综合状态指标:专注度、放松度、疲劳指数、焦虑指数、压力指数、抑郁指数等。7.    统计分析:系统自带数据中心的统计功能,可以按单位进行所有检测人员的压力分布图及重点关注人员的信息显示。8.    检测完成后系统自动生成检测报告,检测报告需包含每项参数的检测数据大小、参考范围、异常数据等,以及用情绪参数雷达图、饼状图、直方图、曲线视图等多种表示方法。9.    信息查询功能:管理员可通过多条件查询功能,只需通过任意一项查询条件即可快速查询出与之对应和匹配的测试者信息,以及该测试者的历史测试记录,并可对该测试者的测试记录进行纵向和横向对比,综合分析该名测试者的心理健康状况。9.用户管理端:以管理员身份登录该系统可对用户进行管理。可进行添加用户、删除用户、查询用户、用户信息修改、密码修改、级别权限设置、单位框架搭建、查看用户报告,以及导出、打印用户报告。10.系统具有特定场合模态设置功能,可关闭和开启语音检测功能。11.视频检测时面部框具有信号质量检测功能,通过不能的颜色在面部框进行彩色状态提示,同时具有人脸检测判别功能,比如面部不全、距离较远等识别功能
北京京师慧智科技有限公司 2025-05-22
人脸识别
已有样品/n采用自主研发的人脸识别技术,识别率达到国际先进水平。已经在 多个案例中使用。 该项目广泛应用于平安城市、智慧城市、智能安防、门禁、司法鉴 定、公安侦查方面,具有较好的市场前景。
华中科技大学 2021-01-12
图像识别
图像识别服务基于大数据和深度学习实现,可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,包含图像打标、场景分类、鉴黄等在线API服务模块,应用于智能相册管理、图片分类和检索、图片安全监控等场景。
阿里云计算有限公司 2021-02-01
应用于网络及电话通信信息安全领域的声纹认证关键技术
1 成果简介由于网络应用中所特有的不可接触的特点,以及声纹特征容易被获取(甚至可能是唯一可获取的)、其采集易被用户接受、所需设备成本低廉等优势,研发团队在本领域的重要成果包括: ( 1)北京市科技计划项目“ 通用声纹识别身份认证系统引擎的研制” 于 2008 年 2 月28 日通过了验收。验收专家组一致认为:“ 该课题完成了任务书中规定的各项考核指标,创新性强,达到了国际先进水平,具有广泛的应用前景。” ( 2) 起草了原信息产业部行业标准《自动声纹识别(说话人识别)技术规范》标准(编号 S06014-T),于 2006 年 12 月 24 日在京召开了标准审定会,获顺利通过;并在原信息产业部进行网上公示获通过并正式颁布。是我国第一个关于“ 声纹识别(说话人识别)” 的标准。 ( 3) 2006 年 12 月 25 日,国家标准化管理委员会[2006]95 号文件批准公安部负责筹建“全国安全防范报警系统标准化技术委员会人体生物特征识别应用分技术委员会( SAC/TC100/SC2)”,研发团队作为主要起草单位参与标准制修订工作。 ( 4)联合承担的“ 司法语音自动分析和鉴别系统的研制” 课题,于 2004 年 5 月 29 日通过了公安部科技局主持的科技成果鉴定会,鉴定委员会专家一致认为,该项技术“ 是一项创新的、国内领先的研究成果”。2 应用范围声纹识别关键技术可以广泛应用于金融、证券和信息等方面的安全认证,公安、国防和军队等方面的侦听和刑侦排查,日常生活中的个性化服务等诸多方面。包括金融交易和电子商务,公共安全和国家安全以及呼叫中心客户服务等各个领域。3 效益分析目前已完成核心技术攻关和应用,达到产业化前期阶段,预期产业规模在 100 人左右。产值超过 2000 万元人民币。
清华大学 2021-04-13
1 2 3 4 5 6
  • ...
  • 27 28 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    64届高博会于2026年5月在南昌举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1