高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
音乐情感自动识别及自动标注系统
网络音乐以其使用率一直位居中国互联网应用前三甲的宝座,音乐已经成为用户通过搜索引擎搜索的前三大类内容之一,用户比例高达41.6%,大部分综合搜索引擎都已经提供针对音乐的垂直搜索功能。互联网上日益庞大的用户规模以及海量的数字音乐要求高效的音乐检索手段和令用户满意的检索体验。 本系统采用多模态情感回归的方法,实现音乐情感的自动标注,并通过音乐情感词作为中间桥梁,实现音乐情感维度信息到情感类别的映射,间接实现了音乐情感的分类。因此本系统能够同时满足对音乐情感维度信息和类别信息自动标注的需求。
北京大学 2021-02-01
基于主动视情感识别与面部重建技术研究
由于计算机视觉和人类视觉系统统的工作机理不同,研究适合计算机的传感方法和处理方法,是机器视应用的一条切实可行的途径。基于多目人脸识别重建的关键技术研究,采用主动视视频图像重采样技术,实现人脸三维数字化,对立体视觉多CCD传感器数据融合研究。重点研究基于混沌、小波神经网络和遗传算法等经算法实现情感的特征提取与识别技术,构建其数学模型系统,然后对人脸进行三维重建,最后对真实感三维人脸实施编辑,实现原型系统研制。 可获得的成果 1)、基于主动视觉对运动人脸特征与情感进行特征提取与识别技术; 2)、基于混沌、小波神经网络等优化算法实现情感识别技术; 3)、人脸重建关键技术的研究及其真实感三维人脸编辑研究并对实现原型系统研制。
西南交通大学 2021-04-13
应用于移动平台的语音情感识别系统
结合模式识别及语音情感感知算法,开发了应用于移动平台的语音情感识别系统,该技术具有自主知识产权。该系统能够通过移动终端采集用户的语音信号,经情感建模和识别算法处理后,实时感知用户语音中包含的六种基本情感信息(高兴、悲伤、惊讶、害怕、生气、嫌恶)。系统特点:1、融合说话人无关和说话人相关两种语音情感模型,用以弥补单一模型无法兼顾算法普适性和准确性的不足;2、具备在线及离线两种工作模式,在线模式下,移动设备可以借助服务器获得更为准确的识别结果,并且节省运算资源;3、对移动设备使用环境中的低采样率与低信噪比环境作了针对性优化,保障了识别算法在一般环境下的鲁棒性。 本系统基于北京航空航天大学模式识别与人工智能实验室的多模型融合语音情感识别技术,在移动平台上实现了对说话人情感表达的识别。其能够对说话人相关和说话人无关情形进行相应优化,对于未在系统注册的一般用户,识别准确率为76%;对于已在系统注册的用户,识别准确率可达83%,属于国内外领先水平。对于长度为2s的语音,本系统离线模式下识别时间小于0.5s,在线模式下识别时间小于0.2s。
北京航空航天大学 2021-04-13
一种基于李群论的多模态情感识别方法
本发明公开了一种基于李群论的多模态情感识别方法,包括以 下步骤:获取视频,并提取视频帧中图像区域的高斯型特征描述子, 基于高斯型特征描述子对视频中的图像区域进行跟踪,根据视频子序 列构建 ARMA 模型获取 ARMA 模型间的距离,根据 ARMA 模型之间 的距离构建核函数,并进行情感表达分类,根据人体、脸部和手部的 情感类别概率对人进行情感识别。本发明根据视频中所包含的人体姿 态运动信息、手势和脸部表情信息来判断人的情感状态,是一个将视 频数据映射到人体运动特征、手势特征和脸部表情特征,再从人体运 动特征空间和脸部表情特征映射到状态空间的过程,并提出利用李群 论进行多模态情感识别,提高模型进行情感识别的精确性。
华中科技大学 2021-04-11
一种基于近邻原则合成情感模型的说话人识别方法
本发明公开了一种基于近邻原则合成情感模型的说话人识别方法,包括:(1)训练出参考语音和用户中性语音的模型;(2)提取GMM参考模型的中性-情感高斯分量映射集;(3)提取与用户的中性训练高斯分量邻近的若干中性参考高斯分量映射的情感参考高斯分量;(4)合成出用户的情感训练高斯分量,进而得到用户的情感训练模型;(5)合成出所有用户的GMM训练模型;(6)输入测试语音进行识别。本发明采用基于KL散度的近邻原则从语音库中提取若干与用户的中性训练语音相似的参考语音,用参考语音中的情感参考语音合成出用户的情感训练语音,改善了在训练语音与测试语音失配情况下说话人识别系统的性能,提高了说话人识别系统的鲁棒性。
浙江大学 2021-04-13
情感安抚对话系统技术
1. 痛点问题 根据国家卫健委疾病预防控制局公布的数据显示,截至2017年底,全国13.9亿人口中有2亿4千万人患有精神障碍问题,其中严重精神障碍患者超过1600万,这一数字还在逐年增长。2021年权威数据显示,全球患有抑郁症的患者超过3.5亿人,中国抑郁症患者高达5400万人,占总人口的4.2%,1.5亿青少年中受情绪和压力困扰的超过3000万人,每年因心理问题导致死亡的近300万。仅清华大学心理咨询中心一学期接诊学生就近4000人次。这些数字说明,我国民众的心理健康问题日趋严重。 与此形成巨大反差的是,在我国拥有心理咨询师从业资格证(三级和二级)的人数大约有150万,但实际上从业人数不足10%,其中专业水平也是参差不齐。2020年中国精神科执业(助理)医师刚刚达到4万人。因此,心理健康的专业从业者数量存在巨大缺口。这就为数字化心理健康技术和产品提供了发展空间。 2. 解决方案 核心技术: 面向心理咨询和治疗的自然语言处理技术 针对心理健康常见的情绪识别、关键信息提取技术。       情绪支持对话技术 借鉴心理咨询模型的情绪支持对话框架,根据策略标注实现高效的情感安抚对话生成。 预期产品和服务: 面向高校学生、企业员工和社会人士提供的智慧心理健康服务平台,融合了专业心理咨询服务,人工智能赋能的朋辈咨询对话机器人,以及辅助心理健康产品的服务平台。 心理健康信息化系统: 为专业心理咨询机构和心理咨询师提供流程管理和优化、来访者档案管理、咨询档案管理、智能辅助机器人等服务。
清华大学 2021-09-18
人脸识别
已有样品/n采用自主研发的人脸识别技术,识别率达到国际先进水平。已经在 多个案例中使用。 该项目广泛应用于平安城市、智慧城市、智能安防、门禁、司法鉴 定、公安侦查方面,具有较好的市场前景。
华中科技大学 2021-01-12
基于3D仿生代理的情感人机交互系统
本系统基于北京航空航天大学模式识别与人工智能实验室的多模情感识别与情感表达融合技术,开发了基于3D仿生代理的多模情感人机交互系统。该系统具有情感感知与表达能力,能够通过采集用户的视音频信号,实时感知用户表情和语音中包含的六种基本情感信息(高兴、悲伤、惊讶、害怕、生气、嫌恶),识别准确率达到85%,并通过3D仿生代理生动的语音和肢体动作与用户进行自然和谐的对话交流。系统消耗资源少,适合移动平台;融合表情和语音进行决策级情感识别,识别率高;采用3D仿生代理,交互界面生动自然。该系统及相应情感感知技术可应用于新一代情感人机交互界面。本成果已获得授权发明专利2项,受理发明专利15项,申请国际发明专利2项。授权发明专利如下:一种鲁棒的人脸表情识别方法,ZL200810223211.6;汉语语音情感信息的提取及建模方法,ZL200810104541.3。
北京航空航天大学 2021-04-13
RFID八通道读写模块工业物流仓储多标签识别抗干扰远距离识别模组
产品介绍 CK-M8L超高频RFID读写模块是小型化的UHF RFID 读写器 ,集成了模拟射频前端与基带数字信号处理模块等功能;用户只需要在模块的基础上作电源处理即可,可以很方便的通过API函数库控制模块工作适合各种应用场景用户开发。该模块支持固件升级,可满足协议扩展和功能扩展的应用需要。     产品特点 支持多种协议:ISO 18000-6C/EPC C1G2 、 ISO 18000-6B、国标GB/T29768-2013(可拓展支持)。 密集读取:端口最大输出33dBm,可根据需要设置功率,可应对非常密集的使用环境,多标签识别算法,每秒可识别超过400张以上。 能够定频或跳频工作。 输出功率可调,调节步进:1dBm。 支持标签数据过滤、支持防碰撞协议、支持多标签识别。 全频段、大功率、灵敏度高、功率准、零配置即可获得最佳性能。 规格参数 主要规格参数 产品型号 CK-M8L 性能参数 频率范围 940MHz~960MHz 空口协议 EPC C1G2、ISO18000-6B/C、GB/T29768-2013(可选配) 功能特点 支持密集读写、多标签识别、支持标签数据过滤、支持RSSI:可感知信号强度 通道数 8通道 RF输出功率(端口) 33dBm±1dBm(MAX) 输出功率调节 ±1dBm 前向调制方式 DSB-ASK、PR-ASK 连续读标签距离(读EPC码) 0-10米,连续读100次,读取成功率大于95%(无干扰环境)(8dBi圆极化天线@H3) 连续写标签距离(写EPC码) 0〜4米(与标签芯片性能有关),连续写100次,写成功率大于90%(8dBi圆极化天线@H3) 标签识别速度 >400次/秒 通讯口 TTL串口 物理接口 15PIN端子 1.25mm间距 空口协议 ISO 18000-6C/EPC C1G2 、 ISO 18000-6B、 GB/T29768-2013(可拓展支持) 功能特点 支持密集读写、多标签识别、支持标签数据过滤、支持RSSI:可感知信号强度 读卡功耗 (33dBm):8W 物理参数 外观尺寸 93*72*8mm 外壳材质 铝型材外壳 安装方式 通过四个螺丝孔固定 电源 工作电压   操作环境 工作温度 -20°C~+70°C 储存温度 -40°C~+85°C 工作湿度 <95% (+25°C)
深圳市斯科信息技术有限公司 2025-12-27
声纹识别
声纹是对语音中所蕴含的、能唯一表征和标识说话人身份的语音特征参数及基于这些特征参数所建立的语音模型的总称。声纹是人的生物个性特征,很难找到两个声纹完全一样的 人。声纹识别技术属于生物识别技术的一种,是一项根据语音波形中所蕴涵的说话人信息, 自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人 信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音 信号中的言语内容,并不考虑说话人是谁,它强调共性。声纹识别根据应用的范畴,可分为两类:(1)声纹辨认(说话人辨认):用以判断某段 语音是若干人中的哪一个所说的,是“多选一”问题;(2)声纹确认(说话人确认):用以 确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。截止到 2009 年初,声纹识别产品在生物识别市场的占有率为 15.8%,仅次于指纹识别 和掌形识别。目前,我国生物识别行业内厂商有 200 多家,其中 96%从事指纹识别技术相 关产品的研究和开发,产品趋同化明显。国内声纹识别市场已经启动,其发展空间更为广阔, 在金融、证券、社保、公安、军队及其他民用安全认证等行业和部门有着广泛的需求。
清华大学 2021-04-11
1 2 3 4 5 6
  • ...
  • 28 29 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    64届高博会于2026年5月在南昌举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1