高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
智能声纹识别系统(开源工具ASV-Subtools)
ASV-Subtools的设计理念在于代码高度复用的同时保持模块分化和开发自由,因此具有高效性、可读性、通用性、灵活性四大特性。使用者可以轻松上手并只需通过简单的编辑配置文件就能探索不同的网络架构,实现最优异的性能。 一、项目分类 关键核心技术突破 二、成果简介 声纹识别是指从说话人的语音信号中提取声纹特征,并通过有效的分类识别模型,对说话人的身份进行校验和鉴别。声纹识别广泛应用于刑侦、人机交互声纹口令验证、银行声纹身份验证等领域。得益于深度学习的发展,声纹识别的性能在不断提升,但落地难度也相应提高。 ASV-Subtools是厦门大学智能语音实验室(XMUSPEECH)于2020年6月推出的一套高效、易于扩展的声纹识别开源工具,该工具是基于Kaldi与Pytorch开发的,充分结合了Kaldi 在语音信号和后端处理的高效性以及PyTorch 开发和训练神经网络的便捷灵活性。自开源以来,ASV-Subtools就以卓越的性能和灵活便捷的框架受到国内外重点科研院所和研发人员的青睐。 ASV-Subtools的设计理念在于代码高度复用的同时保持模块分化和开发自由,因此具有高效性、可读性、通用性、灵活性四大特性。使用者可以轻松上手并只需通过简单的编辑配置文件就能探索不同的网络架构,实现最优异的性能。 相较于语音领域的其他开源工具,ASV-Subtools专注于声纹领域的研究,不仅先后为东方语种、CNSRC等国内外知名竞赛中提供基线系统和技术支持,同时在声纹领域公开的VoxCeleb数据集上也在不断刷新着SOTA的结果。 为了加快声纹产品的落地,厦门大学智能语音实验室(XMUSPEECH)与厦门天聪智能软件有限公司(TalentedSoft)合作,共同为ASV-Subtools的开发与更新做出贡献。目前ASV-Subtools已打通声纹识别从算法研究到产品落地的全流程,技术成熟度已达到可以量产的水平。     GitHub:https://github.com/Snowdar/asv-subtools
厦门大学 2022-07-28
韦斯科技WIS智能图像跟踪系统V2.1
产品详细介绍系统概述: 本系统采用最先进的图像(人脸、色彩、物体移动趋势等多种方案联动)跟踪方案,其优势部分在于其跟踪策略的组合及配置(多位优质课专家参于设计,并在数千堂实况课实时测试更新),配合其它厂家的录播主机可满足智能跟踪系统的需求,学生和教师跟踪主机可分别单独使用,同时使用可以达到最佳的无人值守的学生及教师跟踪轨迹,是目前教育市场上最佳的图像跟踪方案,此方案的跟踪策略完全由主机智能分析完成,兼容市面大部分主机厂家录播主机,不需要录播厂商或系统集成商二次开发。 教师跟踪主机(型号:WIS-ITRACE-T01): 学生跟踪部分(型号:WIS-ITRACE-S01):     功能简述: l         平滑的教师跟踪、清晰的板书跟踪、准确的学生跟踪; l         自带窗口化调试工具,安装调试及使用调试,有基本电脑常识的老师即可设置; l         满足教学PC的鼠标键盘移动侦测响应; l         灵活的摄像机拉近拉选,可用鼠标的滚轮来按制,像操作窗口滚动条一样拉近拉选; l         简单的云台控制,实现平滑的画面感且可设定移动速度 l         快捷的场景切换,可预置远中近和全景四个场景,由快捷按钮一键实现 l         方便配合云台的预置位,而且可以用鼠标光标直观控制,人机操作方便   系统特点: 1、  教师跟踪模式:智能图像识别,直接对录制视频图像进行分析,老师讲课时无需佩戴任何定位设备,也无需安装任何红外、超声波、射频发射器以及图像辅助定位摄像机,实现常态化教学(含板书跟踪、鼠标移动侦测); 2、  学生机跟踪模式:由一台广角全景定位摄像机和跟踪摄像机组成,定位摄像机监控整个教室内学生起立和举手动作并控制跟踪摄像同进行追踪和定位,准确度较其它跟踪方案高,且安装简单; 3、  跟踪距离:2M~50M(视摄像机的焦距能力而定); 4、  跟踪角度:0~355度; 5、  最小跟踪目标:≥4*4像素; 6、  抗干扰能力:采用领先的人体特征跟踪算法,完全不受光线、声音、电磁等外在的环境影响; 7、  定位与实时:自动识别目标位置,定位精确,多种跟踪策略可选,并可自定义跟踪策略; 8、  标准1U机架式设备,功耗低,稳定性强,兼容性强,标准化云台接口,支持多种云台设备; 9、  支持高清摄像机的方案;   方案的对比   智能图像跟踪系统 红外跟踪 超声波 图像流畅度 流畅 不流畅 不流畅 定位准确度 误差<2% 误差>10% 误差>20% 抗干扰性 强 太阳光,热光源都会差生干扰 有辐射,对人体有害 安装难易 简单,只装摄像机,安装调试半天 复杂,还要安装发射和接收,一般2-3天 复杂,安装接收和发射,一般2-3天 产品升级 容易,更新主机即可 困难 困难 系统组成部分 跟踪主机独立完成 需辅助设备 需辅助设备 实时跟踪,目标跟踪 350度跟踪目标,不会丢失,跟踪流畅 角度受限,有盲区 角度90度左右,有盲区   主机参数: l         通迅、管理、扩展接口:RS232 l         视频接口:CVBS l         电源:AC 5V   主机应用: l         精品录播课程 l         多媒体教学 l         校园电视台 l         手术示教 l         微格教室 l         优质课评选 l         各种会议 l         指挥调度  
北京韦斯达通科技有限公司 2021-08-23
AI心理情绪识别系统
AI心理情绪识别系统1.多模态信号采集:人脸动态图像、脑电信号采集、语音情感检测。2.功能模块包含:情绪检测、情绪档案、数据统计、用户管理、系统设置功能模块。3.系统基于情绪心理学相关理论,结合面部表情的二维情感空间分析技术、脑电信号的状态分析、语音的三维情感空间分析三种模态相互融合叠加技术,检测人心理情绪状态,提高其检测准确度。3.    基于摄像头面部情绪识别技术,可以实时分析人体面部所包含的情绪状态。通过非接触式的实时视采用 AI 人工智能学习技术,结合心理学,通过对被测试人员 60秒的测试,能够获取相关心理/心理指标。帮助被测试人员了解自己的心理健康状况,并且引起人们重视心理健康,从而在工作、学习、生活当中提高身心健康。并且通过定期测试,能够获取个体、准确的进行心理危机预警,显示被测人员心理危机测试报告,提醒心理医生重点关注。用户在进行注册登录后,根据语音提示可直接进入测试界面进行情绪识别。点击测试按钮,调整好站立位置,脸部朝向屏幕,人脸录入即可完成测试,测试完成即可生成测试报告并能打印报告。4    基于脑电生物传感器状态检测、实时展示人体脑波原始状态指标以及Delta、Theta、Alpha、Beta、Gamma等8个EEG参数。5.    采用任务态模式进行语音情感分析,测试者按照系统设定的特定语境信息进行朗读来进行情感分析。6.    检测结束后可实时出具“心理生理状态分析结果报告”,其中包括被测试人员信息、检测时间、12维度心理生理情绪数据,包含正面情绪(平衡、自信心、活力、调节水平),负面情绪(攻击性、压力、紧张、可疑),生理参数(抑制、神经质、消沉、幸福指数),以及综合状态指标:专注度、放松度、疲劳指数、焦虑指数、压力指数、抑郁指数等。7.    统计分析:系统自带数据中心的统计功能,可以按单位进行所有检测人员的压力分布图及重点关注人员的信息显示。8.    检测完成后系统自动生成检测报告,检测报告需包含每项参数的检测数据大小、参考范围、异常数据等,以及用情绪参数雷达图、饼状图、直方图、曲线视图等多种表示方法。9.    信息查询功能:管理员可通过多条件查询功能,只需通过任意一项查询条件即可快速查询出与之对应和匹配的测试者信息,以及该测试者的历史测试记录,并可对该测试者的测试记录进行纵向和横向对比,综合分析该名测试者的心理健康状况。9.用户管理端:以管理员身份登录该系统可对用户进行管理。可进行添加用户、删除用户、查询用户、用户信息修改、密码修改、级别权限设置、单位框架搭建、查看用户报告,以及导出、打印用户报告。10.系统具有特定场合模态设置功能,可关闭和开启语音检测功能。11.视频检测时面部框具有信号质量检测功能,通过不能的颜色在面部框进行彩色状态提示,同时具有人脸检测判别功能,比如面部不全、距离较远等识别功能
北京京师慧智科技有限公司 2025-05-22
大象机器人—myCobot 320 Pi六轴机械臂--图像识别/ROS教育/AI
    myCobot 320 Pi是隶属“myCobot 320系列”产品,采用树莓派微处理器,内嵌roboFlow可视化编程软件,是大象机器人面向创客及科研人员开发的机器“助手”。 myCobot 320 Pi本体重量3kg,负载1kg,工作半径320mm,体积相对小巧但功能强大, 操作简单、能与人协同、安全工作。作为大象机器人首款万元级机械臂,具有易用性、安全性和经济性三大优势,是高性价比之选。 产品特性 内嵌树莓派生态,开发无限可能 树莓派4B,1.5GHz 4核微处理器,运行Debian/Ubuntu平台 支持4路USB,2路HDMI,标准化GPIO接口、TF卡可插拔 高配置,性能强大 采用无刷直流舵机,可以达到±0.5mm的重复定位精度。 底座及末端带有安装接口,适用于各种周边产品设备开发。 操作方便,开源易用 拖动示教,用户可迅速上手操作 支持ROS/moveIt等开发系统及大象机器人自主研发的roboflow操作软件 一体化设计,安全协同作业 精巧结构设计使其能够充分利用空间,完美融入实际环境 兼备基于精确动力学模型的防碰撞检测功能使其能与人安全协同作业 经济适用,超高性价比 标准8小时工作制,能够替代重复性、标准性的工作 万元级机械臂,有效为需要高性能&低成本的科研降本增效 独特工业设计 一体化设计,整体机身结构紧凑,净重3kg。 模块化设计,备件少、维护成本低,可快速拆卸更换。 应用场景     myCobot 320 PI同myCobot 320 M5一样是生产力工具也是想象力边界的拓展工具,既可搭配多种末端执行器适配多种应用场景,如科学研究、教育场景、展示场景等,目前客户反馈极佳。 联系我们: 深圳市大象机器人科技有限公司 官网:https://www.elephantrobotics.com 淘宝官方旗舰店:https://shop504055678.taobao.com/?spm=a1z10.1-c-s.0.0.2b0e58e7URShvv 电话:+86 (0755) 8696 8565​ / +86 181 2384 1923 地址:深圳市福田区华强北电子科技大厦D座智方舟国际智能硬件创新中心D403、D504、D505室
深圳市大象机器人科技有限公司 2021-12-08
大象机器人—myCobot Pro 600六轴机械臂--图像识别/ROS教育/AI
    myCobot Pro-600 旨在替代重复性劳动力,可应用于商业和轻工业。 myCobot pro 600 是一款可靠的轻型协作机器人,由大象机器人开发,采用迷你一体式设计。本体重量8.8KG,其有效负载2KG,工作半径600MM。 myCobot pro-600体积小但功能强大、易于使用且极具成本效益。 具有简单、安全、经济三大优势,是自动化生产的最佳选择。 myCobot Pro-600 快速部署在生产线上,为企业降低了大量成本并提高了工作效率。 产品特性 一体化设计,安全协同操作 一体化设计使其充分利用工作空间,完美融入生产环境。兼备基于精确动力学模型的防碰撞检测功能使其能够与人安全地协同工作。 性能 强大 操作便捷易用采用谐波减速机+伺服电机,高性能商用轻工机械手。结构精巧,携带方便,安装简单,即插即用。 树莓派主控大象机器人自主研发的 Roboflow 操作系统,简单易用支持ROS/Python等开发系统 经济适用 高性价比标准的7×24小时工作制,替代高重复性和标准流水线工作。超高性价比,有效为企业降本增效。 联系我们: 深圳市大象机器人科技有限公司   官网:https://www.elephantrobotics.com 淘宝官网旗舰店:https://shop504055678.taobao.com/?spm=a1z10.1-c-s.0.0.2b0e58e7URShvv 电话:+86 (0755) 8696 8565​ / +86 181 2384 1923 地址:深圳市福田区华强北电子科技大厦D座智方舟国际智能硬件创新中心D403、D504、D505室
深圳市大象机器人科技有限公司 2021-12-08
大象机器人—myCobot树莓派六轴机械臂—图像识别/ROS教育/AI
myCobot for Raspberry Pi 六轴协作机器人是大象机器人精心研发的多功能轻量型智能机械臂,隶属“myCobot系列”产品,采用树莓派微处理器,是大象机器人面向机器人及人工智能教育生态的核心产品之一。 myCobot for Raspberry Pi 六轴协作机器人自重860g,有效载荷250g,臂展280mm,体积小巧但功能强大,具备丰富的软硬件交互方式及多样化兼容拓展接口,支持多平台的二次开发,有效帮助用户实现多场景的应用开发。   产品特性 内嵌树莓派生态,开发无限可能 树莓派4B,1.5GHz 4核微处理器,运行Debian/Ubuntu平台。 支持4路USB,2路HDMI,标准化GPIO接口、TF卡可插拔。 自带ROS,图形化编程Blockly 内置ROS仿真机械臂运行状态,超强扩展性。 blockly可视化编程,同时支持通用Python软件接口。 图像识别 丰富配件 应用广泛 自带图像识别算法,可选配任意摄像头。 自主搭配显示器、夹爪吸泵等不同配件,实现更多应用化场景。 独特工业设计,极致小巧 一体化设计,整体机身结构紧凑,净重仅860g,十分便于携带。 模块化设计,备件少、维护成本低,可快速拆卸更换,实现即插即用。 高配置,搭配Lego接口 内含6个高性能伺服电机,响应快,惯量小,转动平滑。 底座及末端带有乐高科技件接口,适用于各项微型嵌入式设备开发。 应用场景 myStudio 联系我们:深圳市大象机器人科技有限公司 官网:https://www.elephantrobotics.com/淘宝官方旗舰店:https://shop504055678.taobao.com/?spm=a1z10.1-c-s.0.0.2b0e58e7PY8UhV电话:+86 (0755) 8696 8565/+86 181 2384 1923地址:深圳市福田区华强北电子科技大厦D座智方舟国际智能硬件创新中心D403 D504 D505
深圳市大象机器人科技有限公司 2021-12-10
红外数码智能识别印染织物纠偏对中系统及装置
印染织物电脑对中纠偏系统及其装置,具有布边卷取、展开、扩布和对中控制功能。可连接棉印行业的烧毛机、水洗机、镀层机、丝光机、定型机、平网印花机、圆网印花机以及造纸机、塑料薄膜生产线等机械的入口处。自动对中修正偏斜,减少偏斜式边缘弯曲不正所产生的摺纹式色泽光泽不均现象,提高产品品质,实现生产自动化。 本系统采用微电脑与红外数码技术,将模糊智能识别用于对中纠偏,较模拟电路的对中装置上一档次,属国内首创。该系统具有抗干扰性能强、动作稳定可靠、灵敏度高等优点,不受织物厚薄和幅宽的限制,可自动控制中心位置,可高速运行,是提高印染产品质量的好帮手。本系统还可选配笔记本电脑监控工作状况连接Internet网络。
东华大学 2021-02-01
一款准确的野外矿物智能识别手机软件
图1. 矿识的4个页面 a: 选取待识别的矿物,可现场拍照获取或从手机相册中选取 b: 截取待识别矿物中心图 c: 输入便携硬度仪测量或经验估计所得的硬度值后得到识别结果 d: 可以不使用硬度值,仅用图片进行识别 表1 矿识与其他相关工作的对比 图片类型 相关研究 性能 可识别矿物数 准确率(%) Raman spectroscopy 拉曼光谱 Computers & geosciences 2013 6 83.0 Microscope 显微镜 Sensors 2019 4 90.9 Mathematical and Computational Applications 2011 5 93.9 Photo 相机图片 Artificial Intelligence in Theory and Practice, 2008 6 91.0 Minerals 2019 12 74.2 photo & hardness 相机图片+硬度 矿识 36 90.6   表2 矿识能够识别的36种矿物及其准确率 矿物名 样本数  仅用图片识别的正确数 结合图片与硬度识别的正确数 Agate玛瑙 5 5 5 almandine铁铝榴石 6 4 4 azurite蓝铜矿 2 1 2 beryl绿柱石 1 1 1 chalcopyrite黄铜矿 2 1 2 cinnabar辰砂 1 1 1 copper铜 2 2 2 fluorite萤石,氟石 11 8 10 galena方铅矿 3 2 3 halite石盐 1 1 1 hematite赤铁矿 8 1 5 malachite孔雀石 6 5 5 opal欧泊 1 1 1 orpiment雌黄 3 1 3 pyrite黄铁矿 6 5 6 quartz石英 4 4 4 sphalerite闪锌矿 1 0 0 stibnite辉锑矿 8 7 8 sulphur硫磺 2 2 2 total 73 52 65 Accuracy \ 71.2% 89%    
中国地质大学(北京) 2021-05-10
基于音视频识别及语义分析的智能约谈平台
针对行政约谈场景中存在的人工记录效率低、内容理解偏差记录、资料追溯繁杂等问题,本成果开展了基于音视频识别及语义分析的智能约谈平台的研究。基于 AI 深度学习的音视频识别框架、复杂网络理论和语义知识本体的文本语义相似度计算方法,研究音视频识别的语音转写、对话管理、计算机视觉技术和内容分析的语义理解、语义优化、情感识别方法,实现网信约谈、纪委约谈、公安审讯、监狱谈话等多种行政约谈场景下的约谈智能化和数字化。其中,语音识别转写是开展智能约谈系统研究的前提和基础,本成果训练了声学模型和语言模型,构建编码器,通过音频角色分离和声纹识别技术分离说话人声音,编码器识别解码,经过文本语义处理转写为文本。而文本语义处理是智能约谈系统提升约谈效能的源动力,成果构建了基于语义本体的自动专家导引约谈知识库,通过基于复杂网络的语义相似度计算给约谈工作人员推荐约谈问题;约谈结束后,利用融合主题特征的文本自动摘要技术快速生成汇报摘要,利用基于分布式表示的事件抽取技术自动生成约谈报告。本成果研制高效、便捷的智能约谈音视频识别及语义分析平台,实现了在线约谈预约、人脸识别身份核验、语音实时转写、约谈问题智能引导提问、音视文同步显示、汇报摘要自动生成、约谈报告自动生成、约谈文件回溯、约谈大数据分析等功能。
西安电子科技大学 2022-12-15
基于耳内图像的耳科疾病智能辅助诊断系统
本项目通过收集本院耳鼻喉科6066张正常人、分泌性中耳炎、急性化脓性中耳炎活动期及化脓性中耳炎静止期耳内镜图像。 一、项目进展 创意计划阶段 二、负责人及成员 姓名 学院/所学专业 入学/毕业时间 徐倩慧 中山大学医学院 2017.09~2022.06 童钊鹏 中山大学孙逸仙纪念医院 2021.09~ 三、指导教师 姓名 学院/所学专业 职务/职称 研究方向 蔡跃新 中山大学孙逸仙纪念医院 副主任医师 耳鼻喉头颈外科 四、项目简介 本项目通过收集本院耳鼻喉科6066张正常人、分泌性中耳炎、急性化脓性中耳炎活动期及化脓性中耳炎静止期耳内镜图像。通过模仿医生诊断的注意力机制,将获取局部关键特征的局部分类器与获取全局特征的主分类器有机结合,构成深度学习的主框架。通过计算AUC等统计学指标来评估模型的性能,并与两位副主任医师、两位主治医师进行人机对比来进一步评估模型的性能,同时通过热图显示深度学习模型在耳内镜图像不同区域的权重,以判断深度学习关注的区域是否与临床医师一致。该深度学习模型可获得整体93.4%的准确率,区分正常人与分泌性中耳炎的AUC为0.99,而区分化脓性中耳炎活动期与静止期的AUC为0.94.模型的准确率要高于两位主治医师,达到副主任医师的水平,同时热图显示深度学习模型定义的关键区域恰好是临床医生做诊断的区域,如化脓性中耳炎鼓膜穿孔区域,分泌性中耳炎的光锥区域。同时,同时,本项目还将深度学习模型的技术落地,自主研发出研发便携式可拍摄与自动诊断的耳镜设备。
中山大学 2022-08-10
首页 上一页 1 2
  • ...
  • 5 6 7
  • ...
  • 228 229 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    63届高博会于5月23日在长春举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1