高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
语音实验室
产品详细介绍  1、教师部分:  主控制台、边柜、主控制箱、控制软件、主电源、主录放机、教师耳机、教师转椅、控制电脑、投影仪、投影屏幕。   2、学生部分:  学生桌、学生凳、学生机、学生耳机、盖线板、连接电缆、分线盒、字符、耳麦挂钩、视频显示器(选配)。 
长沙科源教学设备实业有限公司 2021-08-23
智能语音离线SDK
采用先进的端到端神经网络翻译技术,为您提供高效,精准的翻译。同步翻译说话内容,支持中英日韩等多种语言,解决跨国沟通的问题。支持文本音频的翻译转写,自定义热词,术语等,提升准确率。准确的识别说话内容,满足直播,视频会议等多样的业务场景。
慧言科技(天津)有限公司 2021-12-15
语音识别集成电路 IP 与协处理器
1 成果简介语音识别在嵌入式芯片上实现的主要矛盾是算法实现的性能精度与芯片功耗、速度之间的矛盾,一个性能较好的 800 条典型汉语普通话语音识别算法以纯粹软件嵌入方案实现通常需要 200MIPS 以上 ARM( Advanced Risc Machine) MCU 处理速度,因此我们提出语音识别集成电路 IP 与协处理器来克服以上的问题,通过关键运算的硬件化映射来大幅提高语音识别计算的功耗和处理速度。该设计可作为语音识别集成电路 IP 放入客户的 SoC 芯片中,也可作为协处理器放在片外。 关键性能指标如下: *工艺:苏州 HJTC 0.18um 1P6M 标准 CMOS 工艺 *管芯面积: 1.5 x 2mm *逻辑规模: 3 万等效门(标准二输入与非门,不含 SRAM) *I/O 数: 52 封装: CQFP64 *存储规模:片上集成 1 片单口 SRAM,共 4K×16 比特 *供电电压:核心部分->1.8V, IO 部分->3.3V *正常工作频率: 20MHz(最高工作频率 100MHz) *功耗: 80uW/MHz *速度: 4us/帧(特征维数取 27,时钟频率取 20MHz) 图 1 语音识别集成电路版图图 2 ARM+语音识别协处理的测试系统表 1 与其他语音识别芯片的对比2 应用说明语音识别 IP 或协处理器基于对高斯混合模型计算的优化,适合于各种 HMM 模型的模式识别计算,在语音识别、说话人识别、说话人确认、语音合成等方面均可以广泛应用。 语音识别 IP 或协处理器以加速 ASIC 的模式工作,相同时钟主频下计算性能是 TI C54x系列 16bit DSP 的 5.5 倍以上,对主系统计算性能提升可以达到 4~8 倍。 语音识别 IP 或协处理器对于性能要求型场合和功耗限制型场合都十分适合,芯片支持16bit 并行总线接口,适合于各种 32 位/16 位 MCU 系统,迅速为系统集成高性能语音处理能力。3 应用范围车载导航, GPS 手机,支持大规模识别词表(例如万条以上的地名)支持模糊语音检索;低端手机平台,支持语音拨号、语音控制,支持用户身份确认、声纹密码。4 效益分析语音识别 IP 或协处理器芯片可应用拓展到个人移动信息终端的全市场空间,以 GPS 产品为例,细分的预装 GPS、个人导航设备( Portable Navigation Device, PND), GPS 手机三种产品,根据 CCID( Consulting China Research Center)咨询公司预测 2008 年这三者分别约占到全球市场总量的 15%、 35%和 50%。快速增长的 GPS 市场,对语音识别功能有着非常迫切而又实际的需求, GPS 应用提出的超大规模词表、高混淆度和高环境复杂度这一系列语音识别的技术难题,也只能由语音识别芯片解决。语音识别加快了人机交互与地名等信息的检索,可提高驾驶期间操作 GPS 的行车安全性,同时可以反过来进一步促进 GPS 产品的销售增长。 语音识别技术通过芯片在性能得到大幅提升后,将摆脱传统的人名拨号功能,可用于菜单控制、地名、信息、多媒体内容的检索等等。而语音识别芯片使得低功耗和低成本的要求得以满足,有望成为手机人机交互界面( Man-Machine Interface, MMI)发展的新技术增长点,移动通信领域的市场潜力特别巨大。
清华大学 2021-04-13
多媒体数字语音教室
产品详细介绍  XB系列型多媒体数字语音室,是我公司自行研制,开发及生产的,具有独立知识产权的语言学习系统。  XB系列型多媒体数字语音室是在计算机数字通信技术基础上构成,由教师计算机,服务器,USB集线器,学生数字语音终端等,组成的新一代数字多媒体语言学习系统。它所有的语音数据和数据文件,均通过传输率高达480M的USB2.0协议,传送给用户终端。它以优良的音质,网络教学的功能,满足了教学多样性的需要。   网络特性  数字多媒体语言学习系列是建立在USB系统上,它在功能实现上,充分利用了USB的技术特性:具有交互性强,资源共享,利用率高,信息传递准确等特点。它不仅具有传统语音室的所有功能,而且又扩展许多新的功能。例如自由收播,视听阅览,数字跟读,数字录音,文体发布,电子测试等等。使它具有语音室,电子阅览室,计算机辅助测试,internet等功能。   系统功能  系统控制软件采用Windows操作,系统稳定,操作界面符合教学环境,简单易学。  系统兼容性好,可以与各种多媒体设备录音机、录像机、投影机、DVD等视听设备连接。  系统采用专用的硬件机制控制语音传输具有CD的音质,语音清晰、亮丽、无噪声、无延时。  系统具有全班课授,学生示范,单独对讲,电子黑板,学生监听,多组讨论,多人讨论等功能。  系统具有多媒体中央控制,多种教材播放,教材文本发送,数字化教材播发,教材插话,教材监听等功能。  系统具有教材管理,教材制作等功能。  系统具有丰富资料库,包括听力教材,阅读教材,听力测试,语法测试,音乐欣赏等。  系统具有考试管理,电子阅卷,成绩分析,成绩打印,成绩存储等功能。   学生终端  学生可以自由点播视听同步教材,自由阅览文本教材,自由点播音乐等功能。  学生可以通过学生终端方便的阅读网络上的课本,课外读物,参考材料,小说等。  学生终端具有同步或自由的标准听力测试,口语测试,试卷测试等功能。
北京科乐达教学设备技术研究所(原东城五四电子仪器厂) 2021-08-23
脉搏语音图像分析系统
该系统是与北大医学部物理教研室联合研制。涵盖了脉搏、语音等非电量的信号采集、频谱分析、分解与合成等功能;结合数字图像处理技术,进行傅里叶光学实验模拟。系统可完成多个设计性、创新性、趣味性的实验内容。 《脉搏语音图像分析系统》是与北京大学医学部物理教研室联合研制开发。 该系统涵盖了脉搏、语音等非电量的信号采集、频谱分析、分解与合成等功能;并结合数字图像处理技术,进行傅里叶光学实验模拟。 仪器可应用于开设“压力传感器测量脉搏”、“语音形态观测”、“数字图像的离散傅里叶变换”等多个实验,更能够让学生自主设计各类频谱滤波器,完成多个设计性、创新性、趣味性的实验内容。 系统特色: 1.  直观地展现语音、脉搏等生活中常见的信号,实现脉搏信号和语音信号的可视化; 2.  快捷地分析脉搏、语音信号的频谱构成、选频、重建; 3.  轻松地完成阿贝成像空间滤波物理研究性实验内容,以及数字图像的二维频谱分析、滤波、重建等功能; 4.  高灵敏度的采集探头对脉搏信号进行真实呈现,精确分析脉搏强度,实现科学定量地脉搏诊断。 功能模块 一、脉搏语音实验仪 二、信号分析软件 1. 脉搏信号测量分析测量脉搏波,并对脉搏信号作傅里叶频谱分析;并根据信号频谱图,进行原信号的分解以及合成还原。 教学应用: 可用于研究脉搏波的不同频率构成,通过任意分解和还原脉搏信号,分析不同频率对于脉搏图像的影响程度和变化规律。 2.  语音信号观察测量语音,并对语音信号作傅里叶频谱分析;在此基础上对原信号分解、合成、还原。 (1) 不同语音图像和频谱对比; (2) 分析同一实验者的不同音节,并进行信号的傅里叶变换,对比两段语音的时域差别和频域差别;(3) 分析不同实验者语音频谱,理解和掌握语音识别的原理; (4) 长时动态傅里叶频谱观察,进行长时间动态观察语音信号的时域图像和频域图像。教学应用:(1) 方便学生观察不同音节的语音形态,分析语音结构的细节特征;(2) 直观地反映语音信号在短时间内重复的周期变化,对不同类周期信号进行分析,研究类周期信号之间的异同点;(3) 对语音进行时-频分析,观察不同人、不同声音的频谱特征。 3.  多通道信号叠加分析 将多通道信号进行叠加,频谱分析、信号分解、分离和还原。将实验中多种信号通过传感器转换为电信号,接入外接通道,进行信号观察、检测和时-频分析。 教学应用: (1) 用标准信号进行实验分析,并与理论计算公式作对比,对傅里叶变换公式进行实验验证; (2) 根据实际需要,可以让学生设计测量各种物理量的传感器,直接输入到实验仪的外接通道,进行待测信号的测量。 4.  数字图像处理与光学实验模拟 观察黑白图片的二维傅里叶频谱,使用不同形状和参数的滤波器,对图像频谱进行低通、高通以及带通处理,对比处理后图像与原图的异同。 教学应用: (1) 将数字图像作为二维函数,通过傅立叶变换转换到频率域上,让学生根据具体需要,对频谱进行各种滤波处理,并将滤波后的频谱反变换,得到特定增强滤波处理后的图像; (2) 使用不同的图片模拟光学实验,进行空间滤波。无需到实验室搭建实际光路,就能够让学生观察到复杂的光学成像结果。 典型应用 教学中可开展的实验内容  1.压力传感器测量脉搏 压力的测量是各种测量技术中最常见的一种测量。本实验采用压电晶体式压力传感器测量脉搏波的波形及脉搏频率。 2.  语音形态观测实验由话筒采集语音信号,信号放大后输入计算机由数/模转换器转换为数字信号,经软件处理后显示在监视器上。实验中可通过观察同一人发不同音、不同人发相同音,理解语音识别的基本原理。 3.  傅里叶光学的空间频谱与空间滤波实验滤波器:低通滤波,高通滤波,带通滤波,自定义滤波器滤波 物屏:一维光栅滤波,二维光栅滤波, “光”字屏滤波。
安徽省科大奥锐科技有限公司 2021-02-01
语音立体地形图
数字高程模型 专业地图出版 无线点读技术 内容扩展升级 多民族语言解说(蒙、藏、维吾尔、朝鲜语)          语音立体地形图以公开版地形地图为基础底图,并根据教学需要,进行合理的地图综合,实现政区图和地形图的完美统一。产品新材料、新工艺,整合光学识别技术、无线点读技术、音频技术等,实现了地图无线点读、多民族语言解说、内容智能升级。     语音立体地形图创新地图设计,数字高程模具热压成型,智能点读,无线信号传输,实现了基础底图的规范化、制造模具的精准化、教学方式的多样化、视听内容的扩展化。     语音立体地形图适用于中小学地理专用教室、青少年活动中心和校外活动场所的建设和配备;同时其所具有的国情教育、世界自然地理环境教育,也可广泛应用于学校校园文化建设。     ● 立体地形图+无线点读教鞭+音箱     ● 基础底图科学严谨,符合底图公开出版的要求     ● 内置初中、高中双版本,符合新课程标准,兼顾多种地理教材     ● 支持多民族语言解说(蒙语、藏语、维吾尔语、朝鲜语),即点即图,内容翔实丰富     ● 多项智能教学应用模块,内容可扩充可升级     ● 材质轻便,环保,易于安装、使用     ● 通过国家教学仪器设备质量检测中心和教育部专项研究成果专家鉴定 《中华人民共和国语音立体地形图》内容:     ①国地级以上城市和大部分县,省级行政区划和国界线。     ②铁路、高速公路等交通要素。     ③主要的河流、湖泊、山脉、沙漠、盆地及相关要素。     ④标注地级以上城市和县(密度大时可删除部分县)名称,主要的河流、湖泊、山脉、沙漠、盆地、海洋、岛屿名称。     ⑤突出表示三大阶地、四大高原、四大盆地、三大平原自然地理形态,综合表达中国地形的起伏形态和地理特点。 《世界语音立体地形图》内容:     ①世界各国家和地区的名称、范围、国界线。     ②主要铁路、公路。     ③主要河流、湖泊、山脉、沙漠、盆地、海洋、岛屿并标注地理名称。     ④各国家和地区的面积和人口。     ⑤突出显示七大洲、四大洋的自然地理形态和特点。
北京中教启星科技股份有限公司 2021-08-23
精彩活动预告③ | 第63届高博会开创未来系列发布活动——解码人工智能教育新生态、科研仪器突围新实践
第63届高等教育博览会将于5月23-25日在中铁·长春东北亚国际博览中心举办。作为高等教育领域的高品质、综合性、专业化品牌展会,本届高博会紧扣“融合·创新·引领:服务高等教育强国建设”主题,携700余家科技企业、1000余所参会院校,在10余万平方米的科技矩阵中,全面展示新技术、新产品在高等教育领域的应用成果,为推进高等教育现代化贡献智慧与力量。
高等教育博览会 2025-05-19
人机语音交互关键技术
一、项目简介 随着智能硬件的快速普及,人机交互方式发生了重大变革,迫切需要语音唤醒、近/远场语音识别、语音合成等语音交互关键技术,尤其要解决复杂场景下的识别鲁棒性等问题。 二、前期研究基础 已开发实现语音唤醒、命令词识别系统、多元麦克风阵列系统、云端“自由说”语音识别系统、基于深度学习的语音合成系统。 三、应用技术成果 应用开发方面,课题组与华为公司合作,研发语音交互关键技术,涉及语音唤醒、声纹识别、语音识别、麦克风阵列,已开发实现语音唤醒、声纹识别和麦阵语音识别系统,应用到智能手机、智能机器人等平台。 四、合作企业 华为技术有限公司是一家生产销售通信设备的民营通信科技公司,于1987年正式注册成立,总部位于中国深圳市龙岗区坂田华为基地。华为是全球领先的信息与通信技术(ICT)解决方案供应商,专注于ICT领域,坚持稳健经营、持续创新、开放合作,在电信运营商、企业、终端和云计算等领域构筑了端到端的解决方案优势,为运营商客户、企业客户和消费者提供有竞争力的ICT解决方案、产品和服务,并致力于使能未来信息社会、构建更美好的全联接世界。2013年,华为首超全球第一大电信设备商爱立信,排名《财富》世界500强第315位。目前,华为约有18万名员工,业务遍及全球170多个国家和地区,服务全世界三分之一以上的人口。
厦门大学 2021-04-11
西兴技术智能语音系统
项目背景:西兴技术智能语音交互是基于语音输入的新 一代交互模式,通过说话就可以得到反馈结果。语音技术实 现了人机语音交互,使人与机器之间沟通变得像人与人沟通 一样简单。语音技术主要包括语音合成和语音识别两项关键 技术。让机器说话,用的是语音合成技术;让机器听懂人说 话,用的是语音识别技术。此外,语音技术还包括语音编码、 音色转换、口语评测、语音消噪和增强等技术,有着广阔应 用空间。 所需技术需求简要描述:1.当麦克风和信号源距离太远 时(比如 10m、20m 距离),录制信号的信噪比会很低,算法 处理难度很大,需要提供协助。2.如何实现回声消除:近场 环境下,播放音乐或是语音播报的时候可以按键停止这些, 但远场环境下想要通过语音控制,必须得实现回声消除。3. 如何实现低信噪比和混响:远场环境要求拾音麦克风的灵敏 度高,这样才能在较远的距离下获得有效的音频振幅,同时 近场环境下又不能爆音(振幅超过最大量化精度)。这样的 环境下,噪音必然会很大,从而使得语音质量变差,即 SNR 降低。 
西兴(青岛)技术服务有限公司 2021-09-10
人工智能语音识别芯片转让
人工智能物联网时代要求语音交互有非常好的体验感,室内环境下,当距离超过两米后,通过墙壁的反射造成的混响、音响设备的回声及其他环境噪声对语音识别带来了极大的影响,因此基于麦阵的声音采集与处理模块成为物联网时代的最佳人机交互采集模块。目前成熟的麦克风阵列语音信号采集与前端处理模块尚未出现,市面上仅有少数国外厂家如科胜讯提供双麦降噪芯片。同时,语音识别应用还需要配合降噪处理,目前的方案全部采用分离设计,一颗降噪芯片+一颗语音识别芯片。近年来随着大数据挖掘,基于人工智能神经网络的深度学习开始在语音识别领域进行推广运用,相对于传统的GMM模型,识别率得到了很大的提升。然而神经网络计算量非常巨大,需要采用GPU或CPU阵列的方式来进行运算,并且需要外加语音阵列降噪模块,其方案成本高,体积和功耗大。因此市场上对一款同时支持远场语音麦阵降噪和神经网络识别,具备高性价比的单芯片需求极大,具有巨大的市场前景和竞争力。
电子科技大学 2021-04-10
首页 上一页 1 2 3 4 5 6
  • ...
  • 321 322 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    63届高博会于5月23日在长春举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1