高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
高性能XMLXML数据处理技术
北京工业大学 2021-04-14
“镜湖一号”——“高校对外宣传数据智能分析平台”一体机
当前,高校内部学院、部门网站更新不及时,僵尸网站、发布内容存在不规范用语、错别字等情况较为普遍,造成了很大的安全风险。由内蒙古财经大学自主开发的“镜湖一号——高校对外宣传数据智能分析平台一体机”,很好的解决了上述出现的问题。同时,还具备了呈现学校对外宣传数据数据分析与挖掘的可视化态势展现功能,支持大屏观看和手机端查看。“镜湖一号”基于高校对互联网发布的各类数据,使用人工智能和大数据分析技术设计应用模型,让学校的管理者实时掌握数据动态。 应用场景及创新点: 1.监控敏感信息泄露,展现处置状态。 2.代替人工发现更新不及时、不到位的网站。 3.对比分析高校党建态势,同时展现学校内部各部门党建状态和成果。 3.实时展示高校发布的宣传数据态势,分析出最受欢迎、热门文章等。 4.平台支持国产化平台部署。 5.实现一体机快速部署。
内蒙古财经大学 2025-05-08
融合架构的高时效可扩展大数据分析平台
大数据应用的多样化 需要的计算模型、数据模型多样化; 目前每类模型需要单独的开源系统来支持(如HDFS、HBase、Neo4j、MongoDB,Flink,Spark,Tensorflow等)。 多系统导致大数据分析平台非常复杂、效率低下。研究目标:研究和开发面向新型多计算模型融合架构的、高时效、可扩展的新 一代大数据分析支撑系统与工具平台FAST(Fusion-Architecture, Scalable, Time-efficient big data analysis platform)。针对目前大数据分析平台复杂、效率低下的痛点,该系统具有三个 方面的优势:首先,这套系统采用融合架构,一方面实现关系、图、键 值、文档等多种数据模型的高效融合,另一方面实现批处理计算、流计 算的深度融合,并可以通过SQL扩展语言来进行多模型的统一查询,实现高效的跨模型查询。其次,对于复杂系统来说,时效性非常重要,这 套系统采用融合架构提高效率是实现高时效的基础,更重要的是,我们 对大数据分析从数据到用户进行了端到端的全栈时效优化。最后,对于 大数据应用来说,系统扩展性非常重要,本系统在资源层、存储层和计 算层进行了全面的扩展性优化。下面在融合架构、高时效和可扩展这三 个方面,分别详细介绍FAST系统的三个主要亮点。融合架构FAST系统的第一个亮点是融合架构,我们在技术方面的创新主要包 括多数据模型融合和多计算模型融合两方面。多数据模型融合:设计和研发了多模型数据管理与查询引擎,支持关系、图、键值、 文档等多种数据模型,实现了查询解析、查询优化、元数据管理、数据 分布等功能,将多种数据模型进行统一管理和深度融合。同时扩展了SQL语言,通过统一的查询接口支持对关系、键值、图、文档等数据进行独立访问或者跨模型查询。经过试验,多模型数据融合查询,比Spark 2.3.4的查询时间能平均减少70.7%。目前spark等现有系统还需要手工编程方式来实现跨模型查 询,所以FAST系统在易用性上也表现良好,降低使用门槛,提高开发效率。多计算模型融合:在计算层实现了最常见的批处理计算和流计算深度融合,批流融合的核心方法是在系统内部实现批和流的统一表达,批是对有限数据集 的运算,流是对无限数据流的计算,我们设计了UCollection结构对批和 流数据进行统一表达,通过识别的bounded标志,来确定是批、流、或批流融合。有了统一表达,可以开展一系列融合优化来提升系统性能。 并且对上通过Unified API统一用户的批、流接口,实现二者在编程范式上的统一表达。对于批流混合的计算,融合架构系统的查询延迟比Flink 1.4.2能减少57%,吞吐量平均可以提升到6.72倍。高时效FAST系统的第二个亮点是高时效,即缩短大数据分析的时间消耗, 提高效率。由于大数据分析平台是一个非常复杂的系统,为了做到高时效,系统不能存在性能短板,因此需要对大数据分析的整个过程进行端到端的全栈时效优化。如图中所示,自下而上,需要在多模态存储、批流融合、机器学习、人工操作各层都进行优化。对于多模态存储,面向应用负载和异构硬件特征进行自适应优化;对于批流融合计算,在统一表达基础上,进行系列融合优化技术, 包括DAG优化、迭代优化、部署优化、操作符优化等;在机器学习层面,进行模型优化、消息优化、梯度优化、概率优化 等来提高时效;而且我们也考虑到大数据分析过程中用户人工操作的时效性问题, 通过智能地进行大数据分析方法和模型的推荐,来缩减人工操作的 时间。可扩展FAST系统的第三个亮点是可扩展,由于大数据应用规模很大,数据增速快,对系统可扩展性的要求非常高,为此我们在系统的资源层、 存储层和计算层进行了全面的扩展性优化。在资源层,系统都部署在云计算的虚拟化资源之上,利用了云计算资源的弹性机制进行系统扩展。并在系统中实现了可伸缩调整模块, 能实时监控软硬件系统的状态,按照应用需求来自适应地进行弹性伸缩。在存储层,分布式存储系统扩展性的关键在于分布式共识和一致性 协议(Raft),因此提出了KV-Raft、vRaft等进行Raft的扩展优化。在计算层,我们扩展了机器学习模型的参数规模,使系统可以支持 到百亿级别的超大规模机器学习模型训练,并且性能方面有明显提 升。亮点成果:融合架构大数据分析平台目前已经在阿里巴巴双十一进行示范应用。 从2020年11月10日至11月16日一周的时间,在阿里的生产环境中,研发 的系统一直连续稳定运行,基于淘宝和天猫的实际用户信息进行大数据 分析,综合运用了本系统的存储、计算、机器学习等多个模块的能力, 累计进行了184亿件商品推荐。同时在双十一期间,基于智能交互向导技术,也面向电子商务应用 的卖家提供了“生意参谋”应用,基于大数据分析,帮助卖家分析产品 销量变化的原因,以及促销的有效手段等。
中国人民大学 2021-04-10
大数据产业创新发展行动专项方案设计
成果通过大数据基础性共性关键技术研究,提升重庆大数据应用指导理 论和应用系统水平,形成国内领先的大数据应用研究成果和示范应用,研制具 有自主知识产权的若干大数据软硬件产品和工具,达到国内领先水平,以点带面, 引领重庆大数据产业创新发展。成果研究与设计大数据产业新型研发机构示范, 设计成立市场化运营、独立法人的新型研发机构,创新管理、科研和成果转化、 产业化的模式和机制,面向社会和重点产业开展大数据应用关键共性技术研究和 成果转化服务,吸引国内外大数据技术企业、海外大数据人才和社会资本,构建 产学研用协同创新,具有产业联动效应、连接向上下游的重庆大数据产业创新机 构。完善重庆大数据产业基础性技术支撑系统建设,具备创业与孵化等功能,组织策划实施重庆大数据产业重点专项,促进重庆大数据产业科技成果转化,推进 重庆大数据产业创新发展。成果包含以下方面的行动方案调研与研究:高速大数 据挖掘关键技术研究及应用示范;实时动态大数据处理关键技术研究及应用示范; 大数据分析预测模型与智能决策系统研究及应用示范;多维叠加式大数据可视化 系统平台研究及应用示范。 成果为政府和行业提供决策咨询、产品规划、方案设计等服务,帮助其梳理 业务数据、挖掘数据价值、重构业务流程。成果为政府和行业提供决策咨询、产 品规划、方案设计等服务,帮助其梳理业务数据、挖掘数据价值、重构业务流程。 成果为政府和行业提供包括大数据解决方案及系统集成和数据资产运营的全方 位的大数据解决方案服务;参与数据资产运营,获得数据增值部分的分成。
重庆大学 2021-04-11
基于大数据分析的小基站开关控制方法
本发明公开了一种基于大数据分析的小基站开关控制方法,包括:采集场景信息步骤;数据预处理步骤;提取特征步骤;选择并训练模型步骤;预测步骤。本发明利用特殊场景下时刻表以及小基站接入人数的历史记录,建立数学模型,预测未来小基站内的待服务人数,根据待服务人数去控制小基站的开关,达到节能、减少基站间干扰的目的。在建立数学模型的过程中,本方法结合数据挖掘和机器学习,提高了预测的准确率和系统的实用性。
东南大学 2021-04-11
融合架构的高时效可扩展大数据分析平台
研究背景:  大数据应用的多样化  需要的计算模型、数据模型多样化;  目前每类模型需要单独的开源系统来支持(如HDFS、HBase、Neo4j、MongoDB,Flink,Spark,Tensorflow等)。  多系统导致大数据分析平台非常复杂、效率低下。 研究目标: 研究和开发面向新型多计算模型融合架构的、高时效、可扩展的新 一代大数据分析支撑系统与工具平台FAST(Fusion-Architecture, Scalable, Time-efficient big data analysis platform)。 针对目前大数据分析平台复杂、效率低下的痛点,该系统具有三个  方面的优势:首先,这套系统采用融合架构,一方面实现关系、图、键  值、文档等多种数据模型的高效融合,另一方面实现批处理计算、流计  算的深度融合,并可以通过SQL扩展语言来进行多模型的统一查询,实现高效的跨模型查询。其次,对于复杂系统来说,时效性非常重要,这  套系统采用融合架构提高效率是实现高时效的基础,更重要的是,我们  对大数据分析从数据到用户进行了端到端的全栈时效优化。最后,对于  大数据应用来说,系统扩展性非常重要,本系统在资源层、存储层和计  算层进行了全面的扩展性优化。下面在融合架构、高时效和可扩展这三  个方面,分别详细介绍FAST系统的三个主要亮点。 融合架构 FAST系统的第一个亮点是融合架构,我们在技术方面的创新主要包  括多数据模型融合和多计算模型融合两方面。 多数据模型融合: 设计和研发了多模型数据管理与查询引擎,支持关系、图、键值、  文档等多种数据模型,实现了查询解析、查询优化、元数据管理、数据  分布等功能,将多种数据模型进行统一管理和深度融合。同时扩展了SQL语言,通过统一的查询接口支持对关系、键值、图、文档等数据进行独立访问或者跨模型查询。 经过试验,多模型数据融合查询,比Spark 2.3.4的查询时间能平均减少70.7%。目前spark等现有系统还需要手工编程方式来实现跨模型查 询,所以FAST系统在易用性上也表现良好,降低使用门槛,提高开发效率。 多计算模型融合: 在计算层实现了最常见的批处理计算和流计算深度融合,批流融合的核心方法是在系统内部实现批和流的统一表达,批是对有限数据集  的运算,流是对无限数据流的计算,我们设计了UCollection结构对批和  流数据进行统一表达,通过识别的bounded标志,来确定是批、流、或批流融合。有了统一表达,可以开展一系列融合优化来提升系统性能。 并且对上通过Unified API统一用户的批、流接口,实现二者在编程范式上的统一表达。对于批流混合的计算,融合架构系统的查询延迟比Flink 1.4.2能减少57%,吞吐量平均可以提升到6.72倍。 高时效 FAST系统的第二个亮点是高时效,即缩短大数据分析的时间消耗,  提高效率。由于大数据分析平台是一个非常复杂的系统,为了做到高时效,系统不能存在性能短板,因此需要对大数据分析的整个过程进行端到端的全栈时效优化。如图中所示,自下而上,需要在多模态存储、批流融合、机器学习、人工操作各层都进行优化。 对于多模态存储,面向应用负载和异构硬件特征进行自适应优化; 对于批流融合计算,在统一表达基础上,进行系列融合优化技术, 包括DAG优化、迭代优化、部署优化、操作符优化等; 在机器学习层面,进行模型优化、消息优化、梯度优化、概率优化 等来提高时效; 而且我们也考虑到大数据分析过程中用户人工操作的时效性问题,  通过智能地进行大数据分析方法和模型的推荐,来缩减人工操作的  时间。 可扩展 FAST系统的第三个亮点是可扩展,由于大数据应用规模很大,数据增速快,对系统可扩展性的要求非常高,为此我们在系统的资源层、  存储层和计算层进行了全面的扩展性优化。 在资源层,系统都部署在云计算的虚拟化资源之上,利用了云计算资源的弹性机制进行系统扩展。并在系统中实现了可伸缩调整模块,  能实时监控软硬件系统的状态,按照应用需求来自适应地进行弹性伸缩。 在存储层,分布式存储系统扩展性的关键在于分布式共识和一致性 协议(Raft),因此提出了KV-Raft、vRaft等进行Raft的扩展优化。 在计算层,我们扩展了机器学习模型的参数规模,使系统可以支持  到百亿级别的超大规模机器学习模型训练,并且性能方面有明显提  升。 亮点成果: 融合架构大数据分析平台目前已经在阿里巴巴双十一进行示范应用。  从2020年11月10日至11月16日一周的时间,在阿里的生产环境中,研发 的系统一直连续稳定运行,基于淘宝和天猫的实际用户信息进行大数据 分析,综合运用了本系统的存储、计算、机器学习等多个模块的能力, 累计进行了184亿件商品推荐。 同时在双十一期间,基于智能交互向导技术,也面向电子商务应用  的卖家提供了“生意参谋”应用,基于大数据分析,帮助卖家分析产品  销量变化的原因,以及促销的有效手段等。
中国人民大学 2021-05-09
新型冠状病毒大数据交叉学科研究平台
2020年1月23日,国防科技大学系统工程学院与四川大学、电子科技大学共同组建新型冠状病毒大数据交叉学科研究平台,为新型流行病研究和防控贡献科学力量。 参与该平台组建的是国防科技大学系统工程学院吕欣教授牵头的大数据与复杂网络研究团队,该团队主要研究方向为大数据挖掘,应急管理与人类行为动力学分析,长期围绕地震、洪水、流行病等问题应用大数据技术开展应急救援工作,在海地地震与霍乱、孟加拉台风Mahasen、西非国家埃博拉、中国登革热等事件中得到广泛应用。 该团队基于新型冠状病毒大数据交叉学科研究平台,利用海量多源异构大数据,结合疫情发生发展规律,对人群流动及传播风险进行了综合建模和分析,为政府决策提供了参考依据。
国防科技大学 2021-04-10
大数据挖掘在植物表观遗传组学中的应用
近年随着测序技术的不断完善,生物领域积累了大量基因组、转录组、表观组学数据。怎样有效利用这些数据挖掘生物学新知识,是研究工作者在大数据时代面临的挑战。该研究以DNA甲基化测序数据入手,探索了大数据挖掘揭示生物学新知识的研究之路。翟继先课题组重新分析了公共数据库中来自不同实验室的约500余组Col-0型拟南芥DNA甲基化数据:通过比较单个突变体和多个野生型,鉴定了每个突变体中高置信度的DNA甲基化差异区域,进而分析了不同突变体间DNA甲基化差异区域的重合度,揭示控制DNA甲基化相关基因之间的联系。
南方科技大学 2021-04-13
基于物联网的智慧农业大数据集成应用系统
采用层次化、模块化设计,整个系统由数据采集控制模块、数据传输系统、自动反馈系统和显示系统组成。服务器整合数据存入数据库,采用大数据分析技术建立专家系统, 并以此作为自动调控的标准。在自动反馈系统里采用三级自动控制技术,分别是单片机控制的模块级、嵌入式网关级和服务器级,三者相互独立,互为保险,并且均可以根据实时环境状况做出调节,并自动下达控制指令。显示系统由三部分组成,一是位于农业现场的显示屏,二是 PC 终端,三是基于安卓系统的移动终端,从而实现环境参数值的实时观测和控制,并实时指导农业生产。系统可
扬州大学 2021-04-14
柴油车排放遥感大数据监测系统及监测方法
针对柴油机气态排气污染物遥感检测难题,提出了基于柴油机燃烧过程过量空气系数修正的遥感测试数据反演计算方法,从而实现对柴油车NO等气态排放物浓度实时检测,满足了国家遥感标准中对柴油车NO排放浓度检测要求。 一、项目分类 关键核心技术突破 二、技术分析 针对柴油机气态排气污染物遥感检测难题,提出了基于柴油机燃烧过程过量空气系数修正的遥感测试数据反演计算方法,从而实现对柴油车NO等气态排放物浓度实时检测,满足了国家遥感标准中对柴油车NO排放浓度检测要求。并针对国内遥感大数据提出了遥感大数据处理方法,分工况区域动态确定排放阈值,从而达到动态高精度筛查高排放柴油车的目的。在汽车排放遥感监测领域具有良好市场前景。
北京理工大学 2022-08-16
首页 上一页 1 2
  • ...
  • 9 10 11
  • ...
  • 300 301 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    63届高博会于5月23日在长春举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1