高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
用于大数据处理系统的内存数据集置换系统与置换方法
本发明公开了一种用于大数据处理系统的内存数据集置换系统, 包括分析模块、信息监测模块、决策模块。分析模块用于对上层用户 程序进行逻辑分析,得出各运算阶段中生成内存数据集时的运算步骤 集合;信息监测模块用于对运行中的用户程序进行监测,并收集生成 内存数据集时的信息提交给决策模块;决策模块用于对收集到的信息 进行分析和排序,判断当前阶段是否需要对系统中的内存数据集进行 置换,在系统需要进行置换时确定需要移除的内存数据集并
华中科技大学 2021-04-14
一种基于 GPU 的异步图数据处理系统
本发明公开了一种基于 GPU 的异步图数据处理系统,包括:实 现一个混合着色的算法:将原有的单一、启发式着色算法改为混合着 色算法;数据预处理策略:将原有的基于顶点度数的预处理分割方法 改为基于顶点着色分布的方式;异步处理执行引擎:将处理引擎的执 行方式由同步 BSP 方式改为异步处理的方式,结合混合着色算法模块, 实现 GPU 上的无锁异步编程;在异步处理执行引擎内部,实现迭代处 理模块、数据流执行模块,对 CPU
华中科技大学 2021-04-14
一种基于图数据处理系统的数据并行访问方法
本发明公开了一种基于图数据处理系统的数据并行访问方法, 所述方法包括以下步骤:S1、载入图数据至内存,将图数据各节点平 均分配至各处理器上并行处理;S2、各处理器调用图算法并行处理分 配至自身的图数据节点,处理过程中对图数据节点进行原子性读写; S3、将经图算法处理后的所有图数据节点写回至硬盘形成完整图数据, 判断所有图数据节点是否均收敛,如果收敛,则流程结束;如果不收 敛,则返回步骤 S1 进行下一次循环直到写回至
华中科技大学 2021-04-14
大数据处理平台
可以量产/n该项目是提供一个大数据处理框架和处理平台,具备较强的大数据 处理能力。 该项目需求广泛,将产生较大的经济效益。
华中科技大学 2021-01-12
高性能大数据处理平台
项目简介 本成果基于高性能计算技术和大数据存储与处理技术,避开传统依赖单个计算机或 集群计算的缺点,应用先进的分布式文件系统和并行计算架构,使用普通的 PC 级机器构 建高性能的大数据处理平台。属国内领先项目。该成果处于中试研究阶段,并申请了专 利,专利号:ZL201010510071.8。 性能指标 (1)能利用 PC 级机器实现高速的大数据处理。 (2)能高效存储和管理海量的数据。 (
江苏大学 2021-04-14
交互式大数据处理与分析技术
1.痛点问题 多年来,工业大数据领域大数据分析算法和模型都是基于大量代码实现,效率低,难以实现快速开发。同时,工业大数据处理分析模型处理过程多由多个算法通过一定的计算流程构成,计算流程复杂多变,迫切需要一款支持灵活定制和快速开发的处理分析技术来支持工业大数据处理分析。 2.解决方案 清华数为交互式大数据处理与分析技术针对工业大数据处理与分析任务的交互式探索、建模、调试和应用而设计。根据CRISP-DM设计原则,一般大数据处理与分析分为业务理解、数据理解、数据准备、建模、评估和部署等阶段,各阶段相辅相成,形成一个大数据处理分析生命周期。 图1.交互式大数据处理与分析技术设计思想 本成果技术基于上述CRISP-DM的设计思想而设计,完全支持大数据处理与分析生命周期。该技术的特点包括: (1)内置数百种通用和专用的大数据分析算法和模型,并提供了按需扩展机制,用户可以按照自己的需要随时添加和扩充,以支持客户特定的大数据应用需求; (2)支持拖拽方式构建处理与分析流程,完全图形化设计大数据处理分析计算流程,并能在设计过程中进行单步/多步运行调试,查看中间结果,实时调整运行结果,以获得用户期望的处理分析结果; (3)支持机器学习模型训练及使用,内置了机器学习模型训练框架,一般机器学习模型在该技术的支持下,可以实现快速训练,训练结果可支持进一步的大数据处理与分析; (4)支持数据处理与分析流程参数化,在其提供的内部数据处理与分析算法模板中,用户通过算法模板可以开发面向Java、Python的算法,并集成和扩展到该技术的算法集合,实现按需定制处理分析; (5)支持数据画像和学习模型可视化,以图形化的方式定制数据画像的方法模型,并以二维和三维图表的形式展示给用户; (6)支持批处理、流处理和流转批处理三种处理方式; (7)按需定制运行计划与资源有效利用,用户可设置任务执行计划,任务执行计划定期运行,以实现周期性处理分析,方便获得持续的运行结果。 清华数为交互式大数据处理与分析技术面向多种用户角色,包括数据工程师、数据分析师、数据科学家、算法工程师、运维工程师、代码工程师等。采用分层设计,分为客户层、服务层、计算层。 客户层包括流程建模调试工具,用户可用工具图形化拖拽式设计处理与分析计算模型,并可进行调试和查看中间结果;管理工具,针对服务层所调用和访问的计算框架或者外部系统进行管理,包括对于数据源、计算环境、存储环境等的管理工具。 服务层主要包括流程调度服务,即负责按照用户所设定的工作计划来定时调度执行计算模型;执行服务,是负责执行处理分析计算的模型和算法的服务;计算资源管理服务负责管理执行服务中所能集成的所有的服务,如计算框架和存储设施等。 计算层是执行服务在执行处理分析算法和模型中所访问的外部服务,包括计算组件或框架,以及持久化存储组件或者系统等。 图2.交互式大数据处理与分析技术架构 本成果的交互式处理与分析技术较好地解决了工业大数据处理分析工作中所遇到的问题和痛点,并且能够广泛应用于多个行业和领域中,如能源、矿山、医疗器械、装备制造业、消费品制造业、工程机械行业等。 合作需求 期待与工业、医疗等领域企业紧密合作,获得各领域的实际需求,促使该技术不断完善和升级迭代,走向成熟。 未来将在工程机械行业、医疗机械行业、矿山行业、装备制造行业、互联网电商行业等寻求更多的成果转化、深度合作机会,在合作基础上,推动上述行业领域实现数字化转型和智能化升级,为国家实现“双碳”目标做出清华贡献。
清华大学 2022-04-25
基于内存计算的高时效大数据处理平台
小试阶段/n该平台继承了目前主流计算框架和编程模式,尤其是内存计算框架, 通用性强、时效性高。该平台从根本上解决了目前大数据处理中耗时过 长的问题,通过优化大数据处理系统的任务管理和内存管理,对用户提 供主流的简洁编程接口,与目前国际上主流系统对比,该平台可以大量 减少内存占用,最高性能提升可达 41 倍,。该平台同时从根本上解决了 大数据系统自动管理内存的开销,减少 90%以上的开销。该技术平台是一 种通用数据处理平台,不影响上层生态应用,可以适用于各类大数据生 态系统,包括机器学习与深度学习领域
华中科技大学 2021-01-12
高性能XMLXML数据处理技术
北京工业大学 2021-04-14
理学院大数据研究团队在人工智能与大数据处理领域发表系列高水平研究成果
我校理学院大数据研究团队在人工智能与大数据处理技术研究方面取得系列进展,研究成果分别发表在IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Cybernetics和Information Sciences三大人工智能顶级期刊。神经网络是人工智能领域中目前最为火热的研究方向——深度学习的架构基础。虽然深度学习在近几年发展迅速,但是关于如何设计最优神经网络架构的问题仍处于探索阶段。该团队分别针对人工智能中神经网络结构复杂、高维大规模数据存在无效和冗余特征、难以获取长时序信息等问题与缺陷,设计出了一系列网络结构优化、大数据特征选择和时序循环神经网络模型,有效改善了上述不足,提高了人工智能模型的学习性能。 题目为《带Group Lasso惩罚与控制冗余的神经网络特征选择》(Feature Selection using a Neural Network With Group Lasso Regularization and Controlled Redundancy)的研究论文发表在人工智能领域权威国际期刊IEEE Transactions on Neural Networks and Learning Systems。王健副教授和博士生张华清为该论文共同第一作者, 我校荣誉教授Nikhil R. Pal院士(印度统计研究所)参与指导,中国石油大学(华东)为第一署名单位。该项工作得到国家自然科学基金、国家科技重大专项、山东自然科学基金、中央高校基本科研业务费、中国石油天然气集团公司重大科技项目以及山东省高校青年创新科技支撑计划的资助。 特征选择技术也称属性选择,是指从原始特征或属性中选择出最有效的特征或属性以降低数据维度的过程,它是人工智能数据预处理环节的重要步骤,也是大数据处理技术的重要环节。该项工作在神经网络中嵌入Group Lasso惩罚项并实现特征冗余控制,在选出对解决问题最有帮助、蕴含信息量最大的特征或属性的同时,控制所选特征子集的冗余程度,以达到降维的最优效果,从而使模型的泛化能力更强,降低神经网络模型产生过拟合的风险。 题目为《基于L1正则化的神经网络结构优化模型设计与分析》(Learning Optimized Structure of Neural Networks by Hidden Node Pruning With L1Regularization)的研究论文发表在国际人工智能领域权威期刊IEEE Transactions on Cybernetics。硕士生谢雪涛和博士生张华清为论文共同第一作者,王健副教授为通讯作者,我校荣誉教授Nikhil R. Pal院士(印度统计研究所)参与指导,中国石油大学(华东)为第一署名单位。该项研究成果得到了国家自然科学基金、山东省自然科学基金和中央高校基本科研业务费的资助。 该项工作借助L1正则子具有的稀疏表达能力,提出两种神经网络结构优化学习模型;本项工作另外一个突出贡献就是提出了一种简单且具有通用性的收敛性证明方法,同时保证了模型设计的合理性。实验结果表明所提出模型具有强大的鲁棒性、广泛的适用性、理想的剪枝能力和良好的泛化能力,适用处理高维大数据。该研究成果在人工智能与深度学习构造最简网络结构方面具有很强的指导作用和应用推广价值。
中国石油大学(华东) 2021-02-01
大规模并发数据流处理系统及其处理方法
一种大规模并发数据流处理系统及其处理方法,涉及数据处理技术领域,所解决的是提高流处理器处理效率的技术问题.该系统包括数据流单元缓冲区,数据流单元聚类队列池,数据流单元映射表,流处理器池,数据流读取部件,DSU聚类分配部件,任务调度部件,计算后处理部件,所述流处理器池由多个GPU构成,其中数据流读取部件用于将并发数据流写入数据流单元缓冲区,DSU聚类分配部件用于对数据流单元缓冲区中当前被处理的数据流单元进行分类,任务调度部件用于将数据流单元聚类队列池中的就绪队列加载至流处理器池中的GPU上执行流计算,计算后处理部件用于将GPU的计算结果返回到数据流.本发明提供的系统,能提高流处理器的处理效率.
上海理工大学 2021-05-04
1 2 3 4 5 6
  • ...
  • 633 634 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    63届高博会于5月23日在长春举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1