高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
融合架构的高时效可扩展大数据分析平台
研究背景:  大数据应用的多样化  需要的计算模型、数据模型多样化;  目前每类模型需要单独的开源系统来支持(如HDFS、HBase、Neo4j、MongoDB,Flink,Spark,Tensorflow等)。  多系统导致大数据分析平台非常复杂、效率低下。 研究目标: 研究和开发面向新型多计算模型融合架构的、高时效、可扩展的新 一代大数据分析支撑系统与工具平台FAST(Fusion-Architecture, Scalable, Time-efficient big data analysis platform)。 针对目前大数据分析平台复杂、效率低下的痛点,该系统具有三个  方面的优势:首先,这套系统采用融合架构,一方面实现关系、图、键  值、文档等多种数据模型的高效融合,另一方面实现批处理计算、流计  算的深度融合,并可以通过SQL扩展语言来进行多模型的统一查询,实现高效的跨模型查询。其次,对于复杂系统来说,时效性非常重要,这  套系统采用融合架构提高效率是实现高时效的基础,更重要的是,我们  对大数据分析从数据到用户进行了端到端的全栈时效优化。最后,对于  大数据应用来说,系统扩展性非常重要,本系统在资源层、存储层和计  算层进行了全面的扩展性优化。下面在融合架构、高时效和可扩展这三  个方面,分别详细介绍FAST系统的三个主要亮点。 融合架构 FAST系统的第一个亮点是融合架构,我们在技术方面的创新主要包  括多数据模型融合和多计算模型融合两方面。 多数据模型融合: 设计和研发了多模型数据管理与查询引擎,支持关系、图、键值、  文档等多种数据模型,实现了查询解析、查询优化、元数据管理、数据  分布等功能,将多种数据模型进行统一管理和深度融合。同时扩展了SQL语言,通过统一的查询接口支持对关系、键值、图、文档等数据进行独立访问或者跨模型查询。 经过试验,多模型数据融合查询,比Spark 2.3.4的查询时间能平均减少70.7%。目前spark等现有系统还需要手工编程方式来实现跨模型查 询,所以FAST系统在易用性上也表现良好,降低使用门槛,提高开发效率。 多计算模型融合: 在计算层实现了最常见的批处理计算和流计算深度融合,批流融合的核心方法是在系统内部实现批和流的统一表达,批是对有限数据集  的运算,流是对无限数据流的计算,我们设计了UCollection结构对批和  流数据进行统一表达,通过识别的bounded标志,来确定是批、流、或批流融合。有了统一表达,可以开展一系列融合优化来提升系统性能。 并且对上通过Unified API统一用户的批、流接口,实现二者在编程范式上的统一表达。对于批流混合的计算,融合架构系统的查询延迟比Flink 1.4.2能减少57%,吞吐量平均可以提升到6.72倍。 高时效 FAST系统的第二个亮点是高时效,即缩短大数据分析的时间消耗,  提高效率。由于大数据分析平台是一个非常复杂的系统,为了做到高时效,系统不能存在性能短板,因此需要对大数据分析的整个过程进行端到端的全栈时效优化。如图中所示,自下而上,需要在多模态存储、批流融合、机器学习、人工操作各层都进行优化。 对于多模态存储,面向应用负载和异构硬件特征进行自适应优化; 对于批流融合计算,在统一表达基础上,进行系列融合优化技术, 包括DAG优化、迭代优化、部署优化、操作符优化等; 在机器学习层面,进行模型优化、消息优化、梯度优化、概率优化 等来提高时效; 而且我们也考虑到大数据分析过程中用户人工操作的时效性问题,  通过智能地进行大数据分析方法和模型的推荐,来缩减人工操作的  时间。 可扩展 FAST系统的第三个亮点是可扩展,由于大数据应用规模很大,数据增速快,对系统可扩展性的要求非常高,为此我们在系统的资源层、  存储层和计算层进行了全面的扩展性优化。 在资源层,系统都部署在云计算的虚拟化资源之上,利用了云计算资源的弹性机制进行系统扩展。并在系统中实现了可伸缩调整模块,  能实时监控软硬件系统的状态,按照应用需求来自适应地进行弹性伸缩。 在存储层,分布式存储系统扩展性的关键在于分布式共识和一致性 协议(Raft),因此提出了KV-Raft、vRaft等进行Raft的扩展优化。 在计算层,我们扩展了机器学习模型的参数规模,使系统可以支持  到百亿级别的超大规模机器学习模型训练,并且性能方面有明显提  升。 亮点成果: 融合架构大数据分析平台目前已经在阿里巴巴双十一进行示范应用。  从2020年11月10日至11月16日一周的时间,在阿里的生产环境中,研发 的系统一直连续稳定运行,基于淘宝和天猫的实际用户信息进行大数据 分析,综合运用了本系统的存储、计算、机器学习等多个模块的能力, 累计进行了184亿件商品推荐。 同时在双十一期间,基于智能交互向导技术,也面向电子商务应用  的卖家提供了“生意参谋”应用,基于大数据分析,帮助卖家分析产品  销量变化的原因,以及促销的有效手段等。
中国人民大学 2021-05-09
基于极化码的分段CRC校验堆栈译码方法及架构
本发明公开了一种基于极化码的分段CRC校验堆栈译码方法,包括:将信息序列分为N部分;对每一段最后一位比特在极化码码字序列中的位置进行标记;在进行堆栈译码的过程中,当译码长度到达标记位置时,实施CRC检验,若通过,则该译码路径存活,若不通过,则该译码路径被淘汰。与传统的方法相比,本发明大大降低了算法复杂度并使译码性能得到提升,并提升了译码的正确率。此外,在译码方法的基础上,硬件架构同时被提出,资源占据较传统算法实现了降低。
东南大学 2021-04-14
一种面向 NUMA 架构的虚拟 CPU 调度优化方法
本发明公开了一种面向 NUMA 架构的 VCPU 调度优化方法,具 体地:采集每个 VCPU 的访存信息,分析计算各 VCPU 的访存特征; 根据每个 VCPU 的内存块位置和类型,在将访存密集型 VCPU 平均分 配到不同 NUMA 节点的基础上,保证最大限度的本地内存访问;当存 在空闲的 CPU 时,根据 CPU 负载大小以及 CPU 所属节点信息,为该 空闲的 CPU 选取一个合适的 VCPU 来运行。本发明针对访存密集型应
华中科技大学 2021-04-14
非接触性智能筛查及导诊系统
赣南医学院第一附属医院曾祥泰博士研究团队联合江西憶源多媒体科技有限公司徐林楠研究团队、北京万泰中联科技以及多家大型医院共同攻关,成功研发出国内首套非接触式可视化新型冠状病毒感染的肺炎院内智能筛查诊断及防控系统并投入试运行。针对疫情蔓延形势,赣南医学院快速展开了应急科技攻关计划,从而实现导诊、分诊、就诊和预警非接触式智能一体化。 就诊时,医生通过高清双向可视对话问诊系统,实现疑似患者确诊前非接触式诊疗。同时,病历系统智能提取分析患者相关病情和检查结果,形成新冠肺炎潜在人群的疑似级别自动判别,辅助医师诊断。此外,对发热患者等潜在肺炎人群从导诊、分诊、诊间、检查和隔离区域全流程高清视频监控监测智能识别,进行智能追踪筛查和活动轨迹查询,实现全方位覆盖、不间断实时监控以及不当防护措施预警报警,同时在医院急诊科、门诊大厅等关键出入口位置,通过高清双视红外摄像仪、患者图像自动识别记忆技术以及人体高温发热提醒报警技术等,智能找出漏诊的发热疑似患者。
赣南医学院 2021-04-10
大型光学综合设计性拓展性实验系统
本实验系统还可拓展出做如下经典光学实验: 1、双棱镜干涉实验; 2、单纯的偏振光系列实验,如验证马吕斯定律等; 3、透镜成像实验; 4、光强分布实验 ; 5、自组望远镜实验、显微镜实验。
长春市长城教学仪器有限公司 2021-02-01
干悬浮性种子包衣剂生产技术
干悬浮性多功能种衣剂内含杀虫剂、杀菌剂、植物生长调节剂、肥料及保水材料,外观呈粉末状态,类似于干悬浮剂,具有较高的科技含量。与悬浮种衣剂或悬乳济相比,其特点是含量高,体积小,可节省瓶、箱等包装材料,便于贮存和运输,且贮存稳定性好。使用时,按比例加水调制即可使用,可发挥多功能的作用,但对制剂中的成膜剂等助剂的质量要求比悬浮种衣剂要高。目前,多功能干悬浮剂在国内还未大量生产。干悬浮性多功能种衣剂的功能保水吸水、透气逸氧;防病治虫、肥效缓释;壮根壮苗、调节生长;省工节本、增产增收。 根据不同农作物的特点及气候状况,具有针对性的开发了以下种衣剂: 玉米:玉米在我国东北、西北、华北、华中等地区的地下害虫主要有:蛴螬、蝼蛄、地老虎、金针虫等,开发了针对玉米以杀虫作用为主的干悬浮性多功能种衣剂。棉花:棉花的主要虫害是地老虎,主要病害有棉立枯病、炭疽病、角斑病等,针对棉花开发了以杀菌、杀虫为主的干悬浮性多功能种衣剂。小麦:小麦的主要虫害有蛴螬、蝼蛄、金针虫,主要病害有白粉病、黑穗病、赤霉病等,开发了以杀菌、杀虫为 的干悬浮性多功能种衣剂。
武汉工程大学 2021-04-11
先进的过程设备预测性维修规划技术
通过发展与时间相关的破坏理论,形成了结构弱点识别技术,有效地解决了过程设备何处修与何时修的问题,从而可对高温高压大型化的现代过程工业关键设备进行预测性维修。学术水平:国际先进,国内领先经济效益:累计4亿元以上社会效益:有力地保证了设备长周期安全可靠的运行
南京工业大学 2021-04-13
猪传染性胸膜肺炎综合控制技术
中试阶段/n本项目技术的来源于湖北省"十五"重点科技攻关项目(2001-2003)和国家自然科学基金项目(2002-2005)。猪传染性胸膜肺炎是全球养猪业常见的呼吸系统疾病,严重危害养猪业的健康发展,造成较大的直接和间接经济损失,由于该病血清型多,疾病表现形式多样化,而且与其它类症疾病不易区分,控制难度大。主要内容是根据疾病的流行状况,利用本实验室的条件和技术,分离并鉴定优势菌株,研制出适合该地区的疫苗,结合养殖场的特点,制定合理的免疫控制程序,准确评估免疫效果。该项技术中的疫苗制备部分已经完成了
华中农业大学 2021-01-12
气密性检测及泄漏点定位技术
本项目包括容器类和管道类两种测试对象的泄漏测试和泄漏点定位技术。1) 本项目得到了北京市教委产学研教育基金、国家自然科学基金、“211工程”、“985工程”等基金的资助;2) 研制了系列化的高精度气密性检测仪;3) 研制了基于红外图像处理技术进行泄漏点检测及定位的装置;4)研制了多种主要针对汽车变速器/离合器壳体的高效率、高精度在线式自动试漏机,满足了当前实际生产需要,并取得了较大的经济效益。5)将模式识别理论与方法应用于气体管道的泄漏诊断中,实现气体管道动态泄漏和稳态泄漏的检测与定位;6)研制了气
北京理工大学 2021-04-14
人才需求;技术人才:高分子材料与工程专业;材料化学专业;应用化学专业
技术人才:高分子材料与工程专业;材料化学专业;应用化学专业
山东日科化学股份有限公司 2021-09-07
首页 上一页 1 2
  • ...
  • 33 34 35
  • ...
  • 999 1000 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    64届高博会于2026年5月在南昌举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1