高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
理学院大数据研究团队在人工智能与大数据处理领域发表系列高水平研究成果
我校理学院大数据研究团队在人工智能与大数据处理技术研究方面取得系列进展,研究成果分别发表在IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Cybernetics和Information Sciences三大人工智能顶级期刊。神经网络是人工智能领域中目前最为火热的研究方向——深度学习的架构基础。虽然深度学习在近几年发展迅速,但是关于如何设计最优神经网络架构的问题仍处于探索阶段。该团队分别针对人工智能中神经网络结构复杂、高维大规模数据存在无效和冗余特征、难以获取长时序信息等问题与缺陷,设计出了一系列网络结构优化、大数据特征选择和时序循环神经网络模型,有效改善了上述不足,提高了人工智能模型的学习性能。 题目为《带Group Lasso惩罚与控制冗余的神经网络特征选择》(Feature Selection using a Neural Network With Group Lasso Regularization and Controlled Redundancy)的研究论文发表在人工智能领域权威国际期刊IEEE Transactions on Neural Networks and Learning Systems。王健副教授和博士生张华清为该论文共同第一作者, 我校荣誉教授Nikhil R. Pal院士(印度统计研究所)参与指导,中国石油大学(华东)为第一署名单位。该项工作得到国家自然科学基金、国家科技重大专项、山东自然科学基金、中央高校基本科研业务费、中国石油天然气集团公司重大科技项目以及山东省高校青年创新科技支撑计划的资助。 特征选择技术也称属性选择,是指从原始特征或属性中选择出最有效的特征或属性以降低数据维度的过程,它是人工智能数据预处理环节的重要步骤,也是大数据处理技术的重要环节。该项工作在神经网络中嵌入Group Lasso惩罚项并实现特征冗余控制,在选出对解决问题最有帮助、蕴含信息量最大的特征或属性的同时,控制所选特征子集的冗余程度,以达到降维的最优效果,从而使模型的泛化能力更强,降低神经网络模型产生过拟合的风险。 题目为《基于L1正则化的神经网络结构优化模型设计与分析》(Learning Optimized Structure of Neural Networks by Hidden Node Pruning With L1Regularization)的研究论文发表在国际人工智能领域权威期刊IEEE Transactions on Cybernetics。硕士生谢雪涛和博士生张华清为论文共同第一作者,王健副教授为通讯作者,我校荣誉教授Nikhil R. Pal院士(印度统计研究所)参与指导,中国石油大学(华东)为第一署名单位。该项研究成果得到了国家自然科学基金、山东省自然科学基金和中央高校基本科研业务费的资助。 该项工作借助L1正则子具有的稀疏表达能力,提出两种神经网络结构优化学习模型;本项工作另外一个突出贡献就是提出了一种简单且具有通用性的收敛性证明方法,同时保证了模型设计的合理性。实验结果表明所提出模型具有强大的鲁棒性、广泛的适用性、理想的剪枝能力和良好的泛化能力,适用处理高维大数据。该研究成果在人工智能与深度学习构造最简网络结构方面具有很强的指导作用和应用推广价值。
中国石油大学(华东) 2021-02-01
大数据交易应当重视和研究的几个问题
《大数据交易应当重视和研究的几个问题》指出,为了保证交易数据来源的正当性和交易主体的合法性,为了有效克服大数据交易中的问题和风险,对于数据这种新型特殊财产的权属、开发利用及流转的特殊规律应当抓紧研究,相关制度建设要及时跟进。该报告建议从两方面入手:一是从私法角度明确数据的财产性质及其权属分配规则。在充分保护人格权和商业秘密的基础上,将数据产权按价值贡献在被采集者、采集者以及数据加工者等相关主体之间进行合理分配。二是从公法角度明确关于数据采集、加工,大数据产品的开发、流转等的监管规范。要明确数据的采集和利用不得违背公认的社会道德和善良风俗;在不损害相关主体的合法权益和公共利益的前提下,推动政府数据公开共享;禁止有可能威胁国家安全的跨境数据流动。
中央财经大学 2021-02-01
中国区域高分辨率气象驱动数据集
清华大学地球系统科学系阳坤教授课题组在《科学数据》(Scientific Data)上发表题为“The first high-resolution meteorological forcing dataset for land process studies over China”的研究成果,发布了过去十年间阳坤团队开发的一套服务于陆面、水文、生态等地表过程模型的中国高时空分辨率气象数据集。该数据采用严格的数据质量控制,统一的站点数据、卫星数据和再分析数据的融合方法,避免了不同学者对同一研究区域气象数据的重复处理。近地面气象数据是地表模型的主要驱动。自2004年美国国家航空航天局(NASA)发布全球陆面数据同化(GLDAS)气象数据以来,北美、欧洲等区域高分辨率气象驱动数据集也不断涌现。阳坤教授团队自2008年起利用中国气象局数据共享的契机,开始了中国区域高分辨率气象驱动数据集的开发,建立了气象数据的预处理系统和融合系统,完成了首套相对稳定可靠的长时间序列数据产品。该数据集覆盖了中国陆地区域,时间跨度为40年(1979-2018),空间分辨率0.1度,时间分辨率3小时,包括了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等 7 个变量。基于独立站点数据的评估表明,该数据集较国际上广泛使用的 GLDAS 数据集具有更高精度。目前,该中国区域高分辨率气象驱动数据集已发布在国家青藏高原科学数据中心,可免费获取。原文链接:https://www.nature.com/articles/s41597-020-0369-y数据网址:https://doi.org/10.11888/AtmosphericPhysics.tpe.249369.file
清华大学 2021-04-10
基于138名新冠肺炎病人临床数据的研究
这项研究收集了2020年1月1日至1月28日期间,中南医院收治的138名新冠肺炎病例数据,其中40名(29%)医护人员和17名(12.3%)住院病人受到院内交叉感染。受感染的医护人员中,31人在普通病房工作,7人在急诊部门,2人在重症监护室。 武汉中南医院的这项单中心病例分析成果,清楚阐释了新冠肺炎的临床特征和治疗经验,为抗“疫”阻击战取得进一步胜利打下坚实基础。同时,研究证明“超级传播者”存在的可能性和病毒不可小觑的侵袭力,全员警戒一刻不容松懈,尤其要求一线的医护战士得到最严格的防护武装。
武汉大学 2021-04-10
玻璃与混凝土火灾现场痕迹图谱数据库
火灾事故调查是是一项技术性、政策性、规范性、法律性和时效性都很强的工作。由于火灾现场的千差万别,火灾调查这一专业执法工作所涉及的知识面特别广泛,在现场勘查过程中遇到的专业问题又相互交织在一起,加之建筑新材料、新工艺、新技术、新产品的不断涌现,使得火灾现场典型痕迹的发现和识别显得尤为重要。本课题选题从消防部队实际需求出发,以实际火灾现场中的痕迹为主要研究对象,收集提炼玻璃和混凝土等常见材料在火场高温条件下的痕迹特征,以解读痕迹形成的过程和规律,为火灾调查工作的开展提供有力支撑。
中国人民警察大学 2021-05-03
分层检测空移键控传输系统接收端数据检测
包括以下步骤:第一步、确立接收端模型;第二步、化简接收端模型;第三步、通过分层检测算法解调出发送的数据。本发明的基于分层检测的空移键控传输系统接收端数据检测方法,其误码(BER)性能随着搜索半径的增加逐渐逼近最优检测算法(ML),当搜索半径为发送端天线数目时,本发明的检测算法等价于最大似然检测算法。本算法通过对每层进行计算排序使得在较小的搜索半径下可获得接近最优检测算法的误码率性能,因此本发明能在获得较好性能的同时,大幅度降低接收端算法的复杂度。
电子科技大学 2021-04-10
基于大数据的能源互联网能量管理系统
随着电网数据规模越来越大,所蕴含的价值也越来越多。清华大学信研院研发了基于机器学习方法的能源互联网能量管理系统,主要功能为对电网的稳定性进行预测和可视化。系 统分为训练部分和预测部分。训练部分通过历史数据进行机器学习,建立一个电压稳定性的 分类器。分类器训练完成后,再对新增的未知数据进行预测。训练部分主要分为特征提取、 类别标记、特征压缩、分类器类型选择。预测部分主要分为分类器数据启动阶段和预测输出 阶段。本系统提出利用机器学习方法对电网电压稳定性进行预测,进一步综合多个节点给出 电网态势感知的评估结果。在训练每一个节点分类器的时候,本系统将特征选取的时段和预 测时间节点拉开,形成一种延时的预测方法,本发明对复杂系统有着更好的还原效果。2 应用说明本系统实施电压稳定性预测的具体步骤为:步骤 1:通过部署在关键测点的同步相角测量单元 PMU 采集电网实时数据,所述 实时数据包含电网中每个关键测点的电压 U、 有功 P、无功 Q、电流 I;分别计算 U 的衍 生量 dU/dt,Q 的衍生量 dQ/dt,电压的变化 量比上无功的变化量的衍生量 dU/dQ,用这 些衍生量作为特征,来表征量的时间变化速 率;步骤 2:对步骤 1 中提取的特征进行数 据降维与压缩;根据特定时刻电压 U 是否恢 复到标准值的 0.8 倍来区分每组样本组是否 稳定,用 0 标记稳定,用 1 标记不稳定;步骤 3:选择分类器,建立一个电压稳 定性的分类器;步骤 4:训练分类器;当分类器训练完 成后,将训练好的参数储存起来;步骤 5:进入预测部分的数据启动阶段, 填充特征矩阵,没有输出;步骤 6:把多个节点的特征按照顺序排列,形成特征矩阵;特征矩阵填充完成后, 根据分类器给出的预测结果;特征时段向前滑动,最初的特征被抛弃,新特征补充在队尾, 分类器持续给出预测结果;步骤 7:每隔一定时间间隔 ,要把新收集来的数据与以前的数据一起,重新回到步骤 4 训练分类器,更新参数。在具体系统搭建过程中,我们充分利用现有机器学习平台。其中 Hadoop 的文件管理系统 HDFS 负责数据存储;Spark 负责模型训练;Storm 负责在线预测;Kafka 负责在 Storm 和Hadoop 之间传递更新后的模型参数。
清华大学 2021-04-11
基于大数据 AI 的智能网络规划及运维
基于大数据和 AI 的应用,可实现复杂场景下的网络问题识别、多场景优化方案的协同策略方案的动态和自动化执行。可以构建智能网络规划及运维平台,以实现极致性能和极简运维,使能新业务的自动化覆盖优化、移动性优化、负载均衡优化、节能优化、故障分析与定位。同样可以基于无线数据和视频数据融合的用户个体及群体行为在多场景应用下,充分发挥5G的优势,创造巨大的社会效益。
东南大学 2021-04-11
社交网络中舆情数据的精准实时抓取与实证
舆情监控是整合互联网信息采集技术及信息智能处理技术通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握网民思想、行为动态,做出正确舆论引导,提供分析依据。西安交通大学大数据分析技术与算法国家工程实验室舆情大数据分析研究小组在舆情监控领域进行了大量的研究工作,在数据方面构建了包括 Facebook、Twitter、微博、贴吧、门户网站、论坛在内的 100 余处主流站点的数据,构建了包括文本、图片、视频等在内的跨模态舆情大数据。该项目团队拥有完整独立自主的知识产权,实现了技术的自主可控,并且能够提供一站式社交网络信息处理方案和技术支持,如更广的数据采集扩展、丰富的数据分析、多样的舆情报告、多端的平台应用。目前该系统已应用于教育部考试舆情监控系统、榆林舆情监控系统、丝路学院知识中心,用户涵盖国家部委、公安、宣传、军队、高校等领域,并获得了用-- 25 --西安交通大学国家技术转移中心户的一致认可和高度评价。
西安交通大学 2021-04-10
基于HOOK云存储应用加密数据包破解方法
本发明(专利号ZL 201510665184.8,2018/9/21授权)涉及一种基于HOOK 的云存储应用加密数据包破解方法,分析云存储客户端程序,找到需要设置HOOK 点的函数,通过获取并且修改API传入的参数,进而返回结果,获取云存储客户端与服务器进行通信的数据明文。本发明适用各种语言实现的云存储客户端,对于认证的方式没有特殊要求,具有广泛的兼容性;不受用户网络环境的影响,无需在客户端和服务器之间增加代理服务器、不受客户端Certification pinning 安全技术的限制,具有广泛的适用性。
厦门大学 2021-04-10
首页 上一页 1 2
  • ...
  • 70 71 72
  • ...
  • 167 168 下一页 尾页
    热搜推荐:
    1
    云上高博会企业会员招募
    2
    64届高博会于2026年5月在南昌举办
    3
    征集科技创新成果
    中国高等教育学会版权所有
    北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1