高等教育领域数字化综合服务平台
云上高博会服务平台 高校科技成果转化对接服务平台 大学生创新创业服务平台 登录 | 注册
|
搜索
搜 索
  • 综合
  • 项目
  • 产品
日期筛选: 一周内 一月内 一年内 不限
多属性文本自适应标注系统
成果描述:多属性文本自适应系 统主要实现对每个未 知属性的通信实体进 行属性标注的功能。 主要分为两个过程, 即训练过程和预测过 程。 在训练过程中,系统 根据用户提供的已经 具有属性的数据集、 用户选择的分类算法 所对应的参数进行训 练,得到训练模型。 在预测过程中,系统 根据用户选择的训练 模型对未知属性的数 据集中的每个实体进 行属性标注,并得到 标注过属性的数据集 。(注:在训练过程 中,用户可以使用在 训练数据集上进行交 叉验证的方法获得在 固定参数和分类算法 下模型对未知样本预 测的性能的大致估计 。)市场前景分析:随着互联网的迅速发 展,Web页面上的信 息量呈指数级急剧增 长,如何快速、准确 地从海量数据中抽取 出用户真正需要的信 息已经成为互联网对 科研工作者提出的严 峻挑战。 属性标注能够将网页 非结构化文本内容转 化为结构化的属性数 据,方便用户查询和 进一步分析使用;其 作为信息抽取的关键 一步,对提高信息抽 取的性能方面也具有 重要意义。与同类成果相比的优势分析:包括训练和预测两个 过程,实现对不同数 据集的自适应性属性 标注; 特征选择功能,可以 在训练模型时,选择 出对区分数据类别更 有用的特征词,这样 ,可以降低实体所对 应属性的维度,从而 ,减少占用的内容空 间,提高计算效率; 交叉验证功能,帮助 我们在训练阶段,就 可以了解参数和算法 的选择,对属性标注 时准确性的影响; 生成报告功能,可以 在训练阶段的交叉验 证结束后,产生一个 训练阶段的报告,帮 助用户更好地记录实 验数据、参数、时间 和准确性等信息; 评估功能,比较模型 标注结果与样本真实 标签的一致性、差异 性,以评价一个模型 的好坏。
电子科技大学 2021-04-10
多属性文本自适应标注系统
多属性文本自适应系统主要实现对每个未知属性的通信实体进行属性标注的功能。 主要分为两个过程, 即训练过程和预测过 程。 在训练过程中,系统 根据用户提供的已经 具有属性的数据集、 用户选择的分类算法 所对应的参数进行训 练,得到训练模型。 在预测过程中,系统 根据用户选择的训练 模型对未知属性的数 据集中的每个实体进 行属性标注,并得到 标注过属性的数据集 。(注:在训练过程 中,用户可以使用在 训练数据集上进行交 叉验证的方法获得在 固定参数和分类算法 下模型对未知样本预 测的性能的大致估计 。)
电子科技大学 2015-02-12
智慧政务的文本数据挖掘应用
一、项目进展 创意计划阶段 二、负责人及成员 姓名 学院/所学专业 入学/毕业时间 学号 陈泳岐 计科院/计算机科学与技术 2019.9/2023.6 201931061097 三、指导教师 姓名 学院/所学专业 职务/职称 研究方向 杨云 计科院/软件工程 讲师 数据库应用 四、项目简介 本次研究主要是在“智慧政务”等网络留言平台的基础之上对大量留言数据进行分类、提取热度并对留言的回复情况进行质量评价,构建出基于机器学习的自然语言处理平台的一系列算法实现。主要包括三种算法,分别对应于政务留言中的三个痛点问题。留言分类算法主要是用来将不同留言进行分类和标签,再分别发送到对应部门,问题处理之后,留言回复质量评价算法将官方人员的回复质量进行采集与评价,判断单位人员对留言的处理情况。留言热点计算算法能够抽取每个留言的主题并生成相应的关键词展示给政务人员。
西南石油大学 2023-07-20
一种文本分类方法与设备
本发明涉及计算机技术领域,提供一种文本分类方法与设备,所述方法包括:S1,利用基于关键词库扩充的特征选择规则,确定各目标文本的特征词集合;S2,利用基于特征词类内均匀度和特征词类间区分度的权重计算公式,计算所述特征词集合中各特征词的权重;S3,利用最大权重融合算法,对同一目标文本的特征词在不同文本类别中的权重进行权重融合运算,构建目标文本特征向量;S4,基于所述目标文本特征向量,利用多标记分类模型对所述目标文本进行分类。本发明提供的一种文本分类方法与设备,能够有效提高文本信息表达的准确性、提高模型构建的效率,确保准确高效地对文本信息进行多标记分类。
中国农业大学 2021-04-11
互联网文本内容主题概念漂移检测系统
成果描述:互联网文本内容主题 概念漂移检测系统, 通过分析数据集中的 所有文档数据的潜在 语义关系,提取出它 们之间的潜在语义主 题标示,通过评估参 数的方法,将生成的 主题时序关系用数据 的形式表示出来,并 以此为依据主动发现 待预测数据集中主题 的转变与转化现象, 并提供给用户这一主 题转移过程。市场前景分析:点。基于这些特点, 流数据的处理和分析 面临巨大的挑战,是 当前数据挖掘领域研 究的热点。 分类是数据挖掘领域 的重要课题,当前流 数据分类问题面临的 主要挑战之一就是概 念漂移问题,即数据 中学习的概念(从属 性到类别的映射)是 随时变化的。 通过对互联网中文本 内容的主题概念漂移 进行检测,对于正确 分类互联网文本等方 面具有重要的意义。与同类成果相比的优势分析:能够将生成的主题时 序关系用数据的形式 表示出来,方便用户 查看; 可以动态调整评估参 数,以实现对不同数 据集的自适应性分析; 可以将评估参数值与 发生概念漂移的主题 中心相关联,主动探 测出主题发生变化的 过程。
电子科技大学 2021-04-10
互联网文本内容主题概念漂移检测系统
互联网文本内容主题 概念漂移检测系统, 通过分析数据集中的 所有文档数据的潜在 语义关系,提取出它 们之间的潜在语义主 题标示,通过评估参 数的方法,将生成的 主题时序关系用数据 的形式表示出来,并 以此为依据主动发现 待预测数据集中主题 的转变与转化现象, 并提供给用户这一主 题转移过程。
电子科技大学 2015-02-12
基于维基百科与文本的知识单元挖掘软件
成果描述:本软件面向文本,对知识单元关联关系进行挖掘,从而实现对海量数据信息的合理利用。现在已经能够根据文本挖掘出文本所含知识单元对的对应关系,实现了从海量信息中的知识关系提取。市场前景分析:随着计算机网络的迅速发展和日益普及,因特网上的信息以指数增长。信息时代带来了海量的数字化文本,日益积累的数据使得信息的获取越来越困难。人们的时间和精力是有限的,面对如此巨大的数字资源,无法从大量数据中迅速而准确地找到有用的信息,因而需要自动化的抽取工具,来帮助人们检索海量数据。与同类成果相比的优势分析:本软件相对于其他同类成果,自动化程度更高,挖掘关系的正确性有相对提高,对海量数据中知识单元关系的挖掘有很大的用处。
电子科技大学 2021-04-10
基于维基百科与文本的知识单元挖掘软件
本软件面向文本,对知识单元关联关系进行挖掘,从而实现对海量数据信息的合理利用。现在已经能够根据文本挖掘出文本所含知识单元对的对应关系,实现了从海量信息中的知识关系提取。
电子科技大学 2015-02-12
一种基于全卷积网络的多方向文本检测方法
本发明公开了一种基于全卷积网络的多方向文本检测方法,首 先获取训练数据集中的文本块,并训练全卷积网络模型;然后利用训 练好的全卷积网络模型对测试数据集中的图片进行检测,获取文本块; 然后提取文本块的字符成分,并根据字符成分的位置信息估算图像中 的候选文本条位置;最后训练针对文本条中字符成分的全卷积网络模 型,利用训练好的模型对候选文本条进行检测,获取其中的字符成分, 根据字符成分过滤掉不需要的文本条,得到图像中文本条的位置。本 发明方法文本检测方法检测率高,且能够克服光照、遮挡、模糊等不 利因素的影响。
华中科技大学 2021-04-11
金融市场监察中借助常识知识的文本分析方法
  这项研究以现有证券市场识别可疑交易的方法为基础,提出利用信息分析技术和常识知识推理能力,进行市场新闻的文本分析,并过滤可疑交易的数量。文中所提出的算法解决了交易线索和信息线索之间的关系识别和深层挖掘的问题。在技术指标测试,数据可靠性测试和用户体验测试之下,该原型系统均表现良好。
南方科技大学 2021-04-13
1 2 下一页 尾页
热搜推荐:
1
云上高博会企业会员招募
2
63届高博会于5月23日在长春举办
3
征集科技创新成果
中国高等教育学会版权所有
北京市海淀区学院路35号世宁大厦二层 京ICP备20026207号-1