|
华中科技大学
华中科技大学 教育部
  • 74 高校采购信息
  • 3409 科技成果项目
  • 0 创新创业项目
  • 0 高校项目需求

一种基于函数依赖的数据清洗方法

2021-04-11 00:00:00
云上高博会 https://heec.cahe.edu.cn
点击收藏
所属领域:
电子信息
项目成果/简介:

本发明公开了一种基于函数依赖的数据清洗方法,其特征在于,

包括:对原始数据进行数据转换,以将其不同类型的属性全部转换为

数值型属性;对于数据转换后的原始数据,提取其属性的自依赖函数

特征;对于数据转换后的原始数据,提取其属性之间的互依赖函数;

根据自依赖函数特征和互依赖函数确定需要进行清洗及待清洗的属性

及样本,并根据该属性及样本形成相关清洗决策依据,判断待清洗的

属性对象是采用自依赖函数清洗还是采用互依赖函数进行清洗,若采

用自依赖函数清洗,则将不符合条件的样本根据自依赖函数确定的多

项式进行校准修复,并加上白噪声作为随机扰动。本发明能够解决大

数据中“脏数据”问题,为后续的大数据分析挖掘提供高质量的数据。

项目阶段:
未应用
会员登录可查看 合作方式、专利情况及联系方式

扫码关注,查看更多科技成果

取消