本发明属于数据挖掘领域,尤其是涉及一种基于自然共享最近邻居搜索的发现簇和离群点的算法。其特征在于,首先对数据集进行自然最近邻居搜索,当发现数据集中没有共享最近邻居的点的数量不再变化时搜索结束,得到搜索最近邻个数n;根据提出的自然共享邻居定义,计算每个对象在n近邻下得到的自然共享最近邻居关系;然后基于共享最近邻的自然邻居搜索算法确定了每个对象的自然共享最近邻域关系,根据该自然共享最近邻居关系,对数据进行聚类和离群点判别。本发明的算法中提出一种新的共享最近邻居关系和自然邻居搜索终止条件,解决了现有算法因为自然邻居关系定义不够严密及搜索条件不够科学而引起的聚类效果不好和离群点检测精度不高的问题。
扫码关注,查看更多科技成果