一种可扩展的重复数据检测方法,属于计算机存储技术领域, 解决现有重复数据检测方法中存储容量无法高效扩展的问题,以适应 存储需求扩大,重删系统面临升级换代的现状。本发明包括分块处理、 指纹提取、布隆过滤器检索、指纹子集表检索、未满布隆过滤器判断、 新指纹标记、布隆过滤器数量判断以及布隆过滤器阵列扩展步骤。本 发明采用布隆过滤器阵列来检索指纹数据,可快速定位检索范围,提 高检索效率,实现重复数据的检测,具有高扩展性、高查