本发明涉及一种基于划分的多区穿越向量近似检索方法和系统,方法包括:获取待搜索的数据集,对数据集以采样比λ采样一部分向量作为路由向量,对数据集中未被采样的向量随机划分为m个分区,将路由向量作为各个分区的共享向量;对m个分区分别构建稀疏近似近邻图;接收查询信息,以第一候选集队列长度进行第一阶段搜索,逼近到查询信息附近的区域;在逼近的区域中以第二候选集队列长度进行第二阶段搜索,若搜索过程中扩展到路由向量,则将该路由向量在所有分区中的副本加入到候选集队列中,进行跨分区的动态搜索。与现有技术相比,本发明在各类图算法的测试中,几乎在所有精度要求下均能实现1.5倍至2倍的查询效率提升。
扫码关注,查看更多科技成果