本发明公开了一种基于全局统计的去碎片方法,包括:确定待 备份的数据流中的各重复数据块,统计各重复数据块所对应的被引用 段中所有被引用数据的长度,得到段引用缓冲区;计算待备份的数据 流中的各重复数据块所对应的被引用段中所有被引用数据的长度与该 被引用段的长度的比值,并判断该比值是否小于设定阈值,若是则将 该重复数据块写入段中。本发明还提供了一种基于全局统计的去碎片 系统。本发明统计得到各重复数据块所对应的被引用段中所有