时序数据水印系列算法技术
1. 痛点问题
工业时序数据具有应用领域广、数据规模大、经济价值高的特点,蕴含的巨大商业价值,因而其安全性受到不法分子采用黑客攻击等技术手段以及雇佣商业间谍等非技术手段的威胁。数据所有者通常会采用前效方法对数据库中的数据加以保护,但是这些方法只能有效防止外部人员进行非法盗窃,对于内部人员盗窃等途径并不能有效遏制。数字水印是解决数据在传播过程中安全问题的一个主流分支,通常的数字水印采用分组多数投票方法来提升算法的鲁棒性,但时序数据通常有较多的噪声,高价值数据点相对集中,因而一个未经加权的投票算法可能会因为大范围的噪声干扰而导致水印判定失效。此外,常见时序数字水印算法基于时间戳进行水印嵌入计算,容易受到更改时间戳或频率变换的攻击,一旦时间戳序列大幅度改变,水印提取算法将受到很大影响,很可能导致水印提取完全失效。
2. 解决方案
工业物联网数据是工业大数据规模迅速扩张的主要来源。各类物联网传感器以极高的频率采集其所在设备的工作状态数据,通常为一系列包含数据产生时间戳(Timestamp)和采集数据(Data)形式为(Timestamp, Data) 的元组序列,称为时间序列。工业时序数据具有应用领域广、数据规模大、经济价值高的特点,蕴含的巨大商业价值,因而其安全性受到不法分子采用黑客攻击等技术手段以及雇佣商业间谍等非技术手段的威胁。
数据所有者通常会采用前效方法对数据库中的数据加以保护,包括但不限于:数据加密、用户权限划分等等。但是,这些方法只能有效防止外部人员进行非法盗窃,对于内部人员盗窃等途径并不能有效遏制。数字水印是解决数据在传播过程中安全问题的一个主流分支,常见时序数字水印算法基于时间戳进行水印嵌入计算,容易受到更改时间戳或频率变换的攻击,一旦时间戳序列大幅度改变,水印提取算法将受到很大影响,很可能导致水印提取完全失效。此外,数字水印通常采用分组多数投票方法来提升算法的鲁棒性,但时序数据通常有较多的噪声,高价值数据点相对集中,因而一个未经加权的投票算法可能会因为大范围的噪声干扰而导致水印判定失效。
本项目针对常见的水印失效场景进行了分析,提出了能够有效提示水印鲁棒性的技术,更好的确保数据安全的管理能力。
3.合作需求
在全国范围内工业互联网/工业大数据相关领域寻求应用场景,希望能与能源/装备制造行业的大中型企业开展这方面的合作研究和落地实施;并针对上述企业开展包括二次开发在内的各类实际应用,助力企业降本增效、转型升级。
清华大学
2023-02-14