1. 痛点问题
工业时序数据具有应用领域广、数据规模大、经济价值高的特点,蕴含的巨大商业价值,因而其安全性受到不法分子采用黑客攻击等技术手段以及雇佣商业间谍等非技术手段的威胁。数据所有者通常会采用前效方法对数据库中的数据加以保护,但是这些方法只能有效防止外部人员进行非法盗窃,对于内部人员盗窃等途径并不能有效遏制。数字水印是解决数据在传播过程中安全问题的一个主流分支,通常的数字水印采用分组多数投票方法来提升算法的鲁棒性,但时序数据通常有较多的噪声,高价值数据点相对集中,因而一个未经加权的投票算法可能会因为大范围的噪声干扰而导致水印判定失效。此外,常见时序数字水印算法基于时间戳进行水印嵌入计算,容易受到更改时间戳或频率变换的攻击,一旦时间戳序列大幅度改变,水印提取算法将受到很大影响,很可能导致水印提取完全失效。
2. 解决方案
工业物联网数据是工业大数据规模迅速扩张的主要来源。各类物联网传感器以极高的频率采集其所在设备的工作状态数据,通常为一系列包含数据产生时间戳(Timestamp)和采集数据(Data)形式为(Timestamp, Data) 的元组序列,称为时间序列。工业时序数据具有应用领域广、数据规模大、经济价值高的特点,蕴含的巨大商业价值,因而其安全性受到不法分子采用黑客攻击等技术手段以及雇佣商业间谍等非技术手段的威胁。
数据所有者通常会采用前效方法对数据库中的数据加以保护,包括但不限于:数据加密、用户权限划分等等。但是,这些方法只能有效防止外部人员进行非法盗窃,对于内部人员盗窃等途径并不能有效遏制。数字水印是解决数据在传播过程中安全问题的一个主流分支,常见时序数字水印算法基于时间戳进行水印嵌入计算,容易受到更改时间戳或频率变换的攻击,一旦时间戳序列大幅度改变,水印提取算法将受到很大影响,很可能导致水印提取完全失效。此外,数字水印通常采用分组多数投票方法来提升算法的鲁棒性,但时序数据通常有较多的噪声,高价值数据点相对集中,因而一个未经加权的投票算法可能会因为大范围的噪声干扰而导致水印判定失效。
本项目针对常见的水印失效场景进行了分析,提出了能够有效提示水印鲁棒性的技术,更好的确保数据安全的管理能力。
3.合作需求
在全国范围内工业互联网/工业大数据相关领域寻求应用场景,希望能与能源/装备制造行业的大中型企业开展这方面的合作研究和落地实施;并针对上述企业开展包括二次开发在内的各类实际应用,助力企业降本增效、转型升级。
现有数字水印技术通常针对关系型、文档型、视频、图像、音频的数据,时序数据管理领域的水印工作仍处于起步和探索阶段。本技术直接面向工业时序数据管理这一快速发展的领域,应用前景广阔。
本项目提出一种具有时间戳对齐功能的时序数据水印方法,该方法可以识别时序数据的核心特征,通过自动监测时间序列数据的关键点,自动对齐时间戳,保证时序数据中插入的水印信息,不会因为频率变换、插入、删除等攻击而失效,也使得对时间戳本身的修改无效,有效防止了时序插入和时序删除攻击对水印提取的影响。
图1:一种具有时间戳对齐功能的时序数据水印算法示意图
本项目提出的另一种基于数据特征权重分析的时序数据水印比较方法,采用数据特征分析,通过分析与比较时间序列数据的相对价值密度,赋予高价值密度数据点更高的数字水印权重,通过加权投票分析,保证高价值密度区域的数据安全,确保在高价值区间的水印重合更容易被监测,大幅度提升数字水印方法的可检测性和安全性。
图2:一种基于数据特征权重分析的时序数据水印比较算法示意图
两者都是面向工业时序数据水印这一关注较少的领域,现有视频、音频数据水印方法可一定程度上运用至时序水印领域,但由于缺乏针对工业时序数据的定制优化,效果并不理想。本技术具有一定的先进性,目前属于理论研究和内部测试阶段,理论和方法基本成熟,尚未针对工程应用进行完善。
扫码关注,查看更多科技成果