近日,中心研究生梅雅欣同学在数据安全存储方向工作“Privacy-Enhanced Cooperative Storage Scheme for Contact-free Sensory Data in AIoT with Efficient Synchronization”被国际学术期刊ACM Transactions on Sensor Networks录用。
ACM Transactions on Sensor Networks是传感器网络领域顶级期刊,重点关注传感器网络的新概念、新技术、新分析或新结构,长期以来一直是该领域受关注较高的国际期刊,属于CCF(中国计算机学会)推荐的B类国际学术期刊。
该工作作者为2023级博士研究生梅雅欣(第一作者),指导老师王田教授,合作老师湖南大学刘琴副教授、广州大学陈淑红副教授。
该工作聚焦解决非接触式感知数据在云中心存储时的隐私安全与数据同步问题,提出了一种云边端协同的存储及同步方案,该方案充分利用云端、边缘端和终端的能力差异,将处理后的感知数据分别存储在三端,并利用增量更新提高同步效率。理论分析和仿真实验结果表明,该工作所提方法能够避免恶劣环境下的隐私泄露,并且只有较小的同步开销。
研究背景与动机
智能物联网(Artificial Intelligence of Things, AIoT)技术的发展推动了全球感知数据的显著增长,将数据交由云中心存储和分析已经成为了一种主流模式。传统的云存储技术虽然减轻了终端存储负担,但广泛的开放性是云计算环境的固有特征。因此在AIoT中,数据面临着极高的隐私泄露风险。此外,在一些对延迟敏感的应用程序中,云服务器和终端设备之间的通信成本和高延迟是无法忍受的。当数据频繁波动时,云服务器与终端设备间的数据同步会导致冗余通信和高延迟。同时,由于云服务提供商本身是“诚实且好奇的”,依托于云存储技术的方法仍无法保证数据的可靠性与可用性。针对上述问题,我们对近期流行的云边端协同模型展开了研究,该模型不仅可以优化计算任务分配,提高计算效率,还可以提高数据存储安全性。设计基于云边端协同的存储和同步方法,需要设计合理的数据划分策略以保护数据隐私性和保证数据的可用性。但分层的数据存储策略会给频繁更新的动态数据增加同步上的计算复杂度,同时增加更新时的计算或带宽消耗。因此如何设计数据划分策略,并根据该策略设计高效的数据同步方法是本工作的关键问题。
解决方案
1、协同存储方案
首先对数据对象进行Reed-Solomon编码,得到数据块集{D1, D2, …, Dk}和冗余块集{C1, C2, …, Cm}。然后根据信息熵对数据块进行处理,选取数据块Di中信息密度较低且访问频率较高的数据作为Basic Data,存储在终端;其余信息密度高的数据作为Service Data存储在云端。冗余块{C1, C2, …, Cm}被放置在边缘端。根据Reed-Solomon编码的性质,这加大了第三方窃取数据获得隐私的难度。
图1 协同存储方案
2、基于边缘的数据同步
1)单轮数据更新
数据更新包括两个部分:数据块更新和冗余块更新。对于数据块的更新采用了全写策略,而由于冗余块是数据块线性组合的结果,因此可以采取增量更新,该过程由云边端协作完成。
图2 协同更新过程
2) 批量数据更新
在AIoT中,同一位置的数据可能会频繁更新,始终对该位置信息进行即时更新会造成一定程度的资源浪费。找到触发批更新的适当时间间隔是一个挑战,时间间隔过长或过短都会对上层应用造成影响。我们设计了一种基于二分法的自适应阈值调整算法,该算法以更新数据块的数量和更新数据的大小作为自适应标准,能够很大程度解决上述问题。

实验评估
为了评估同步方法的有效性,我们进行了仿真实验,从通信开销和更新时间两个方面评估。对比算法为两种基于增量更新的经典算法,分别是DUM(分布式更新)和PUM(集中式更新)。部分实验结果如下。
图4 不同数据对象大小、数据块大小和修改数据大小对通信开销的影响
图5 不同数据对象大小、数据块大小和修改数据大小对更新时间的影响
对比实验表明,DUM由于节点之间的连接而具有最高的通信开销,更新时间适中。由于采用集中式更新,PUM的通信开销最小,但容易造成计算瓶颈,会消耗更多的时间。与其他更新方法相比,本工作所提的方法所需更新时间最少,且通信开销与PUM相近。此外,结合批量更新,同步效率表现更优。
总结
本工作提出了一种隐私增强的协同存储方案,综合考虑了数据的访问频率、价值密度和数据同步差异,将数据分为三部分并分别存储在云端、边缘端和终端。从隐私性和可靠性两方面论证了该方案在隐私保护方面的有效性。同时根据块的特性设计了基于边缘的更新算法。仿真实验表明该算法与其他两种典型更新算法相比能在带宽消耗和更新时间上都取得较好的表现。