
隐私信息与应用场景、信息表达方式、人的情绪和心理状态、时空语境均有关联,即因时而异、因人而异、因场景而异。
因此,从多模态数据中感知隐私分量、度量隐私大小必须是智能的、动态的。
隐私信息在跨系统交换过程中,不同系统保护能力可能存在差异,也需要对隐私信息进行二次动态度量。
隐私信息的智能感知与压缩感知、动态度量是隐私自动化计算的基础。
1.隐私信息的智能感知
隐私信息的智能感知是针对多模态数据形成隐私信息描述X中的隐私信息分量I,针对不同类型的数据需要使用相应的方法和工具。
例如:
针对文本数据,可以使用自然语言处理方法将文本分割为最小粒度;
针对图像数据,可以采用图像理解算法识别图像数据中包含的语义。
在此基础上,基于隐私智能感知算法,识别其中包含的隐私信息分量。
隐私信息的智能感知可以通过预先构建的隐私识别模板或者隐私知识图谱匹配来实现。
要保证隐私信息感知的准确率,则需要重点研究隐私知识图谱。
2.隐私信息的压缩感知
压缩感知(Compressed Sensing)源自信息处理领域,也称为压缩采样或者稀疏采样,通过寻找欠定线性系统的稀疏解,用于获取和重构稀疏或可压缩的信号。
相较于奈奎斯特(Nyquist)采样定理,可以用较少的采样值恢复出整个信号。
压缩感知基于信号的可压缩性,通过低维空间、低分辨率、欠Nyquist采样数据的非相关观测来实现高维信号的感知。
针对隐私感知领域,隐私信息的压缩感知是利用隐私信息的特性,使信息服务提供者采集最少的信息,达到满足个性化服务的效果,或者面向数据挖掘和机器学习的数据交换过程中对数据进行能够达到数据可用性要求的最大强度脱敏。
3.隐私信息的动态度量
隐私信息的度量是对隐私信息X中的隐私属性向量赋值,关键是确定量化操作函数的具体形式,其随场景、时间、隐私信息主体的主观看法动态变化。
特别说明:小编本人是产品出身,不懂编写代码,所以在资料整理中会更侧重的是技术构成、实现原理、产品概念、落地方法等方向。


