
不同类型的隐私保护算法虽然具有不同的数学基础理论,但不论数学基础是否相同,隐私保护算法设计准则均应从算法模型化的角度设计算法的整体框架,考虑算法框架各环节间的关联关系,以框架为基础将不同保护要求参数化,分析算法组合对保护效果影响的规律,并对算法的复杂度和效能建立量化分析体系。
隐私保护算法设计准则是实现隐私保护系统的架构设计、隐私保护状态的传递/迁移的基础,也是保证隐私保护系统实现代码相对稳定、易于在线升级的基础。
算法模型化是针对不同保护效果的需求,在保持代码架构不变的情况下只需改变参数设置即可完成。
同时对于算法的升级,只需对算法代码的部分环节模块进行升级,提高了代码的稳定性。
算法模型的环节化和模块化组合特性的分析,对于算法运行状态维护、提高并行性有重要的作用。
因此算法设计准则对隐私计算的落地实现是必不可少的。
隐私保护算法设计的5个准则
不同应用场景、不同信息类型的隐私保护需求差异性很大,但是在隐私保护算法设计过程中仍需遵守一定的共性准则。
准则1:预处理
对隐私信息X进行预处理,确定数据分布特征、取值范围、数据隐私保护敏感度、隐私操作次数的期望值、隐私操作结果的经验分布等。例如,隐私操作次数的期望值time=f(I , A ,Θ)。
准则2:算法框架
根据应用场景和信息类别,确定隐私保护算法的数学基础,给出算法具体步骤及步骤间的组合关系,并给出隐私属性向量与隐私信息向量之间的关系。
例如,对于不要求被保护信息可逆的应用场景,可采用基于泛化、混淆、匿名、差分等技术的隐私保护机制。
以差分隐私保护为例,需在准则1的指导下,结合I、A、Θ以及C、Q、L等要素,确定具体的加噪机制。
准则3:算法参数设计
根据隐私保护效果与可用性的应用需求,结合准则1和准则2,确定隐私保护算法中相关参数的具体取值。
例如,差分隐私机制中需根据隐私保护需求确定隐私操作次数的期望值(对基于拉普拉斯机制的差分隐私保护方案需确定隐私预算ε的取值),还需根据具体的查询函数确定敏感度、隐私操作结果的社会经验值,在准则2中已确定的加噪机制前提下,结合I、Θ,确定添加噪声的具体分布。
准则4:算法组合
根据应用场景和信息特征,在算法内部实现不同步骤的组合,或在相似算法间实现排列组合,以达到安全性或性能方面的提升。
例如,在采用差分隐私保护过程中,结合I、Θ以及差分隐私相关组合性质,包括后处理性质、顺序组合性质和平行组合性质等,实现同一算法在步骤间的动态组合。
对于具有复杂隐私保护需求的应用场景,例如,同时兼顾发布数据的统计特征和匿名性,需在隐私信息处理过程中充分考虑各类具有相近数学机理的算法特征,通过有机整合以确保满足复杂隐私保护需求,并提升整体的安全性和性能。
准则5:算法复杂度与效能分析
从需要保护的隐私信息分量数目、算法安全参数取值范围、算法的时间复杂度和空间复杂度、隐私保护效果的期望值等因素,综合分析评估隐私保护算法的实现代价,以评估所选算法是否适合所对应的应用场景。


