数据安全保护与数据流通是数字时代的两难问题,破解之道就是隐私计算。
但隐私计算并非“新鲜事物”。早在1979年,计算机科学的先行者们就开始探索秘密分享的技术问题。仅仅几年后,后来回到国内工作的姚期智院士就提出了安全多方计算和混淆电路的思路。
但隐私计算在21世纪的独特发展当然与时代背景密不可分。最近几年来,网络的快速发展让隐私问题不断凸显,也让个人隐私和网络发展之间的平衡从社会议题变成了科学问题,安全多方计算(密码学)、联邦学习及可信计算环境随时发展成为隐私计算的几个主要领域。
过去,受制于性能瓶颈、技术信任不足、标准不统一等问题,隐私计算尚只能在少量数据的场景下应用。随着专用芯片、加密算法、白盒化、数据信托等技术融合发展,隐私计算有望跨越到海量数据,数据源将扩展到全域,激发数字时代的新生产力。
预计未来三年,全域隐私计算技术将在性能和可解释性上有新的突破,或将出现数据信托机构提供基于隐私计算的数据共享服务。
趋势解读
在数字经济时代,数据成为核心生产要素,但与此同时,数据确权、数据法规、隐私保护意识、数据安全保障等因素,已成为跨组织间数据的共享与价值挖掘必须面对的课题。
隐私计算融合密码学、人工智能、芯片设计等学科,以多方安全计算、差分隐私、可信计算为代表技术,可在保证数据隐私不泄露的情况下实现计算分析,为跨组织的数据共享提供可行的模式。然而性能瓶颈、技术信任不足、标准不统一等问题,让隐私计算尚只能在少量数据的场景下应用。
隐私计算将迎来三方面的突破,让隐私计算能被大规模应用:一是性能与效率的跨越式提升,包含同态加密的算法突破,降低加解密的算力需求、软硬一体的加速芯片,针对多方安全计算和联邦学习场景进行性能优化、更多第三方提供可信执行环境(TEE)等。二是隐私计算技术的白盒化,提升技术的可解释性进而强化信任度,通过开放集成能力,降低跨技术、跨模型的集成壁垒。三是数据信托机构的出现,作为可信第三方提供技术与运营,加速组织间的数据共享。
隐私计算的技术突破将推动数据计算由私域走向全域,分析的精度与深度也随着可用的数据量增加而提升,在某些对数据量强依赖的领域效果更显著,如商业分析、风险控制、学术研究、人工智能、精准营销等。另一方面,全域隐私计算技术成熟后,有望成为数据共享的标准,数据流通的风险将大幅降低,数据所有者与数据保管者的责任边界更加明确,安全程度也更加可衡量。
除了技术之外,隐私计算最大的不确定性来自于运营模式和合规标准。运营模式尚未形成完整的体系,让数据提供方有足够的诱因共享数据,同时保障数据质量让数据使用方有意愿付出费用。就合规标准而言,隐私计算的合规红线并不明确,让技术发展存在较大的不确定性,技术与标准需要在发展过程中不断地相互促进。
我们预测在三年内,全域隐私计算将在性能和可解释性上有新的突破,并开始出现数据信托机构提供基于隐私计算的数据共享服务。在未来的五到十年,全域隐私计算将改变现有的数据流通方式,新型业务也将在全域数据的基础上诞生,提升全社会以数据为核心的生产效率。