日前,2020中关村论坛在京开幕,全球顶尖科学家、企业家齐聚论道。在9月18日举行的全球医药健康大数据平行论坛中,翼方健数(BaseBit.ai)首席执行官罗震畅谈隐私安全计算技术如何赋能医疗行业,并且通过实际落地案例佐证隐私安全计算已成数据价值盘活的“关键之钥”。

999

(高峰论坛:右一为翼方健数首席执行官罗震)

罗震表示,希望通过隐私安全计算的方法构建一个数据和计算的互联网,一个让数据所有者、数据使用方和服务提供商所组成的活跃生态系统。实现技术向善,在充分保护数据安全和个人隐私的前提下,让数据产生价值,成为真正的生产要素。

数据共享是否意味着失守?隐私安全计算成突破口

医疗领域被认为是对于隐私数据要求最高的场景,而这一方向的数据若是共享,效应巨大。医疗平台集聚个人最私密的数据,共享是否意味着失守?开放应用生态更成无本之木?

面对备受关注的医疗数据话题,罗震坦言,医疗数据的价值不言自明,但是利用率却十分低下。传统上数据共享的方法是基于原始数据的共享,而医疗行业对于原始数据有非常强烈的数据安全和个人隐私保护的需求,这就导致原始数据的共享很难实现。

对此,翼方健数提出了一个数据价值共享的重要理念不分享原始数据,通过计算共享数据价值。“这就是隐私安全计算的核心。这里的计算有两层含义,一个是我们采用什么样的安全计算方法,另一个是具体的数据应用。”罗震介绍隐私安全计算。

翼方健数在医疗行业通过化解数据安全和应用开放的矛盾,促进数据价值流通。在国家健康医疗大数据试点城市厦门,翼方健数与厦门市卫健委合作,搭建了一个健康医疗大数据应用开放平台。基于这一平台,健康医疗数据可在数据脱敏、治理的基础上向数据的使用者授权开放。数据的使用者在平台上得到数据的授权后,并不能下载数据,而是通过第三方应用或者自己开发的程序利用沙箱计算等安全计算方式对于原始数据进行挖掘。平台允许用户拿走数据分析的结果或者通过智能服务的方式对平台外输出数据产生的能力。

罗震表示,通过这一方法,平台可以和大量对于健康医疗数据有诉求的第三方机构合作,在平台内形成一个数据生态,数据价值充分发挥。并且通过联邦学习等隐私安全计算的方式,实现跨平台的数据价值共享,同时保证数据安全,打消数据共享的顾虑。

隐私安全计算如何成为“关键之钥”?

罗震表示,在一个真正的大数据平台建设过程中,会面临许多具体的技术挑战,这些都需要通过隐私安全计算的方法来解决。如何选择技术?如何解决个人数据的隐私保护问题以及数据的溯源和可重复性问题?罗震进行了具体阐述。

技术选择方面,翼方健数根据不同的信任假设和计算的复杂度,有多方安全计算和同态加密,联邦学习,安全沙箱计算与可信任执行环境等多种安全计算方式。对技术的选择来源于不同的信任假设和实际业务场景。

数据隐私安全方面,在个人数据隐私保护上常见的数据脱敏方式是将一些个人的可识别信息进行匿名化处理,然而这样的脱敏方式在大数据时代远远不够。“如果我知道我的邻居昨天在第二医院做了肠镜,上周在第三医院门诊看了病,通过几个简单的条件可以很容易在大数据平台里找到我邻居的ID,并且通过这个ID在平台内找到我的邻居的健康档案。”罗震举例解释匿名化处理的弊端。

这样的隐私保护风险现在可以通过差分隐私的技术手段进行有效规避。并且差分隐私技术和量子计算等技术入选由麻省理工科技评论选出的2020年全球十大突破性技术。

数据价值流通离不开数据溯源。区块链技术和隐私计算平台相结合可实现数据实现全生命周期管理,数据的创建、授权、挖掘过程都可以记录在区块链上,重现数据的演化过程。同时,可以在此基础上建立智能合约,实现数据价值的合理分配,让所有直接或者间接提供过数据或者为数据价值付出过劳动的人都得到相应的回报。

罗震是翼方健数的首席执行官。此前,罗震在普林斯顿大学获得计算机工程博士学位,并获工学院最高荣誉Gordon Y.S Wu奖学金。工作后,罗震一直在从事软件设计工作,深耕算法、大数据、机器学习等领域,曾带领美国、印度、中国的研发团队,取得重大的技术突破。

888

翼方健数首席执行官罗震