网盘或能存储基因数据 同态加密是关键
2017-07-31
将来医学的空想是领略DNA和疾病之间的接洽,并以此为基本为患者拟定本性化的治疗方案。可是,科学家意识到这样的「本性化」或「精准」医学有一个困难:如安在担保基因数据和医疗记录安详的同时,可以或许运用云端强大的计较本领阐明找出基因和疾病之间有意义的关联。
现在,一项新兴的数据加密技能也许可以办理这一困难。
加州大学圣地亚哥分校(以下简称UCSD)正在探讨如何团结加密技能举办基因数据阐明,他们在较小的数据会合应用一个被称作「同态加密(homomorphic encryption)」的要领,10分钟内就能找到与疾病相关的基因变异。尽量在实际事情中,计较机从由成百上千DNA片断构成的全基因组数据集里找出与疾病相关的基因变异要耗费数小时时间,可是,暗码技能专家照旧值得勉励。
同态加密是一种加密形式,它答允人们对密文举办特定的代数运算获得仍然是加密的功效,将其解密所获得的功效与对明文举办同样的运算功效一样。换言之,这项技能令人们可以在加密的数据中举办诸如检索、较量等操纵,得出正确的功效,而在整个处理惩罚进程中无需对数据举办解密。其意义在于,真正从基础上办理将数据及其操纵委托给第三方时的保密问题,譬喻对付各类云计较的应用。
这一直是暗码学规模的一个重要课题,以往人们只找到一些部门实现这种操纵的要领。而2009年9月克雷格·金特里(Craig Gentry)的论文从数学上提出了「全同态加密」的可行要领,即可以在不解密的条件下对加密数据举办任何可以在明文长举办的运算,使这项技能取得了抉择性的打破。人们正在此基本上研究更完善的实用技能,这对信息技能财富具有重大代价。
——摘自维基百科
UCSD的一名计较机科学家Xiaoqian Jiang说道,「这是一个可预见的功效,但挑战依然存在」。
大夫和研究人员认为,领略基因和疾病之间的干系需要从数以百万计人群中收集数据,包罗基因方面和生理方面的数据。有些筹划项目已经启动,好比,美国总统奥巴马提倡的精准医学项目以及英国的十万基因组项目。如此错乱的任务大概需要操作互联网云端主机的处理惩罚本领,可是,已往几年里网络安详裂痕袒露了在云端存储大量敏感数据的庞大隐患。美国国度卫生研究院的基因型与表型数据库 (dbGaP)有一个有关医疗和基因数据的目次,它的打点人员很是担忧安详问题,他们克制数据库的用户在可联网的电脑上储存数据。
同态加密可以办理这种担心,从而让研究者用数学加密的方法把资料储存在云端。该技能会把当地电脑上的数据举办加密,然后再把加密后的数据上传到云端。加密数据的计较也可以在云端举办,计较的功效加密后再传会当地的计较机。即便有人在此进程中窃取了加密的数据,但这些加密数据里包括的埋没内容仍然是安详的。
UCSD的计较机科学家Lucila Ohno-Machado认为:「假如能确保这项技能由浸染,那么对付办理掩护小我私家隐私的前提下举办海量数据的运算和存储的困难至关重要,这的确可以晋升我们的信心。」
1978年,同态数据加密技能被首次提出,差异于其他方法,这一技能可以在云端处理惩罚加密的数据,从本质上说,云永远不会真正「看到」数据处理惩罚。另一个差异点则是,该技能还能给出未加密状态下的沟通数据处理惩罚功效。
直到2009年,IBM沃森研究中心的暗码学家Craig Gentry论证了对同态加密数据可以举办任何形式的运算大概性。此时,这一理念还很洪流平上逗留在理论层面。该要领通过将每个数据点转换为一块加密的信息或密文,但加密后的数据量比原始数据更大也更巨大。每个未加密的字节被加密成几兆字节的数据,相当于一张数码照片的巨细。
当然这是一个打破,但加密前后如此大的容量差别也让这项技能无法真正应用起来,要知道数据存储的硬件本钱是很高的。