手动为生物信息学利用同态加密外文翻译资料

 2022-10-25 02:10

英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


手动为生物信息学利用同态加密

摘要-生物学数据科学是一个新兴的领域面临着多重挑战托管、共享、计算,并与大型数据集进行交互。隐私法规和担忧泄露敏感的个人健康和基因组数据的风险增加了一层复杂性问题。最新进展在密码学在过去的五年里取得了一个工具,同态加密,可用于加密数据的方式存储可以外包给一个不可信的云,和数据可以计算以加密的形式,以一种有意义的方式没有解密密钥。介绍了同态加密的生物信息学社区,并给出了一个非正式的“手动”使用简单的加密运算库(密封),我们公开可用的生物,基因等研究目的。

关键词:同态加密、外包计算,隐私,全基因组关联研究、序列匹配

  1. 介绍

丰富的个人基因组数据变得可用由于科学的进步人类基因组的测序和基因组装技术。医院、研究机构、诊所、和企业处理人类基因材料和其他敏感的健康数据都是面对的共同问题安全地存储和交互,大量数据。商业云提供解决方案,但是有传票,数据误用或盗窃,和可能的内部攻击。减轻固有的隐私风险敏感数据存储和计算,密码学提供了一个潜在的解决方案以加密的形式,这比喻锁数据的“盒子”,需要一个开放的关键。传统的加密系统锁定数据的方式使它无法使用,或计算,以加密形式。最近的密码学的发展产生了新的工具,允许加密数据的操作。一个这样的工具是同态加密。加密数据使用同态加密方案允许有意义的计算加密数据以加密形式产生的结果计算,不需要解密密钥解密或需要访问。

本文详述了先进的同态加密解决方案,旨在作为指南使用生物信息学和基因组计算。微软研究院的简单加密运算库(密封)已经公开发布和下载实验和研究目的。

同态加密技术加密数据以这样一种方式,它可以计算由任何人,没有访问加密或解密密钥,以加密形式计算得到的结果。同态加密的解决方案,允许一个操作,比如,已经知道了几十年,例如基于RSA或困难的密码。但同态加密的解决方案,允许无限的两个操作,即加法和乘法,使电路的计算,因此此类解决方案被称为完全同态(FHE)。第一个FHE[14]提出了解决方案,和许多改进和扩展了过去5年:[9],[6],[15],[30],[1]。在实际应用程序中,一个重要的概念引入[25]是使用同态加密方案只允许一个固定数量的计算数据。通常情况下,计算(函数或算法),将被应用到数据提前知道,以便同态加密方案可以被实例化只允许计算的数据量。这一观点导致改进参数,从而更好的存储和计算效率。计划它是可能的,对于任何固定给定的函数,参数选择,这样的计划允许同态的评价函数,称为夷为平地同态加密方案。使用同态计划被夷为平地,参数设置为允许某种预定的,固定数量的计算,结合特定于应用程序的数据编码和算法的优化,导致显著的效率改进。我们将等结合实际同态加密(法)。

虽然被认为是一个重大突破为同态加密开发解决方案,严峻的挑战仍将这些建议转化为实际系统可以克服障碍和存储性能要求。显著改善了编码数据计算以聪明的方式来减少暗文的大小和电路计算的深度。第三节我们提出新的编码方法真实数据,导致混凝土改善性能和存储需求。

当使用板式换热器、参数编码的加密方案应选择优化效率,同时保持安全性和正确性。让这个可行的在实践中,我们实现了工具(最重要的是增长噪声模拟器和自动参数选择模块)帮助用户选择参数最大性能。第四部分详细阐述了这些技术,在实践中演示了他们的使用

一些的同态加密提供了一个合适的解决方案,但不是全部,隐私问题和场景。当前的解决方案允许单个数据所有者,如医院、加密数据,以便它可以安全地存储在一个商业云。私钥和公钥的解决方案都是实用,而且与公共密钥版本很多党派可以上传数据在医院的公共密钥加密:医生、患者、实验室技术人员,等,和医院管理局可以设置一个政策获取计算和解密。同样的想法可以应用研究所,在云中存储数据,选择性地允许研究人员进行查询加密数据,然后提供解密结果。消费者和患者情况通过同态加密包括安全和私人外包存储个人健康记录,或为疾病风险预测服务。

这篇文章的目的是作为一个指南帮助生物信息学家使用图书馆,与安全计算生物医学实验数据,评估安全的影响。

  1. 同态加密

加密数据的加密方案,使任意计算没有首先解密数据,和没有任何访问解密密钥,所以被称为完全同态加密(FHE)计划。任何此类计算的结果加密的数据本身就是以加密形式提供,只能由所有者进行解密的密钥。第一FHE方案提出了由贵族[14]在2009年发现以来,提出了许多改进和新的结构[33],[9],[8],[6],[12],[22],[4],[1],[16],[10]。

在贵族的工作,和许多后来的论文,数据加密位操作。这意味着一个单独的密文生产每一位的信息。计算被描述为一个布尔电路和XOR和盖茨,也可以实现加法和乘法模2。两个操作可以进行加密。不幸的是,分解计算位运算可以迅速导致一个大型和复杂的电路,在内存使用每一起重大开销这让同态加密方案强加的计算成本非常高昂。

幸运的是,大多数已知的结构允许一个更大的信息空间。在实际应用中所需的计算通常只包括添加和整数或实数的乘法,所以不需要表达数据位操作的方式。事实上,大多数已知的结构允许加密整数,或适当的整数编码,同态加和乘这些值。这种方法有明显的优势,密文现在包含更多的信息比一个位的数据,使同态计算更有效。

在已知的FHE计划,通常暗文含有一定量的固有噪声,而“污染”。这噪音生长在同态操作期间,如果它变得太大不能解密密文即使正确的解密密钥。为了执行一个无限数量的操作,从而实现完全同态加密,暗文需要不断刷新,以减少噪音。这是通过使用一个昂贵的过程称为引导[14]。

然而,在应用程序只有一个预先确定的计算需要做,可以避免昂贵的引导过程通过使用所谓的同态加密方案被夷为平地。作为一个指导原则,选择的参数规定多少顺序乘法计算可以涉及,即计算的最大允许深度表示为一个算术电路,虽然在现实中也其他特性的计算需要考虑。这种方法往往比使用一个更实用FHE方案与引导,但不灵活,如果在稍后的点不同,更复杂的函数需要评估。

这一节的其余部分描述了夷为平地同态加密方案,实现在我们的简单加密运算库(密封)。

  1. 同态加密方案的算法

我们使用的加密方案是一个公钥,同态加密方案,并由以下算法:

bull;密钥生成算法注册机(改),输入系统参数及parm,生成一个公钥/私钥对(pk,sk)和公众评价关键evk,用于在同态的乘法。

bull;一个加密算法Enc(pk,m),使用公钥加密明文的pk。

bull;一个解密算法(sk,c),12月与私钥解密密文c sk。

bull;一个同态操作添加(c1,c2),作为输入加密c1和c2的m1和m2,输出密文加密和m1 m2。

bull;同态乘法操作相乘(c1,c2),鉴于加密c1和c2的m1和m2,输出密文加密产品m1·m2。

B .加密参数

具体实例化实现密封的更实际的变体方案YASHE,提出论文[1]。加密方案的参数n,程度模q和t,w,分解词大小和分布chi;key,chi;err。因此,改:=(n,q t w,chi;key,chi;err)。接下来我们详细讨论这些参数。

bull;参数n是多项式的最大数量的术语用来表示明文和密文的元素。在密封,n是2的幂。多项式Xn 1叫做多项式系数,并表示poly_modulus密封。

bull;参数q是模量系数。它是一个整数系数用来减少密文多项式的系数。在密封,问叫coeff_modulus。

bull;参数t是明文的模量。它是一个整数系数用来减少明文多项式的系数。在密封,t叫做plain_modulus。

bull;整数w是基础,我们将整数系数分解成更小的部分。它决定 w,问:= blogw数量(q)c 1部分的整数分解模问基本w。在实践中,w是2的幂,叫log2 w分解位计数。在密封,log2 w叫做decomposition_bit_count。

bull;chi;key分布最多的多项式概率分布度nminus;1整数系数,用于多项式的系数较小样本用于密钥生成过程。在密封,系数是均匀采样{minus;1 0 1 }。

bull;同样,chi;err分布多项式的程度最多nminus;1用于样本噪声多项式,这需要在密钥生成和加密。在密封,chi;err是截断离散高斯分布集中在零,标准差sigma;。在密封,sigma;叫做noise_standard_deviation。

本节的其余部分进入进一步的细节,介绍了必要的数学结构,解释了不同的参数如何彼此相关。环R的方案操作:= Z(X)/(Xn 1),其中的元素是整系数多项式的程度小于n,其中n是2的幂。任何元素isin;R可以写成一个= Pnminus;1 i = 0 aiXi,aiisin;Z。所有的明文,暗文,加密和解密密钥,等环R的元素,这种形式。R coefficient-wise做加法,乘法是多项式乘法模Xn 1,即标准多项式乘法模Xn 1减少紧随其后。减少模Xn 1进行替换出现的所有Xnminus;1。

该计划使用两个整数模q和t,同时问远远大于t。密文和关键元素的系数被模q,而系数的明文元素模t。接下来,我们使用符号[一]q(分别地。[一]t)表示的操作减少isin;R模的系数q(分别地。t)到集{ e dminus;q / 2,hellip;,b(问minus;1)/ 2 c }(分别地。{ e dminus;t / 2,hellip;,b(tminus;1)/ 2 c })。

同态乘法操作,下面的定义,包含一个给定的多项式分解成一个矢量步较小的多项式的系数。这一步是需要管理同态乘法噪声增长通过计算两个中间通过一个标量多项式的乘积的产品。较小的系数的大小取决于参数w,从而控制增殖效率之间的权衡和评估关键尺寸一方面,增长和噪音。我们现在这个分解的细节。

一个多项式系数的isin;R { e dminus;q / 2,hellip;,b(问minus;1)/ 2 c }可以分解使用基地wisin;Z = P w,问minus;1我= 0 aiwi,aiisin;Rhave系数{ dminus;w / 2 e,hellip;,b(wminus;1)/ 2 c }。这是通过分解每个系数基本w。两个函数的利用同态加密方案。第一个是Decw q(a):=((ai)w) w,问minus;1 = 0,这需要一个多项式的系数模q,并返回向量多项式部分通过上述w-adic分解。第二个是Poww q(a):=([awi]问) w,问minus;1 = 0,一个多项式,并返回一个向量的多项式多项式的权力基础的产品w。两个函数多项式,将其映射到一个向量R w多项式的q,这样拥有以下属性

hDecw,q(a),Poww,q(b)i = a·b (mod q), h·,·i 表示向量的点积(多项式的),以通常的方式定义的。

最后,计划使用两个概率分布在R,chi;keychi;err,都生成多项式与小系数R。在我们的实现中,我们选择chi;key分布为均匀分布在多项式系数{minus;1,0,1 }。抽样一个元素根据这个分布意味着采样所有系数一致{minus;1 0 1 }。chi;err分布,我们使用一个离散高斯分布的意思是0,适当选择标准差sigma;。

c .明文空间和同态操作

明文所有元素,即消息可以用同态加密方案,加密中多项式环R,与整数系数减少模t。所有密文元素,即加密明文的元素,是多项式环R,与系数减少模整数q。正式,这意味着明文空间戒指Rt:= R / tRsim;= Zt型(X)/(Xn 1),中移动和密文空间戒指中包含:= R / qRsim;= Zq[X]/(Xn 1)。然而,并不是每一个元素中移动的是一个有效的密文。

任何产生的密文的加密函数的方案,如下所述,加密明文消息多项式misin;rt,每当同态(分别地。乘法)上执行暗文两明文加密元素,m1,m2isin;Rt,生成的密文加密和m1 m2(分别地。产品m1·m2)。明文元素之间的操作执行沿环的同态除了这意味着生成的密文加密coefficient-wisesum m1 m2,系数的自动减少模同态乘法的明文模数t。由此产生的密文加密产品m1·m2isin;Rt,这意味着多项式将自动减少模Xn 1,即所有权力Xn将自动取代minus;1,直到没有单项n或更高程度依然存在,就像在同态,多项式的系数m1·m2将自动减少模t。

这些属性时需要考虑加密数据,如整数或实数,首先需要被编码为明文多项式。需要知道的各种减少发生在明文多项式在同态操作不一定对应积分或真实数据有意义的操作。

D .详细算法描述

下面给出了密钥生成的详细描述,加密,解密,同态评价算法。

bull;注册机(改):输入加密参数及parm:=(n q tchi;keychi;err),密钥生成算法样本多项式f0,glarr;chi;key密钥分发,并设置f:=(1 tf0)问。如果f是不可逆的模q,它选择一个新的f0。否则,它计算逆Rqminus;1 f。接下来,该算法样本向量e sisin;R w,q,每个组件的抽样根据chi;err误差分布,并计算多项式gamma;的向量:=[Poww q(f) e h]q。它计算h:=[tgfminus;1]qisin;R和输出密钥对(pk,sk):=(h,f)isin;Rtimes;R,和评估关键evk:=gamma;。

bull;Enc(h,m):加密明文元素misin;Rt,加密算法小样本误差多项式年代,elarr;chi;err,并输出密文c:=(bq /中药 e h)问isin;R

bull;12月(f、c):考虑到私有解密密钥f和密文c = Enc(h,m),加密算法恢复使用m = m(bt / q·(fc)量化宽松)tisin;R。

bull;添加(c1,c2):给定两个暗文c1和c2,算法添加输出密文cadd:=(c1 c2)问。

bull;相乘(c1,c2,evk):给定两个暗文c1和c2,相乘的算法首先计算tilde;cmult:=(bt / q(c1·c2)e]q。然后执行一个所谓重复线性化(或钥匙开关)操作,通

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[154124],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。