云上多数据所有者的安全密文搜索技术_第1页
云上多数据所有者的安全密文搜索技术_第2页
云上多数据所有者的安全密文搜索技术_第3页
云上多数据所有者的安全密文搜索技术_第4页
云上多数据所有者的安全密文搜索技术_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、云上多数据所有者的安全密文搜索技术摘要:随着网络储存服务的发展,越来越多的企业和 个人选择把本地复杂的数据管理事物外包给第三方服务器。 这种情况下,为了保护信息的隐私性,企业和个人会在外包 之前先对数据进行加密。研究怎样利用已经趋于成熟的明文 检索技术,设计适用于密文的检索技术,是现在可搜索加密 技术研究的热点。本文采用“坐标匹配”的方法度量搜索请 求和数据文件相关关系,利用安全内积计算技术,定义和解 决了云上多数据所有者多、关键词的安全排序搜索问题。并 且,通过仿真实验,分析了不同参数变化对效率的影响。关键词:云计算;多数据拥有者;可搜索加密;隐私安 全;多关键词搜索;排序搜索中图分类号:

2、TP393文献标识码: A0 引言 云计算的高速发展使得提供及云计算应用厂商越来越 多,比如微软云、 IBM 云、亚马逊云、谷歌云、红帽云服务 等。对于存储在云中的数据,企业和个人并不希望云服务中 心的员工能够随意查看自己的信息。因此,外包数据一般都 是以密文的形式存储在云上的。仅仅把信息存储在云上并不 是用户和云计算提供企业的目的,用户上传数据后,还要能 随时、随地简单便捷的根据需要对数据进行搜索下载,这就 需要精确、安全的可搜索加密技术的支持。国内外有关可搜索加密技术的研究有很多:基于属性的 加密方法;布尔关键词搜索技术;单关键词的可搜索加密方 案。但在计算量和检索效果上都未能满足实用性的

3、需要。本 文在曹宁等人多关键词的搜索方案的基础上提出云上多数 据所有者的多关键词安全排序搜索。“坐标匹配”的方法是将数据和请求的关键词,按照数 据中提取的关键词词典映射为向量,查询它们之间的相似性 时按照请求向量与数据向量的相似项的多少作为评判的标 准,相似项越多,则相关性越高。为了量化相似值,方便对 比相似值后对搜索结果进行排序,我们采用内积相似性作为 量化这种相似性的方法,对由搜索请求和数据向量作内积。 为了满足多语义搜索的需要,提高搜索的精确性,在生成向 量时用 TF*INF 规则为数据向量和请求向量赋值。为了隐私性考虑,数据与搜索请求不能以明文的形式传 送给云服务中心,我们采用安全的内

4、积计算技术保护数据和 请求的隐私性。本文运用以上方法设计方案,定义和解决了 云上多数据拥有者多、关键词的安全排序搜索问题。同时, 为这一云上的安全数据检索服务设置了一系列严格的安全 要求。1 隐私目标和攻击模型在方案模型中我们假设云服务商是 “honest-but-curious ”。现有的可搜索加密方案大部分都是在 这一前提下运行的。隐私性的主要目的是要保证云除了搜索 结果外不知道其他涉及隐私的内容。因此,我们为方案定义 了如下的严格的隐私要求和攻击模型。已知密文攻击模型,云服务商只知道由数据拥有者存储 在上面的文件密文和经过加密的索引。除此之外,不知道其 他的信息。已知背景攻击模型,攻击能

5、强于已知密文攻击模 型,与已知密文攻击模型相比云服务商可能拥有更多的信 息。如收到的搜索请求之间的相关关系;与数据集有关的统 计信息等。数据本身的隐私。数据拥有者在外包之前依靠传统的对 称加密方法加密数据,避免云服务商窥探外包的数据。关键 词的隐私。索引机密性:云不能获得加密的索引中包含的明 文信息,如,关键词和关键词的词频;请求机密性:云不能 得到加密的请求中包含的明文信息,如,请求中的关键词和 文件频率;请求不可链接性:不能推断两个或两个以上的 trapdoor T 是否来自同一个请求;关键词隐私:不能判定索 引中、请求中、文件集中特定的关键词。云在知道数据集的 一些背景信息时,可以用来反

6、推关键字,设计的算法要能抵 抗这种类型的攻击。2 基本模型下的安全内积计算 在对单个数据所有者的数据进行检索服务的基本模型 中,包含三个不同的实体,如图 1 所示:数据所有者、数据 用户和云服务商。数据所有者有数据文件集F,加密成密文C 后外包为云,为了对 C 进行有效的检索,数据所有者对数 据外包之前,先从文件中提取关键词,形成词典 W ,根据词典为文件集作一个加密的搜索索引I,然后把密文C和索引I一起传送给云。授权用户要检索自 己感兴趣的关键词对应的文件时,先通过搜索控制机制请求 相应的 trapdoor T ,如广播加密、公钥加密等。从数据所有 者收到 T 后,给云服务商发送检索请求,云

7、收到请求后检索 搜索索引 I ,得出相关的密文 ID ,返回给用户。为了提高搜 索的精确度和效率,减少用户的计算量,云要按照相关性的 大小对搜索结果进行排序。同时为了减少通信量,用户在给 云服务商发生请求 trapdoor T 的时候可以上传整数 k 作为阀 值,云只需要返回最相关的 k 个文件即可。7 效率分析 由于设备和数据量的限制,本文的效率分析,引用了王 从等人的效率分析,因算法和模型上的差异,下面的效率分 析只是为了反映各个参数的变化对运行时间的影响。(1)索引建立时的计算量包括: 分裂过程;四个( d+U+1 ) x( d+U+1 )的矩阵乘法。而数据向量的维度大小直接影响 着映射

8、或加密的时间消耗,子索引的多少也直接影响着整个 索引建立时的时间消耗,子索引的数量也就是文件数。图 3 左图是词典大小固定时,不同的文件数对索引生成的时间的 影响;右边是文件数固定时,不同的词典大对索引生成时间 的影响。可以看出在词典大小固定的情况下,索引建立的时 间消耗与数据集的大小几乎是成线性的关系。在数据集大小 固定的情况下,索引建立时间随词典变大而增加。(2) trapdoor 生成时的效率。为了给请求关键词生成 Trapdoor,先要把请求的关键词映射成请求向量g。请求向量g 变成 Trapdoor 的过程中涉及到的计算有:分裂过程;四个(d+U+1 )X( d+U+1 )的矩阵乘法。词典中关键词的多少 直接影响着请求向量的维数,进而影响程序的运行时间。( 3)请求效率。在云上执行的请求过程包括的运算有: 为数据集上的每个文件计算与 Trapdoor 之间的相关值, 并排 序相似值。其中的计算包括,四个(d+U+1 )X( d+U+1 )的矩阵乘法和两个( d+U+1 )维的向量乘法。请求的时间受 文件数量的影响,而请求关键词的多少对请求时间的影响不 大。图 5 左图给出了请求关键词固定的情况下,数据集中文 件数不同时对请求时间的影响;右图给出了在文件数固定的 情况下,关键词数量的不同对请求时间的影响。8 总结 本文针对云计算的可搜索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论