云存储加密技术
基于透明加密的云存储文件系统(kefs)——技术文档

基于透明加密的云存储文件系统(KEFS)技术文档目录1.系统概述 (2)2.技术实现 (2)2.1系统结构 (2)2.2系统文件构架 (3)2.3工作原理 (3)2.4加密原理 (4)2.5文件过滤驱动实现 (5)2.5.1需要截获的IRP (5)2.5.2获取文件全路径 (6)2.5.3加/解密的判断 (6)2.5.4驱动和用户层程序的通信 (6)3.支持的操作系统 (7)nxxjmpf@1.系统概述KEFS系统是基于IFS文件过滤驱动开发的透明加密文件系统。
基于此系统,进一步应用到本地存储和云存储,实现了本地存储和云存储的透明加密解密,保证数据安全性。
KEFS系统是基于目录的加密系统。
任何在工作目录内的读写操作,都将自动进行解密和加密。
Windows 2003以后,自带了EFS文件加密系统,但是该系统仅支持NTFS文件系统,并且对于本地加密文件的共享很困难,此外,EFS 只是对本地文件的加密,不支持云存储。
而KEFS解决了以上问题。
2.技术实现2.1系统结构2.2系统文件构架KEFS系统由三部分组成:sfilter.sys , KESF.exe , KEFS_Server.exe Sfilter.sys 文件过滤驱动:负责截获系统IO操作,并做加密或解密等操作。
KEFS.exe 系统通信程序:用户身份验证;给sfilter发密钥;和sfilter交换文件数据。
KEFS_Server.exe 服务器程序:和客户端KEFS通信。
服务器上保存的是用户加密过的文件。
2.3工作原理在Windows操作系统中,系统是以层次结构设计的。
一般的文件操作(打开、读、写、关闭等)都是通过调用系统API来完成。
对于某一个文件操作API,会将请求下发给文件驱动,再由文件驱动下发请求,当文件操作完成后,返回数据将先上传给文件驱动,然后文件驱动进一步上传给用户层,由此一个API操作完成。
由此,我们开发一个文件过滤驱动sfilter,这个驱动套在系统文件驱动层之上。
海康云存储系统 ec 原理

海康云存储系统 ec 原理
海康云存储系统是一种基于云计算和物联网技术的先进存储系统,它包含了海康威视自主研发的EC(Erasure Code)技术。
本文将从EC技术的原理入手,探讨海康云存储系统的工作原理。
EC技术是一种纠删码技术,在数据存储的过程中,将数据分成多个部分,并通过计算形成多个冗余校验码。
这些码可以通过各种数学运算进行计算,从而能够在发生数据损坏时进行数据恢复。
相较于传统的数据备份技术,EC技术具有更高的数据保护能力和更低的存储成本。
海康云存储系统采用EC技术,将存储数据划分为多个数据块和冗余校验块。
数据块和校验块的数量可以通过调整参数实现。
例如,将数据划分为10个数据块和5个校验块,即可实现对5个数据块的损坏进行修复。
同时,海康云存储系统还采用了分布式存储技术,将数据块和校验块分散存储在多个节点上,从而实现数据的高可用性和高可靠性。
当某个节点发生故障时,系统可以自动将数据块和校验块分散存储在其他节点上,从而保证数据的完整性和可用性。
海康云存储系统还采用了数据加密技术,保证数据的安全性。
在存储数据时,系统会将数据进行加密处理,防止数据泄露。
同时,在数据传输过程中,也会对数据进行加密处理,防止数据被窃取或篡改。
总之,海康云存储系统采用了EC技术、分布式存储技术和数据加密技术等先进技术,实现了对数据的高可靠性、高可用性和高安全
性,为广大用户提供了一种高效、稳定的云存储服务。
云计算的云存储技术

云计算的云存储技术云计算是现代科技发展中的一个重要概念,它通过互联网实现资源的共享和服务的提供。
而云存储技术作为云计算的重要组成部分,具有丰富的应用场景和巨大的潜力。
本文将从云存储的定义、特点、优势和应用等方面展开论述。
一、云存储的定义云存储是基于云计算技术的一种数据存储方式,它将数据存放在云平台上的服务器中,用户可以通过网络对数据进行访问和管理。
云存储提供了高效、可靠和安全的存储解决方案,使用户可以享受到低成本、高扩展性和便捷的存储服务。
二、云存储的特点1. 可扩展性:云存储可以根据用户的需求进行扩展,无需进行硬件设备的购置和扩容操作,大大降低了存储成本和管理的复杂性。
2. 可靠性:云存储采用分布式存储技术,数据会被复制到多个物理设备上,即使某个设备发生故障,数据也能够得到保护和恢复,不会造成数据丢失。
3. 安全性:云存储通过数据加密、访问控制和备份等安全措施,保护用户的数据不被未经授权的访问和篡改,并提供灾备备份功能,确保数据的可用性和完整性。
4. 可访问性:云存储可以通过互联网进行远程访问和管理,用户可以随时随地获取自己的数据,方便实现数据的共享和协作。
三、云存储的优势1. 低成本:云存储不需要用户购买昂贵的硬件设备和维护成本,用户只需按需购买存储空间,可以大大降低存储成本。
2. 高可用性:云存储采用冗余备份和负载均衡技术,保证数据的高可用性和可靠性,用户不需要担心数据丢失和不可用的问题。
3. 高扩展性:云存储可以根据用户的需求进行弹性扩展,满足大规模数据存储的需求,支持海量数据的存储和管理。
4. 灵活性:云存储可以根据用户的需求进行灵活配置和管理,用户可以根据自己的业务需求调整存储空间和性能,提高存储效率和利用率。
四、云存储的应用1. 个人存储:用户可以将个人文件、照片和视频等存储到云平台上,随时随地进行访问和共享,方便实现跨设备的数据同步和备份。
2. 企业存储:云存储可以为企业提供高可靠、高扩展和高安全性的存储解决方案,支持企业的数据备份、共享和协作,提升工作效率和数据管理的便捷性。
云存储技术使用注意事项

云存储技术使用注意事项云存储技术是一种将数据存储在网络服务器上的技术,用户可以通过网络来访问和管理自己的数据。
由于其便捷性和可扩展性,越来越多的个人和企业开始使用云存储技术来管理和备份他们的数据。
然而,对于新手来说,使用云存储技术也有一些需要注意的事项。
下面是一些云存储技术使用的注意事项:1. 安全性:由于云存储技术的本质是将数据存储在网络服务器上,安全性是一个非常重要的问题。
选择一个有信誉和可靠的云存储服务提供商,并确保其具备安全的数据加密和访问控制功能,以确保您的数据不会被未授权的人员访问。
2. 数据备份:尽管云存储技术可以让您从硬件故障中恢复数据,但这并不意味着您可以完全忽视数据备份。
定期将重要数据备份到本地设备,以防止云存储服务提供商出现故障或意外数据丢失。
3. 上传速度:云存储技术需要通过网络进行数据传输,因此上传速度可能会受到网络连接的限制。
在选择云存储服务提供商时,要考虑其网络速度和稳定性,以确保上传和下载数据的效率。
4. 数据隐私:使用云存储技术意味着您将数据存储在第三方服务器上,这可能会引发数据隐私问题。
因此,您需要了解云存储服务提供商的数据隐私政策,并确保您的数据在存储和传输过程中得到适当的保护。
5. 服务可靠性:云存储服务提供商的可靠性对于您的数据安全和可用性非常重要。
选择一个有良好信誉和高可靠性的云存储服务提供商,并注意其服务协议中的可用性保证。
此外,定期监测云存储服务的性能,以确保其能够满足您的需求。
6. 成本控制:尽管云存储技术可以降低数据存储和管理的成本,但如果您不注意使用情况,费用可能会不断上升。
了解云存储服务提供商的定价模式,并根据您的实际需求选择适当的计划,以控制费用。
7. 数据迁移:如果您决定更换云存储服务提供商或将数据迁移到其他存储介质,则需要考虑数据迁移的复杂性和成本。
在选择云存储服务提供商时,了解其数据迁移策略和工具,以便在需要时能够顺利迁移数据。
总的来说,云存储技术可以为个人和企业带来很多便捷和灵活性,但同时也需要注意一些问题,如安全性、数据备份、上传速度、数据隐私、服务可靠性、成本控制和数据迁移等。
云存储技术的优点与缺陷

云存储技术的优点与缺陷随着互联网的不断发展,云计算逐渐成为了企业和个人备份和存储数据的首选。
云存储技术由于其高效、安全、低成本、易用等优点,获得了越来越广泛的应用和认可。
但是,云存储技术也存在一些缺陷,需要引起注意。
优点1: 高效云存储技术通过网络连接在云端进行数据传输和存储,避免了传统的硬件设备存储的不便和低效。
在传输和存储数据时,云存储技术能够快速定位和查找数据,大大提高了数据的操作效率。
同时,云存储技术的高效能够提供多种数据备份和恢复方式,为企业和个人提供了更加安全、可靠的数据存储和备份解决方案。
优点2: 安全数据安全是企业和个人存储和备份的重中之重,云存储技术可以为用户提供更加安全可靠的数据存储服务。
现代的云存储技术通过加密和身份验证等多种方式来保护用户数据的安全性。
同时,在云存储技术中,用户的数据是以多样化的方式存储在不同的服务器上,可以防止服务器故障或数据丢失造成大规模数据损失的情况发生。
优点3: 低成本云存储技术可以为企业和个人节省大量的存储设备、运维成本,降低技术实现、管理和运维的成本。
同时,云存储技术还可以根据企业和个人的需求,实现定制和扩展,为其提供更加灵活和高效的数据存储方案。
相比于传统的硬件存储,云存储技术是一个更加符合现代企业和个人备份、存储、分享和协同的存储方式。
缺陷1: 隐私问题随着云存储技术的不断成熟,一些企业对于云存储的安全性提出了疑问,认为数据隐私不够得到保护。
由于存储在云端的大量数据,有可能被云存储服务提供者窃取或非法使用。
因此,在选择云存储服务时,需要谨慎选择有信誉和声誉的服务提供商,避免数据泄露和隐私受损的情况出现。
缺陷2: 网络延迟云存储技术是通过网络连接进行数据传输和存储的,因此网络延迟是其面临的困难之一。
在数据的传输和存储过程中,由于网络带宽不足或传输距离过远等原因,可能造成文件传输时间较长。
对于一些大量数据、复杂数据和高性能数据来说,这种延迟可能会影响数据的实效性。
云存储服务的安全风险与保护方法

云存储服务的安全风险与保护方法云存储服务的兴起给我们提供了便捷的数据存储和共享方式,然而伴随而来的安全风险也需要我们高度关注和有效保护。
本文将介绍云存储服务的安全风险,并提出相应的保护方法。
一、云存储服务的安全风险1. 数据泄露风险:数据在传输和存储过程中存在被黑客窃取的风险,可能导致个人隐私或商业机密泄露。
2. 数据篡改风险:黑客可以通过操纵数据包或者攻击云端服务器,篡改用户存储的数据,导致数据真实性和完整性的问题。
3. 账号安全风险:用户的登录凭证可能被破解或者盗用,黑客可以冒充用户身份访问云存储服务。
4. 云服务提供商风险:云服务提供商的安全措施可能不足或者存在漏洞,黑客可以利用这些漏洞入侵云平台。
二、云存储服务的保护方法1. 强化密码策略:用户应该设置强密码,并定期更换密码。
同时,禁止使用弱密码和相同密码在多个平台使用。
2. 数据加密:对于重要的数据,用户可以采用加密算法对数据进行加密处理,确保数据在传输和存储过程中的安全性。
3. 多因素身份认证:用户登录云存储服务时,应该启用多因素身份认证,通过手机验证码、指纹识别等方式增加登录的安全性。
4. 防火墙和入侵检测系统:用户可以在本地设备和网络上部署防火墙和入侵检测系统,及时发现和阻止潜在的安全威胁。
5. 定期备份:用户应该定期备份云存储中的重要数据,以防数据丢失或被破坏。
6. 选择可信赖的云存储服务提供商:在选择云存储服务提供商时,用户应该考虑其安全性和可信度,选择有良好声誉的提供商。
7. 安全意识培训和教育:用户和企业应该加强对云存储服务的安全意识培训和教育,提高对安全风险的认识和应对能力。
总结:云存储服务的安全风险需要我们高度关注和有效保护。
本文介绍了云存储服务的安全风险,并提出了一些相应的保护方法,包括强化密码策略、数据加密、多因素身份认证、防火墙和入侵检测系统、定期备份、选择可信赖的云存储服务提供商以及安全意识培训和教育。
希望读者能够根据这些方法,提高云存储数据的安全性,保护个人隐私和商业数据的机密性。
云计算环境下的数据存储关键技术研究

云计算环境下的数据存储关键技术研究随着信息技术的不断发展,数据存储成为了云计算环境下的一个重要问题。
云计算已经成为IT行业发展的新趋势,云计算的发展需要更高效、更安全、更可靠的数据存储技术。
本文将讨论云计算环境下的数据存储关键技术研究。
1. 数据存储的需求在云计算环境下,数据存储的需求日益增长。
传统的数据存储方式已经无法满足云计算环境下的需求。
云计算环境下的数据存储面临如下挑战:安全性、可靠性、性能、扩展性以及成本问题。
为解决这些问题,必须开发新的技术和方法,以提高数据存储的效率、安全性和可靠性。
2. 数据存储的关键技术2.1 数据加密技术数据加密技术是保证数据存储安全性的基础,通过对数据进行加密可以保证数据在传输和存储过程中不被非法访问和篡改。
但是,传统的加密方式会对性能造成较大影响,因此需要考虑更加高效的加密方式,比如硬件加速技术、可伸缩的加密算法等。
另外,在保证加密性能的前提下,加密算法的安全性也需要重视。
2.2 数据备份与恢复技术数据备份与恢复是保障数据的可靠性的关键技术。
数据备份可以通过多副本存储技术来实现,可以采用异地多活技术备份数据,并通过实时数据同步算法保证多份数据一致性,以保证数据的可靠性。
同时,应该开发可靠的数据恢复技术以应对各种故障。
2.3 数据压缩与传输技术数据传输是保障数据存储性能的关键技术,在数据传输过程中,采用高效的压缩算法对数据进行压缩可以减少数据传输量和存储开销。
同时,也应该研究如何提高数据传输的性能,如采用本地缓存、分段传输、分组传输、多通道传输等。
2.4 数据分布式存储技术数据分布式存储技术是保障数据存储扩展性的关键。
数据分布式存储通过将大量的数据分散存储在不同的服务器上,可以有效地提高存储容量,并且新增容量也可以通过简单的需求扩容来实现。
针对数据分布式存储技术,在数据分割、分布式存储管理、分布式缓存管理、分布式数据库管理等方面需要做出相应的技术创新。
2.5 数据实时分析技术数据分析是云计算环境下的重要应用场景,数据实时分析技术将大量的数据实时分析提供了可能。
数据加密技术在云计算中的应用研究

数据加密技术在云计算中的应用研究在当今数字化时代,云计算作为一种强大的计算模式,为企业和个人提供了便捷、高效的数据存储和处理服务。
然而,随着云计算的广泛应用,数据安全问题日益凸显。
数据加密技术作为保障数据安全的重要手段,在云计算环境中发挥着至关重要的作用。
云计算是一种基于互联网的计算方式,它允许用户通过网络访问远程服务器上的计算资源和数据存储。
这种模式带来了诸多优势,如灵活性、可扩展性和成本效益。
但同时,也带来了一系列安全挑战。
由于数据存储在云端,用户失去了对数据的直接物理控制,这使得数据更容易受到攻击和泄露。
数据加密技术的核心思想是通过对数据进行编码和变换,使得未经授权的用户无法理解和访问原始数据。
在云计算中,常见的数据加密技术包括对称加密和非对称加密。
对称加密算法使用相同的密钥进行加密和解密。
常见的对称加密算法如 AES(高级加密标准),具有加密速度快、效率高的优点。
在云计算中,当需要对大量数据进行快速加密和解密时,对称加密算法非常适用。
例如,在云存储服务中,用户可以使用对称加密算法对自己的文件进行加密,然后上传至云端。
在需要访问和使用这些文件时,再使用相同的密钥进行解密。
然而,对称加密算法存在密钥管理的难题。
如果密钥在传输或存储过程中被窃取,那么加密的数据将不再安全。
为了解决这个问题,非对称加密算法应运而生。
非对称加密算法使用一对密钥,即公钥和私钥。
公钥可以公开,用于加密数据;私钥则由用户秘密保存,用于解密数据。
常见的非对称加密算法如 RSA 算法。
在云计算中,非对称加密算法常用于密钥交换和数字签名。
例如,当用户向云端发送数据时,可以使用云服务提供商的公钥对对称加密算法的密钥进行加密,然后将加密后的密钥和使用对称加密算法加密的数据一起发送给云端。
云端使用对应的私钥解密出对称加密算法的密钥,再用该密钥解密数据。
除了上述两种基本的加密技术,还有一些混合加密技术在云计算中得到应用。
例如,先使用对称加密算法对大量数据进行加密,然后使用非对称加密算法对对称加密算法的密钥进行加密,以实现高效和安全的加密效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
云存储加密技术 前言: 云计算自身的数据安全问题阻碍其推广应用。通过对数据进行加密可以保护企业及个人用户的数据隐私。对加密数据有效检索难以通过传统信息检索方式实现。文章在分析云存储应用中的存储安全技术基础上,针对加密存储的需求,基于常见的加密检索方法和相关技术,结合自己的研究成果,提出了一种基于全同态加密的检索方法,该方法能在一种程度上提高检索效率。 关键词: 云存储; Abstract: The problem of data security impedes the spread and application of cloud computing. While corporate and personal data can be protected through data encryption, effective retrieval of encrypted data is difficult to achieve by traditional means. This paper analyzes storage security technology in cloud storage and also the demands of encrypted storage (using common methods of encryption and related technologies). In light of research results, this paper proposes a retrieval method based on fully homomorphic encryption—which can markedly improve efficiency. Key words:
cloud storage; vector space model; relevance ranking 云计算是一种通过网络以按需、易扩展的方式获取所需服务的在线网络服务交付和使用模式,它是
分布式计算的一种形式。是网络上的服务以及提供这种服务的数据中心的软硬件集合[1]。云计算是并行计算、分布式计算和网格计算的演进。云计算的实现形式包括软件即服务、效用计算、平台即服务、基础设施即服务。目前云计算已经有部分应用,如Google公司的GoogleDocs[2],另外微软、Amazon[3-4]也有类似的云计算服务设施。 云计算主要目标是提供高效的计算服务。云计算基础设施之一是提供可靠、安全的数据存储中心。因此,存储安全是云计算领域的安全话题之一。为解决数据隐私的保护问题,常见的方法是由用户对数据进行加密,把加密后的密文信息存储在服务端。当存储在云端的加密数据形成规模之后,对加密数据的检索成为一种迫切需要解决的问题。 在加密信息检索的相关研究工作中,对加密信息的检索有单用户线性搜索、基于关键词的公钥搜索、安全索引等几种算法。这几种算法可以快速地检索出所需信息,但其代价较高,不适用大规模数据检索的情况,而且,在云存储中,检索时相关的文档较多,对其进行相关排序是进一步需要解决的问题,以上几种算法均不能解决问题。 通过保序加密可以利用文档中的词频信息对文档依相关度进行排序,提高了检索准确率和返回率。然而在文档中某些关键词出现的频率非常高,指代性不强,这一类词称为常用词,常用词的存在歪曲了文档和实际查询相关度。而准确反映文档、查询相关度的向量空间模型无法直接应用。全同态加密提供可以对密文进行操作的加密算法。而且通过全同态加密,一方面可以保证密文信息不被统计分析,另一方面可以对加密信息进行加法和乘法运算,同时保持其对应明文的顺序。 1 云存储应用中的加密存储技术 大规模高性能存储系统安全需求,特别是云存储应用中,可扩展和高性能的存储安全技术,是推动
网络环境下的存储应用(如云存储应用)最根本的保证,已经成为当前网络存储领域的研究热点。云存储应用中的存储安全包括认证服务、数据加密存储、安全管理、安全日志和审计。 访问控制服务实现用户身份认证、授权,防止非法访问和越权访问。主要功能包括:用户只能对经管理员或文件所有者授权的许可文件进行被许可的操作;管理员只能进行必要的管理操作,如用户管理、数据备份、热点对象迁移,而不能访问用户加密了的私有数据。 加密存储是对指定的目录和文件进行加密后保存,实现敏感数据存储和传送过程中的机密性保护。 安全管理主要功能是用户信息和权限的维护,如用户帐户注册和注销等,授权用户、紧急情况下对用户权限回收等。 安全日志和审计是记录用户和系统与安全相关的主要活动事件,为系统管理员监控系统和活动用户提供必要的审计信息。 对用户来说,在上述4类存储安全服务中,存储加密服务尤为重要。加密存储是保证用户私有数据在共享存储平台的机密性核心技术。 随着存储系统和存储设备越来越网络化,存储系统在保证敏感数据机密性的同时,必须提供相应的加密数据共享技术。保护用户隐私性要求存储安全建立在对存储系统的信任基础之上。必须研究适用于网络存储系统的加密存储技术,提供端到端加密存储技术及密钥长期存储和共享机制,以确保用户数据的机密性和隐私性,提高密钥存储的安全性、分发的高效性及加密策略的灵活性。在海量的加密信息存储中,加密检索是实现信息高效共享的主要手段,是加密存储中必须解决的问题之一。 2 加密信息检索技术 对加密信息检索的研究始于2000年,Song等人提出加密数据搜索的实用算法[5],Boneh等人提出基于
关键词的公钥加密算法[6],Park等人提出安全索引搜索算法[7]。 2.1 线性搜索算法 在线性搜索算法中,首先用对称加密算法对明文信息加密。对于每个关键词对应的密文信息,生成
一串长度小于密文信息长度的伪随机序列,并生成一由伪随机序列及密文信息确定的校验序列。伪随机序列的长度与检验序列长度之和等于密文信息的长度。伪随机序列及检验序列对密文信息再次加密。在搜索过程中,用户提交明文信息对应的密文信息序列。在服务器端,密文信息序列被线性的同每一段序列模2加。如果得到的结果满足校验关系,那么说明密文信息序列出现,否则,说明密文信息不存在。 线性搜索方法是一种一次一密的加密信息检索算法,因此有极强的抵抗统计分析的能力。但其有一个致命的缺点,即逐次匹配密文信息,这使得这种检索方法在大数据集的情况下难以应用。 2.2 基于关键词的公钥搜索 基于关键词的公钥加密搜索算法由Boneh等人提出,其目的是可以在用户端存储、计算资源不足的
情况下,通过访问远端数据库获取数据信息。存储、计算资源分布具有不对称性,即用户存在的计算存储能力不能时时满足其需求。另一方面用户在移动情况下存储、索引数据的需求也有增加,比如Email服务等。在这种特定情况下,需要保护用户的数据隐私。加密数据有多个不同来源,针对这一问题的解决方法是加密算法使用公钥加密。 算法的过程如下,首先生成公钥、私钥,然后对待存储的明文关键词用公钥进行加密,生成可搜索的密文信息。 2.3 安全索引 安全索引由Park等人提出,解决了简单索引方式易受统计攻击的问题。其机制是每次加密所用的密
钥是事先生成的一组逆Hash序列,加密后的索引被放入布隆过滤器中。当检索的时候,首先用逆Hash序列密钥生成多个陷门,然后进行布隆检测。对返回的密文文档解密即可得到所需检索的文档。针对有新用户加入、旧用户退出的多用户加密信息检索,这是一种解决方法。但其存在的缺陷是需要生成大量的密钥序列,随着检索次数的增加,每多进行一次检索,其计算复杂度均线性增加。这在实际应用中很难被接受。 在以上提到的多种加密信息检索算法中,所用的检索模型都是布尔模型,因而无法根据查询与待检索文档的相关度进行排序操作。在实际情况中,尤其是在数据规模较大的云存储应用中,包含某一查询关键词的文档可能有很多个,如何在多个可能相关的文档中找出最相关的一个或若干个文档是需要解决的问题。对加密的文档,是否可以应用成熟的向量空间模型,进而进行相关排序,是一个开放的问题。 2.4 引入相关排序的加密搜索算法 Swaminathan等人提出了保护隐私的排序搜索算法[8]。在这一算法中,每一文档中关键词的词频都被
保序加密算法加密。提交查询给服务器端后,首先计算检索出含有关键词密文的加密文档;然后对用保序算法加密的词频对应的密文信息进行排序处理;最后把评价值高的加密文档返回给用户,由用户对其进行解密。 这一种方法可以在给定多个可能相关文档的情况下对加密文档进行排序,进而把最可能相关的文档返回给用户。但这一种算法首先不适用于一个查询包含多个查询词的情况,其次算法只利用了文档中的词频信息,无法利用词的逆文档频率,进而向量空间模型无法直接应用。解决前一种问题的一种方法是用加法同态加密算法[9]对词频信息进行加密处理。 3 一种基于全同态加密的检索方法 在加密信息检索研究中,结果的排序是衡量检索算法性能的重要指标之一。当前随着云计算技术的
提倡和应用,加密文档必将呈爆炸式增加。排序的准确性成为对检索系统性能的客观要求,其主要目的是提高检索系统服务质量和检索效率。分析现有的加密信息检索算法发现,在保证查准和查全两方面性能的同时,对排序问题以及准确性方面考虑不够。针对该问题,本文提出了一种面向云存储应用中的全同态加密的检索方法。全同态加密的检索方法是采用信息检索中的向量空间模型,计算检索出的文档与待查询信息之间的相关度,对检索词词频和倒排文档频率进行统计,然后采用全同态方法对文档进行加密并建立索引方法。检索后将加密文档与索引项密文一起上传到服务器端。 全同态加密检索及排序过程如图1所示。提交检索之前,同样先对检索语句进行分词、词干化,得到关键词明文序列并对明文进行加密。云端服务器对提交密文序列进行检索时,提交加密后的检索词。