大数据安全高效搜索与隐私保护机制展望

合集下载

大数据时代的隐私保护问题与解决方案

大数据时代的隐私保护问题与解决方案

大数据时代的隐私保护问题与解决方案随着大数据时代的到来,隐私保护问题凸显出来。

在数字化技术的快速发展和数据的无限增长的情况下,大数据应用已经成为各行业的常态。

然而,大数据的广泛应用也引发了对隐私保护的关注。

个人的信息、隐私和数据安全面临着严峻的挑战。

一方面,个人数据被大数据技术不可避免地收集和利用。

另一方面,隐私泄露事件频频发生,用户的个人信息常常成为黑客攻击的目标。

因此,大数据时代的隐私保护问题亟待解决。

本文将分析大数据时代的隐私保护问题,并探讨相应的解决方案。

一、大数据时代的隐私保护问题1.个人隐私泄露在大数据时代,用户的个人信息往往被大数据平台、公司或机构收集和利用。

一旦这些信息泄漏,会对用户造成严重的损害。

例如,用户的身份信息、财务信息、健康信息等可能会被不法分子利用进行欺诈、侵犯个人权益。

这是一个非常严重的问题,因为用户的个人信息可能会被用于进行各种形式的欺诈和犯罪活动。

2.数据滥用在大数据时代,数据被广泛收集和利用,但很少有人能够真正掌握数据的去向和使用方式。

因此,数据的滥用成为一个严重的问题。

一些公司或组织可能会将收集的数据用于商业目的,或将数据出售给第三方,从而导致用户的隐私权益受到侵犯。

大数据的滥用可能会导致用户的隐私暴露,并对用户的生活和工作造成严重影响。

3.隐私保护技术滞后随着大数据技术的快速发展,隐私保护技术也在不断进步。

然而,由于技术发展的滞后性,目前的隐私保护技术仍然无法完全保障用户的隐私安全。

例如,用户的数据可能在传输、存储和处理过程中遭受攻击,导致隐私泄露。

因此,隐私保护技术与大数据技术的发展尚存在不匹配的问题。

二、解决大数据时代的隐私保护问题的方案1.加强立法监管为了保护用户的个人信息和隐私权益,政府应该加强立法监管。

通过立法和监管,可以对数据的收集、存储、处理和利用加以规范,从而减少数据滥用和泄露的可能性。

此外,政府还可以强化对违法行为的打击力度,从而有效遏制隐私泄露事件的发生。

大数据的利与弊隐私保护的关键问题

大数据的利与弊隐私保护的关键问题

大数据的利与弊隐私保护的关键问题随着信息技术的快速发展,大数据已经成为当今社会的热门话题。

大数据的应用给我们的生活带来了很多便利,但同时也引发了一系列的隐私保护问题。

本文将探讨大数据的利与弊以及隐私保护的关键问题。

一、大数据的利1. 提供个性化服务:大数据技术可以分析海量的用户数据,从中挖掘出用户的偏好和需求,为用户提供个性化的服务。

比如,电商平台可以根据用户的购买记录和浏览行为推荐适合的商品,搜索引擎可以根据用户的搜索历史提供更精准的搜索结果。

2. 优化决策:大数据分析可以帮助企业和政府做出更准确的决策。

通过对大量的数据进行分析,可以发现隐藏在数据背后的规律和趋势,从而为决策者提供更多的参考信息。

比如,政府可以通过分析交通数据来优化城市交通规划,企业可以通过分析销售数据来调整产品策略。

3. 促进科学研究:大数据技术可以帮助科学家处理和分析海量的数据,从而加快科学研究的进程。

比如,天文学家可以通过分析天体观测数据来研究宇宙的起源和演化,生物学家可以通过分析基因数据来研究人类的遗传特征。

二、大数据的弊1. 隐私泄露:大数据的应用需要收集和分析大量的个人数据,这就存在着隐私泄露的风险。

比如,一些互联网公司可能会收集用户的个人信息,然后将其用于商业目的,这就可能导致用户的隐私被泄露。

2. 数据滥用:大数据的应用需要建立庞大的数据集,这就给黑客和不法分子提供了机会。

一旦这些数据被不法分子获取,就可能被用于进行诈骗、盗窃等违法活动。

3. 偏见和歧视:大数据的分析结果可能存在偏见和歧视。

由于大数据分析是基于历史数据进行的,如果历史数据中存在偏见和歧视,那么分析结果就可能会受到影响。

比如,一些招聘网站可能会根据历史数据中的性别和种族信息进行筛选,从而导致性别和种族歧视。

三、隐私保护的关键问题1. 数据收集和使用的透明度:企业和政府在收集和使用个人数据时应该保持透明,告知用户数据的用途和范围,并取得用户的明确同意。

大数据环境下的信息安全与隐私保护

大数据环境下的信息安全与隐私保护

大数据环境下的信息安全与隐私保护一、引言随着互联网和信息技术的快速发展,大数据时代已经到来。

大数据的应用给人们的生活和社会的发展带来了众多的便利和潜在的价值。

然而,大数据也带来了一系列的信息安全和隐私保护的问题,如何在大数据环境下保护信息安全和隐私成为了亟待解决的问题。

二、大数据环境下的信息安全问题1. 数据泄露大数据环境下,海量的数据被存储、传输和处理,这就给黑客攻击和数据泄露带来了更多的机会。

一旦数据泄露,个人、企业乃至国家的利益都将受到严重的损失。

2. 数据篡改大数据的价值在于对海量数据的分析和利用,然而,如果数据被篡改,那么利用这些数据得到的结果将是不准确和不可靠的。

数据篡改会导致误导决策和损害社会利益。

3. 数据访问控制大数据环境下,数据被多个用户或系统共享和使用,如何控制数据的访问权限成为一个重要的问题。

如果数据的访问控制不当,将会导致敏感信息泄露和滥用。

三、大数据环境下的隐私保护问题1. 个人隐私泄露在大数据环境下,个人的行为和习惯往往被大数据算法分析和挖掘出来,这就会导致个人隐私的泄露。

个人的浏览记录、购物习惯、社交网络等信息都可能被获取并用于商业推广或者其他不良目的。

2. 匿名信息还原在大数据环境下,大量的匿名数据被收集和分析,然而,通过不同的数据关联和分析手段,这些匿名信息可以被还原,进而泄露出个人的隐私信息。

3. 监控与跟踪大数据环境下,各种传感器和监控设备收集了海量的数据,这些数据可以被用于对人们进行实时跟踪和行为监测。

这种监控与跟踪行为侵犯了个人的隐私权。

四、大数据环境下的信息安全与隐私保护对策1. 加强技术防护手段在大数据环境下,加强技术防护是保护信息安全和隐私的关键。

包括建立安全的数据传输通道、加密敏感数据、建立强大的访问控制机制等。

2. 制定完善的法律法规在大数据环境下,制定和完善信息安全和隐私保护相关的法律法规是必要的。

要对数据收集、存储、处理和共享等过程进行规范,明确责任和义务。

大数据时代的网络安全与隐私保护

大数据时代的网络安全与隐私保护

大数据时代的网络安全与隐私保护随着互联网普及程度的不断提高,人们对于网络安全和隐私保护的意识也逐渐加强。

而在这个大数据时代,每一个人都成为了数据的生产者,数据的分析和利用已经成为了商业、政治乃至社会生活中不可或缺的一部分。

在这种情况下,如何保护网络安全和隐私已成为了一个至关重要的问题。

一、大数据时代网络安全的挑战大数据时代下数据的采集、处理、储存和传输非常方便,但同时也带来了许多网络安全问题。

大数据量导致了很多数据的批量处理,这势必成为黑客攻击的目标。

黑客利用自动化攻击获得恶意访问权限,窃取数据或者引发破坏。

黑客还可以通过社交工程手段以及钓鱼邮件等多种方式欺骗用户进行操作而入侵网络系统。

除此之外,还有个人电脑和移动设备的漏洞问题。

也就是漏洞攻击,许多黑客通过开发网络协议和操作系统的漏洞来攻击系统。

在大数据时代下,如果网络系统或者软件应用存在漏洞,就会造成大规模数据泄露。

二、大数据时代隐私保护的挑战网络信息技术的发展,用户数据产生的规模也不断增加,用户产生的数据包括了个人的社交网络、购买记录、健康历史、浏览记录和搜索记录等,我们需要守护的不单只是可见的支付信息和身份证明,更是难以识别的WiFi和GPS记录等。

互联网公司可以在广泛使用这些数据来做广告的同时,还可以将数据卖给别的公司或者政府机构,这就造成了用户隐私泄漏的风险。

除此之外,在互联网生活日常中,一样涉及到大量的个人数据,包括了敏感的身份信息、社会联系和消费等,这些数据的保密,不但涉及到个人隐私权,更则是涉及到国家安全。

三、如何保护网络安全和隐私[1]严格控制数据的存储和传输。

尤其是对于个人隐私数据,必须严格控制数据的存储和传输方式以防止数据泄露。

对于商业公司,收集和使用用户数据时,必须严格遵守有关隐私政策和法律法规,并采取适当的安全保护措施,防止病毒和木马入侵。

个人用户也要时刻警惕网络病毒以及其他恶意软件。

[2]加强技术防范。

在大数据时代下,数据防护技术应该是不断完善的。

大数据时代下的数据安全和隐私保护

大数据时代下的数据安全和隐私保护

大数据时代下的数据安全和隐私保护随着互联网技术的不断发展,我们已经步入了一个大数据时代。

在这样的时代里,数据的重要性已经不需要过多强调了,数据对于企业决策、社会治理、科学研究等方面都起到了不可替代的作用。

但是随着数据的重要性变得越来越明显,数据安全和隐私保护也变得越来越重要。

本文将浅谈大数据时代下的数据安全和隐私保护。

一、数据安全数据安全普遍面临着几个主要问题:一是防范数据泄漏,特别是对于敏感数据如个人隐私;二是保护数据不被篡改,特别是对于应用于金融、医疗等领域的数据;三是保护数据的可用性,保证数据能够在需要时被正常访问。

1、防范数据泄漏在大数据时代,各种数据源不断涌现。

为了收集这些数据,企业和机构需要建立大规模的数据中心,这些数据中心内部涉及大量的敏感数据,例如个人身份证号、个人地址、银行账号等数据。

一旦这些数据被泄露,将导致严重的后果。

因此,数据泄漏的问题是数据安全的首要问题。

企业可以通过加强员工教育、建立安全机制、加密技术等方式来防范数据泄漏。

在员工教育方面,企业要加强对员工的教育和培训,提高员工对数据安全的重视程度,使员工知道如何保护数据,如何从个人角度保护企业数据安全。

2、保护数据不被篡改数据的完整性也是数据安全的重要方面。

在大数据环境中,数据被经常用于金融、医疗等领域,必须确保数据的完整性和准确性。

异常的数据可能会导致计算的结果或分析的结论与实际不符。

因此,企业必须通过数据加密、访问控制、数据备份和恢复等方法来确保数据的完整性和准确性。

3、保证数据可用性在大数据时代,数据的可访问性是非常重要的。

无论是企业还是个人,数据的丢失都可能导致不可估量的损失。

在数据中心中,数据可用性问题主要是指保障企业内部对数据的访问。

为了确保数据的可访问性,企业需要构建强大的硬件基础设施,如高速网络、高性能存储和计算平台等,同时还需要定期备份和恢复数据。

二、隐私保护在大数据时代,个人隐私保护已经成为了社会关注的焦点。

大数据时代的隐私保护与安全

大数据时代的隐私保护与安全

大数据时代的隐私保护与安全未来的世界将逐渐步入大数据时代,人们生产出了前所未有的数据,这个趋势不可阻挡。

然而,我们需要确保这些数据的隐私保护和安全。

随着各种数据泄漏和信息安全事件的发生,越来越多的人意识到,个人数据的隐私和安全需要得到更加严格的保护。

本文旨在探讨大数据时代中的隐私保护和安全问题,并提出合理的解决方案。

一、如何保护隐私?网络安全是关键问题。

随着互联网技术的普及和发展,数据已经成为一个企业、一个机构、一个政府的重要资产,甚至可以说是这些机构的命脉。

面对如此重要的资源,隐私保护和安全问题必须得到足够的重视。

针对这个问题,可以提出以下方案:1.个人隐私教育首先,我们可以通过提高人们对于隐私保护的意识来进行隐私保护。

可以通过各种方式向个人传递隐私保护的重要性。

例如,可以在学校里教授关于网络安全的基础知识,或者通过社会广告来向公众普及网络安全知识。

2.隐私保护法律的完善为了进一步保护个人隐私和信息,我们需要加强隐私保护法律的建设和完善。

政府应该加强对各类隐私泄漏的打击力度,同时加强对于相关隐私保护法律的制定和完善,设置个人隐私泄漏等方面的司法责任。

二、如何实现信息安全?与隐私保护不同,信息安全通常是指确保数据不会被窃取或毁坏,同时保证数据在传输过程中不被干扰。

实现信息安全需要一个集成的方案,才能充分保护用户。

1.加强数据加密安全加密技术总是可以加强网络数据的安全性。

在任何一个网络通讯传输链路中,网络加密算法都是保证数据安全的好手段。

通过全面应用多种加密技术,可以确保数据的安全。

2.数据异地备份和传输这个方案可以保证即使某个地点发生了灾难性事件,导致本地数据丢失,但是数据在其他地方也可以进行备份保存,不影响数据的完整性。

在数据传输方面,通过多个通道、多重加密和多个判断检测机制来确保数据传输的安全性。

三、个人用户的自我保护在大数据时代,仅仅依靠政府的隐私保护方案和企业公司的数据保护行为并不能完全保护个人用户的隐私和信息安全。

大数据技术的发展现状与未来趋势展望

大数据技术的发展现状与未来趋势展望近年来,随着互联网和移动互联网的高速发展,大数据技术逐渐成为各行各业的重要工具。

大数据技术通过对海量数据的收集、分析和运用,为企业和组织提供了全新的决策依据和商业机会。

本文将探讨大数据技术的发展现状,并展望其未来的趋势。

一、大数据技术的发展现状大数据技术在过去十年内取得了巨大的进展。

首先,数据规模呈爆发式增长,各种传感器、社交媒体平台和智能设备不断产生着庞大的数据流。

其次,云计算技术的普及使得数据的存储和处理更加高效和便捷。

再者,机器学习和人工智能的快速发展为大数据的挖掘和分析提供了新的方法和算法。

这些因素的共同促进,大数据技术得以持续创新和升级。

在商业领域,大数据技术被广泛应用于市场研究、用户分析和精准营销等方面。

以电商巨头阿里巴巴为例,其利用大数据技术实现了用户画像和个性化推荐,提高了用户购物体验和精准营销效果。

此外,大数据技术也被应用于证券交易、风险管理和供应链管理等金融和物流领域,为企业提供了全新的商业模式和增长机会。

在城市管理方面,大数据技术能够实现对城市内各种设施设备和人流、交通流的实时监测和调度。

例如,各大城市的智能交通管理系统能够通过大数据分析实现交通拥堵的预测和疏导;而智能电网系统能够通过大数据技术进行电力需求和供应的优化和调控。

大数据技术的应用使得城市变得更加智能、高效和宜居。

二、大数据技术的未来趋势展望1. 数据安全与隐私保护将成为重要关注点随着大数据规模的不断扩大,数据安全和隐私问题将越来越突出。

未来,大数据技术需要更加注重数据的安全存储和传输,采用更加严格的数据权限管理和加密技术,防止数据泄露和滥用。

同时,隐私保护法律和监管政策也需要随之完善,确保个人隐私权益得到有效保护。

2. 边缘计算和智能设备将推动大数据技术的进一步发展边缘计算是指将计算任务从中心服务器下放到数据源附近的网络边缘。

未来,随着物联网的普及和智能设备的智能化,边缘计算将为大数据技术的应用提供更大的便利。

大数据安全与隐私保护的挑战与解决方案

大数据安全与隐私保护的挑战与解决方案随着互联网技术的飞速发展,大数据正成为各行业的核心资源和重要决策依据。

然而,大数据的应用也带来了巨大的安全与隐私保护挑战。

本文将探讨大数据安全与隐私保护的挑战,并提出相应的解决方案。

一、大数据安全的挑战1. 数据泄露风险:大数据中涵盖了大量的个人敏感信息,如姓名、身份证号码、银行账号等。

一旦这些信息被泄露,可能导致个人隐私曝光、身份盗用等问题。

2. 数据篡改威胁:大数据中的数据量庞大,且分布在不同的数据源中,这为黑客进行数据篡改提供了机会。

一旦数据被篡改,可能导致错误决策、财务损失等后果。

3. 数据存储与传输安全:大数据需要存储在云服务器中进行分析和处理,这就需要确保数据在存储和传输过程中的安全性,避免被未授权的访问和窃取。

4. 多维数据隐私保护:大数据中往往包含了多维度的个人信息,如地理位置、社交关系等。

如何在数据分析中保护这些个人隐私,成为了一个亟待解决的问题。

二、大数据隐私保护的解决方案1. 强化数据加密技术:通过对大数据进行加密处理,确保敏感信息在存储和传输过程中不被泄露。

常见的数据加密技术包括对称加密、非对称加密和哈希加密等。

2. 数据访问权限控制:建立严格的数据访问权限控制机制,确保只有授权的用户能够访问敏感数据。

可以通过设置身份验证、权限管理和审计日志等手段来实现。

3. 匿名化技术保护隐私:对大数据中的个人信息进行匿名化处理,使得无法直接将数据与具体的个人身份联系起来。

常见的匿名化技术包括数据脱敏、数据泛化和数据加扰等。

4. 隐私保护法律法规的完善:各国应完善相应的隐私保护法律法规,明确大数据使用和隐私保护的责任和义务。

同时,加强隐私保护的监管力度,对违反隐私保护规定的行为进行严惩。

三、大数据安全与隐私保护的未来趋势1. 隐私保护技术的集成应用:将多种隐私保护技术进行集成应用,形成更全面、更有效的隐私保护方案。

例如,将数据加密与匿名化相结合,加强数据的安全性与隐私保护效果。

大数据时代的隐私保护

大数据时代的隐私保护在大数据时代,随着信息技术的飞速发展,个人的隐私安全面临着前所未有的挑战。

隐私保护成为了一项重要的社会议题。

本文将探讨大数据时代的隐私保护问题,并提出相应的解决方案。

一、隐私保护的重要性在大数据时代,我们的个人信息被广泛收集、存储和分析,如购物记录、社交媒体行为、医疗记录等。

这些个人信息的收集和分析为商业目的、社会政策制定以及个性化推荐等带来了很多好处,但同时也存在滥用个人信息的风险。

保护隐私的重要性不言而喻。

二、大数据时代的隐私保护挑战1. 信息泄露风险:大数据的存储和传输过程容易遭受黑客攻击或内部人员泄露,导致个人信息被不法分子利用。

2. 用户追踪和定位:大数据分析技术使得个人的行为习惯和定位信息可被追踪,侵犯了个人的隐私权。

3. 数据关联和分析:大数据的关联分析能够从海量数据中挖掘出个人的敏感信息,例如健康状况、政治倾向等,违背了个人数据的收集目的。

三、大数据隐私保护的解决方案1. 加强法律保护:完善隐私保护相关的法律法规,明确个人信息的收集、使用和披露原则,规范企业和机构的行为。

2. 强化技术手段:加密和脱敏技术可以有效减少数据泄露风险,数据安全的相关技术需要进一步研究和发展。

3. 引入匿名机制:通过匿名化数据处理,个人信息在使用和分析过程中由真实身份转化为匿名身份,保护用户的隐私。

4. 数据共享机制:建立可控的数据共享机制,让用户可以选择是否共享自己的个人信息,并在共享过程中保护隐私安全。

5. 强化个人隐私保护意识:加强大众的隐私保护教育,提高个人隐私意识,增强隐私保护的自主权。

四、成功案例:欧盟的《通用数据保护条例》欧盟颁布的《通用数据保护条例》(General Data Protection Regulation,GDPR)对于保护隐私起到了积极的推动作用。

该条例明确规定了个人信息的收集、使用和披露原则,赋予了个人对于自己信息的更多控制权。

同时,该条例对于违反隐私保护的行为实行了高额罚款,提高了企业和机构对隐私保护的重视程度。

大数据时代的隐私保护问题与解决方案

大数据时代的隐私保护问题与解决方案随着大数据技术的快速发展和广泛应用,隐私保护问题成为了一个日益关注的焦点。

大数据时代的隐私保护问题与解决方案,涉及到个人信息保护、数据安全、数据共享、数据匿名化以及法律法规等多个方面。

在这篇文章中,我们将从这些方面对大数据时代的隐私保护问题进行分析,并给出相应的解决方案。

一、个人信息保护1.隐私泄露问题在大数据时代,个人信息的泄露已经成为一种常见现象。

无论是在网上购物、社交媒体上发布个人信息,还是在移动应用程序中输入个人隐私,都有可能导致个人信息泄露。

为了解决这一问题,首先需要做好个人信息的保护。

用户在网上交易或使用应用程序时,应该注意保护自己的个人信息,不要轻易向第三方机构透露个人隐私。

2.用户知情权问题在大数据时代,个人信息被收集和使用的情况非常普遍。

然而,许多用户并不清楚自己的个人信息被收集和使用的具体情况。

为了解决这一问题,相关机构和企业应该尽量公开他们收集和使用个人信息的方式和目的,给用户提供知情权,让用户了解自己的个人信息被如何使用。

3.个人信息安全问题个人信息安全是保护隐私的基础。

在大数据时代,用户的个人信息往往存储在云端,随时可能受到黑客攻击,导致个人隐私泄露。

为了解决这一问题,相关机构和企业需要加强信息安全措施,采取技术手段加密个人信息,并建立完善的安全管理制度,确保个人信息安全不受侵害。

二、数据安全1.数据泄露问题在大数据应用中,数据泄露风险是一个非常严重的问题。

一旦数据泄露,将给用户和企业带来严重的损失。

为了解决这一问题,相关机构和企业需要加强数据安全管理,制定完善的数据安全策略,并采取技术手段加密存储和传输数据,确保数据不受外界攻击。

2.数据共享问题在大数据应用中,数据共享是一个非常重要的环节。

然而,数据共享往往会面临数据安全的风险。

为了解决这一问题,相关机构和企业需要建立数据共享的安全机制,确保共享数据不受未经授权的访问和使用,维护数据的完整性和安全性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2016年4月Chinese Journal of Network and Information SecurityApril 2016第2卷第4期 网络与信息安全学报 V ol.2 No.4大数据安全高效搜索与隐私保护机制展望李尚,周志刚,张宏莉,余翔湛(哈尔滨工业大学计算机科学与技术学院,黑龙江 哈尔滨 150001)摘 要:随着信息产业的飞速发展,围绕大数据搜索展开的服务已渗透到人们生活的方方面面。

相关技术领域也正在经历深刻变革,如数据融合的隐私保护、场景感知的搜索意图理解、统计概率式的搜索模式等。

结合国内外最新研究进展,对大数据安全高效搜索与隐私保护问题进行了研究展望:首先,从多源数据发布、用户搜索需求感知及隐私感知的智慧解答3个视角凝练了大数据安全搜索与隐私保护的科学问题;其次,提出了面向大数据的信息融合与知识萃取技术、粒度化的知识表示与推演技术、支持平台与用户互动的搜索任务表示模型、基于用户体验驱动的任务管理技术、效用与代价平衡的粒度化搜索技术和基于差分隐私的安全搜索机制等研究内容;最后,对相关的技术路线进行了展望。

关键词:大数据;安全搜索;隐私保护;多源融合 中图分类号:TP393 文献标识码:Adoi: 10.11959/j.issn.2096-109x.2016.00041Prospect of secure-efficient search andprivacy-preserving mechanism on big dataLI Shang, ZHOU Zhi-gang, ZHANG Hong-li, YU Xiang-zhan(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)Abstract: With rapid development of information industry, services related to big data search have permeated into almost every aspect of human lives. Relevant technologies are undergoing profound changes, such as privacy pre-servation for data fusion, context-aware search intention comprehending and statistic search pattern. The issues of secure-efficient search and privacy-preserving for big data were studied and looked ahead. Firstly, three chief scien-tific problems were refined from the aspects of multi-source data publication, awareness of users’ search require-ments and privacy-aware wise solutions, respectively. Secondly, main research contents were proposed, including big data oriented information fusion and knowledge extraction, granular knowledge representation and inference, interactive representation of search task, user experience driven task management, granular search pattern balancing utility with cost, and secure search mechanism based on differential privacy. Lastly, several promising techniques in future were discussed.Key words: big data, secure search, privacy preservation, multi-source information fusion收稿日期:2016-03-07;修回日期:2016-04-02。

通信作者:周志刚,zzgisgod@基金项目:国家自然科学基金资助项目(No.61402137);国家重点基础研究发展计划(“973”计划)基金资助项目(No.2013CB329602)Foundation Items: The National Natural Science Foundation of China (No.61402137), The National Basic Research Program of China (973 Program) (No.2013CB329602)・22・网络与信息安全学报第2卷1 引言随着国家“互联网+”行动计划的实施,信息技术与经济社会的交汇融合引发了数据的迅猛增长,大数据已成为国家基础性战略资源,并已渗透到全球人类生产、流通、分配、消费活动的各个环节,正日益对经济运行机制、社会生活方式和国家治理能力产生重要影响。

大数据中蕴含丰富的信息和知识:在政府决策方面,各地区、各行业、各领域的统计数据,蕴含有政策法规成效与影响的宏观态势,经科学利用后可极大提升政府决策效率和风险防范水平;在社会民生方面,交通、气象、旅游等跨部门跨地域的数据,能够协同构成全方位的出行信息,从而方便公众出行、促进旅游事业蓬勃发展;在经济生产方面,研发设计、生产制造、经营管理、市场营销、售后服务等产品全生命周期产生的数据,综合反映出产业链各环节存在的问题,可推动制造模式变革和工业转型升级。

然而,这些信息和知识并不会自然呈现,而是需要用智慧的方法将其从海量的数据洪流中萃取出来,根据人们的现实需求进行多维度细粒度的高精度定制及演化,进而服务人们的工作和生活。

从用户的搜索需求看,随着人们生活工作的节奏加快,用户对搜索的期许发生巨大改变,相比枯燥漫长地等待精准解答,人们更期望得到满足精度需求的快速搜索体验。

从搜索技术看,传统的搜索引擎主要面向Web 1.0静态网页,是基于关键字的“存在性扫描搜索”,不能支持面向Web 2.0/3.0应用具有5V特性的大数据及其满足用户快速高精度的搜索需求。

这些问题催生了研究者对新型大数据搜索技术的探索。

本文研究的面向大数据的安全高效搜索技术,是在明确用户搜索需求的基础上,对大数据进行融合、萃取、推演等处理挖掘知识,进而快速地给出满足用户搜索需求及数据隐私保护的智慧解答。

大数据搜索具有以下5个特点:1) 多源融合,对多通道、多来源的异质、异构数据和信息进行统一表示,在数据层面消除数据缺失、歧义、冗余等现象,在信息层面消除由数据属性关联带来的融合隐私泄露风险;2) 知识综合,对规模庞大的数据属性进行归约,挖掘数据中蕴含的知识,建立统一的知识与关系表示模型,萃取多层次、粒度化且能够随数据的动态更新自我演化的知识聚合体;3) 有限开放,是指针对多源聚合数据在安全需求等级、隐私保护粒度和管理者利益等方面的不同,具备自适应、可重组、动态可调整的搜索信任、安全、隐私保护机制,面向不同的用户呈现差异化的搜索结果;4) 智慧搜索,综合考虑用户搜索情境、历史行为及数据访问权限等要素,整合挖掘出的相关知识聚合体,提供满足用户多元需求的智慧搜索方案;5) 快速响应,是指同时满足用户对搜索时效及搜索精度的诉求,能够有效复用历史同构搜索的粒度化结果视图,给出快速甚至在线解答。

在国家大数据战略和“互联网+”行动计划深入推进的时代背景下,人们期望大数据搜索能够达到“安全搜索随意行、隐私知识两相宜”的境界。

为了尽快实现这一目标,需要对大数据搜索相关技术的国内外研究现状、发展态势等进行综合分析,进而凝练科学问题,并提出若干需要突破的关键技术。

2 国内外研究进展本节从大数据的多源融合发布、用户搜索需求感知及隐私感知的智慧解答这3个方面分别介绍国内外最新的研究进展。

2.1面向大数据的多源融合发布对于传统的单数据源信息发布的隐私保护研究,如k-匿名[1](k-anonymity)、l-多样化[2](l-diversity)、t-贴近性[3](t-closeness)已广泛开展,Zhou等[4]对其进行了综述,此处不做讨论。

针对多源融合信息的隐私保护,一个值得讨论的问题是“多源融合信息的隐私保护方法能否继承传统的单数据源信息发布的隐私保护方法”,遗憾的是,答案是否定的。

例如,图1中的2个列表分别是数据源A和数据源B发布的数据(Name 列为非公开属性),假设敌手已知Alice的一些背景信息(年龄34),易知2个数据源发布的数据各自都满足(3-anonymity、2-diversity)的隐私需求,然而当2个数据源的数据进行融合时,Alice 患有胃炎的个人隐私信息被暴露。

第4期李尚等:大数据安全高效搜索与隐私保护机制展望・23・为此,Xiao等提出m-不变性[5](m-invariance),m-invariance方案是一种增量式的数据发布方案,要求每次发布的数据与前一次发布的数据相比,满足下列的情况之一:1)新发布的数据与前一次发布的数据属于同一个匿名组;2)为新发布的数据构建新的匿名组;3)当匿名组中的真实数据个数低于预设门限时,将发生匿名组间的融合,但融合后形成的匿名组必须同时满足参与融合的各个匿名组的敏感属性值多样化需求。

然而,该方案需要各个数据源的所有者明确知道彼此的真实数据,因此,仅适用于单个数据源多次数据发布的场景。

安全多方计算成为一个可行的方案,Clifton等[6]提出分布式k-匿名算法(D k A,distributed k-anonymity),该算法假设在垂直划分的数据环境下同一条记录有唯一的全局标识,数据集成的各方都只拥有部分属性的数据,利用可交换加密在通信过程中隐藏原始信息,再构建完整的匿名表判断是否满足匿名门限来实现数据隐私保护。

但该算法的时间开销很大,文献[6]中对defacto benchmark adult数据集匿名化需要12天。

文献[7]开发了一个针对关系数据计数、并、交、笛卡尔积4种典型操作的安全数据多方数据集成工具。

相关文档
最新文档