银行系统大数据共享隐私保护问题研究
大数据环境下的数据隐私保护技术研究

大数据环境下的数据隐私保护技术研究随着科技的不断进步和数据的爆炸式增长,大数据已成为人类社会的重要基础设施之一。
与此同时,数据隐私面临越来越大的挑战。
越来越多的人担心,数据隐私保护成为了大数据时代的一个主要问题。
本文将探讨大数据环境下的数据隐私保护技术研究。
一、大数据背景下的数据隐私问题如今,数据的增长速度远远超过了人类的想象。
一方面,数据的交互和使用常常是以人们的身份信息或自然人信息作为基础与前提条件进行的,另一方面,数据中可能含有的敏感信息更多、更复杂。
这就导致数据隐私问题变得尤为严重,个人隐私信息的泄露给社会和个人带来的风险显著增加。
二、大数据的隐私保护技术的意义及挑战大数据的安全和隐私保障问题一直是备受关注的问题。
保护数据隐私涉及到多个领域,包括密码学、网络安全、法律等。
在大数据迅猛发展的同时,大数据的隐私保护技术也面临着不断提高的挑战。
无疑,保护隐私数据的同时也要充分考虑到数据的使用效率问题。
因此,大数据隐私保护技术也成为大数据应用的瓶颈之一。
三、大数据隐私保护技术的研究现状1. 数据加密数据加密是一种比较常见的保护隐私数据的方法。
主要是将原始信息进行编码处理,使得外部人员无法通过简单的途径来识别和获取数据。
数据加密的常见方式有对称加密和非对称加密以及哈希加密等方法。
2. 噪音注入数据加噪声可以有效地降低隐私泄漏的风险,同时保护数据。
因为噪声越精确,数据的保护程度就越高。
在大多数情况下,噪声注入主要是在数据传输和共享的过程中来实现的。
3. 数据共享和匿名化措施数据共享和匿名化措施是传统的隐私保护方法。
使用这种方法可以确保共享数据的有效性和准确性,同时保护个人隐私信息。
四、大数据隐私保护技术的未来发展趋势1. 安全的算法设备和可信环境为了达到真正的数据隐私保护,今后必须致力于研究新的算法设备和可信环境。
这可以为保护大数据的隐私做出必要的权衡和取舍。
2. 隐私计算在大数据时代,隐私计算也成为了一种重要的技术选择。
大数据时代下的数据安全和隐私保护

大数据时代下的数据安全和隐私保护随着互联网技术的不断发展,我们已经步入了一个大数据时代。
在这样的时代里,数据的重要性已经不需要过多强调了,数据对于企业决策、社会治理、科学研究等方面都起到了不可替代的作用。
但是随着数据的重要性变得越来越明显,数据安全和隐私保护也变得越来越重要。
本文将浅谈大数据时代下的数据安全和隐私保护。
一、数据安全数据安全普遍面临着几个主要问题:一是防范数据泄漏,特别是对于敏感数据如个人隐私;二是保护数据不被篡改,特别是对于应用于金融、医疗等领域的数据;三是保护数据的可用性,保证数据能够在需要时被正常访问。
1、防范数据泄漏在大数据时代,各种数据源不断涌现。
为了收集这些数据,企业和机构需要建立大规模的数据中心,这些数据中心内部涉及大量的敏感数据,例如个人身份证号、个人地址、银行账号等数据。
一旦这些数据被泄露,将导致严重的后果。
因此,数据泄漏的问题是数据安全的首要问题。
企业可以通过加强员工教育、建立安全机制、加密技术等方式来防范数据泄漏。
在员工教育方面,企业要加强对员工的教育和培训,提高员工对数据安全的重视程度,使员工知道如何保护数据,如何从个人角度保护企业数据安全。
2、保护数据不被篡改数据的完整性也是数据安全的重要方面。
在大数据环境中,数据被经常用于金融、医疗等领域,必须确保数据的完整性和准确性。
异常的数据可能会导致计算的结果或分析的结论与实际不符。
因此,企业必须通过数据加密、访问控制、数据备份和恢复等方法来确保数据的完整性和准确性。
3、保证数据可用性在大数据时代,数据的可访问性是非常重要的。
无论是企业还是个人,数据的丢失都可能导致不可估量的损失。
在数据中心中,数据可用性问题主要是指保障企业内部对数据的访问。
为了确保数据的可访问性,企业需要构建强大的硬件基础设施,如高速网络、高性能存储和计算平台等,同时还需要定期备份和恢复数据。
二、隐私保护在大数据时代,个人隐私保护已经成为了社会关注的焦点。
大数据安全与隐私保护关键技术研究

大数据安全与隐私保护关键技术研究随着大数据时代的到来,数据的重要性越来越被人们所认识,而数据安全和隐私保护的问题也日益成为人们关注的焦点。
在大数据应用过程中,数据需要跨平台、跨组织进行共享和分析,这就带来了很大的数据泄露和隐私侵犯的风险。
因此,如何保证大数据安全以及隐私保护,已成为大数据应用过程中不可忽视的问题。
大数据安全保护的关键技术主要包括以下几个方面:1. 数据加密技术加密技术是数据安全保护的重要手段,通过对数据进行加密,可以有效地防止数据泄露和被窃取。
当前广泛使用的加密技术包括对称加密和非对称加密两种方式,其中对称加密速度快,但安全性较差,非对称加密速度较慢,但安全性较好。
在实际应用中需要根据不同的场景选择合适的加密方式。
2. 访问控制技术访问控制技术是指通过控制用户的访问权限来实现对数据的安全保护。
常用的访问控制技术包括:身份认证、访问授权、访问审计等。
其中,身份认证是指通过验证用户的身份来确定其是否具有访问权限;访问授权是指对已经通过身份认证的用户进行权限控制,包括读取、写入和执行等权限;访问审计是对用户的操作进行记录和审计,便于后期追溯和控制。
数据脱敏技术是指将敏感数据进行转换或者模糊化处理,以达到隐藏或消除真实敏感信息的目的。
主要的数据脱敏技术包括:数据替换、数据混淆和数据屏蔽等方式。
通过数据脱敏技术,可以有效地防止数据泄露和隐私侵犯。
数据监控技术是指通过数据监控系统对数据的流向、使用和访问等进行监控和控制,以及预测和识别异常行为。
数据监控技术包括:行为监控、访问频率监控、数据流转监控等技术。
通过数据监控技术,可以实时监测和发现数据安全问题,便于及时进行处理和控制。
数据审计技术是指在数据安全保护过程中对数据操作进行记录和审计,以确定数据的安全性和完整性。
数据审计技术包括:审计日志记录、审计跟踪、审计分析等技术。
通过数据审计技术,可以实现及时发现和追踪数据问题,以便及时进行处理和控制。
大数据时代下的个人隐私保护问题研究

大数据时代下的个人隐私保护问题研究一、大数据时代的背景二、个人隐私保护的现状三、保护个人隐私的措施四、个人隐私保护问题的解决方案五、结论一、大数据时代的背景大数据时代是以数字信息为主要特色的时代。
伴随着繁荣的互联网、移动互联网,大数据已成为了当前企业发展的核心竞争力。
日益完善的数据采集、储存、处理和分析技术为企业提供了更多的商机,为社会带来了便捷与发展。
二、个人隐私保护的现状大数据时代的到来,个人隐私的泄露成为了一个不容忽视的问题。
在互联网、移动互联网的普及下,用户的个人信息和行为数据会被无节制地采集,储存和分析。
这些行为数据包括但不限于个人感兴趣的搜索、浏览器历史记录、地理位置、社交媒体记录等,个人信息则是包括电话号码、日程表、电子邮件、信用卡信息等。
在扩展的互联网时代,数据隐私成为了一个共同的焦点。
目前,大部分企业和服务提供商并未规范他们的数据收集和安全性。
一旦泄漏,个人隐私信息可能会导致身份盗窃、恶意广告以及其他负面影响。
三、保护个人隐私的措施1.个人行为的保护个人用户可以通过以下方式保护他们的隐私:(1)使用具有隐私意识的浏览器加密、隐私插件、IPv6 ,更好的匿名模式或者社交隐身网站等。
(2)合理有效地管理自己的社交账户、电子邮件、移动设备等,尤其注意隐私设置。
(3)选择信誉度高、安全性高等技术服务商,避免使用可疑的网络服务。
2.企业在开展大数据分析时的保护措施企业必须注意保护用户数据,制定具体的策略建议,确保保护个人隐私:(1)在数据隐私政策和安全协议中加强对用户数据的保护。
(2)明确企业开发的应用程序是否收集数据,应如何使用该数据,以及如何处理数据泄露。
(3)通过数据 encryption技术、数据加密、权限访问控制策略、审计方法等手段,对敏感数据进行保护和管理,确保数据的安全。
(4)采取统一身份认证技术,使用户只需一个主要身份在不同的平台上进行身份验证,便可以很方便的管理在线个人信息,便于管理,降低风险。
大数据时代商业银行数据治理研究

大数据时代商业银行数据治理研究【摘要】本文主要探讨了大数据时代下商业银行数据治理的重要性和挑战。
在首先分析了大数据时代对商业银行数据治理带来的挑战,接着对商业银行数据治理的现状进行了深入分析,然后探讨了大数据技术在商业银行数据治理中的应用以及关键问题,并提出了建立科学合理的商业银行数据治理模式的建议。
在总结了本文的研究成果,并展望了未来研究方向。
本文旨在为商业银行在大数据时代下构建有效的数据治理模式提供理论支持和实践指导,以应对日益复杂的金融市场环境和数据管理挑战。
【关键词】大数据时代、商业银行、数据治理、研究、挑战、现状分析、技术应用、关键问题、数据治理模式、总结、展望、未来研究方向、结论。
1. 引言1.1 背景介绍在大数据时代,商业银行作为金融领域的重要组成部分,拥有海量的客户数据和交易信息。
这些数据不仅包含客户的个人信息,还涉及到各种交易记录、风险评估等关键信息。
随着信息技术的飞速发展和数据量的急剧增加,商业银行在数据治理方面面临着越来越多的挑战和压力。
在大数据时代,商业银行需要面对的挑战包括但不限于:数据质量问题、数据安全风险、数据隐私保护等方面的困扰。
商业银行还需要确保数据的准确性、完整性和实时性,以满足监管要求和客户需求。
在这样的背景下,进行商业银行数据治理研究显得尤为重要和迫切。
通过对商业银行数据治理的现状分析,了解大数据技术在其数据治理中的应用,研究商业银行数据治理的关键问题,并建立科学合理的数据治理模式,可以帮助商业银行更好地利用数据资源,提高数据管理和运营效率,降低数据治理风险,推动金融行业的可持续发展和创新。
1.2 研究意义商业银行作为金融服务的主要机构,在大数据时代面临着数据管理和治理的挑战。
商业银行拥有大量的客户数据、交易数据等敏感信息,如何有效地管理和保护这些数据,成为了当前亟需解决的问题。
研究商业银行数据治理的意义在于,可以帮助商业银行更好地利用大数据技术,提升数据处理的效率和准确性,提高风险控制能力,增强竞争力。
大数据安全与隐私保护关键技术研究

大数据安全与隐私保护关键技术研究随着互联网的不断发展,大数据技术也越来越成熟,为我们提供了更多的便利。
但是,同时也引发了大量的隐私和安全问题。
为了保证大数据的安全和隐私,需要开展相关研究,发展关键技术。
大数据安全是指在大数据系统中,保持数据的完整性、可用性和保密性。
要保证大数据安全,需要对数据进行加密、访问控制和数据备份等措施。
其中加密技术是保证数据安全的核心技术。
大数据利用公钥和私钥加密技术,确保数据在传输中的安全。
大数据隐私保护是指在大数据系统中,保持用户个人隐私的安全。
要保证大数据隐私保护,需要采用匿名化、遮蔽化和混淆化等技术。
其中匿名化技术是实现保护个人隐私的重要方法,通过对数据进行脱敏处理,将个人身份与数据剥离。
同时,遮蔽化技术也能够有效防止数据泄露。
当前,大数据安全和隐私保护的关键技术主要包括以下几个方面:1. 数据安全和隐私保护模型的设计。
针对大数据安全和隐私保护问题,需要设计相应的模型。
通过对数据的安全和隐私进行建模,可以更好地理解和分析大数据安全和隐私问题。
2. 数据加密技术的研究。
对于大数据系统来说,数据的传输过程非常重要,因此需要采取加密技术保证数据在传输过程中的安全。
常用的加密技术包括对称加密和非对称加密。
3. 数据脱敏技术的研究。
在处理大数据的过程中,需要对数据进行脱敏处理,保护个人隐私。
脱敏技术包括数据匿名化、数据遮蔽化和数据混淆化等。
4. 数据访问控制技术的研究。
为了保证数据的安全,需要限制数据访问的权限。
因此需要采用访问控制技术来防止非法访问和信息泄漏。
总之,大数据安全和隐私保护是当前互联网发展中重要的研究领域之一。
需要我们不断深入开展研究,发展更多的关键技术,加强对大数据的保护。
大数据背景下隐私权问题研究
大数据背景下隐私权问题研究随着大数据时代的到来,个人隐私正面临着前所未有的威胁,因为大数据技术的普及和应用使得个人数据可以被大规模地收集、分析和利用。
在这个背景下,隐私保护面临着诸多挑战,同时也产生了许多有关隐私权问题的研究和案例。
首先,隐私保护在医疗领域中是一个非常重要的问题。
例如,2015年美国的健康保险公司安盛(Anthem)遭到数据泄露事件,超过8000万名客户的个人信息被泄露,包括姓名、出生日期、社会保险号码以及医疗记录等。
这个事件导致了个人隐私权的侵犯,也引发了对医疗机构在数据安全管理方面的诸多疑问。
其次,在社交媒体平台上,隐私问题也经常受到关注。
例如,Facebook在2018年被曝光利用用户数据为政治目的。
此事在全球范围内引发了公众关注,隐私问题也因此成为热门话题。
毫无疑问,这种利用个人隐私数据因素的行为已经引发了关于社交媒体平台是否处理和保护用户数据的质疑。
另外一个例子是关于个性化广告的问题。
因为大数据和机器学习技术在广告领域的广泛应用,例如个性化广告,我们经常会发现一些广告精准地针对我们的兴趣爱好和行为习惯而推送。
但是,这种广告也存在一些问题,包括广告商如何使用我们的隐私数据以及如何保护我们的隐私权。
总之,随着大数据技术的进一步发展,隐私保护已经成为一项重要的问题。
未来,我们需要在技术和政策上采取更多的措施,以确保个人隐私得到更好的保护。
在面对大数据背景下的隐私权问题时,我们需要考虑如何平衡隐私保护和数据利用之间的关系。
一方面,我们需要更加确立和完善相关的法律法规来强化个人隐私保护,如加强对个人数据的收集、存储、传输、使用、销毁等各个环节的监管。
另一方面,我们也需要借助科技手段来解决这些问题,如数据加密、安全存储、虚拟身份、数据去标识化等手段可以保障用户的隐私安全。
此外,我们还需要提高公众对隐私权的认知和关注度,让更多的人了解个人隐私保护的重要性。
同时,公共管理部门应该继续加强数字素养和安全意识的培训,提高部门员工和机构的安全意识和技能,以更好地应对各种网络安全威胁和挑战。
大数据安全与隐私保护研究
大数据安全与隐私保护研究随着互联网技术的不断发展,大数据的应用越来越广泛。
大数据不仅在商业领域发挥着重要作用,还在医疗、教育、政府管理等领域得到了广泛的应用。
然而,大数据的安全和隐私保护问题也愈发引人关注。
本文将从大数据安全和隐私保护两个方面对大数据的研究进行探讨。
一、大数据安全大数据安全主要是指在大数据处理中,如何保证数据不被破坏、篡改、泄露等问题。
大数据的处理需要大量的计算资源和存储资源,因此一旦大数据安全问题出现,其后果将是灾难性的。
在大数据的安全研究中,主要包括数据加密技术、访问控制技术、防火墙技术等。
1、数据加密技术数据加密技术是大数据安全中不可缺少的一部分,它可用于保护数据的机密性、完整性和可用性。
数据加密技术可以将明文数据通过加密算法转换成密文数据,以达到数据保密的目的。
当前最常用的数据加密技术包括对称加密算法和非对称加密算法。
对称加密算法是对于加密和解密使用相同的密钥,而非对称加密算法则需要使用公钥和私钥进行信息加密和解密。
2、访问控制技术访问控制技术用于限制数据的访问,只有具备相应权限的用户才能访问相关数据。
访问控制技术可分为基于角色的访问控制、基于授权的访问控制以及基于内容的访问控制等。
其中,基于角色的访问控制是目前比较常见的访问控制方式,它是将用户按照角色分类,并将访问权限授权给特定角色,从而实现访问控制。
3、防火墙技术防火墙技术主要用于保护网络不受攻击,同时也能够防范数据被窃取或篡改。
防火墙可将来自外部的网络攻击拦截在外,保护服务器和数据的安全。
目前,防火墙技术已经非常成熟,主要包括包过滤器、状态检测、应用层网关等。
二、大数据隐私保护大数据隐私保护主要考虑的是如何保护数据的隐私性。
在大数据的处理中,对数据隐私的保护显得尤为重要。
数据隐私保护主要分为数据匿名化、隐私保护技术、隐私保护协议等。
1、数据匿名化数据匿名化是数据隐私保护的重要手段之一,它可以将原始数据进行匿名化处理,从而保护数据隐私。
大数据下隐私保护问题探析
栏目编辑:梁丽雯 E-mail:liven_01@虽然大数据时代的到来为人们的生活、工作带来了便利,但随之而来的一个更大的问题—— 隐私泄露越来越受各方的关注。
隐私泄露在大数据环境下变得防不胜防,电商平台可以通过分析用户的采购信息、浏览记录、收货信息等轻易获得用户敏感信息;搜索引擎可以通过分析用户搜索信息获得相应的隐私信息;社交软件、手机App更可以轻而易举地获得用户位置、通讯录等各种信息;运营商也可以通过基站定位获得用户位置信息。
对于一个生活在大数据时代的人而言,隐私正变的越来越透明。
隐私泄露后人们的生活带来了巨大的困扰,各种电信诈骗、银行卡盗刷、推销广告、骚扰电话等问题比比皆是。
要使大数据行业快速健康发展,必须从多层次、多角度去保护个人隐私。
一、大数据下隐私保护存在的问题移动互联网、网购、移动支付的飞速发展,积累了大量的金融大数据,也使得大数据在金融领域的应用有了数据基础。
然而金融大数据所涉及的个人信息更加具体、敏感,一旦泄露将有可能对个人财产、生活造成极大损失及困扰。
近年来,银行卡盗刷现象严重、电信诈骗猖獗,个人征信信息泄露时有发生,这些均与隐私泄露有关。
金融大数据下对隐私保护刻不容缓,特别是隐私保护技术发展相对缓慢、隐私收集滥用问题严重、隐私保护相关法律不完善、大数据应用与隐私保护难以平衡等问题亟须解决。
(一)隐私保护技术发展相对缓慢大数据不同于传统的数据,其包含了很多的外源性数据,这些大量的外源性数据通过整合和分析之大数据下隐私保护问题探析■ 中国人民银行周口市中心支行 赵战勇 黄北北摘要:近年来,随着互联网的逐步普及和移动互联网的迅猛发展,人们的生活得到了极大的改善。
在获得便利生活体验的同时,人们衣食住行等各种活动的痕迹都可能会被记录、存储、分析并加以应用。
这就是近年来常被提到的大数据技术的一种应用。
该技术可以为人们提供更精准便利的服务,但若使用不当也会暴露个人隐私,给个人生活带来极大的困扰。
大数据时代的隐私保护问题与解决方案
大数据时代的隐私保护问题与解决方案随着大数据技术的快速发展和广泛应用,隐私保护问题成为了一个日益关注的焦点。
大数据时代的隐私保护问题与解决方案,涉及到个人信息保护、数据安全、数据共享、数据匿名化以及法律法规等多个方面。
在这篇文章中,我们将从这些方面对大数据时代的隐私保护问题进行分析,并给出相应的解决方案。
一、个人信息保护1.隐私泄露问题在大数据时代,个人信息的泄露已经成为一种常见现象。
无论是在网上购物、社交媒体上发布个人信息,还是在移动应用程序中输入个人隐私,都有可能导致个人信息泄露。
为了解决这一问题,首先需要做好个人信息的保护。
用户在网上交易或使用应用程序时,应该注意保护自己的个人信息,不要轻易向第三方机构透露个人隐私。
2.用户知情权问题在大数据时代,个人信息被收集和使用的情况非常普遍。
然而,许多用户并不清楚自己的个人信息被收集和使用的具体情况。
为了解决这一问题,相关机构和企业应该尽量公开他们收集和使用个人信息的方式和目的,给用户提供知情权,让用户了解自己的个人信息被如何使用。
3.个人信息安全问题个人信息安全是保护隐私的基础。
在大数据时代,用户的个人信息往往存储在云端,随时可能受到黑客攻击,导致个人隐私泄露。
为了解决这一问题,相关机构和企业需要加强信息安全措施,采取技术手段加密个人信息,并建立完善的安全管理制度,确保个人信息安全不受侵害。
二、数据安全1.数据泄露问题在大数据应用中,数据泄露风险是一个非常严重的问题。
一旦数据泄露,将给用户和企业带来严重的损失。
为了解决这一问题,相关机构和企业需要加强数据安全管理,制定完善的数据安全策略,并采取技术手段加密存储和传输数据,确保数据不受外界攻击。
2.数据共享问题在大数据应用中,数据共享是一个非常重要的环节。
然而,数据共享往往会面临数据安全的风险。
为了解决这一问题,相关机构和企业需要建立数据共享的安全机制,确保共享数据不受未经授权的访问和使用,维护数据的完整性和安全性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分会具体提到。
3 结 语
2.2在客 户办理信 用卡时,个 .信用记 录泄露问题
本文讨论了实体 匹配中隐私保护的有关问题并提 出了两
在某位 客户在办理信用卡 时,地方银行会从中国人 民银 个解决银行系统内具体问题的解决框架 。通过本文介绍的隐
行调取该位客户的个人信用记录信息,该行为侵犯 了客户的 私保护的实体匹配技术,可 以在不暴露隐私信息的情况下得
圄爵固一国}固
图1 隐私保 护下的实体 匹配流程
作者 简介 :袁凤霞 (1966一 ),女,辽宁抚顺人 ,工程师,学士 ;研究方向:计算机。
一 38 一
第 3期 2018年 2
无 线 互联 科 技 ·网络地带
No.3
应用框 架如图2所示,可 以保证在各银 行的客户信息均 过在中国人 民银行设立信用评测系统,各地方银行只需 向中
第 3期 2018年 2月
无 线 大 数 据 共 享 隐私保 护 问题 研 究
袁 展 凤 霞葭
(沈 阳理 工 大学,辽宁 沈 阳 1101 59)
国 摘 要:在大数据时代 ,企业实现数据共享,可以减少数据 采集、资料收集等重复劳动和相应费用。但在共享并使用数据的道
随着计算机应用越 来越 广泛 ,各行业各部 门对信息的需 的流 程 如 图 l所 示 。
求也越 来越广泛 ,要求越来越 高。但 由于数据 由不 同用户以
隐私保护 下记 录 匹配的流程 主 要分为分块 、比较、决
不 同方式建模 ,导致了各数 据源之 间不 同程度的异构,使得 策3个核心过程。
个人 隐 私 。
到实体匹配 的结果。隐私保护的实体匹配技术 的研究,对于
个人信用记录保护框架 (见 图3)可以解决 以上问题。通 大数据共享具有深远的意义。
图2 隐私保护下的数据共享框 架
客户信 息
该用户 开 图3 个 ^信用记录保护框架
[参考文献】
[1]VERYKIOS V S,BERTINO E,FOVINO I N.State-of-the·art in privacy preserving data mining[J].ACM SIGMOD Record,2004(1):
享可能导致一些违规操作。又例如,客户在 申请信用卡前,各 性问的相似度。
银 行 会 调 取该 客 户 的个人信 用 记 录 ,该 行为 无 疑 侵 犯 了客户
(3)决策过 程:采取特定策 略将各属性的相似度 结合
的 个人 隐 私 。
成为两条记录 的相似 度,例如将 各属性 的相似度进 行加 权
账不得超 过5 000美元 。但如果某位 客户已在银行B转出外
1 隐私下的实体匹配概 述
币5 000美 元 ,又 到 银 行A继 续办 理 外 币转 账 业务 则可 以正常
隐私保 护下的实体 匹配是将 描述现 实世界中同一实体 办理。该现 象说明由于银行 间的数据不共享 ,导致一些违规
的不同表现形式的信息进行匹配的过程口。J,该过程中除了最 操作的存在 。但将各银行的客户信息进行共享又会导致 企业
而,在大数据共享的同时,不得不考虑到隐私问题。例如,在 的环 境 下对 数 据源 进行 分块 处 理 。
金融行业 ,各银 行在为个人提供外汇业务时,并不知情该客
(2)比较过程:根据模 式匹配信息,在隐私保护技术的
户是否 己在其他银行办理过此项业务,各银行间的数据不共 保护下分别对候选匹配对中各属性进行相似度计算,得到属
数 据 的应 用 。当前 ,隐 私保 护 领 域 的研 究 工作 主 要 集 中 2.1各银 行间数据不共享导致的外汇违规操作 问题
于 如 何 设 计 隐 私 保 护 原 则 和 算 法 更 好 地 达 到 这 两 方 面
在银 行系统中的外汇业务 规定 ,每位 客户每天 外 币转
的 平 衡 。
相关信 息无法方便地统一起 来。数据集成 技术就是为 实现
(1)分块 过程 :在实体 匹配中,Blocking ̄有非常重要
各种数 据源间信息的交流和共享而发 展起来 的。大数据共 的地位 。Blocking算法可 以将记录进行分块 ,从而减少 比较
享在金 融、医疗、政府等领域 都具有广泛而深远 的意义,然 次数,进而提高实体 匹配的效率。应 用隐私保护 技术在安全
终匹配 结果被数据源间共享 ,其他信息均 未泄露。隐私保护 内部隐私信息的泄露。因此 匹配出同一客户在不 同银行办理
下的实体 匹配的输入为结构已知的记录集合,即关系数据库 的所有外汇业务,并且不泄露除了该项信息以外的其他客户
中的表,其输出是两个数据库中匹配上 的实体的ID对。匹配 信息是亟待解决的问题 。
隐私保 护技 术[1-21的出现 就是为了解 决上述 问题 。具体 求和。最后通过判断两条记录的相似度是否大于阈值,来确
地说 ,实施 数据 隐私保 护主要 考虑 以下两个方面 :(1)如 定两 条记 录 是 否描 述 同一 实体 。
何保证 数 据应 用过 程 中不泄 露 隐私 ;(2)如何 更有 利于 2 银行系统存在的隐私保护问题及解决框 架
未被泄露的前提下,匹配出该位客户己在银行B转 出过5 000 国人 民银行传入客户信息,信用评测系统会 自动评测该客户
美元 。该技术 即为隐私保护实体 匹配 技术,因此 ,实体 匹配 信用 ,判 断其是否符合开卡标准并返 回给各银行。这样避免
中隐私保护 问题的研究成为当今热点。该技 术在接下来的部 了该客户个人信用记录的泄露。
路上,我们必须面对的一个问题是数据 隐私,它已成为制约大数据共享进一步发展的最大障碍。在银行 系统中,由于各银 行考 虑到客户及企业隐私 ,各银 行间并不进行数据共 享,这导致一些通过数据共 享可以非常简单的业务操作也要消耗 大量的人 力 物力来解决。文章提 出的隐私保护实体 匹配技术在保证个人和企业 隐私的前提下,解决了上述 问题 ,阐述了隐私保护实体 匹配 技术的概念,并提 出了两个针 对银行 系统具体问题的解决框 架。 关键词 :实体 匹配;隐私 ;密码 学;金 融