大数据一词在近年来被广泛提及,它不仅越来越频繁的出现在
大数据概论(专,2020春)_第一章测验——判断题0

4.1997年,1GB闪存的价格将近8000美元,现在是25美分。
答案:正确
ห้องสมุดไป่ตู้
5.具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响, 从而说服决策者信服并采纳其建议, 是数据分析能力对大数据人才的基本要求。
答案:错误
6.简单随机抽样,是从总体 N个对象中任意抽取 n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
答案:错误
7.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。
答案:错误
8.根据麦肯锡的预测,随着大数据的普及,全球零售业和医疗行业的利润将会减少。
答案:错误
9.宁家骏委员指出,发展大数据的应用,有助于促进医疗改革。
答案:正确
试卷总分:9 得分:9
1.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
答案:错误
2."大数据”一词,最早出现于20世纪90年代,当时的数据仓库之父比尔.恩门经常提及Big Data。
答案:正确
3.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
科技常用词组

科技常用词组科技已经成为了我们生活中不可分割的一部分,而科技领域也衍生出了许多常用的词组。
这些词组在科技新闻、科技论文和科技领域的交流中频繁出现,对于了解科技趋势和突破具有重要意义。
在本文中,我们将介绍一些科技领域中常用的词组,并对其进行简要解释。
1. 人工智能(Artificial Intelligence,AI)人工智能是指计算机系统通过模拟人类智能的方式进行任务处理和决策制定的技术。
在近年来,人工智能在语言识别、图像处理、机器学习等领域取得了突破性的进展,被广泛运用于各个行业,如医疗、金融、交通等。
2. 云计算(Cloud Computing)云计算是指通过互联网和数据中心的虚拟化技术,将计算资源和服务通过网络提供给用户的一种模式。
它将计算、存储和网络资源进行统一管理和分配,用户可以根据需求灵活获取和使用这些资源,大大提高了计算效率和资源利用率。
3. 物联网(Internet of Things,IoT)物联网是指通过互联网连接和通信的各类物理设备和物体,使其能够相互交互和共享数据的网络。
物联网将传感器、智能设备和云计算技术结合起来,实现了设备与设备之间的智能互联,为人们的生活带来了更多便利和智能化的体验。
4. 大数据(Big Data)大数据是指规模庞大且复杂的数据集。
这些数据集往往难以被传统的数据处理工具进行捕捉、管理和处理。
大数据技术通过适用于大规模数据的存储、处理和分析方法,实现了对数据的高效利用,以挖掘出有价值的信息和趋势。
5. 虚拟现实(Virtual Reality,VR)虚拟现实是一种通过计算机图形学和人机交互技术,模拟出虚拟环境和场景的技术。
通过佩戴虚拟现实头盔和使用手柄等设备,用户可以身临其境地感受到虚拟世界,为游戏、教育、医疗等领域带来了新的体验和可能性。
6. 区块链(Blockchain)区块链是一种分布式账本技术,通过由多个节点共同验证和维护的链式数据结构,实现了去中心化的可信交易和信息存储。
大数据是什么大数据有哪几类

大数据是什么大数据有哪几类在当今这个数字化的时代,“大数据”这个词频繁地出现在我们的生活中。
但对于很多人来说,大数据似乎是一个神秘而又复杂的概念。
那么,大数据究竟是什么?它又可以分为哪几类呢?简单来说,大数据就是指规模极其庞大、复杂到无法用传统的数据处理方式在合理时间内进行捕捉、管理和处理的数据集合。
这些数据的规模通常是 PB 级(1PB = 1024TB)甚至更大。
而且,大数据不仅仅是数据量大,还具有数据类型多样、处理速度快、价值密度低等特点。
想象一下,我们在互联网上的每一次搜索、每一次购物、每一次社交互动,都会产生大量的数据。
这些数据包括文字、图片、音频、视频等等,类型繁多。
同时,这些数据产生的速度非常快,需要在极短的时间内进行处理和分析,才能从中提取出有价值的信息。
然而,由于数据量太大,其中真正有价值的信息可能只占很小的一部分,这就导致了大数据的价值密度相对较低。
大数据的出现,给我们的生活和工作带来了巨大的影响。
它让企业能够更加精准地了解消费者的需求,从而提供更个性化的产品和服务;它帮助政府更好地制定政策,提高公共服务的质量和效率;它也推动了科学研究的发展,让科学家能够处理和分析海量的数据,发现新的规律和知识。
接下来,让我们来了解一下大数据的分类。
首先是结构化数据。
这是一种具有明确格式和结构的数据,比如数据库中的表格数据。
它通常以行和列的形式组织,每一行代表一个记录,每一列代表一个字段,具有高度的规范性和一致性。
这类数据易于存储、查询和分析,是企业和组织中最常见的数据类型之一。
其次是非结构化数据。
与结构化数据相反,非结构化数据没有固定的结构和格式。
它包括文本、图像、音频、视频等。
例如,一篇博客文章、一张照片、一段音乐、一个视频文件都属于非结构化数据。
这类数据占大数据总量的很大一部分,但其处理和分析相对复杂,需要使用特殊的技术和工具。
然后是半结构化数据。
它介于结构化数据和非结构化数据之间,具有一定的结构,但不如结构化数据那么严格。
大数据论文3000字范文(精选5篇)

大数据论文3000字范文(精选5篇)第一篇:大数据论文3000字当人们还在津津乐道云计算、物联网等主题时,“大数据”一词已逐渐成为IT网络通信领域热门词汇。
争夺大数据发展先机俨然成为世界各国高度重视的问题,其中不乏IBM、EMC、甲骨文、微软等在内的巨头厂商的强势介入,纷纷跑马圈地,它们投入巨额资金争相抢占该领域的主动权、话语权。
大数据时代的来临,除了推动现有的信息技术产业的创新,其对我们生产生活的方式也将产生重大影响。
从个人视角来看,不管是日常工作中遇到的海量邮件或是从网上获取的社交、购物、娱乐、学习、理财等信息,还是生活中最常见的手机存储,大数据已经渗透到我们日常生活的方方面面,极大地方便了我们的生活;对企业而言,互联网公司已开始采用大数据来冲击传统行业,精准营销与大数据驱动的产品快速迭代,促进企业商业模式创新;在社会公共服务方面,教育、医疗、交通等行业在大数据的影响下,出现了各种新的应用,数据化、社交化的新媒体平台、智能交通与城市数字监管系统,以及病历存储调用的医疗云等,此外,政府还可以通过大数据来高效完成信息采集,这样可优化升级管理运营。
然而大数据在给我们展示前所未有的发展机遇的同时,也给国家信息安全、信息技术、人才等方面带来了很大的挑战。
不久前,斯诺登披露了美国国家安全局(NSA)一直进行信息监视活动、已收集数以百万计的全球人的信息数据的消息,在全球范围内掀起轩然大波。
该事件对“大数据”的信息安全敲响了警钟。
大数据让大规模生产、分享和应用数据成为可能,将信息存储和管理集中化,我们在百度上面的记录,无意识阅读的产品广告、旅游信息,习惯去哪个商场进行采购等这些痕迹,却不知所有的关系和活动在数据化之后都被一些组织或商家公司掌控,这也使得我们一方面享受了“大数据”带来的诸多便利,但另一方面无处不在的“第三只眼”却在时刻监控着我们的行动。
面对大数据在信息安全方面存在的隐忧,我们在技术上要应对其“大容量、多类别、高时效”的三大挑战。
新版精选2020年最新公需科目《大数据》完整考试题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.cpu 处理能力强二、单选题2.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源3.下列关于计算机存储容量单位的说法中,错误的是( C)。
(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,4.下列关于数据交易市场的说法中,错误的是( C)。
(单选题)A.数据交易市场是大数据产业发展到一定程度的产物B.商业化的数据交易活动催生了多方参与的第三方数据交易市场C.数据交易市场通过生产数据.研发和分析数据,为数据交易提供帮助D.数据交易市场是大数据资源化的必然产物5.下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题)A.互联网金融打破了传统的观念和行为B.大数据存在泡沫C.大数据具有非常高的成本D.个人隐私泄露与信息安全担忧三、多选题6.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题)是否7.贵州发展大数据的顶层设计是要逐步建成三个中心,即()。
BCDA.大数据人才中心B.大数据金融中心C.大数据内容中心D.大数据服务中心8.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
√正确错误9.大数据的思维会把原来销售的概念变成服务的概念。
√正确错误10.2012年全国各城市支付宝人均支出排名中,位居第三位的是()A.嘉兴市B.嘉义市C.杭州市D.高雄市11.人类历史上的五次媒介革命具体指的是语言出现.()。
A.印刷术B.文字出现C.电话.广播.电视D.计算机.互联网.数字化12.2015年8月31日,国务院印发了《促进大数据发展行动纲要》。
正确错误13.韩国政府利用位置信息和通话记录数据,规划出合理的公交线路,提升了政府科学决策和公共服务水平,提高了公众满意度。
《大数据时代》的读后感

《大数据时代》的读后感《大数据时代》的读后感(通用7篇)《大数据时代》的读后感1这两年,大数据这个词突然变得很火,不仅出现在互联网公司的战略规划中,同时在中国国务院和其他国家的政府报告中也多次提及,无疑成为当今互联网世界中的新宠儿。
笔者对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据时代》才有了粗略的认识。
《大数据时代》从思维、商业、管理三个方面阐述了在大数据时代下的变革。
这些变革涉及人们生活的方方面面,其影响程度可以与两次工业革命相媲美。
作者在第一部分提出了三个比较令人震惊的观点:第一,不是随机样本,而是所有数据,这里要求数据有很多。
第二,不是精确性,而是混杂性,这里要求数据更杂。
第三,不是因果关系,而是相关关系,这里要求数据要更好。
第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。
第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。
个人认为这本书的精髓部分是第一部分。
第一部分的三个观点涉及面很广,包括统计学、逻辑学、哲学等。
后两个部分都是以第一部分这三个观点为基础展开阐述的。
笔者侧重于从第一部分中的这三个观点谈谈自己的看法。
这三个观点其实就是哲学上讲的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。
首先,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,人们可以获得海量的数据,抽样自然就失去它的意义了。
其次,要效率不要绝对的精确。
作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。
如果不接受混乱,剩下95%的非结构化数据都无法被利用。
作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据,一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。
新版精选2020年最新公需科目《大数据》完整考试题库(含标准答案)

49.DDS是指分布反射式拒绝服务。×分
正确
错误
50.根据涂子沛先生所讲,因为数据的内涵发生了改变,计算的内涵也发生了改变。
正确√
错误
A.数字城市B.物联网C.联网监控D.云计算
43.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。因此,大数据收集的信息量要尽量精确。(F)(判断题)
是否
44.下列关于数据交易市场的说法中,错误的是(C)。
A.数据交易市场是大数据产业发展到一定程度的产物
B.商业化的数据交易活动催生了多方参与的第三方数据交易市场
A.对数
B.指数
C.正比
D.反比
8.大数据元年是指()。C
A.2012年
B.2011年
C.2013年
D.2010年
9.建立大数据需要设计一个什么样的大型系统?
■A.能够把应用放到合适的平台上■B.能够开发出相应应用■C.能够处理数据■D.能够存储数据
10.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是()。
100分
47.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。(单选题1分)
A.77%
B.97%√
C.67%
D.87%
48.大数据的特征是:(ABCD)(多选题3分)分
A.速度快
B.类型多
C.价值密度低
D.优化存储设备,降低设备成本
E.提高社会效益,优化社会管理
24.根据周琦老师所讲,高德早在(B)就开始投入;;
A.2005年;B.2007年;C.2002年;D.2004年;
大数据试题与答案--最全

1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的多流形结构分析我们已经进入了一个信息爆炸的时代,海量的数据不断产生,迫切需要对这些大数据进行有效的分析,以至数据的分析和处理方法成为了诸多问题成功解决的关键,涌现出了大量的数据分析方法。
几何结构分析是进行数据处理的重要基础,已经被广泛应用在人脸识别、手写体数字识别、图像分类、等模式识别和数据分类问题,以及图象分割、运动分割等计算机视觉问题(人脸识别、图像分类、运动分割等实例见下文)中。
更一般地,对于高维数据的相关性分析、聚类分析等基本问题,结构分析也格外重要。
文献[1]指出一个人在不同光照下的人脸图像可以被一个低维子空间近似,由此产生大量的数据降维方法被用来挖掘数据集的低维线性子空间结构,这类方法假设数据集采样于一个线性的欧氏空间。
但是,在实际问题中很多数据具备更加复杂的结构。
例如,文献[2]中指出,运动分割(motion segmentation)中的特征点数据具有多个混合子空间的结构,判断哪些特征点属于同一子空间是这个问题能否有效解决的关键。
针对单一子空间结构假设的后续讨论主要是两个方面,首先是从线性到非线性的扩展,主要的代表性工作包括流形(流形是局部具有欧氏空间性质的空间,欧氏空间就是流形最简单的实例)学习等。
流形学习于2000年在著名杂志Science上被首次提出,之后逐渐成为了研究热点。
基于数据均匀采样于一个高维欧氏空间中的低维流形的假设,流形学习试图学习出高维数据样本空间中嵌入的低维子流形,并求出相应的嵌入映射。
流形学习的出现,很好地解决了具有非线性结构的样本集的特征提取问题。
然而流形学习方法通常计算复杂度较大,对噪声和算法参数都比较敏感,并且存在所谓的样本溢出问题,例如,当增加新的样本点时,不能快速地提取新特征。
其次是流形或子空间从一个到多个的扩展,即假设数据集采样于多个欧氏空间的混合。
子空间聚类(又称为子空间分割,假设数据分布于若干个低维子空间的并)是将数据按某种方式分类到其所属的子空间的过程。
通过子空间聚类,可以将来自同一子空间中的数据归为一类,由同类数据又可以提取对应子空间的相关性质。
根据综述[2],子空间聚类的求解方法有代数方法、迭代方法、统计学方法和基于谱聚类的方法。
其中基于谱聚类的方法在近几年较为流行,这类方法首先定义一个关于样本点相互关系的图,然后利用Normalized Cut[3]等谱聚类方法(其输入是一个反应样本关系的相似度矩阵,矩阵的第i行j列的数值越大说明第i个样本和第j个样本的关系越密切,如果能将同类样本的相似度构造的较大,不同类的较小,这类方法一般都能得到正确的分类结果)得到分割结果。
代表性的基于谱聚类的子空间分割方法包括低秩表示[4]和稀疏表示[5]等,下面对这两种方法的做个简单介绍。
稀疏子空间聚类:稀疏子空间聚类方法,是对子空间表示系数进行稀疏约束的一类子空间聚类方法。
子空间聚类的最终结果是将同一子空间的数据归为一类。
在子空间相互独立的情况下,属于某一子空间的数据只由这个子空间的基的线性组合生成,而在其他子空间中的表示系数为零。
这样高维数据的表示系数就具有稀疏的特性。
同一子空间中的数据,因为都仅在这一子空间中有非零的表示系数,表现为相同的稀疏特性,通过对表示系数稀疏约束的求解,突出了数据表示系数的这种稀疏特性,进而为数据的正确聚类提供支持。
低秩子空间聚类通过对子空间表示系数矩阵的研究,有些学者在求解子空间表示系数矩阵时,引入核范数(一个矩阵的核范数是指矩阵的所有奇异值的加和)约束,希望通过系数矩阵的低秩要求得到更好的数据的子空间表示。
文章[4]给出了低秩表示模型的闭解且理论上保证了当子空间独立且数据采样充分的情况时,低秩表示可以得到块对角的解。
这个结论基本保证了低秩表示方法在解决独立子空间分割问题的有效性。
有些实际问题的数据并不符合混合子空间结构的假设,例如图3(a)中一个圆台的点云,圆台的顶,底和侧面分别采样于不同流形。
所以假设数据的结构为混合多流形更具有一般性。
由于混合流形不全是子空间的情况,数据往往具有更复杂的结构,分析这种数据具有更大的挑战性。
基于谱聚类的方法仍然是处理该类问题的流行方法如文献[6]。
虽然这类数据本身无法使用相互表示的方式,但是数据的特征可相互线性表示且表示系数具有稀疏性或低秩性的特点。
由此一些学者通过提取数据的特征将低秩表示模型扩展用于处理图像分割[7]、图像的显著性检测[8]等问题。
本几何结构分析问题中假设数据分布在多个维数不等的流形上,其特殊情况是数据分布在多个线性子空间上。
请按照文献中的方法或以文献中的方法为基础创新新的方法完成以下问题, 创新部分一定要讲清思路,要具有一般性(例如不仅适应低维数据也适应高维数据)。
回答方式:第1题,第3题的b与c请制作一个表格输出样本的类别标签,每行20个,其余题目请将分类结果画出:1.当子空间独立时,子空间聚类问题相对容易。
附件一中1.mat 中有一组高维数据(.mat 所存矩阵的每列为一个数据点,以下各题均如此),它采样于两个独立的子空间。
请将该组数据分成两类。
2.请处理附件二中四个低维空间中的子空间聚类问题和多流形聚类问题,如图1所示。
图1(a)为两条交点不在原点且互相垂直的两条直线,请将其分为两类;图1(b)为一个平面和两条直线,这是一个不满足独立子空间的关系的例子,请将其分为三类。
图1(c)为两条不相交的二次曲线,请将其分为两类。
图1(d) 为两条相交的螺旋线,请将其分为两类。
-101-1-0.500.5-0.8-0.6-0.4-0.20.20.40.60.8(a) (b)(c) (d)图13. 请解决以下三个实际应用中的子空间聚类问题,数据见附件三(a)受实际条件的制约,在工业测量中往往需要非接触测量的方式,视觉重建是一类重要的非接触测量方法。
特征提取是视觉重建的一个关键环节,如图2(a)所示,其中十字便是特征提取环节中处理得到的,十字上的点的位置信息已经提取出来,为了确定十字的中心位置,一个可行的方法是先将十字中的点按照“横”和“竖”分两类。
请使用适当的方法将图2(a)中十字上的点分成两类。
(b)运动分割是将视频中有着不同运动的物体分开,是动态场景的理解和重构中是不可缺少的一步。
基于特征点轨迹的方法是重要的一类运动分割方法,该方法首先利用标准的追踪方法提取视频中不同运动物体的特征点轨迹,之后把场景中不同运动对应的不同特征点轨迹分割出来。
已经有文献指出同一运动的特征点轨迹在同一个线性流形上。
图2(b)显示了视频中的一帧,有三个不同运动的特征点轨迹被提取出来保存在了3b.mat文件中,请使用适当方法将这些特征点轨迹分成三类。
(a) (b)图2(c)3c.mat中的数据为两个人在不同光照下的人脸图像共20幅(X变量的每一列为拉成向量的一幅人脸图像),请将这20幅图像分成两类。
4. 请作答如下两个实际应用中的多流形聚类问题图3(a)分别显示了圆台的点云,请将点按照其所在的面分开(即圆台按照圆台的顶、底、侧面分成三类)。
图3(b)是机器工件外部边缘轮廓的图像,请将轮廓线中不同的直线和圆弧分类,类数自定。
(a) (b)图3参考文献[1] R. Basri and D. W. Jacobs. Lambertian reflectance and linear subspaces. IEEE Transactions on Pattern Analysis and Machine Intelligence, 25(2):218–233, 2003.[2] R. Vidal. Subspace clustering. IEEE Signal Processing Magazine, 28(2):52–68, 2011.[3] J. Shi and J. Malik, “Normalized cuts and image segmentation,”IEEE Transactions Pattern Analysis Machine Intelligence, 22(8):888–905, 2000.[4] G. Liu, Z. Lin, S. Yan, J. Sun, Y. Yu, and Y. Ma. Robust recovery of subspace structures bylow-rank representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(1):171–184, 2013.[5] E. Elhamifar and R. Vidal. Sparse subspace clustering: Algorithm, theory, and applications.IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(11):2765–2781, 2013.[6] Y. Wang, Y. Jiang, Y. Wu, and Z. Zhou. Spectral clustering on multiple manifolds. IEEE Transactions on Neural Networks, 22(7):1149–1161, 2011.[7] B. Cheng, G. Liu, J. Wang, Z. Huang, and S. Yan, Multi-task low rank affinity pursuit for image segmentation, ICCV, 2011.[8] C. Lang, G. Liu, J. Yu, and S. Yan, Saliency detection by multitask sparsity pursuit, IEEE Transactions on Image Processing, 21(3): 1327–1338, 2012.。