2中国海洋大学学士论文开题报告范文
论文开题报告怎么写5篇

论文开题报告怎么写5篇论文开题报告怎么写(篇1)一、研究背景20世纪初才在我国大量栽培。
洋葱中含有丰富的黄酮类化合物,而黄酮类化合物在医药和食品中有着广泛的应用。
黄酮类化合物具有抗癌、抗心血管老化、抗炎、杀菌及降血压等作用。
有报道说,洋葱中主要的类黄酮是黄酮醇懈皮素及其衍生物,其含量达总黄酮含量的80%以上,由于含有酚烃基结构而具有较强的抗氧化作用,许多药理学研究表明,懈皮素具有比其它类类黄酮更强的抗氧化性、清除自由基活性、抑制脂肪氧合酶和环氧化物酶,防止血小板凝集的作用。
由于洋葱具有多种保健功能特性,其精深加工产品蕴涵着巨大的市场。
因此,对洋葱的深入研究将会为降血糖、降血脂、抗血栓、抗菌抗癌等天然药物的开发利用提供新的线索。
目前对洋葱的研究主要集中在含硫化合物上,而对其黄酮类化合物提取、应用开发技术方面的研究报道甚少目前,国内也几乎没有真正意义上的洋葱深加工产品,其加工水平和产品处于脱水等较低水平。
例如:洋葱干和洋葱粉,以及洋葱沙拉酱等。
而在发达国家开发出洋葱黄酮胶囊、洋葱方便食品等多种既具较强保健功能又方便、营养可口的深加工产品。
因此通过高新技术应用和提取工艺的优化从洋葱中提取黄酮类化合物,能够提高原料的利用率,提高产品的附加值,有利于经济效益的提高。
我国加入WTO后,因包括劳动力在内的生产要素低廉,所以洋葱等原料在国际贸易中具有明显的外贸比较优势。
多年来中国洋葱产业主要以原料或初级加工产品面向国际市场。
目前,我国洋葱及其制品的生产和销售受到三个方面的制约:第一,原料形式出口和销售受市场因素制约较大,且价格较低,附加值低;第二,应用领域不宽,出口价格波动较大,导致产品积压,同时又反过来影响了种植和加工;第三,加工品种类型单一,销售一市场单一。
以上三方面的影响导致其价格不稳定,收入不稳定,极大地影响了我国洋葱产业的发展。
尤其是洋葱产业普遍存在产品结构不合理、品种单一、生产上艺水平低、呈现主要药理功能作用的风味物质提取率及在产品中的含量低的缺点,难以创造高技术含量、高附加的适应市场需求的新产品,严重影响了产业的进一步发展。
学士学位论文设计开题报告

学士学位论文设计开题报告学士学位论文设计开题报告一、概念界定(一)择园家长们都希望孩子能够赢在人生的起跑点,这种想法很正常,但是很多家庭不顾自身条件,憋着劲想把孩子送进最好的最贵的学校受最好的教育。
(重新查资料,解释什么是择园,看看前人有哪些研究说到了择园的定义,然后归纳总结)二、文献综述:根据中国知网文件检索和校图书馆书库查询结果,目前国内对幼儿家长择园方面的研究集中于收费标准、硬件设施、家的远近、幼儿教师与家长之间的关系等方面,现分述如下:(一)国内研究1.关于收费标准的研究随着我国经济的发展,城市和农村的收入差距不断增大。
冯芳在《“择园培优热”现象引发的思考》一书中提到,幼儿园的收费标准对于家长的择园选择具有很大的影响,诸多家长因为自身收入状况的影响,在选择幼儿园的时候较多选取离家较近且学费在自身承受范围内的学校为主。
幼儿园收费标准的高低影响到家长的选择。
(只有这一个研究么)补充“硬件设施”相关内容关于家的远近的研究当前社会的发展和进步,使得我国人民的出行工具愈加多样,遍地的车辆使得幼儿家长对孩子一书中指出,由于消费水平的差异,诸多幼儿园家长在为孩子选择幼儿园的前期,首先便会考虑到学校的远近问题,家长较多选择离家较近的幼儿园,某些家长甚至为了让孩子上一所较好的幼儿园会重新购置房产,可见家的远近对于家长的择园有较大影响。
(还可以补充)关于老师自身关系研究学者唐林兰在《从幼儿家长的择园观谈择园策略》一书中提到,某些幼儿家长在择园的前期会充分发挥自身的人脉关系,他们对于自己的朋友或者亲戚的信任度更高,更乐意将自己的孩子交到其手上,由此幼儿教师与家长的关系使家长的择园出现较大偏向性。
(太简单了,很单薄)(二)国外研究Anonymous在《UK Government: Hannah and Rachel - Brits with the green-fingered X - chosen to shape 2012 garden》和《Chooses Fiber One 90 Calorie Chewy Bars Winner》两篇文章中中针对幼儿家长的择园因素进行了分析,着重分析了收费标准、硬件设施、家的远近三方面,文章中阐明了国外家长在择园过程中较多考虑的因素为幼儿园的硬件设施和收费标准方面,基于消费水平的差异,国外私家轿车较为普遍,因此家的远近是择园的因素,但不是主要因素,国外家长的考虑因素主要集中在幼儿园的硬件设施上,较为注重孩子的成长环境和学习环境。
毕业论文开题报告范例

毕业论文开题报告范例一、选题背景选题背景是介绍你选择这个课题的原因,以及该课题的研究价值和意义,应该简单明了地阐述论文研究的动机和目的。
本文研究的课题是“基于深度学习的图像分类算法研究”,随着人工智能技术的不断发展,深度学习已经成为计算机视觉领域的研究热点之一,在图像分类、目标检测等方面取得了很多成功应用,具有极高的研究价值和应用前景。
二、研究现状研究现状是对课题领域内的前沿进展进行梳理和归纳,包括国内外研究现状、研究动态,通过收集和阅读文献,掌握研究动态,把握研究热点。
目前,国内外学者在深度学习的图像分类领域有了许多较为成熟的算法,如卷积神经网络(CNN)、循环神经网络(RNN)等。
其中,CNN算法以其良好的分类效果和高效率受到广泛的关注。
三、研究内容和方法研究内容和方法是对论文的研究内容和设计方法论述,应该包括研究内容的具体描述和研究方法的设计思路。
论文研究的内容主要是基于深度学习的图像分类算法设计,对比和改进。
主要包括以下三个方面:1.对深度学习的基本理论和技术进行综述,主要介绍卷积神经网络等深度学习算法在图像分类方面的应用。
2.设计并实现针对图像分类的深度学习网络,探究不同的网络结构(比如LeNet、AlexNet、GoogLeNet等)对分类性能的影响。
3.分别在公开的图像数据集上对比分析各种算法的分类效果和资源开销,为图像分类领域的深度学习算法提供一定的理论和实验依据。
论文研究的方法主要包括以下几个方面:1.阅读相关文献,系统学习深度学习算法的理论与应用;2.设计并实现基于Python语言和TensorFlow深度学习框架的图像分类算法,并通过自主收集的图像数据进行训练和验证;3.对比分析不同深度学习算法的分类性能和资源开销,具体包括准确度、召回率、精确度、资源占用等方面的综合评估;4.分析实验结果,对比各个算法的优劣,提出改进算法的思路和方法。
四、研究进度安排研究进度安排是针对上述研究内容和方法,通过时间轴的形式,制定出具体的研究计划和进度安排。
海洋工程专业毕业设计开题报告

海洋工程专业毕业设计开题报告一、选题背景与意义海洋工程是一个涉及海洋资源开发利用、海洋环境保护、海洋能源开发等多个领域的综合性学科,随着我国海洋事业的不断发展,海洋工程专业的毕业设计显得尤为重要。
本文选题旨在探讨海洋工程领域中的某一具体问题,通过深入研究和实践,为相关领域的发展提供新的思路和方法。
二、选题内容和目标本次毕业设计选题为《海洋平台结构在极端环境下的抗风性能研究》,旨在通过对海洋平台结构在极端环境(如台风、飓风等)下的抗风性能进行深入研究,探讨其在恶劣气象条件下的稳定性和安全性,为我国海洋工程领域的发展提供技术支持和理论指导。
三、选题研究内容和方法文献综述:对国内外相关领域的研究现状进行梳理和总结,分析已有研究成果和存在的问题。
理论分析:运用结构力学、流体力学等理论知识,对海洋平台结构在极端环境下的受力情况进行分析和计算。
数值模拟:借助有限元分析软件,建立海洋平台结构的数值模型,模拟不同极端环境下的风载荷作用情况。
实验验证:设计并进行相关实验,验证数值模拟结果的准确性,并对不同参数对结构抗风性能的影响进行研究。
四、预期成果对海洋平台结构在极端环境下的抗风性能进行深入研究,揭示其受力规律和变形特点。
提出针对海洋平台结构抗风设计的优化方案,提高其在恶劣气象条件下的安全性和稳定性。
为我国海洋工程领域相关技术提供新思路和方法,推动我国海洋事业的可持续发展。
五、进度安排第一阶段(1-2周):开展文献综述,梳理相关领域研究现状。
第二阶段(3-6周):进行理论分析,建立数值模型,开展初步数值模拟。
第三阶段(7-10周):设计实验方案,进行实验验证,并对结果进行分析和总结。
第四阶段(11-14周):撰写毕业设计论文,并准备答辩材料。
第五阶段(15周):完成毕业设计论文撰写,并准备答辩。
以上为本次毕业设计开题报告内容,希望能得到指导老师的认可与支持,谢谢!。
毕业论文开题报告的参考范本

毕业论文开题报告的参考范本一、选题背景及意义随着社会的不断发展和进步,高等教育已经成为人们提升自身素质、获取知识技能的重要途径。
而毕业论文作为高等教育的重要组成部分,对于学生的综合能力和学术水平有着重要的检验作用。
因此,如何选择一个合适的毕业论文课题显得尤为重要。
本文旨在提供一份毕业论文开题报告的参考范本,帮助学生更好地完成毕业论文选题和开题报告的准备工作。
二、选题的依据和意义1. 选题依据选题应当符合自身专业知识和兴趣爱好,同时要考虑到社会的需求和发展趋势。
在选择毕业论文课题时,可以参考相关领域的研究现状和热点问题,结合自身的实际情况和兴趣爱好,确定一个既有研究价值又具有实践意义的课题。
2. 选题意义选题的意义在于为学生提供一个展示自己研究能力和学术水平的平台,同时也可以为相关领域的学术研究和实践工作提供有益的参考和借鉴。
通过毕业论文的撰写和答辩,学生可以提升自己的研究能力和表达能力,为将来的学术研究和工作打下坚实的基础。
三、选题内容和研究方法1. 选题内容选题内容应当明确具体,要求符合学术规范和研究要求。
在确定选题内容时,可以参考相关领域的研究成果和前沿动态,结合自身的研究方向和实际需求,确定一个既有研究价值又具有实践意义的课题。
2. 研究方法研究方法是毕业论文研究的核心内容,直接关系到研究成果的可信度和科学性。
在确定研究方法时,应当根据选题内容和研究目的,选择合适的研究方法和技术手段,确保研究过程科学规范、数据可靠有效。
四、研究进度和计划安排1. 研究进度研究进度是毕业论文研究的重要指标,直接关系到论文的完成质量和答辩效果。
在确定研究进度时,应当合理安排研究时间和任务分工,确保研究工作按部就班、有条不紊地进行。
2. 计划安排计划安排是毕业论文研究的关键环节,直接关系到研究工作的顺利进行和论文的按时完成。
在确定计划安排时,应当根据研究进度和任务要求,制定详细的研究计划和时间表,确保研究工作有序进行、按时完成。
中国海洋大学学士论文开题报告(模板)

中国海洋大学
本科毕业论文(设计)
开题报告
题 目
院、 系
专 业(年级)
学生姓名
学 号
指导教师
教务处制表
年 月 日
一、选题依据
课题来源、选题依据和背景情况;课题研究目的、学术价值或实际应用价值
二、文献综述
国内外研究现状、发展动态;查阅的主要文献
三、研究内容
1.学术构想与思路;主要研究内容及拟解决的关键问题(或技术)
2.拟采取的研究方法、技术路线、实施方案及可行性分析
四、论文(设计)进度安排
起止时间
主要内容
预期目标
五、审核意见
导师意见
导师签字:
年 月 日
审核小组意见
审核小组成员签字:
年月日
注:1、表格不够可加附页。
2、审核小组应至少由三位具有高级职称的教师组成;必要时可召集开题报告会。
海洋科学毕业论文开题报告
海洋科学毕业论文开题报告尊敬的指导教师:我准备以《海洋生态系统中的缺氧现象研究》为题,进行海洋科学毕业论文的开题报告,旨在分析和探讨全球海洋中的缺氧现象对生态系统的影响,并寻找可能的解决方法。
一、研究背景与意义在地球的气候变化和人类活动的影响下,全球海洋中的缺氧现象日益严重。
缺氧是指水体中溶解氧含量低于生物需求水平的情况,严重影响了海洋生态系统的稳定性和健康。
缺氧引起的生态问题已经引起国际社会的广泛关注。
海洋生态系统是地球上最大的生态系统之一,对全球气候、生物多样性和物质循环具有重要影响。
因此,深入研究缺氧现象对海洋生态系统的影响及其机制,对于保护海洋生态环境、维护海洋资源的可持续利用具有重要意义。
二、研究目标与内容本研究的目标是通过对全球重要海域的实地调查和数据分析,揭示海洋生态系统中缺氧现象的主要原因和影响机制,为建立缺氧监测和预警体系提供科学依据,并探讨缺氧治理手段以提高海洋生态系统的健康状况。
具体研究内容包括以下几个方面:1. 收集与整理全球重要海洋区域的缺氧相关数据,分析全球缺氧现象的时空分布特征;2. 利用现有的观测和模拟数据,研究缺氧现象与全球气候变化的关系;3. 探索缺氧对海洋生态系统中底栖生物、渔业资源等生态要素的影响,并研究其生态修复潜力;4. 分析缺氧治理的可行性和效果,探讨改善海洋生态环境的策略和手段。
三、研究方法与技术路线本研究将采用以下方法与技术路线:1. 收集海洋水质监测站点的观测数据,包括溶解氧、营养盐、温盐等关键参数;2. 利用地理信息系统(GIS)和统计学分析方法,处理和分析多源数据,重点研究缺氧的时空分布特征和影响因素;3. 结合数值模拟,模拟缺氧发生的机制以及缺氧事件的演变过程;4. 利用实地观测和实验室分析,研究缺氧对海洋生态系统中生物多样性和生态功能的影响;5. 运用评估方法和规划工具,评价缺氧治理措施的效果和可行性。
四、预期成果与创新点通过本研究,预期将获得以下成果:1. 对全球海洋生态系统中缺氧现象的时空分布特征有较为准确的描述,并揭示其与全球气候变化的关系;2. 研究缺氧对底栖生物和渔业资源等生态要素的影响机制,明确与缺氧相关的生态修复潜力;3. 提出改善海洋生态环境的策略和手段,为缺氧治理和海洋生态系统保护提供科学依据;4. 建立缺氧监测与预警体系,为相关部门的决策提供技术支持。
中国海洋大学学士论文开题报告
[17]徐学福.着力营造先进文化生态系统[J].理论视野,2004,(5).
[18]张永贞等.关于海洋文化生态的几个问题[J].经济与社会发展,2009,(10).
[19][法]德里达.论文字学[M].上海译文出版社,1999.
(3)、学校图书馆中有着大量的文献资料;
(4)、便捷的网络方便研究中随时获取信息;
(5)、很多青岛本地的同学,更方便调查研究。
四、论文(设计)进度安排
起止时间
主要内容
预期目标
1月15~3月20日
3月21~4月1日
4月 2~4月25日
4月26~5月15日
5月16~5月30日
查阅相关文献,进行论文研究综述
[5]林彦举.《把握机遇,凝成一体,明确目的,虚实并举》[J].岭峤春秋(海洋文化论集),1997,(10).
[6]欧初.《研究海洋文化、增强海洋意识是当代一项战略任务》[J].岭峤春秋(海洋文化论集),1997,(10).
[7]邓红风.海洋文化与海洋文明[J].中国海洋文化研究,1998,(1).
[8]曲金良.海洋文化二题[J].中国海洋大学学报(社科版),1997,(4).
[9]张开城.海洋文化和海洋文化产业研究述论[J].全国商情(理论研究),2010,(16).
[10]曲鸿亮.全国首届海洋民俗文化研讨会(青岛)论文[J].中国海洋文化研究,1998,(1).
[11]郭晓楠.民族特性与海洋文化[J].科技经济市场,2010,(7).
修改开题报告,进行论文初步构思
撰写论文初稿
根据导师意见,对论文进行修改
最终总结完善,准备答辩
中国海洋大学 开题报告
中国海洋大学开题报告中国海洋大学开题报告引言:中国海洋大学(Ocean University of China,简称OUC)是一所位于中国山东省青岛市的综合性大学,是中国教育部直属的全日制本科高校之一。
其前身为创办于1924年的山东大学海洋学院,经过近百年的发展,已成为国内外知名的海洋科学与技术研究中心。
本文将对中国海洋大学的发展历程、学科特色以及研究成果进行介绍,并探讨其在未来海洋领域的发展前景。
一、发展历程中国海洋大学的前身可以追溯到1924年的山东大学海洋学院,当时以培养海洋工程技术人才为主要目标。
经过多次改革与扩建,海洋学院于1959年正式更名为中国海洋大学。
随着中国对海洋资源的重视和海洋科学的迅速发展,中国海洋大学逐渐成为了国内外海洋科学研究的重要基地。
二、学科特色中国海洋大学以海洋科学与技术为主要学科方向,涵盖了海洋生物学、海洋地质学、海洋化学、海洋工程等多个领域。
其中,海洋生物学是中国海洋大学的传统优势学科之一,该学科在国内外享有盛誉。
此外,中国海洋大学还拥有一支高水平的教师队伍,其中包括一批享受国家特殊津贴的海洋科学家和工程师。
三、研究成果中国海洋大学在海洋科学研究方面取得了丰硕的成果。
其科研团队在海洋生物多样性保护、海洋资源开发利用、海洋环境保护等方面做出了重要贡献。
例如,该校的科研人员在海洋生物多样性保护方面开展了一系列的研究,发现了多种新物种,并提出了一些保护策略。
此外,中国海洋大学还积极参与国际合作项目,与其他国家的科研机构开展合作研究,推动了海洋科学的国际交流与合作。
四、未来发展前景随着中国国内对海洋资源的需求日益增长,中国海洋大学在未来的发展前景非常广阔。
首先,该校可以进一步加强与国内外高水平大学和科研机构的合作,提高研究水平和科研能力。
其次,中国海洋大学可以加强对海洋工程技术人才的培养,满足国内海洋工程建设的需求。
此外,该校还可以积极参与国家海洋战略的制定与实施,为中国海洋事业的发展做出更大的贡献。
【开题报告】开题报告++范文
开题报告++范文
随着时代的脉搏,我怀揣着满腔的热情与对知识的渴望,踏入了这片探索的领域。
以下是我对即将展开的研究工作的开题报告。
在浩如烟海的学术海洋中,我选择了这一课题,犹如一颗璀璨的明珠,照亮了我的研究方向。
它不仅仅是一段文字的串联,更是一个充满挑战与机遇的征程。
首先,我对这一课题进行了深入的文献回顾,汲取了前人的智慧与经验。
从古至今,无数学者为之倾注心血,他们的研究成果如同一座座灯塔,指引着我前行。
在研究方法上,我将以实证研究为基础,结合定性分析与定量研究,以期达到理论与实践相结合的最佳效果。
我相信,这样的研究方法能够让我更加全面地了解这一课题,为其提供有力的理论支撑。
在这个过程中,我将不断调整自己的研究思路,以适应不断变化的研究环境。
我将保持对知识的敬畏之心,对待每一个数据、每一篇文献都如获至宝。
此外,我深知团队协作的重要性。
在这个课题的研究中,我将积极与团队成员沟通交流,共同探讨问题,分享心得。
我相信,在大家的共同努力下,我们能够克服重重困难,取得丰硕的成果。
在研究的道路上,我将以坚定的信念为指引,以严谨的学风为保障,不断追求卓越。
我坚信,只要我们脚踏实地,勇于创新,就一定能够在这个课题上取得突破。
最后,我将以一颗感恩的心,感谢导师的悉心指导,感谢同行的支持与帮助。
在未来的日子里,我将以更加饱满的热情,投入到这一课题的研究中,为我国的相关领域贡献自己的一份力量。
愿这段旅程充满阳光,愿我的研究之路越走越宽广。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二ቤተ መጻሕፍቲ ባይዱ文献综述
课题研究目的:
本文在国内外文献关于时间序列数据异常点检测的基础上,从两个方面进行研究:一是运用数理统计的方法研究由海洋资料浮标传感器获得的数据,判断出异常点的位置以及其属性;二是利用若干周期的正常数据对时间序列数据拟合一个ARIMA模型,对未来时间点的数据进行预测。
学术价值及应用价值:
我国提出“蓝色经济”概念后,对于海洋的研究便更加蓬勃地发展起来,对于海洋的一些特征数据指标变化的掌握对了解海洋,发展海洋经济具有重要意义。比如,研究海水温度变化可以对厄尔尼诺现象等全球性气候问题的研究起到帮助作用,同时也对促进渔业等海洋产业的发展间接做出了贡献;其他的一些数据比如风速,波高等也被许多海上作业的人们所重视。
未知标准差情形下,对单组数据判断和处理异常值方法,常用的有Grubbs法和Dixon法。在水平测试均匀性样品的选取当中的异常值检验,依标准规定剔除异常值都采用Grubbs或Dixon法。Dixon法适用于小样本检测数据中异常值的检验,它比Grubbs法更简便,已成为国际标准化组织(ISO)和美国材料试验协会(ASTM)的推荐方法。Dixon法主要应用于在检测值中发现多个异常值的检验,还可以检查多次分析的平均值是否可疑,或者检查实验室平均值是否大体上服从正态分布[18]。
一.经典孤立点检测算法:
1.基于统计学原理的孤立点检测算法:
早期的孤立点检测算法大多数是基于统计学原理实现的[11-13],通常可以分为基于分布的检测算法和基于深度的检测算法两类。前者一般先构造一个标准分布来拟合数据集,然后根据概率分布来确定孤立点,例如Rosner提出的单样本多个离群检测算法ESD方法[11]和Yamanishi[12]等使用混合高斯模型的孤立点检测算法.此类算法方法的明显不足在于估计多维数据分布的难度较大且准确性低[13];基于深度方法主要以计算几何为基础,通过计算不同层的k-d凸包[14]将外层的对象判定为孤立点,但当数据集的数目增长时,此类方法在维数上的伸缩性不好。
中国海洋大学
本科毕业论文(设计)
开题报告
题目基于Score检验的浮标监测数据异常值诊断方法研究
院系工程学院自动化及测控系
专业自动化(年级)2008级
学生姓名王熠伟
学 号080232008055
指导教师黎明
教务处制表
2012年3月20日
一、选题依据
课题来源、选题依据和背景情况;课题研究目的、学术价值或实际应用价值
[11]Paul S T,Fung K Y.A Generalized Extreme Studentized Residual Multipleoutlier detection Procedure inLinear Regression[J].Technometrics,1991,33(3):339348.
另外,关于建立时间序列的ARIMA模型的步骤和方法具体可以参考魏武雄[24]的著作。
参考文献:
[1]BARAGONA R,BATTAGLIAF.Outlier detection in multivariate time series by independent componentanalysis [J]. NeuralComputation, 2007, 19(7): 1962-1984.
[6]HAWKINS D M. Identification ofOutliers [M]. London: Chapman and Hall, 1980.
[7]吴婷.数据挖掘在信用卡欺诈识别上的应用研究[D].南京:东南大学, 2006.
[8]范秉琪,朱晓东,马鸿雁等.基于数据挖掘的网络入侵检测系统的设计与应用[J].河南理工大学学报, 2006, 25 (3):247-250.
[9]汤光华,王俐莉,刘常昱,等.一种时序数据的离群数据挖掘新方法及其应用[J].计算机工程与应用,2006(8):209-211.
[10]KnorrE,Ng R,Tucakov V.Distance Based Outlier:Algorithms and Applications[J].VL DB,2000,8(3-4):237-253.
[4]JAGADISH H V, KOUDAS N, MUTHUKRISHNAN S. Mining deviants in a time series database[C] // Proceedings of 25thInternational Conference on Very Large Data Bases. San Fracisco: Morgan Kanfman Publishers Inc, 1999: 102-113.
获取这些数据可以通过海洋资料传感器得到,但是这些传感器分布在距离岸边十几公里甚至更远的地方,因此许多未知不可控因素便会影响传感器获取的数据的准确性,即会产生异常数据。
异常数据也称离群数据,现在已经越来越受到国内外学者的重视。如果获得的数据序列中存在异常数据,将会对基于此数据的分析起到致命的影响,导致获取的结论不准确。因此,对时间序列数据中的异常数据的检测具有很高的学术价值和应用价值。
2.基于密度的异常检测方法:
如局部异常因子(LOF,local outlier factor)[19],该方法克服了不同密度子集混合而造成的检测错误,检测精度较高,但当数据集较大时计算量大,复杂度过高,响应速度较慢。
3.基于距离的孤立点检测算法:
基于距离的孤立点检测算法的基本思路是把数据点看作空间中的点,孤立点被定义为在数据集中与大多数数据对象之间的距离大于某个给定的阈值的对象点,通常被描述为DB(pct,dmin)。当且仅当数据集S中至少有pct个数据点与P点的距离大于dmin时,数据对象P点称为孤立点。这类方法基于密度的检测算法有很大的相似之处,不需要事先知道数据集的分布模型,对于任意的分布模型均有效。经典的k近邻最先是由Knorr and Ng[20]提出来的。该算法定义了孤立点的范围,但要求事先给出合适的参数d和k。Knorr and Ng给出了两种算法:循环嵌套算法和基于单元的算法。前者时间复杂度为O(dn2),在挖掘海量数据集时表现不能令人满意;后者运行效率和数据集的大小成线性关系,但和数据集的维数成指数关系,仅当维数为4时运行速度较快。
选题来源:自选课题
选题依据和背景情况:
异常数据是数据集中偏离大部分对象的数据,它们的表现与大多数常规对象有着明显的差异。随着数据挖掘技术的飞速发展,异常数据挖掘受到研究者的广泛关注,成为数据挖掘领域的一个重要分支。近年来异常数据挖掘在信用卡欺诈检测、网络入侵检测、气象预报、疾病诊断、故障检测、恐怖活动防范等诸多领域得到广泛应用。因此本课题以此为依据,研究海洋资料浮标传感器所得到的异常数据的特点,分析其所在的具体位置,对正常数据序列做出预测具有重要的现实意义。
[5]KOTSAKIS E, WOLSKI A. MAPS: a method for identifying and predicting aberrant behavior in time series[C] // Proceeding of14th International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems. NewYork: ACM, 2001: 314-325.
随着统计理论的发展,许多关于异常检测的统计方法应运而生,如Score检验,Dixon检验以及Grubbs检验。
Score统计量的最大优点是,人们只需要计算在原假设条件下(例如方差齐性的条件下)参数的极大似然估计,而不需要在很复杂的备择假设下(异方差条件下)计算参数的极大似然估计,而且Score统计量的渐近分布与似然比统计量的渐近分布相同,检验的功效也相当[15]。李俊[16]运用Score统计量对美国海军设备所需的人力进行异常点检测并得到较满意的结果。
虽然很多学者已对大型数据集的孤立点数据挖掘做出了大量研究与探索,其主要思想一般是减少或消除孤立点,然而由于孤立点既有可能是噪声信息也有可能是有用信息[10],随意删除孤立数据可能导致有用信息的丢失,所以通过孤立点检测发现和利用在孤立点中的有用信息具有非常重要的意义。
孤立点检测算法主要分为经典孤立点检测算法和面向特殊数据的孤立点检测算法。
二.面向特殊数据的孤立点检测算法:
如数据流中的孤立点检测算法:此类算法主要针对动态数据集进行孤立点检测,可挖掘持续的、数据量大的数据流中的孤立点。Feng Han[21]提出基于kNN的孤立点检测算法来提高数据流中孤立点检测的效率,满足上述的多个评估准则,该算法运用哈希数据结构并充分利用逻辑操作和互为相邻关系,能够有效地挖掘出数据流中的孤立点,并且对数据集大小的伸缩性好,但是最优的参数设置需要更多特定的领域知识。徐雪松[22]深入分析时间序列不确定数据流的特点,针对传统数据流异常数据检测方法存在的问题,提出一种时间序列不确定数据流异常数据检测方法。该方法针对不确定数据流的高速、无限和动态不确定特性,结合小波分析和改进的聚类方法来识别异常数据。
当通过算法检测出来异常值及其位置时,我们需要知道异常点的属性。在时间序列中,不同类型的离群点可能对估计量产生不同的影响,而且离群点可能包含更多的信息,因此区别离群点的类型很有必要。根据离群点的特点Fox[23]将离群点分为两类: (1)AO(Additive Outliers)这种异常点是由某时刻观察和记录的误差所致,它们的出现并不波及到邻近的观测值。(2)IO(InnovationOutliers)这是成片出现异常点,在某时间内一个异常点通过随机序列相关结构波及到它邻近的一批数据(通常是它后继的邻近点)从而使这些邻近点表现一定的异常。