监督分类实验报告

监督分类实验报告
监督分类实验报告

实验报告题目:监督分类

姓名:

学号:

日期:

一、实验目的

理解计算机图像分类的基本原理以及监督分类的过程,运用ERDAS软件达到能熟练地对遥感图像进行监督分类的目的。

二、监督分类原理

监督分类(supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。

1)平行六面体法

在多波段遥感图像分类过程中,对于被分类的每一个类别,在各个波段维上都要选取一个变差范围的识别窗口,形成一个平行六面体,如果有多个类别,则形成多个平行六边形,所有属于各个类别的多维空间点也分别落入各自的多维平行六面体空间。

2)最小距离法

使用了每个感兴趣区的均值矢量来计算每个未知象元到每一类均值矢量的欧氏距离,除非用户指定了标准差和距离的阈值,否则所有象元都将分类到感兴趣区中最接近的那一类。

3)最大似然法

假定每个波段中的每类的统计都呈现正态分布,并将计算出给定象元都被归到概率最大的哪一类里。

4)马氏距离法

是一个方向灵敏的距离分类器,分类时将使用到统计信息,与最大似然法有些类似,但是她假定了所有类的协方差都相等,所以它是一种较快的分类方法。

三、实验步骤及结果

1、定义分类模板

定义分类模板包括分类模板的生成、管理、评价和编辑等,功能主要由分类模板编辑器(Signature Editor)完成,具体步骤包括:

1)打开需要分类的影像

本实验所处理的遥感图像打开如下图所示。

图1 原始遥感图像

2)打开分类模板编辑器

3)调整属性文字

在分类编辑窗口中的分类属性表中有很多字段,可以对不需要的字段进行调整。

4)选取样本

基于先验知识,需要对遥感图像选取训练样本,包括产生AOI、合并、命名,从而建立样本。考虑到同类地物颜色的差异,因此在采样过程中对每一地类的采样点(即AOI)不少于10个。选取样本包括产生AOI和建立分类模板两个步骤。

(1)产生AOI的方法有很多种,本实验采用应用查询光标扩展方法。

(2)建立分类模板

①在分类模板编辑窗口,单击按钮,将多边形AOI区域加载到分类模板属性表中。在同样颜色的区域多绘制一些AOI,分别加载到分类模板属性表中。本实验中每一颜色

类别选取了10个AOI样本点。

②在分类模板属性表中,依次单击这些AOI(按住shift键),并在单击将所选中的模板合并成一个新的模板。

③在分类模板属性表中,单击Edit/Delete,删除合并前的模板。并单击Signature Name 进入输入状态,输入对应的类别名称,单击color设置颜色。

④重复以上步骤将所有的类型建立分类模板。

5)保存分类模板

本实验中共建立了五种分类模板,保存结果如下图所示。

图2 建立5种分类模板

2、评价分类模板

ERDASIMAGINE 提供的分类模板评价工具有: 分类报警工具(A larm s)、可能性矩阵(Con tingencymatrix)、特征对象(featu re object s)、直方图方法(Histograms )、分类的分离性( Signatu reseparability)、分类统计分析(Statistics) 等。研究中利用各工具对遥感影像的监督分类模板进行评价, 得到较理想的结果。

1)分类预警评价

分类模板报警工具根据平行六边形决策规则将原属于或估计属于某一类别的像元在图像视窗中加亮显现, 以示警报, 也可以设置选项使用其它颜色显示。一个报警可以针对一个类别或多个类别。根据模板编辑器中指定的颜色, 选定类别的像元且显示在原始图像视窗中, 并覆盖在原始图像上, 形成报警掩膜, 利用F licker 功能查看报警掩膜, 通过测试, 依靠已有模式识别技能, 或实地数据, 确定准确性。在分别选择农田、水面、山地类别时, 发分类面积过大, 经过几次反

复选点、合并与删除, 再应用分类模板报警工具形成报警掩膜, 以检验模板的准确性, 直到结果满意为止。评价完成后删除分类报警掩膜。

2)可能性矩阵

可能性矩阵评价工具是根据分类模板, 分析AOI 训练区的像元是否完全落在相应的类别中。可能性矩阵的输出结果是百分比矩阵, 说明每个AOI 训练区中有多少个像元分别属于相应的类别。AO I 训练区的分类可应用分类原则: 平行六面体( PanallelePiped )、特征空( FeatureSpace)、最大似然(Maximum Likelihood)、马氏距离(Mahalanob is istance)。研究中选择的是最大似然。随后, 分类误差矩阵将显示在IMAGIN E 文本编辑器(Tex t Editor) 中, 供查看统计。如果误差矩阵值小于85% , 则模板需要重新建立。其中统计数据如下图所示。

图3 分类误差矩阵

3)模板对象图示

模板的特征对象工具可以显示各类别模板的统计图, 以便比较不同类别。评价时, 用模板件中的平均值与标准差计算集中度椭圆, 也可生成平行六面体矩形、平均值以及注记。统计图以椭圆形式显示在特征空间图像中, 每个椭圆都是

基于类别的平均值及其标准差。可以同时产生一个类别或多个类别的图形显示。由于在特征空间图像中绘画椭圆, 所以特征空间图像必须处于打开状态。椭圆的重叠程度, 反映了类别的相似性。如果两个椭圆不重叠, 说明代表相互独立的类别, 是分类所需要的。然而, 重叠是肯定有的, 因为几乎没有完全不同的类别。如果两个椭圆重叠较多,则这两类别是相似的, 分类不理想。对所有波段通过椭圆图分析,可以确定究竟使用哪些模板与波段可以得到准确的分类结果。

4)直方图绘制

直方图绘制工具通过分析类别的直方图对模板进行评价和比较, 可以同时对一个或多个类别制作直方图, 如果处理对象是单个类别, 就是当前活动类别, 如果是多个类别的直方图,就是处于选择集中的类别。通过选择不同类别、不同波段绘制直方图, 可以分析其特征。在H istograms Plot Control Panel中作调整, 并且点击Plot 按钮以实现直方图反映内容的变化。直方图方法是经常使用的模板评价方法, 具有简便、直观的特点, 对于类型的合并极其有用。

5)类别的分离性

分类的分离性工具用于计算任意类别的统计距离,可确定两个类别间的差异性程度,也可确定分类中效果最好的数据层。类别间的统计距离是基于欧氏光谱距离、Jeffries-Matusta距离、分类的分离度、转换分离度方法计算的。采用类别分离性工具可以同时对多个类别操作,如果没有选择任何类别,则对所有的类别操作。在文本编辑器窗口,可以对报告结果分析,将结果保存在文本文件中。本实验对所有类别操作得到的报告结果如下图所示。

图4 类别分离性报告

6)分类统计分析

分类统计分析功能可以对类别专题层统计,作评价和比较。统计分析每次只能对一个类别进行,即处于活动状态的类别就是当前统计的类别。在模板编辑器中选择: View→Statistics→打开Statistics对话框。Statistics对话框的主体是分类统计结果列表,表中包括有该模板基本统计信息(Min,Max,Mean,Std1Dev1) 及协方差(Convariance)。建立的模板city类统计结果见下图。

图5 模板中city的分类统计结果

3、监督分类

建立满意的分类模板后,就需要在一定的分类决策规则条件下,对像元进行聚类判断。在选择判断函数及相应的准则后,便可执行监督分类,具体步骤如下:打开Supervised Classification对话框,参数设置如下:

(1)选择处理图像文件(Input Raster File)。

(2)确定输入分类模板(Input Signature)。

(3)定义输出分类文件(Classified File)。

(4)设置输出分类距离文件为Distance File。

(5)选择非参数规则(Non-Parametric Rule),一般选择Feature Space,即选择特征空间。

(6)选择叠加规则(Overlap Rule),一般为Parametric Rule,参数规则,具体设置以下详述。

(7)选择未分类规则(Unclassified Rule)为Parametric Rule。

(8)选择参数规则(Parametric Rule),一般选择Maximum Likelihood,即最大似然。

输出分类文件如下图所示。

图6 输出分类文件

四、总结

模板评价是监督分类中很重要的一步, 只有高质量的模板评价, 才能得到理想的模板, 保证监督分类结果的精度。

ERDA SIMAGINE 软件提供了诸多的模板评价工具, 可方便、直观、快捷地评价操作, 在对一模板评价时应尽量多采用几种工具, 并反复多次, 根据可靠的实地信息对模板合并、删除等修改操作, 使之不断完善, 最终形成较理想的模板。

布鲁姆 教育目标分类学

教育目标分类学 摘要 本杰明·布鲁姆(Benjamin Bloom,1913年2月21日-1999年9月13日)是美国当代著名的心理学家、教育家。他提出了掌握学习论,教育目标分类学,教学评价理论。本文对其教育目标分类学的分类过程进行了详细而具体的介绍,使师范类学生更好的了解其发展过程、应用等具体情况。 关键字:掌握学习论,教育目标分类学,教学评价理论 一、布鲁姆和他的教学理念 本杰明·布鲁姆(Benjamin Bloom,1913年2月21日-1999年9月13日)是美国当代著名的心理学家、教育家,芝加哥大学教育系教育学教授,曾担任美国教育研究协会会长,是国际教育评价协会评价和课程专家。 面对布鲁纳结构主义教学论、精英主义观显露出来的弊端,布鲁姆因教育提出了目标分类学说,并于1956年出版著作《教育目标分类学》;六十年代,他提出关于“人类特性”的理论,著有《人类特性和学校学习》;七十年代,他又提出“掌握学习”的学校教学理论,著有《我们的儿童都能学习》、《掌握学习理论导言》。布卢姆提出的关于“人类特性”和学校教学的理论,曾经被列为美国“最有意义的教育研究成果之一”。 布鲁姆在教育中的理论可归纳为三点。 (一)、掌握学习论,学习是为了掌握,在学生已有基础上进行教学。布鲁姆说:“如果提供适当的学习条件,大多数学生在学习能力、学习速度和进一步学习的机会方面都会变得十分相似。”他认为,学生的学习能力主要是后天的,是可以改变的,是可以发展的。学生学习能力不是先天的,是由于各种外部和内部的因素造成,主要的原因还是在外部的因素,比如学生的家庭教育和学校教育。 (二)、教学评价理论,评价,不只是针对最终的学习结果,而是在学习的各个过程中施以评价,从而对学习行为进行相应的矫正与评估。形成性评价可以让教师的更多的目光集中到了学生学习中的问题,而不是学生的达成度,应该是学生的未达成度。再通过反馈、矫正等步骤设计教学过程,从而使绝大多数学生达到既定教学目标。 (三)、教育目标分类学,将学生的学习行为进行分类,从而确定其制定其具体的学习程度。其教育目标分类学有效的解决了如何正确评估学生学习行为的标准,给当时的美国和世界其他国家产生巨大的影响。布鲁姆的教育目标分类学理论具有两大特征:一是可量化、可测量。为了使教育评价的起点、评价目标客观标准化,他提出目标的可测量性,为之后的

数据挖掘实验报告资料

大数据理论与技术读书报告 -----K最近邻分类算法 指导老师: 陈莉 学生姓名: 李阳帆 学号: 201531467 专业: 计算机技术 日期 :2016年8月31日

摘要 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K 近邻算法(KNN)是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab环境里仿真实现,并对实验结果进行分析,提出了改进的方法。 关键词:K 近邻,聚类算法,权重,复杂度,准确度

1.引言 (1) 2.研究目的与意义 (1) 3.算法思想 (2) 4.算法实现 (2) 4.1 参数设置 (2) 4.2数据集 (2) 4.3实验步骤 (3) 4.4实验结果与分析 (3) 5.总结与反思 (4) 附件1 (6)

1.引言 随着数据库技术的飞速发展,人工智能领域的一个分支—— 机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(Knowledge Discovery in Databases,简记 KDD)的产生,也称作数据挖掘(Data Ming,简记 DM)。 数据挖掘是信息技术自然演化的结果。信息技术的发展大致可以描述为如下的过程:初期的是简单的数据收集和数据库的构造;后来发展到对数据的管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据的分析和理解, 这时候出现了数据仓库技术和数据挖掘技术。数据挖掘是涉及数据库和人工智能等学科的一门当前相当活跃的研究领域。 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要[1]。目前,数据挖掘已经成为一个具有迫切实现需要的很有前途的热点研究课题。 2.研究目的与意义 近邻方法是在一组历史数据记录中寻找一个或者若干个与当前记录最相似的历史纪录的已知特征值来预测当前记录的未知或遗失特征值[14]。近邻方法是数据挖掘分类算法中比较常用的一种方法。K 近邻算法(简称 KNN)是基于统计的分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中的多数样本的类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法。 大多数分类方法是基于向量空间模型的。当前在分类方法中,对任意两个向量: x= ) ,..., , ( 2 1x x x n和) ,..., , (' ' 2 ' 1 'x x x x n 存在 3 种最通用的距离度量:欧氏距离、余弦距 离[16]和内积[17]。有两种常用的分类策略:一种是计算待分类向量到所有训练集中的向量间的距离:如 K 近邻选择K个距离最小的向量然后进行综合,以决定其类别。另一种是用训练集中的向量构成类别向量,仅计算待分类向量到所有类别向量的距离,选择一个距离最小的类别向量决定类别的归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量的特征之间的关系,这使得距离的计算不精确,从而影响分类的效果。

数据挖掘实验报告

《数据挖掘》Weka实验报告 姓名_学号_ 指导教师 开课学期2015 至2016 学年 2 学期完成日期2015年6月12日

1.实验目的 基于https://www.360docs.net/doc/163410908.html,/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori- ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行对比实验,并画出性能比较图训练并测试。 2.实验环境 实验采用Weka平台,数据使用来自https://www.360docs.net/doc/163410908.html,/ml/Datasets/Br- east+Cancer+WiscOnsin+%28Original%29,主要使用其中的Breast Cancer Wisc- onsin (Original) Data Set数据。Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 3.实验步骤 3.1数据预处理 本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size (均匀的细胞大小),Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁),Mitoses(有丝分裂),Class(分类),其中第二项到第十项取值均为1-10,分类中2代表良性,4代表恶性。通过实验,希望能找出患乳腺癌客户各指标的分布情况。 该数据的数据属性如下: 1. Sample code number(numeric),样本代码; 2. Clump Thickness(numeric),丛厚度;

生物学分类门科整理

一 简介界门纲目科属种的分类来历:近代分类学诞生于18世纪,它的奠基人是瑞典植物学者林奈。林奈为分类学解决了两个关键问题:第一是建立了双名制,每一物种都给以一个学名,由两个拉丁化名词所组成,第一个代表属名,第二个代表种名。第二是确立了阶元系统,林奈把自然界分为植物、动物和矿物三界,在动植物界下,又设有纲、目、属、种四个级别,从而确立了分类的阶元系统。生物分类阶元从大到小:界——门——纲——目——科——属——种,详细分类为:界(K i n g d o m)门(P h y l u m) 亚门(S u b p h y l u m) 总纲(S u p e r c l a s s) 纲(C l a s s) 部(C o h o r t) 总目(S u p e r o r d e r) 目(O r d e r) 亚目(S u b o r d e r) 总科(S u p e r f a m i l y) 科(F a m i l y) 亚科(S u b f a m i l y) 族(T r i b e) 属(G e n u s) 亚属(S u b g e n u s) 种(S p e c i e s) 亚种(S u b s p e c i e s)。生物分类等级界门纲目科属种各级的分类依据是:1、生物分类学是研究生物分类的方法和原理的生物学分支。分类就是遵循分类学原理和方法,对生物的各种类群进行命名和等级划分。地球上现生的物种以百万计,千变万化,各不相同,如果不予分类,不立系统,便无从认识,难以研究利用。分类的对象是形形色色的种类,都是进化的产物。因而从理论意义上说,分类学是生物进化的历史总结。分类学是综合性学科。生物学的各个分支,从古老的形态学到现代分子生物学的新成就,都可吸取为分类依据。分类学亦有其自己的分支学科,如以染色体为依据的细胞分类学,以血清反应为依据的血清分类学,以化学成分为依据的化学分类学,等等。动物、植物和细菌,作为三门分类学,各有其特点;病毒分类则尚未正式采用双名制和阶元系统。生物分类学的历史人类在很早以前就能识别物类,给以名称。汉初的《尔雅》把动物分为虫、鱼、鸟、兽4类:虫包括大部分无脊椎动物;鱼包括鱼类、两栖类、爬行类等低级脊椎动物及鲸和虾、蟹、贝类等,鸟是鸟类;兽是哺乳动物。这是中国古代最早的动物分类,四类名称的产生时期看来不晚于西周。这个分类,和林奈的六纲系统比较,只少了两栖和蠕虫两个纲。古希腊哲学家亚里士多德采取性状对比的方法区分物类,如把热血动物归为一类,以与冷血动物相区别。他把动物按构造的完善程度依次排列,给人以自然阶梯的概念。17世纪末,英国植物学者雷曾把当时所知的植物种类,作了属和种的描述,所著《植物研究的新方法》是林奈以前的一本最全面的植物分类总结,雷还提出“杂交不育”作为区分物

模式识别第二次上机实验报告

北京科技大学计算机与通信工程学院 模式分类第二次上机实验报告 姓名:XXXXXX 学号:00000000 班级:电信11 时间:2014-04-16

一、实验目的 1.掌握支持向量机(SVM)的原理、核函数类型选择以及核参数选择原则等; 二、实验内容 2.准备好数据,首先要把数据转换成Libsvm软件包要求的数据格式为: label index1:value1 index2:value2 ... 其中对于分类来说label为类标识,指定数据的种类;对于回归来说label为目标值。(我主要要用到回归) Index是从1开始的自然数,value是每一维的特征值。 该过程可以自己使用excel或者编写程序来完成,也可以使用网络上的FormatDataLibsvm.xls来完成。FormatDataLibsvm.xls使用说明: 先将数据按照下列格式存放(注意label放最后面): value1 value2 label value1 value2 label 然后将以上数据粘贴到FormatDataLibsvm.xls中的最左上角单元格,接着工具->宏执行行FormatDataToLibsvm宏。就可以得到libsvm要求的数据格式。将该数据存放到文本文件中进行下一步的处理。 3.对数据进行归一化。 该过程要用到libsvm软件包中的svm-scale.exe Svm-scale用法: 用法:svmscale [-l lower] [-u upper] [-y y_lower y_upper] [-s save_filename] [-r restore_filename] filename (缺省值:lower = -1,upper = 1,没有对y进行缩放)其中,-l:数据下限标记;lower:缩放后数据下限;-u:数据上限标记;upper:缩放后数据上限;-y:是否对目标值同时进行缩放;y_lower为下限值,y_upper为上限值;(回归需要对目标进行缩放,因此该参数可以设定为–y -1 1 )-s save_filename:表示将缩放的规则保存为文件save_filename;-r restore_filename:表示将缩放规则文件restore_filename载入后按此缩放;filename:待缩放的数据文件(要求满足前面所述的格式)。缩放规则文件可以用文本浏览器打开,看到其格式为: y lower upper min max x lower upper index1 min1 max1 index2 min2 max2 其中的lower 与upper 与使用时所设置的lower 与upper 含义相同;index 表示特征序号;min 转换前该特征的最小值;max 转换前该特征的最大值。数据集的缩放结果在此情况下通过DOS窗口输出,当然也可以通过DOS的文件重定向符号“>”将结果另存为指定的文件。该文件中的参数可用于最后面对目标值的反归一化。反归一化的公式为: (Value-lower)*(max-min)/(upper - lower)+lower 其中value为归一化后的值,其他参数与前面介绍的相同。 建议将训练数据集与测试数据集放在同一个文本文件中一起归一化,然后再将归一化结果分成训练集和测试集。 4.训练数据,生成模型。 用法:svmtrain [options] training_set_file [model_file] 其中,options(操作参数):可用的选项即表示的涵义如下所示-s svm类型:设置SVM 类型,默

数据挖掘实验报告(一)

数据挖掘实验报告(一) 数据预处理 姓名:李圣杰 班级:计算机1304 学号:1311610602

一、实验目的 1.学习均值平滑,中值平滑,边界值平滑的基本原理 2.掌握链表的使用方法 3.掌握文件读取的方法 二、实验设备 PC一台,dev-c++5.11 三、实验内容 数据平滑 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70。使用你所熟悉的程序设计语言进行编程,实现如下功能(要求程序具有通用性): (a) 使用按箱平均值平滑法对以上数据进行平滑,箱的深度为3。 (b) 使用按箱中值平滑法对以上数据进行平滑,箱的深度为3。 (c) 使用按箱边界值平滑法对以上数据进行平滑,箱的深度为3。 四、实验原理 使用c语言,对数据文件进行读取,存入带头节点的指针链表中,同时计数,均值求三个数的平均值,中值求中间的一个数的值,边界值将中间的数转换为离边界较近的边界值 五、实验步骤 代码 #include #include #include #define DEEP 3 #define DATAFILE "data.txt" #define VPT 10 //定义结构体 typedef struct chain{ int num; struct chain *next; }* data; //定义全局变量 data head,p,q; FILE *fp; int num,sum,count=0; int i,j; int *box; void mean(); void medain(); void boundary(); int main () { //定义头指针 head=(data)malloc(sizeof(struc t chain)); head->next=NULL; /*打开文件*/ fp=fopen(DATAFILE,"r"); if(!fp) exit(0); p=head; while(!feof(fp)){

监督分类实验报告

实验报告题目:监督分类 姓名: 学号: 日期:

一、实验目的 理解计算机图像分类的基本原理以及监督分类的过程,运用ERDAS软件达到能熟练地对遥感图像进行监督分类的目的。 二、监督分类原理 监督分类(supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。 1)平行六面体法 在多波段遥感图像分类过程中,对于被分类的每一个类别,在各个波段维上都要选取一个变差范围的识别窗口,形成一个平行六面体,如果有多个类别,则形成多个平行六边形,所有属于各个类别的多维空间点也分别落入各自的多维平行六面体空间。 2)最小距离法 使用了每个感兴趣区的均值矢量来计算每个未知象元到每一类均值矢量的欧氏距离,除非用户指定了标准差和距离的阈值,否则所有象元都将分类到感兴趣区中最接近的那一类。 3)最大似然法 假定每个波段中的每类的统计都呈现正态分布,并将计算出给定象元都被归到概率最大的哪一类里。 4)马氏距离法 是一个方向灵敏的距离分类器,分类时将使用到统计信息,与最大似然法有些类似,但是她假定了所有类的协方差都相等,所以它是一种较快的分类方法。 三、实验步骤及结果 1、定义分类模板

定义分类模板包括分类模板的生成、管理、评价和编辑等,功能主要由分类模板编辑器(Signature Editor)完成,具体步骤包括: 1)打开需要分类的影像 本实验所处理的遥感图像打开如下图所示。 图1 原始遥感图像 2)打开分类模板编辑器 3)调整属性文字 在分类编辑窗口中的分类属性表中有很多字段,可以对不需要的字段进行调整。 4)选取样本 基于先验知识,需要对遥感图像选取训练样本,包括产生AOI、合并、命名,从而建立样本。考虑到同类地物颜色的差异,因此在采样过程中对每一地类的采样点(即AOI)不少于10个。选取样本包括产生AOI和建立分类模板两个步骤。 (1)产生AOI的方法有很多种,本实验采用应用查询光标扩展方法。 (2)建立分类模板 ①在分类模板编辑窗口,单击按钮,将多边形AOI区域加载到分类模板属性表中。在同样颜色的区域多绘制一些AOI,分别加载到分类模板属性表中。本实验中每一颜色

园艺植物育种学总论 期末复习经典题

第一章绪论(一~三章5分) 1.良种的属性包括:优良、适应、整齐、稳定、和特异、简称优、适、齐稳特。 2.良种的作用:增加产量、增加抗逆性、延长产品的供应和运用时间、适应集约化管理、节约劳动力。 3.育种目标总趋势:高产、优质、高效 第二章园艺植物的繁殖习性、品种类型和育种特点 4.纯育品种:由遗传背景相同和基因型纯和的一群植物组成、包括有性繁殖植物从杂交育种、突变育种中经过系普法育成的品种。 5.杂交种品种:由遗传上纯和的亲本在控制授粉的条件下生产的特异组合的一代杂种群体叫做杂交种品种。 第三章育种对象和目标 6.遗传可塑性:指植物的遗传特性发生适应性变异的潜在可能,取决于遗传变异性的高低 第四章种质资源(四~五章15分) 7.种质资源:培育新品种的原始材料。 8.中国果树起源中心:苹果、梨、桃、李、杏、樱桃、枣、柿、板栗、猕猴桃、柑橘类、琵琶、龙眼、荔枝。 9.种质资源的分类: ①按栽培学分类:种、变种、品种群、品种、品系、群体品种 ②按来源分类:本地种质资源(地方品种、过时品种、主栽品种)、外地种质资源、野生种质资源、人工创造的种质资源。 9.种质资源的保存:就地和迁地保存、种子保存、种植保存、离体试管保存、利用保存、基因文库保存。 10.种质资源的管理基本要求:防止种质资源流失、加强和研究运用部门的联系。及时发挥种质资源的利用。 第五章引种 11.引种:人们为了满足自己的需要。把植物原来的分布范围引种到新地区的实践活动叫做植物引种。 12.引种的材料选择:德国林学家Mayr教授提出在树木引种时应遵循“气候相似法则。” 13.引种的方法:①种源实验②品种比较实验和区域试验③栽培试验 14.引种方式:依据是否改变对象遗传适应性可分为简单引种、驯化引种,后者是引种和实生选种的结合。依据引种对象的类别和引种计划的长短可分为:个别引种和类别引种。 15.引种成败的的标准:①能在不加保护的条件下生长②引种后的品种对产量、品质不减少 ③繁殖方式和引种前的不变 16.引种的生态限制因子:温度、光照、水分、土壤等。构成生态环境的各种因子、对植物来说同等重要,彼此不可替代。温度通常是影响植物分布的主导因子。 17.米丘林学说:米丘林学说的基本思想认为生物体与其生活条件是统一的,生物体的遗传性是其祖先所同化的全部生活条件的总和。如果生活条件能满足其遗传性的要求时,遗传性保持不变;如果被迫同化非其遗传性所要求的生活条件时,则导致遗传性发生变异,由此获得的性状与其生活条件相适应,并在相应的生活条件中遗传下去。从而主张生活条件的改变所引起的变异具有定向性,获得性状能够遗传。这个学说中关于无性杂交、辅导法和媒介法、杂交亲本组的选择、春化法、改造秋播作物为春播作物、气候驯化法、阶段发育理论等 第六章选择育种(12分) 18.选择育种:利用现有的种类、品种的自然变异群体,通过选择的手段育成新品种的途径叫做选择育种。 19.混合选择法:又称表现选择法,是依据蜘蛛的表现性状,从原始的群体中选择符合选择符合标准要求的单株混合留种,下一代混合播种,相邻进行种植对照品种和原始对照品种的

布鲁姆的教育目标分类学说 和加涅的学习结果分类

布卢姆的教学目标分类理论 对教育目标分类体系的设想,最初是1948年由出席在波士顿召开的美国心理学年会的一些考试专家在一次正式会议上提出的。其主要代表人物有布卢姆、克拉斯沃尔(D.R.Krathwohl)等人。布卢姆等人把教育目标分为三大领域──认知领域(cognitive domain)、情感领域(affective domain)和动作技能领域(psychomotor domain)。他们的教育目标分类强调指导教学过程和对结果进行评价,其实是一种教学目标分类。 (一)认知领域的目标分类 布卢姆等人在1956年出版的《教育目标分类学,第一分册:认知领域》中把认知领域的目标分为六个亚领域,即知识(knowledge)、领会(comprehension)、运用(application)、分析(analysis)、综合(synthesis)和评价(evaluation)。 1.知识 知识目标要求学生在学习情境中把某种信息储存在大脑中,以后所要做的就是回忆这些信息。知识这一类别所涉及的主要心理过程是记忆。在知识的测验情境中,提问的形式与最初的学习情境中的形式有所不同,这要求学生在回答问题时有一定程度上的联想和判断过程,但这仅仅是一小部分;在其他类别的学习和测验中也有记忆,同样这也只是一小部分。知识包括具体的知识、处理具体事物的方式方法的知识、学科领域中的普遍原理和抽象概念的知识三大类,每一类型又包括若干个小类型。 (1)具体的知识是指对具体的、孤立的片断信息的回忆。它包括:①术语的知识,即具体符号的指称事物的知识,如熟悉的大量词汇的一般意义;②具体事实的知识,指日期、事件、人物、地点等方面的知识,如对某些特定文化中的主要事实的回忆。 (2)处理事物的方式方法的知识,是指有关组织、研究、判断和批评的方式方法的知识。它包括:①惯例的知识,即有关对待和表达各种现象和观念的独特方式的知识,如了解演讲与写作中的正确形式和习惯用法;②趋势和顺序的知识,即时间方面各种现象所发生的过程、方向和运动的知识,如最近50年美国政府的发展趋势;③分类和类别的知识,即有关类别、组织、部类及排列的知识,如各类文献的范围;④准则的知识,即有关检验和判断各种事实、原理、观点和行为所依据的准则的知识,如对某种作品及其阅读目的作出适当判断的准则;⑤方法论的知识,即有关在某一特定学科领域使用的以及在调查特定的问题和现象时所用的探究方法、技巧和步骤的知识,如有关用科学方法评价健全概念的知识。 (3)学科领域中的普遍原理和抽象概念的知识,指有关把各种现象和观念组织起来的主要观念、体系及模式的知识。它包括:①原理和概括的知识,即关于对各种现象的结果进行概括的特定抽象概念的知识,如用来概括我们所接触到的生物现象的重要原理的知识;②理论和结构的知识,即关于为某种复杂的现象、问题或领域提供一种清晰的、完整的、系统的观点的重要原理和概括,及其相互关系方面的知识,如对进化论进行比较完整阐述的知识。

植物系统学

植物系统学综述 发展、动态: 经典的植物分类学始自林奈时期,称为古典植物分类学时期,时间大致从 18世纪中叶到19世纪末。这一时期,主要是采集标本,根据植物形态的差别对植物进行命名,编写世界各地的植物志以及利用当时所知的全部形态学知识,作为建立自然学说的依据,努力建立一个能反映自然实际的分类系统。工作场所主要是自然界、图书馆和标本室,故工具简单,手段原始,方法只限于绘图和描述等。 古典的植物分类学为植物系统学的形成奠定了基础。达尔文进化论提出以后,植物进化的观点日益深入人心,分类学的概念和工作方法也有所改变。分类学在鉴别种类的同时,也注意研究植物间的相互关系和分布规律,进而形成了植物系统学。 随着植物学各分支学科的不断发展,使系统学与其他学科如解剖学、胚胎学、细胞学、古植物学、遗传学、生态学等保持密切的联系。植物系统分类从这些学科中取得旁证,进而分化出系统解剖学和细胞分类学。 细胞分类学(Cytotaxonomy)以细胞学资料(包括染色体数目、染色体形态结构、染色体组型分析和多倍体等)作为系统关系的依据,结合形态学、解剖学和遗传学等方面的证据,确定分类单位和研究系统演

化。但自然界植物种类繁多,生长环境差别很大,系统演化错综复杂,染色体数目也有变化,所以在植物系统研究中,细胞学资料只是其中的一个参考。 20世纪近代科学技术的发展,特别是生物化学、分子生物学的发展,生命的基本物质核酸、蛋白质等被深入研究,以这些学科的成就应用于植物系统分类中,使古典分类学不在满足于停留在描述阶段,而要求有所突破,向着实验科学发展,便产生了实验分类学和化学分类学。 化学分类学在20世纪60年代左右建立起来,利用化学的特征来研究植物各类群之间的亲缘关系,探讨植物界的演化规律,是在分子水平上来研究植物分类和系统演化的一门学科。它的主要研究任务是:研究各分类阶元所含化学成分的特性和合成途径。作为指标的化合物包括小分子化合物、萜类化合物、蛋白质和核酸等。植物中大分子化合物的研究是以后化学分类学的重点。 20世纪60年代后,在生物学各分支学科对各种生物研究大量积累了新证据以及化石证据不断发现的同时,研究系统的方法也多样化,其中最具代表性的就是莎个系统学派,即表相分类李派Pheriotic(亦称数值分类学Numeric classification )、分支分类学派Cladistics(亦称系统发育分类Phylogenetic)和进化分类学派Evolutionary(亦称综合系统学派Synthetic Systematic)。

实验报告格式

《客户关系管理》课程实验实训报告

集团、卢森堡剑桥集团、亚洲创业投资基金(原名软银中国创业基金)共同投资成立。 当当网成立于1999年11月,以图书零售起家,已发展成为领先的在线零售商:中国最大图书零售商、高速增长的百货业务和第三方招商平台。当当网致力于为用户提供一流的一站式购物体验,在线销售的商品包括图书音像、服装、孕婴童、家居、美妆和3C数码等几十个大类,在库图书超过90万种,百货超过105万种。当当网的注册用户遍及全国32个省、市、自治区和直辖市。注册用户遍及全国32个省、市、自治区和直辖市。当当网于美国时间2010年12月8日在纽约证券交易所正式挂牌上市,是中国第一家完全基于线上业务、在美国上市的B2C网上商城。 当当网于2010年12月8日在纽约证券交易所正式挂牌上市,是中国第一家完全基于线上业务、在美国上市的B2C网上商城。2012年,当当网的活跃用户数达到1570万,订单数达到5420万。 2014年2月28日,当当和1号店已经签订合作协议,当当将在1号店销售图书,1号店将在当当平台上销售食品和日用百货。 公司创建: 当当网由李国庆和俞渝创立,李国庆先生任当当网CEO,俞渝女士目任当当网董事长。二人是夫妻,联手创业,早已在业内传为佳话。 李国庆毕业于北大,两次创业,均以出版为主体。在图书出版领域摸爬滚打了10年,很了解中国传统的图书出版和发行方面的所有环节。俞渝是纽约大学学金融MBA毕业的,在华尔街做融资,有过几个很成功的案例。她在美国生活了整整10年,投资者非常信任她,又有共同语言。 1996年,李国庆和俞渝邂逅,然后在纽约结婚,当当的故事也就开了头。两人从谈恋爱开始,就经常一起思考,一起聊亚马逊的商业模型与传统贸易手段的根本区别。后来夫妇俩常探讨在图书这个行业中间赚钱最关键的环节是什么,有着多年图书出版运营经验的李国庆说肯定是出版社和读者的直接联系。于是他们一起去找风险投资商,说服了IDG、LCHG(卢森堡剑桥集团,该集团公司拥有欧洲最大的出版集团)共同投资,目标锁定在凭借发达国家现代图书市场的运作模式和成熟的管理经验,结合当今世界最先进的计算机技术和网络技术,用来推动中国图书市场的“可供书目”信息事业,及“网上书店”的门户建设,成为中国最大的图书资讯集成商和供应商。 公司历史: 1999年11月,网站进入运营。 2000年2月,当当网首次获得风险投资。 2000年11月,当当网周年店庆大酬宾,在网民中引起巨大反响。 2001年6月,当当网开通网上音像店。 2001年7月,当当网日访问量超过50万(Unique Visitor),成为最繁忙的图书、音像店。 2003年4月,在“非典”肆虐之时,当当网坚持高速运转,满足读者对精神食粮的需求,被文化部等四家政府部门首推为“网上购物”优秀网站。 2003年6月,当当网、新浪网、SOHO、网通等公司举办“中国精神”活动,呼唤开放乐观的民族精神,引起轰动的社会反响。 2004年2月,当当网获得第二轮风险投资,著名风险投资机构老虎基金投资当当1100万美元。 2004年3月,当当网开通期刊频道。

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

学习、教学和评估的分类学(布鲁姆教育目标分类学修订版)

学习心理学与教学设计 学习、教学和评估的分类学 ――布鲁姆教育目标分类学修订版 L.W.安德森 教学是艺术,心理学是科学,目标分类学是目标建模工具 读书笔记

二〇一〇年一月 一分类学:教学目标和学生学习 1 绪论 在生活中,目标帮助我们集中注意和精力,并标明我们想要完成的任务。 1.1 需要分类学 一个教学目标的示例:“描述历史和文化影响与文化选择之间的联系”。产生如下问题: ?什么联系? ?什么影响? ?什么选择? ?描述是什么意思? “这些东西怎样帮助我们教得更好,怎样帮助学生学得更好?” 分类学是一种特殊的框架。用来清晰的描绘目标是什么。同时,就像建筑图纸中所使用的标准图标、软件工程中的UML(建模语言)一样,在教师、教师培训人员、课程协调者、评估专家、学校行政人员之间的交流中起到标准表述语言的作用。 1.2 分类学应用 增强对分类学的理解,怎样才能帮助我们?教师传统上经常被教育、教学、学习问题所困扰。主要有四个最重要的组织问题: (1)在时间有限的学校和课堂里,学什么对学生是最重要的?(学习问题) (2)怎样计划和传递教学内容才能让大多教学产生高水平的学习?(教学问题) (3)怎样选择和设计评估工具和程序才能提供学生学习效果的正确信息?(评估问题)(4)怎样确保目标、教学和评估三者之间保持一致?(一致性问题) 2 目标的结构、具体性和争论问题 2.1 目标的结构 泰勒提出“陈述目标的最有用形式是按行为类别和内容两个维度陈述,行为类别指意

欲通过教学发展的学生的行为类型;内容指学生的行为加以运作的教材内容”。

目标的陈述包括一个动词和一个名词: ?动词,描述我们意欲实现的认知过程(行动)。 ?名词,描述预期学生要学习或建构的知识(内容)。 2.2 目标的具体性 克拉斯沃尔和佩尼鉴别了三种具体性水平: 总体目标、教育目标和教学目标之间的关系 2.3 目标不是什么 不要将教学目标和教学活动或评估混淆: ?目标描述结果――希望的结果,希望的变化。

第一章 植物分类学原理

第一章植物分类学原理(3) 一、植物分类学的原理和方法 (一)原理: 达尔文的进化论,共同祖先理论:所有物种都来自一个共同祖先。自然的分类应是单系,即由来自同一祖先的所有后裔组成。 二、分类学三大学派 ●(一)支序分类学派(C l a d i s t i c s) ●德国昆虫学家亨尼克创立,见于1950年出版的《系统发育系统学原理》(G r u n d z u g e e i n e r T h e o r i e d e r p h y l o g e n t i c h e n S y s t e m a t i k) ●性状处理方法:系统发育由一系列二叉分支(a s e q u e n c e o f d i c h o t o m i e s)组成,每个二叉分支代表祖先种分化成两个子代种;并假定祖先种在二叉分支时消失。系谱的分支点必须完全依据共有衍生特征。(近裔有效) ●遇到的困难:分支不一定是二叉的;分支后原种未必消失。共同衍征确定的困难:趋同现象和极性(进化顺序)的判定。 ●评价:支序分析的最大优点是检验原先已由表征法划分的类群的“自然性”(即单系或单源)的一种有效方法。支序分类是不能被接受的。 (二)表征学派(数值分类学派n u m e r i c a l P h e n e t i c s) ●由S o k a l和S n e a t h创立,见于1963年出版的《数值分类学原理》(P r i n c i p l e s o f N u m e r i c a l T a x o n o m y)。 ●性状处理方法:所有性状等同对待。性状数量化,采用计算机处理,求出不同类群的相似性。(等价处理) ●遇到的困难:复杂的性状难以定量化。 ●评价:原理是错误的,方法是可行的。对属下等级的处理有用,对高级分类单位目、纲,或门不好用。数值分类学最有希望的未来发展可能在于进一步发展加权程序。 (三)进化学派(传统分类学派) ●主要代表为M a y r和S i m p s o n,20世纪40-60年代成熟。 ●性状处理方法:对独有衍征(一个姐妹群所获得而另一个姐妹群所不具有的衍生特征)给予了适当的加权。在分类中不仅表示系谱线(P h e l e t i c l i n e)的分支而且还表示它们随后的趋异现象。(性状加权)

贝叶斯分类实验报告doc

贝叶斯分类实验报告 篇一:贝叶斯分类实验报告 实验报告 实验课程名称数据挖掘 实验项目名称贝叶斯分类 年级 XX级 专业信息与计算科学 学生姓名 学号 1207010220 理学院 实验时间: XX 年 12 月 2 日 学生实验室守则 一、按教学安排准时到实验室上实验课,不得迟到、早退和旷课。 二、进入实验室必须遵守实验室的各项规章制度,保持室内安静、整洁,不准在室内打闹、喧哗、吸烟、吃食物、随地吐痰、乱扔杂物,不准做与实验内容无关的事,非实验用品一律不准带进实验室。 三、实验前必须做好预习(或按要求写好预习报告),未做预习者不准参加实验。四、实验必须服从教师的安排和指导,认真按规程操作,未经教师允许不得擅自动用仪器设备,特别是与本实验无关的仪器设备和设施,如擅自动用

或违反操作规程造成损坏,应按规定赔偿,严重者给予纪律处分。 五、实验中要节约水、电、气及其它消耗材料。 六、细心观察、如实记录实验现象和结果,不得抄袭或随意更改原始记录和数据,不得擅离操作岗位和干扰他人实验。 七、使用易燃、易爆、腐蚀性、有毒有害物品或接触带电设备进行实验,应特别注意规范操作,注意防护;若发生意外,要保持冷静,并及时向指导教师和管理人员报告,不得自行处理。仪器设备发生故障和损坏,应立即停止实验,并主动向指导教师报告,不得自行拆卸查看和拼装。 八、实验完毕,应清理好实验仪器设备并放回原位,清扫好实验现场,经指导教师检查认可并将实验记录交指导教师检查签字后方可离去。 九、无故不参加实验者,应写出检查,提出申请并缴纳相应的实验费及材料消耗费,经批准后,方可补做。 十、自选实验,应事先预约,拟订出实验方案,经实验室主任同意后,在指导教师或实验技术人员的指导下进行。 十一、实验室内一切物品未经允许严禁带出室外,确需带出,必须经过批准并办理手续。 学生所在学院:理学院专业:信息与计算科学班级:信计121

数据挖掘实验报告 超市商品销售分析及数据挖掘

通信与信息工程学院 课程设计说明书 课程名称: 数据仓库与数据挖掘课程设计题目: 超市商品销售分析及数据挖掘专业/班级: 电子商务(理) 组长: 学号: 组员/学号: 开始时间: 2011 年12 月29 日完成时间: 2012 年01 月 3 日

目录 1.绪论 (1) 1.1项目背景 (1) 1.2提出问题 (1) 2.数据仓库与数据集市的概念介绍 (1) 2.1数据仓库介绍 (1) 2.2数据集市介绍 (2) 3.数据仓库 (3) 3.1数据仓库的设计 (3) 3.1.1数据仓库的概念模型设计 (4) 3.1.2数据仓库的逻辑模型设计 (5) 3.2 数据仓库的建立 (5) 3.2.1数据仓库数据集成 (5) 3.2.2建立维表 (8) 4.OLAP操作 (10) 5.数据预处理 (12) 5.1描述性数据汇总 (12) 5.2数据清理与变换 (13) 6.数据挖掘操作 (13) 6.1关联规则挖掘 (13) 6.2 分类和预测 (17) 6.3决策树的建立 (18) 6.4聚类分析 (22) 7.总结 (25) 8.任务分配 (26)

数据挖掘实验报告 1.绪论 1.1项目背景 在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。在超市的经营中,应用数据挖掘技术分析顾客的购买习惯和不同商品之间的关联,并借由陈列的手法,和合适的促销手段将商品有魅力的展现在顾客的眼前, 可以起到方便购买、节约空间、美化购物环境、激发顾客的购买欲等各种重要作用。 1.2提出问题 那么超市应该对哪些销售信息进行挖掘?怎样挖掘?具体说,超市如何运用OLAP操作和关联规则了解顾客购买习惯和商品之间的关联,正确的摆放商品位置以及如何运用促销手段对商品进行销售呢?如何判断一个顾客的销售水平并进行推荐呢?本次实验为解决这一问题提出了解决方案。 2.数据仓库与数据集市的概念介绍 2.1数据仓库介绍 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。........ 2.2数据集市介绍 数据集市,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。....... 3.数据仓库 3.1数据仓库的设计 3.1.1数据库的概念模型 3.1.2数据仓库的模型 数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个

相关文档
最新文档