水样全分析实验报告

水样全分析实验报告
水样全分析实验报告

环境分析实验报告

小组成员:靳培培、张园园、范君、

梅丽芸、饶海英、闫盼盼

指导老师:刘德启教授

日期:2012年5月19日

水样全分析

一、实验目的

1、了解常见的测定水质的指标;

2、掌握测定常用水质指标的方法;

3、掌握测定COD的方法;

4、学会使用TOC仪、气相色谱、离子色谱及其在水质分析中的应用。

二、实验原理

1、化学需氧量(COD):指在一定的条件下,采用一定的强氧化剂处理水样时,所消耗的氧化剂量。它是表示水中还原性物质多少的一个指标。水中的还原性物质有各种有机物、亚硝酸盐、硫化物、亚铁盐等。但主要的是有机物。因此,COD又往往作为衡量水中有机物质含量多少的指标。化学需氧量越大,说明水体受有机物的污染越严重。

COD的测定,随着测定水样中还原性物质以及测定方法的不同,其测定值也有不同。目前应用最普遍的是重铬酸钾氧化法,其原理是在强酸溶液(硫酸)中,用一定量的K2Cr2O7氧化水样中的有机物,过量的K2Cr2O7以亚铁灵作指示剂,用硫酸亚铁铵标准溶液回滴,根据其用量,算出消耗的重铬酸钾的量,再换算成氧气的量即为COD的值。该法氧化率高,再现性好,适用于测定水样中有机物的总量。

2、总有机碳(Total Oxygen Carbon,TOC):以碳的含量表示水体中有机物质总量的综合指标。在900℃高温下,以铂作催化剂,使水样氧化燃烧,测定气体中CO2的增量,从而确定水样中总的含碳量,表示水样中有机物总量的综合指标。由于TOC的测定采用高温燃烧,因此能将有机物全部氧化,它比BOD5或COD更能直接表示有机物的总量。因此常被用来评价水体中有机物污染的程度。

目前广泛应用的测定TOC的方法是燃烧氧化—非色散红外吸收法。其测定原理是:将—定量水样注入高温炉内的石英管,在900-950℃温度下,以铂和三氧化钴或三氧化二铬为催化剂,使有机物燃烧裂解转化为CO2,然后用红外线气体分析仪测定CO2含量,从而确定水样中碳的含量。因为在高温下,水样中的碳酸盐也分解产生二氧化碳,故上面测得的为水样中的总碳(TC)。为获得有机碳含量,可采用两种方法:一是将水样预先酸化,通入氮气曝气,驱除各种碳酸盐分解生成的二氧化碳后再注入仪器测定。另一种方法是使用高温炉和低温炉皆有的TOC测定仪。将同一等量水样分别注入高温炉(900℃)和低温炉(150℃),则水

样中的有机碳和无机碳均转化为CO 2,而低温炉的石英管中装有盐酸浸渍的玻璃棉,能使无机碳酸盐在150℃分解为CO 2,有机物却不能被分解氧化。将高、低温炉中生成的CO 2依次导入非色散红外气体分析仪,分别测得总碳(TC)和无机碳(IC),二者之差即为总有机碳TOC 。

3、气相色谱:是利用试样中各组分在气相和固定液液相间的分配系数不同,当汽化后的试样被载气带入色谱中运行时,组分就在其中的两相间进行反复多次分配,由于固定相对各组分的吸附或溶解能力不同,因此各组分在色谱柱中的运行速度就不同,经过一定的柱长后,便彼此分离,按顺序离开色谱柱进入检测器,产生的离子流讯号经放大后,在记录器上描绘出各组分的色谱峰。

GC 具有高分离效能、高选择性、高灵敏度、快的分析速度、样品用量少等优点,且一般分析沸点有350℃以下的或450℃以下有0.2-10mmHg 蒸气压力,热稳定性良好的有机化合物。而水样中苯酚的沸点为181.1℃,所以,选用GC 测定它的含量。

气相色谱仪器示意图

4、离子色谱(ion chromatography ,IC)作为一项新的分析技术,目前已在分析化学的各个领域得到了日益广泛的应用,特别是对水中阴离子的分析方法是一个突破,解决了许多分析化学长期存在的多组分同时测定等问题,得到广泛应用。其分析过程是样品通过分离柱,使被测离子得到分离,在抑制型离子色谱中还要经过抑制柱(器)使淋洗液的背景电导值降低,最后经检测器进行检测。

原理: 在阴离子交换色谱中,分离柱填充树脂的离子交换功能基是季胺基(-NR 3+ );阳离子交换色谱中,交换的功能基为磺酸基(-SO 3- )。在分离过程中,淋洗液里含有一定量与树脂离子电荷相反的平衡离子。在标准阴离子色谱中,平衡离子为CO 3-/HCO 3- ,在标准阳离子色谱中,平衡离子为H + 。样品中被测离子进入分离柱后与树脂交换功能基的平衡离子争夺交换位置,形成离子对,由于样品离子与固定相电荷之间的库仑力,样品离子将暂时被固定相保留。样品中不同离子与固定相电荷之间的库仑力不同.即亲合力不同。因此,被固定相保留的程度不同。即保留时间不同,被淋洗液洗脱出来的时间不同,从而达到样品中离

阴离子: A - + NR 3+- NR 3+A - + HCO 3-

阳离子: C + + SO 3-H + 3C + + H +

上式中HCO 3-和H +A - 和C + 分别为样品中的阴阳离子以阴离子为例,在活度系数约为1的情况下,可用下式表示阴离子交换平衡常数

式中 K 为选择性系数, 和 为样品中阴离子分别在固定相s 和流动相m 中的浓度。选择性系数决定了样品中被分离离子的不同保留时间。离子价位越高,离子半径越大,与树脂间的亲合力就越大,保留时间就越长.常见阴阳离子的保留时间顺序为F -、Cl -、NO 2-、NO 3-、SO 42-和Li +、Na +、NH 4+、K +、Mg 2+、Ca 2+。

该实验中水样中含NO 3-和PO 43-,所以选用离子色谱测定,并且水质分析时基

本上都是阴离子,所以使用阴离子交换柱,洗脱液为 1.0mmol/LNaHCO 3和

3.2mmol/LNa 2CO 3使用化学抑制后电导检测器监测信号。

三、实验综述

(一)有机污染物的检测方法

有机污染物的出现同整个人类社会的工业进步与发展息息相关,它存在于世界的每一个角落,一些生物体内有机污染物含量水平己接近或超过了已知的可造

[]s A []m A

成伤害的水平。其中持久性有机污染物印(POPs),难以降解,可发生长距离迁移,并且蓄积在环境中。POPs具有“三致”效应,而且可能导致生物体内分泌紊乱、生殖及免疫机能失调。目前,几乎所有人体内(甚至母乳中)都含有POPs,POPs 是环境中的一个“毒瘤”,是人类面临的一个紧迫的环境问题。因此,对于POPs 的研究具有极其重要的意义。

就目前来看,环境中POPs含量极低(一般为ng或pg级),不利于分析检测。但是对POPs的研究仍有一定的进展,主要的检测方法有色谱学检测、生物学检测和免疫学检测。

1. 色谱学检测

色谱学分析法是目前国际公认的检测多种POPs的标准方法,是一种常规分析法。它的分析原理是根据物质分子量大小、电荷、质量、极性和氧化还原电位等不同而进行分离和定量的;其优点是分离能力高、灵敏度高、分析速度快。对于色谱检测方法,检测结果的准确与否取决于两个方面:一个是仪器的稳定性与灵敏度;另一个就是样品预处理程度。而样品的预处理又是实验至关重要的一个过程,往往也是环境样品中POPs分析成败的关键。目前样品处理发展较快的方法主要有:固相萃取(SPE)、微固相萃取(SPME)、溶剂萃取(SE)、超临界流体萃取(ASE)、微波萃取(MAE)和加速溶剂萃取(ASE)等。虽然色谱法具有其它方法不可超越的优点,但是色谱法需要复杂的样品前处理过程,通常需要数天;并且要求有精密的分离检测仪器、良好的实验环境和训练有素的操作人员;用于定量的标准品也是必须的,而目前有些标准品还不具备,这使得其应用受到了限制。为了克服色谱分析法的缺点,人们开始寻求成本低廉且简便快速的检测方法,以便及时准确的进行监测。

2. 生物学检测

生物学分析法主要用来测定二噁英类化学物质和PCBs,它是依靠POPs受体机制,利用AhR—containing extracts 或者哺乳动物细胞培养来测量特异的生物学反应。该方法的优点是简便、快捷、特异性好,不仅可以测定样品中POPs 的总含量,还可对POPs进行毒性和生物活性进行测定。缺点是分析成本较高、耗时、操作专业性强等。POPs中的生物学检测是根据二噁英类化学物质的毒性作用机理进行的。由于二噁英与芳香烃受体结合的量与其诱导基因表达的能力在一定范围内呈正比,因此可通过检测特异基团的表达产物来反映二噁英类化学物质的量。有学者采用的生物学检测法主要是根据细胞、有机体对POPs中二噁英类化合物专一性反应或者是生物分子对PCDD/Fs化合物分子结构独特的识别能力来对这类化合物进行分析检测的。国内外对于检测包括二噁英类似物在内的POPs与芳香烃受体的作用,常用而micro-EROD和DR-CALUX(化学活性荧光素酶基团表达)两种生物学检测方法。

3. 免疫学检测

免疫学分析法是根据抗原抗体反应,应用POPs半抗原、POPs半抗体和适量的酶标POPs类似物发生竞争酶联免疫反应,通过测定酶标POPs类似物结合到抗体上的量来确定样品中POPs的含量,它的优点是分析成本低、选择性好、灵敏度高、操作简单、检测速度快。免疫学检测方法主要用于PCBs和二噁英类化合物的检测。免疫法虽具有一系列优点,但目前免疫法中的抗体实现商品化液并非易事,制备复杂、不能检测PCBs和二噁英类化合物的所有同系物,只是针对毒性较强的几种物质,因此还需要进一步发展,纵观POPs中二噁英免疫检测的发展历程,寻找更低毒、更易于同位素标记的TCDD替代物作为半抗原,将

数据分析实验报告

数据分析实验报告 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2 )W 检验 结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5 多维正态数据的统计量 数据:

数据分析实验报告

《数据分析》实验报告 班级: 07信计0班 学号: 姓名: 实验日期 2010-3-11 实验地点: 实 验楼505 实验名称: 样本数据的特征分析 使用软件名称:MATLAB 1. 熟练掌握利用Matlab 软件计算均值、方差、协方差、相关系数、标准差 与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2. 熟练掌握jbtest 与lillietest 关于一元数据的正态性检验; 3. 掌握统计作图方法; 4. 掌握多元数据的数字特征与相关矩阵的处理方法; 安徽省1990-2004年万元工业GDP 废气排放量、废水排放量、固体废物排放 量以及用于污染治理的投入经费比重见表 6.1.1,解决以下问题: 表6.1.1 实 验 目 的

1. 计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2. 计算各指标的偏度、峰度、三均值以及极差; 3?做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDR废气排放量,安徽省与江苏省是否 服从同样的分布?

程序如下: clear;clc format ba nk %保留两位小数 %%%%%%%%%%%安徽省%数据%%%%%%%%%%%%%%%%%% A=[104254.40 519.48 441.65 0.18 94415.00 476.97 398.19 0.26 89317.41 119.45 332.14 0.23 63012.42 67.93 203.91 0.20 45435.04 7.86 128.20 0.17 46383.42 12.45 113.39 0.22 39874.19 13.24 87.12 0.15 38412.85 37.97 76.98 0.21 35270.79 45.36 59.68 0.11 35200.76 34.93 60.82 0.15 35848.97 1.82 57.35 0.19 40348.43 1.17 53.06 0.11 40392.96 0.16 50.96 0.12 37237.13 0.05 43.94 0.15 34176.27 0.06 36.90 0.13]; %计算各指标的均值、方差、标准差、变异系数、偏度、峰度以及极差 A1=[mea n(A);var(A);std(A);std(A)./mea n(A);skew ness(A,0);kurtosis(A,0)-3;ra nge( A)] %E均值 A2=[1/4 1/2 1/4]*prctile(A,[25 50 75]) % 十算各指标的相关系数矩阵 A3=corrcoef(A) %做岀各指标数据直方图 subplot(221),histfit(A(:,1),8) subplot(222),histfit(A(:,2),8) subplot(223),histfit(A(:,3),8) subplot(224),histfit(A(:,4),7) %检验该数据是否服从正态分布 for i=1:4 [h(i),p(i),lstat(i),cv(i)]=lillietest(A(:,i),0.05); end h,p %十算岀前二列不服从正态分布,利用boxcox变换以后给岀该数据的密度函数[t1,l1]=boxcox(A(:,1)) [t2,l2]=boxcox(A(:,2)) [t3,I3]=boxcox(A(:,3))

arcgis栅格数据空间分析实验报告课案

实验五栅格数据的空间分析 一、实验目的 理解空间插值的原理,掌握几种常用的空间差值分析方法。 二、实验内容 根据某月的降水量,分别采用IDW、Spline、Kriging方法进行空间插值,生成中国陆地范 围内的降水表面,并比较各种方法所得结果之间的差异,制作降水分布图。 三、实验原理与方法 实验原理:空间插值是利用已知点的数据来估算其他临近未知点的数据的过程,通常用于将 离散点数据转换生成连续的栅格表面。常用的空间插值方法有反距离权重插值法(IDW)、 样条插值法(Spline)和克里格插值方法(Kriging)。 实验方法:分别采用IDW、Spline、Kriging方法对全国各气象站点1980年某月的降水量 进行空间插值生成连续的降水表面数据,分析其差异,并制作降水分布图。 四、实验步骤 ⑴打开arcmap,加载降水数据,行政区划数据,城市数据,河流数据,并进行符号化,对 行政区划数据中的多边形取消颜色填充 ⑵点击空间分析工具spatial analyst→options,在general标签中将工作空间设置为实验数据所在的文件夹

⑶点击spatial analyst→interpolate to raster→inverse distance weighted,在input points下拉框中输入rain1980,z字段选择rain,像元大小设置为10000 点击空间分析工具spatial analyst→options,在extent标签中将分析范围设置与行政区划一致,点击spatial analyst→interpolate to raster→inverse distance weighted,在input points下拉框中输入rain1980,z 字段选择rain,像元大小设置为10000

数据分析实验报告册

《数据分析》 实验报告册 20 15 - 20 16 学年第一学期 班级: 学号: 姓名: 授课教师:实验教师:

目录 实验一网上书店的数据库创建及其查询 实验1-1 “响当当”网上书店的数据库创建 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验1-3 “响当当”网上书店会员分布和图书销售查询 实验二企业销售数据的分类汇总分析 实验2-1 Northwind公司客户特征分析 实验2-2 “北风”贸易公司销售业绩观测板 实验三餐饮公司经营数据时间序列预测 实验3-1 “美食佳”公司半成品年销售量预测 实验3-2 “美食佳”公司月管理费预测 实验3-3 “美食佳”华东分公司销售额趋势预测 实验3-4 “美食佳”公司会员卡发行量趋势预测 实验3-5 “美食佳”火锅连锁店原料年度采购成本预测 实验四住房建筑许可证数量的回归分析 实验4-1 “家家有房”公司建筑许可证一元线性回归分析实验4-2 “家家有房”公司建筑许可证一元非线性回归分析实验4-3 “家家有房”公司建筑许可证多元线性回归分析实验4-4 “家家有房”公司建筑许可证多元非线性回归分析 实验五手机用户消费习惯聚类分析 实验六新产品价格敏感度测试模型分析

实验一网上书店的数据库创建及其查询实验1-1 “响当当”网上书店的数据库创建 实验类型:验证性实验学时:2 实验目的: ?理解数据库的概念; ?理解关系(二维表)的概念以及关系数据库中数据的组织方式; ?了解数据库创建方法。 实验步骤: 这个实验我们没有直接做,只是了解了一下数据库的概念。 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验目的 ?理解odbc的概念; ?掌握利用microsoft query进行数据查询的方法。 实验步骤: 1..建立odbc数据源:启动microsoft office query应用程序,在microsoft office query应用程序窗口中,执行“文件/新建”命令,出现“选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。 选择数据源对话框创建新数据源窗口 做图上所示的选择odbc microsoft access安装对话框

空间分析

空间分析主要通过对空间数据和空间模型的联合分析来挖掘空间目标的潜在信息。 空间目标是空间分析的具体研究对象,具有空间位置、分布、形态、空间关系(距离、方位、拓扑、相关场)等基本特征。空间关系是指地理实体之间存在的与空间特性有关的关系,是数据组织、查询、分析和推理的基础。 根本目标: 建立有效的空间数据模型来表达地理实体的时空特性,发展面向应用的时空分析模拟方法,以数字化方式动态地、全局地描述地理实体和地理现象的空间分布关系,从而反映地理实体的内在规律和变化趋势。类型的空间目标具有不同的形态结构描述,对形态结构的分析称为形态分析。 两种表现形式: ?空间数据的分析: ?数据的空间分析。 空间分析的内容:叠置分析、缓冲分析、网络分析、地形分析、统计分析: 此外,空间查询与量算、趋势面分析、三维空间分析、空间插值方法、集合分析及其他应用分析模型如小波分析应用模型 GIS环境下空间分析框架 “GIS分析模拟环境问题的主要能力是能够处理海量的、异质的、空间导向的数据,对地理问题的处理伴随着时空过程。”------Goodchild 空间可以定义为一系列结构化物体及其相互间联系的集合 拓扑空间:描述空间目标宏观分布或目标之间相互关系的有效方法。

拓扑空间是一组任意要素集,是一个连续的概念,并在位置关系基础上进行定义。区域、边界、连通等几何对象以及几何对象的空间关系在拓扑空间中均有定义。在拓扑空间中,若空间目标间的关联、相邻与连通等几何属性不随空间目标的平移、旋转、缩放等变换而改变,这些保持不变的性质称为拓扑属性,变化的性质则称为非拓扑属性。 拓扑关系(topological relation):不考虑距离和方向的空间目标之间的关系,包括相邻(adjacent) ,邻接(connection)、关联(conjunction)和包含(inclusion)等。 空间分析中利用拓扑:拓扑关系:用于检测数据质量或生成新数据集。 地理学中的地理空间(geographic space): 定义:具有空间参考信息的地理实体或地理现象的时空位置集。GIS中的地理空间:绝对空间+相对空间 综合定义:是指经过投影变换后,在笛卡儿坐标系中的地球表层特征空间。是信息世界层面的地理空间。 地理空间是多维的。地理空间具有可分性(divisibility)。 测量中一般采用两类坐标系:天球坐标系和地球坐标系。 惯性坐标系,其坐标原点及各坐标轴指向在空间保持不变,用于描述天体、卫星位置和状态。地球坐标系是为了描述地面点的位置而建立的一个与地球相关联的坐标系。 地理空间数据特征:时空特征、多维结构、多尺度性、不确定性、海量性特征

大数据分析技术与应用_实验2指导

目录 1实验主题 (1) 2实验目的 (1) 3实验性质 (1) 4实验考核方法 (1) 5实验报告提交日期与方式 (1) 6实验平台 (1) 7实验内容和要求 (1) 8实验指导 (2) 8.2 开启Hadoop所有守护进程 (2) 8.2 搭建Eclipse环境编程实现Wordcount程序 (3) 1.安装Eclipse (3) 2.配置Hadoop-Eclipse-Plugin (3) 3.在Eclipse 中操作HDFS 中的文件 (7) 4.在Eclipse 中创建MapReduce 项目 (8) 5.通过Eclipse 运行MapReduce (13) 6.在Eclipse 中运行MapReduce 程序会遇到的问题 (16)

1实验主题 1、搭建Hadoop、Eclipse编程环境 2、在Eclipse中操作HDFS 3、在Eclipse中运行Wordcount程序 4、参照Wordcount程序,自己编程实现数据去重程序 2实验目的 (1)理解Hadoop、Eclipse编程流程; (2)理解MapReduce架构,以及分布式编程思想; 3实验性质 实验上机内容,必做,作为课堂平时成绩。 4实验考核方法 提交上机实验报告,纸质版。 要求实验报告内容结构清晰、图文并茂。 同学之间实验报告不得相互抄袭。 5实验报告提交日期与方式 要求提交打印版,4月19日(第10周)之前交到软件学院412。 6实验平台 操作系统:Linux Hadoop版本:2.6.0或以上版本 JDK版本:1.6或以上版本 Java IDE:Eclipse 7实验内容和要求 (1)搭建Hadoop、Eclipse编程环境; (2)运行实验指导上提供的Wordcount程序; (3)在Eclipse上面查看HDFS文件目录; (4)在Eclipse上面查看Wordcount程序运行结果; (5)熟悉Hadoop、Eclipse编程流程及思想; 程序设计题,编程实现基于Hadoop的数据去重程序,具体要求如下: 把data1文件和data2文件中相同的数据删除,并输出没有重复的数据,自己动手实现,把代码贴到实验报告的附录里。 设计思路: 数据去重实例的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。具体就是Reduce的输入应该以数据作为Key,而对value-list则没有要求。当Reduce 接收到一个时就直接将key复制到输出的key中,并将value设置成空值。在MapReduce流程中,Map的输出 经过shuffle过程聚集成后会被交给Reduce。所以从设计好的Reduce输入可以反推出Map输出的key应为数据,而

数据分析实验报告

《数据分析》实验报告 班级:07信计0班学号:姓名:实验日期2010-3-11 实验地点:实验楼505 实验名称:样本数据的特征分析使用软件名称:MATLAB 实验目的1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2.熟练掌握jbtest与lillietest关于一元数据的正态性检验; 3.掌握统计作图方法; 4.掌握多元数据的数字特征与相关矩阵的处理方法; 实验内容安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:表6.1.1废气、废水、固体废物排放量及污染治理的投入经费占GDP比重 年份 万元工业GDP 废气排放量 万元工业GDP 固体物排放量 万元工业GDP废 水排放量 环境污染治理投 资占GDP比重 (立方米)(千克)(吨)(%)1990 104254.40 519.48 441.65 0.18 1991 94415.00 476.97 398.19 0.26 1992 89317.41 119.45 332.14 0.23 1993 63012.42 67.93 203.91 0.20 1994 45435.04 7.86 128.20 0.17 1995 46383.42 12.45 113.39 0.22 1996 39874.19 13.24 87.12 0.15 1997 38412.85 37.97 76.98 0.21 1998 35270.79 45.36 59.68 0.11 1999 35200.76 34.93 60.82 0.15 2000 35848.97 1.82 57.35 0.19 2001 40348.43 1.17 53.06 0.11 2002 40392.96 0.16 50.96 0.12 2003 37237.13 0.05 43.94 0.15 2004 34176.27 0.06 36.90 0.13 1.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2.计算各指标的偏度、峰度、三均值以及极差; 3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDP废气排放量,安徽省与江苏省是 否服从同样的分布?

数值分析实验报告

学生实验报告实验课程名称 开课实验室 学院年级专业班 学生姓名学号 开课时间至学年学期

if(A(m,k)~=0) if(m~=k) A([k m],:)=A([m k],:); %换行 end A(k+1:n, k:c)=A(k+1:n, k:c)-(A(k+1:n,k)/ A(k,k))*A(k, k:c); %消去end end x=zeros(length(b),1); %回代求解 x(n)=A(n,c)/A(n,n); for k=n-1:-1:1 x(k)=(A(k,c)-A(k,k+1:n)*x(k+1:n))/A(k,k); end y=x; format short;%设置为默认格式显示,显示5位 (2)建立MATLAB界面 利用MA TLAB的GUI建立如下界面求解线性方程组: 详见程序。 五、计算实例、数据、结果、分析 下面我们对以上的结果进行测试,求解:

? ? ? ? ? ? ? ? ? ? ? ? - = ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? - - - - - - 7 2 5 10 13 9 14 4 4 3 2 1 13 12 4 3 3 10 2 4 3 2 1 x x x x 输入数据后点击和,得到如下结果: 更改以上数据进行测试,求解如下方程组: 1 2 3 4 43211 34321 23431 12341 x x x x ?? ???? ?? ???? ?? ???? = ?? ???? - ?? ???? - ???? ?? 得到如下结果:

宏观经济实验报告

学生实验报告

注:1.指导教师和学生成绩一栏由指导教师填写,其它栏目内容均由学生填写。 2.“实验项目名称”要与该实验课程教学大纲中的“实验项目”相对应。

附一: 四、实验指南 (一)宏观经济分析的基本方法 1.总量分析法 总量分析法是对影响宏观经济的总量指标进行分析,如GDP,消费额、投资额、银行贷款总额、物价水平等。总量分析主要是一种动态分析,主要研究总量指标的变动规律 2.结构分析法 是指对经济系统中各组成部分及其对比关系变动规律的分析。比如分析第一产业、第二产业、第三产业之间的比例,分析消费与投资的比例关系。结构分析主要是一种静态分析,即对一定时间内经济系统中各组成部分变动规律的分析 3.宏观分析资料的搜集与处理 宏观分析所需的有效资料一般包括政府的重点经济政策与措施、一般生产统计资料、金融物价统计资料、贸易统计资料、每年国民收入统计与景气动向、突发性非经济因素等。 (二)宏观经济分析的主要内容 宏观经济分析主要包括宏观经运行的变动、宏观经济政策、国际金融环境以及对证券市场的

供求关系等几个方面。当然像人口因素、能源因素以及包括政治因素、战争因素、灾害因素都有可能对证券市场产生决定性的影响,但在一般情况下,上述因素的作用机制必须单独分析研究。宏观经济分析的内容重在对宏观经济形势与经济背景作出基本判断,以分析在新兴加转型背景下中国宏观经济对证券市场的的影响,把握证券市场总体变动趋势,掌握宏观经济政策对证券市场的影响力度与方向,判断整个证券市场的投资价值。 1.宏观经济变动对证券市场的影响 宏观经济分析最重要的参考依据要选取官方公开公布的数据,尤其是国家统计局的数据相对最可靠。可借助统计工具与手段,了解证券价格变化与经济运行形势的关联性。 宏观经济分析包含的内容有许多,在此可重点选取几个方面进行分析,比如可以以国民生产总值对证券价格的影响,看看经济持续增长与衰退对证券市场的影响;也可以选取就业状况的变动对证券市场影响分析,就业状况的好坏不仅反映了经济状况,而且对证券市场资金供给的增减变化有密切关系。通过具体因素的分析,掌握宏观经济形势对证券市场的影响方式与影响程度。宏观经济的运行形势对证券市场的影响可见表3-1、3-2、3-3。 表3-1 评价宏观经济形势的基本指标 表3-2 宏观经济运行对证券市场的影响

计量地理学实验报告解剖

《计量地理学》实验报告 学院: 班级: 学号: 姓名: 指导老师: 实验地点:

目录 一、第一次实验 (1)多元线性回归分析 (3) (2)逐步回归分析 (6) 二、第二次实验 (1)主成分回归分析 (10) (2)方差分析 (13) 三、第三次实验 (1)非线性回归分析 (17) (2)聚类分析 (20) 四、第四次实验 趋势面分析 (22)

第一次实验 1.实验名称:多元线性回归分析 实验目的:通过探讨自变量与因变量之间变动的比例关系,建立模型,揭示地理要素之间的线性相关关系。 实验内容:以《贵州省遵义市海龙坝水源地供水水文地质详查报告》中的数据资料为例,对该地区地下水流量进行预测。从详查报告可以看出,该区地下水流量的动态变化主要受降雨量及人工开采两个因素的影响,因此主要通过研究区降雨量及人工开采用水资料来预测地下水各观测孔流量的变化,而不考虑其它因素的影响,则模型可简化为: 22110x x y ?+?+?= 式中,y 为观测孔地下水流量的变化;21,x x 分别为降雨量和人工开采量。

实验步骤: (1)在DPS系统中对原始数据进行回归分析,将上表中数据编辑、定义成数据块; (2)在“多元分析”菜单下选择“回归分析”中的“线性回归”,系统给出下图界面 点击右下角的“返回编辑”,得到以下数据: 多元线性回归分析结果: 方差来源平方和df 均方F值p值 回归461.3979 2 230.6989 38.0527 0.0004 剩余36.3757 6 6.0626 总的497.7736 8 62.2217 相关系数R=0.962768 决定系数RR=0.926923 调整相关R'=0.950034

数据分析实验报告

数据分析实验报告 【最新资料,WORD文档,可编辑修改】 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50 751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689

1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验 单样本Kolmogorov-Smirnov 检验 身高N60正态参数a,,b均值139.00

标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z.686 渐近显着性(双侧).735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验

数据仓库与数据挖掘实验二(多维数据组织与分析)

一、实验内容和目的 目的: 1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系; 2.理解多维数据集创建的基本原理与流程; 3.理解并掌握OLAP分析的基本过程与方法; 内容: 1.运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。 2.使用维度浏览器进行多维数据的查询、编辑操作。 3.对多维数据集进行切片、切块、旋转、钻取操作。 二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Windows 7 数据库平台:SQL Server 2008 SP2 三、实验原理 在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。 OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。 建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基

于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的OLAP,简称关系OLAP。 OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。 四、实验方法、步骤 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。 五、实验过程原始记录(数据、图表、计算等) 本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。 首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis Service项目,命名为:DW

趋势面分析实验报告

趋势面分析实验报告 实验目的: 趋势面分析是利用数学曲面模拟地理系统要素在空间上的分布以及变化趋势的一种方法。趋势面分析方法常常被用来模拟资源,环境人口及经济要素在空间上的分布规律。利用趋势分析的方法来检测各个数据在空间分布上的特点。 实验要求: 对某城市郊区垃圾占用农田面积的数量在平面上的分布规律进行计算和分析。 实验步骤: 步骤一:导入数据EXCEL格式 步骤三:建立趋势面模型,分析,回归,线性输入自变量和因变量,算出二次拟合方程 Z=2.160+0.638x-0.80y-0.52x*x+0.07xy-0.011y*y

(R的平方=0.593 F=2.620) 步骤四:三次趋势面分析,求出X6,X7,X8,X9,建立三次趋势面模型 4 Z=-5.571+2.002x+3.889y-0.154x*x-0.182xy-0.573y*y-0.001x*x*x+0.015x*x*y+0.001x*y *y+0.024y*y*y (R的平方=0.921 F=6.474)

步骤五:模型检验 (1)结果表明二次趋势面的判定系数为0.593,三次的趋势面判定系数为0.921,可见三次 趋势面回归模型的拟合程度高。 (2)趋势面适度的显著性F检验。二次和三次的趋势面的F值分别为2.620和6.474 。二 次趋势面F=2.2620Fa(9,5),检验显著。(3)趋势面适度的逐次检验。从回归值与实测值的差值(残差)看,三次趋势面残差的绝对 值也显著少于二次趋势面。因此三次趋势面方程可以形象的表示出该城市郊区垃圾点占地的规律。

数值分析实验(2)word版本

数值分析实验(2)

实验二 插值法 P50 专业班级:信计131班 姓名:段雨博 学号:2013014907 一、实验目的 1、熟悉MATLAB 编程; 2、学习插值方法及程序设计算法。 二、实验题目 1、已知函数在下列各点的值为 试用4次牛顿插值多项式()4P x 及三次样条函数()S x (自然边界条件)对数据进行插值用图给出(){},,0.20.08,0,1,11,10i i i x y x i i =+=,()4P x 及()S x 。 2、在区间[]1,1-上分别取10,20n =用两组等距节点对龙格函数()2 1125f x x = +作多项式插值及三次样条插值,对每个n 值,分别画出插值函数及()f x 的图形。 3、下列数据点的插值 可以得到平方根函数的近似,在区间[]0,64上作图 (1)用这9个点作8次多项式插值()8L x (2)用三次样条(第一边界条件)程序求()S x 从得到结果看在[]0,64上,哪个插值更精确;在区间[]0,1上,两种插值哪个更精确? 三、实验原理与理论基础

1、拉格朗日差值公式 )()(111k k k k k k x x x x y y y x L ---+ =++ 点斜式 k k k k k k k k x x x x y x x x x y x L --+--=++++11111)( 两点式 2、n 次插值基函数 ....,2,1,0,)()(0n j y x l y x L i j n k k k j n ===∑= n k x x x x x x x x x x x x x l n k n k k k k k ,...,1,0,) () (... ) () (... ) () ()(1100=------= -- 3、牛顿插值多项式 ...))(](,,[)](,[)()(102100100+--+++=x x x x x x x f x x x x f x f x P n ))...(](,...,[100---+n n x x x x x x f )(],...,,[)()()(10x x x x f x P x f x R n n n n +=-=ω 4、三次样条函数 若函数],,[)(2b a C x S ∈且在每个小区间],[1+j j x x 上是三次多项式,其中, b x x x a n =<<<=...10是给定节点,则称)(x S 是节点n x x x ,...,,10上的三次样条函数。若在节点j x 上给定函数值),,...,2,1,0)((n j x f y j i ==并成立,,...,2,1,0,)(n j y x S i j ==则称)(x S 为三次样条插值函数。 5、三次样条函数的边界条件 (1)0)()(''''''00''====n n f x S f x S (2)'''00')(,)(n n f x S f x S == 四、实验内容 1、M 文件: function [p]=Newton_Polyfit(X,Y) format long g r=size(X); n=r(2); M=ones(n,n); M(:,1)=Y'; for i=2:n

数据分析实验报告

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share

price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75 3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

经济数据分析实验报告

(此文档为word格式,下载后您可任意编辑修改!) 实验报告格式: 商学院经济与管理实验教学中心 实验报告 实验名称经济数据分析综合实验 班级学号姓名 同组学生姓名实验时间:7-18周 得分:批改时间:2014年01月03日实验教师(签名):孙小红评语: 实验一:数据文件的建立 一、实验目的 1、理解并掌握数据类型的概念。 2、掌握一份具体问卷转化为数据文件。 3、掌握正确设置变量及属性,区分处理主观题与客观题、单选题、多选题及表格式题目 的不同之处。 4、掌握带标签值数据的录入。 二、实验内容 见《实验手册》。 三、实验步骤 本次试验的内容是“数据文件的建立”。以下介绍两种不同的数据文件建立方法。 第一种输入变量和数据建立数据文件,以“温州企业基本情况”数据文件为例 1、双击打开SPSS 17.0软件,在弹出的对话框中选择“输入数据” 2、切换到“变量视图”,单击“名称”下的空格,输入“ID”,单击“类型”下的空格,选 择“数值,宽度为2,小数为0”,单击“标签”下的空格,输入“问卷编号”,其他各列选择默认值 3、同步骤2,在“名称”下输入“企业名称”,在“类型”下选择“字符串,宽度为30,

小数为0”,其余默认。 4、在“名称”下输入“企业性质”,在“类型”下选择“数值,宽度为1,小数为0”。单击“值”,弹出“值标签”对话框,在“值”栏输入“1”,在“标签”输入“国有及国有控股企业”,选择“添加”,同理输入其他的选项,接着按“确定”,其余默认。 5、按照步骤4,输入“企业经营情况”和“所属行业” 6、切换到“数据视图”,在各个变量下输入数据 7、选择“文件”菜单,下拉,按“保存” 第二种导入EXCEL文件建立数据文件,以“学生”数据文件为例 1、双击打开SPSS.17.0 2、选择“文件”菜单,下拉,选择“打开---数据”,在弹出的对话框中,在“文件类型”下拉,选择“EXCEL”,然后再选择“查找范围”,选中所要导入的EXCEL“学生”文件。 3、切换到“变量视图”,在“gender”变量的“值”栏,单击添加“1=男生,2=女生”,点击“确认”。 4、选择“文件”菜单,下拉,按“另存为”,存在D盘 四、实验结果与分析 1 企业基本情况 2 态度与认识 3 资金投入、人力资源和企业文化

趋势面分析

趋势面分析 案例:某流域一月降水量与各观测点的坐标位置数据如表,我们设降水量为因变量Z,地 2、Y2、XY、X22、X 3、Y3 2、建立趋势面模型 1)二次多项式 a.我们先将各变量数值输入SPSS软件中,然后选择“分析—回归—线性”工具,将Z送进因变量框中,然后再将其他的自变量送进自变量框中,点击确定便可求的解。

b.运行结果如下 图1 图1中B列的数据为拟合方程的各系数,根据表中的数值及所对应的常量,我们求得的拟合方程为: Z=5.998+17.438X+29.787Y-3.588X2+0.357XY-8.070Y2

图2 图2显示该拟合二次趋势面的判定系数R2=0.839,显著性F=6.232 2)三次多项式 a.方法与二次多项式类似,将所有的变量输入SPSS,选择“分析—回归—线性”工具,将Z 送进因变量框中,然后再将其他的自变量送进自变量框中,点击确定便可求解。

b.运行结果如下 图1 图1中数列B的数据为拟合方程的各系数,根据表中的数值及所对应的常量,我们求得的拟合方程为: Z=-48.810+37.557X+130.130Y+8.389X2-33.166XY-62.740Y2- 4.133X3+6.138X2Y+2.566XY2+9.785Y3 图2 图2显示,该拟合二次趋势面的判定系数R2=0.965,显著性F=6.054 3、检验模型 1)趋势面拟合适度检验。根据两次拟合的输出结果表明,二次趋势面的判定系数为R2=0.839,三次趋势面的判定系数为R2=0.965,可见二者趋势面回归模型的显著性都较高(>0.8),且三次趋势面较二次趋势面具有更高的拟合程度(数值更大)。 2)趋势面适度的显著性检验。根据两次拟合的输出结果表明,两者趋势面的F值分别为F2=6.236、和F3=6.054,在置信水平a=0.05下,查F分布表得F2a=F0.05(5,6)=4.53,F3a=F0.05(9,2)=19.4,我们得出F2>F2a F3 < F3a,因此我们判定用二次趋势面进行拟合比较合理。3)趋势面适度的逐次检验。 用SPSS软件对检验两个阶次趋势面模型的适度值进行计算,然后比较分析。

相关文档
最新文档