气象中使用统计检验的几个问题

anusplin软件操作说明及气象数据处理

气象数据处理方法：spss和Excel 一、下载原始txt数据中的经纬度处理：将度分处理成度，Excel处理首先除以100，处理成小数格式，这里第一个实际是52度58分，在Excel中用公式：=LEFT(O2,FIND(".",O2)-1)+RIGHT(O2,LEN(O2)-FIND(".",O2))/60 需注意：当为整数时，值为空，这时需查找出来手动修改，或者将经纬度这一列的小数位改成两位再试试，可能好使（这个我没尝试）第二步：将经纬度转换成投影坐标，在arcgis实现将Excel中的点导入arcgis，给定坐标系为wgs84地理坐标，然后投影转换成自己定义的等面积的albers投影（因为anusplina软件需要投影坐标，这里转换成自己需要的坐标系）

第三步：spss处理将下载的txt数据导入spss之后，编辑变量属性，删掉不需要的列，然后将最后需要的那些变量进行数据重组本实验下载的数据是日均温数据，全国800+个站点2012年366天的数据。相当于有800+ * 366行数据 1.变量变量属性：变量属性这里的设置决定了在SPLINA这个模块中输入数据的格式，本实验spss处理的气象数据的格式统一用这个：(A5,2F18.6,F8.2,F8.2)，一共5列。

即：台站号，字符串，5位；经纬度：都是浮点型，18位，6个小数位海拔：浮点型，8位，2个小数位日均温：浮点型，8位，2个小数位 2.数据重组，将个案重组成变量：后几步都默认就行：

重组之后结果：变成了800+行，370列，就相当于数据变成了：行代表每个站点，列是代表每一天的数据。 3. 因为anusplin这个软件需要的是投影坐标，在重组完的基础上，将经纬度这两列替换成投影之后的经纬度。方法1：直接复制粘贴即可方法二：用合并文件，添加变量功能

气象统计方法复习资料

气象资料及其表示方法选择最大信息的预报因子气候稳定性检验气候趋势分析一元线性回归多元线性回归逐步回归气象变量场时空结构分离复习题： 1、气象统计预报是利用统计学方法对气象（气候）样本进行分析来估计和推测总体的规律性。 2、突变可分为：均值突变、变率突变、趋势突变。 3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同，一个是（气候特征），一个是（天气特征）。相同点是数据资料都必须是（长时间）的观测数据。 4、（）需要对结论进行一系列的推断，分析结论的可信程度以及是否为因果关系。 A 统计分析； B 统计诊断； 5、采用统计诊断的方法研究天气、气候现象，可以用于哪些方面（）＜多选＞。 A 了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度； B 探索气候变量及其与其它物理因素之间的联系；学习内容： Chapter 1- Chapter 2- Chapter 3- Chapter 4- Chapter 5- Chapter 6- Chapter 7- Chapter-8-

C 对数值模拟结果与实际变化状况之间的差异进行统计诊断，为改进模式提供线索和指导； 6、对天气、气候现象进行统计诊断分析，一般分为四步。首先，（）；其次，（）；再次，（）；最后，（）。 A科学综合和诊断；B选择诊断方法；C资料预处理；D收集资料； 7、气候统计预测，一般分为四步。首先，（）；其次，（）；再次，（）；最后，（）。 A建立统计模型；B统计检验；C预测结论；D收集资料； 8、统计预测模型在利用大量（）观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的，用于对（）状态进行估计。在这一预测过程中，假设气候变化的成因和物理机制至少在（）期间与（）期间一致；气候系统保持稳定。 A过去；B未来；C预测；D观测； 9、气候统计预测过程主要由以下4 个要素构成：1、（），例如：夏季降水量，8 月份高温日数、暴雨日数；2、（），通常为从某些统计上显著相关的预报因子群提取的有效信息；3、（），根据数据性质、预测对象和预测因子特点，选择合适的统计预测模型；4、（），对未来气候变化状态时间、空间、数量、性质等方面的预测。 A预测技术；B预测依据；C预测结果；D预测对象； 10、气象统计研究对象可以划分为（）、多要素气象资料。例如：1950-2016 年南京7 月份高温日数，属于（）气象资料；例如某气象站7 月份日降水量与08时相对湿度，属于（）气象资料。

多元统计分析期末试题

一、填空题（20分） 1、若),2,1(),,(~)(n N X p 且相互独立，则样本均值向量X 服从的分布为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品所属类型的一种统计方法，常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类，R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ，总体),(~ p N X ，对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ，兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是： x y 10，多元回归的数学模型是： p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。二、计算题（60分） 1、设三维随机向量),(~3 N X ，其中 200031014，问1X 与2X 是否独立？),(21 X X 和3X 是否独立？为什么？解：因为1),cov(21 X X ，所以1X 与2X 不独立。把协差矩阵写成分块矩阵 22211211，),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ，而012 ，所以),(21 X X 和3X 是不相关的，而正态分布不相关与相互

气象站点数据插值处理流程

注：下面的为之前做的方法（7-以后不用做），里面的参数与现在的有出入，自己找到区域内站点，插值过程如下。气象站点数据插值处理流程 1气象站点数据整理 Excel格式，第一行输入字段名称，包括站点名称、x经度（lon）、y纬度（lat）、平均气温、平均风速、相对湿度、平均日照时数。其中经纬度需换算为度的形式，其它数据换算为对应单位。 2excel气象数据转为shape格式的矢量点数据插值分析（1）打开Arcgis，添加excel气象站点数据。打开LC_Ther10-11_16m合并_warp_裁剪BIL1.00_cj重采样6066_经纬度.img，打开边界.shp,三个应该能叠加在一起（2）在arcgis内容列表中右键单击excel表，选择“显示XY数据”，设置X、Y字段为表中对应经-x、纬-y度字段，编辑坐标系，设置为气象站点经纬度获取时的坐标系，这里为地理坐标系WGS84。(图中错了，按上述，要不就换下一下XY对应的经纬度试一试看看形状对就可以了) （3）导出为shape格式的点数据。右键单击上一个步骤中新生成的事件图层，单击“数据-导出数据”。需注意导出数据的坐标系应选择“此图层的源数据”。

（4）设置Arcgis环境。在“地理处理”菜单下单击“环境”，在环境设置窗口中选择“处理范围”，选择一个处理好的遥感数据（LC_Ther10-11_16m合并_warp_裁剪BIL1.00_cj重采样6066_经纬度.img，主要是参考该遥感数据的行数和列数）。再选择“栅格分析”，按下图设置插值的分辨率为“0.0045”，掩膜文件设置为边界2/LC_Ther10-11_16m合并_warp_裁剪BIL1.00_cj重采样6066_经纬度.img。注意：生成出来的是否有坐标系，插值-环境-输出坐标系-与**相同（5）气象站点数据插值。在toolbox中选择工具箱“Spatial Analyst————反距离权法”，默认12个数据参与运算，“Z值字段”分别选择平均风速、平均气温、相对湿度，直接输出，不要改输出路径名字。再导出数据。在差值分析界面最下栏也有环境，进去设置，注意经纬度显示位置是经纬度投影的投影坐标系，UTM不能用（6）数据转换为image格式。上步骤中得到的插值栅格数据是Arcgis格式的栅格格式（grid格式），该格式envi识别不了。右键单击插值数据选择“数据—导出数据”，设置导出数据格式为image。（7）再用envi claas 转换为UTM投影（8）UTM 设置参数：datum：（原来为North America 1927）改为为WGS84, zone 49。 E: 719614.2770 N: 4100314.6180 X/Y PIXEL: 16.0 meter output x size: 8723 output y size: 6066

多元统计分析期末试题及答案

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92, 3216___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________， __________， ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立？ (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

现代气象统计

现代气象统计复习题 1、向量正交且归一化的概念及表达式？ 2、 m维空间中的任一向量X可以用基向量V1，V2，...，V m线性组合表示，即，的几何意义是什么？ 3、一个实对称矩阵A，其特征值和特征向量有哪些性质？ 4、一个m阶方阵，其特定特征值和相应特征向量哪一个是唯一的。 5、详细了解EOF展开的原理,一个气象变量标准化距平场EOF展开中，给定协方差矩阵，如，计算其特征值、特征向量、方差贡献率。 6，多元统计中多维随机变量主成分的定义是什么？主成份的性质有哪些？ 7，一个场先处理成标准化距平，再进行主成分分析。第k个归一化的特征向量图和场的每个格点序列与第k个主成份序列之间的相关系数分布图有何关系？某个特征向量图与以哪个格点为定点的“一点相关图”最相似？ 8, EOF和PCA的功能是什么？ 9, EOF分析方法中特征向量矩阵和时间系数矩阵的特点和性质? 10, PCA与EOF的异同。 11,在EOF或者PCA的实际应用中，空间型可以有哪些表示方法，请叙述各自所表征的含义 12,EOF和REOF在气象要素时空特征分析用，各自的用途和优缺点是什么？ 13, REOF旋转中截取多少个模态旋转是如何确定的(三种) 8，旋转EOF分析的问题的提法（或旋转的原则）是什么？了解其原理。 9，旋转EOF的性质1、2的理解 10，了解REOF结果的分析 11，奇异值分解（SVD）方法在气象研究中的功能是什么？ 12，数学中一般实矩阵SVD的定义是什么？ 13，了解实一般矩阵SVD的性质 15，SVD分析中，两个场之间总的联系用什么衡量？与两个场之间交叉协方差矩阵的奇异值有什么关系？每一对SVD模态解释两个场总协方差平和的百分率、以及解释左右场各自方差的百分率怎么确定？SVD分析的原理保障反映出两个场之间的联系达最大还是反映两个场的方差量

应用多元统计分析试题及答案

一、填空题： 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品（或变量）进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素：一部分为公共因子，另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立，则样本均值向量x服从的分布为_x~N(μ，Σ/n)_。二、简答 1、简述典型变量与典型相关系数的概念，并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合，使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合，使其配对，并选取相关系数最大的一对，如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量，它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。相应分析，是指对两个定性变量的多种水平进行分析。设有两组因素A和B，其中因素A包含r个水平，因素B包含c个水平。对这两组因素作随机抽样调查，得到一个rc的二维列联表，记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换，使得因素A

和因素B 具有对等性，从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上，从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。从k 个总体中抽取具有p 个指标的样品观测数据，借助方差分析的思想构造一个线性判别函数系数：确定的原则是使得总体之间区别最大，而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出值，然后根据判别一定的规则，就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤第一，提出待检验的假设和H1；第二，给出检验的统计量及其服从的分布；第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。协差阵的检验检验0=ΣΣ 0p H =ΣI ： /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI ： /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

气象统计方法实习报告

目录实习一求500hPa高度场气候场、距平场和均方差场 ----------------------------------------------------- 5 1、资料介绍------------------------------------- 5 2．要求------------------------------------------- 5 3、实习结果------------------------------------- 6 1）、FORTRAN源程序 --------------------- 6 (2)、grads文件 ----------------- 10 （3）、实习结果------------------------ 11 实习二计算给定数据资料的简单相关系数和自相关系数 ---------------------------------------------- 19 1、资料介绍------------------------------------ 19 2、要求------------------------------------------ 20 3、实习结果------------------------------------ 20 （1）、Fortran源程序 ---------------- 20

（2）、程序运行结果： --------------- 25 实习三分析中国夏季降水线性趋势的分布特征26 1.资料介绍及要求： -------------------------- 26 2.实习结果------------------------------------- 26 （1）.matlab程序 ---------------------- 26 （2）.程序运行结果 -------------------- 27 实习四求给定数据的一元线性回归方程 ------ 29 1、资料介绍及要求--------------------------- 29 2、实习结果------------------------------------ 30 （1）、MATLAB程序 ---------------- 30 （2）、程序运行结果------------------ 31 （3）、结果分析------------------------ 32 实习五对给定的海温数据进行EOF分析 ---- 35 1、资料介绍------------------------------------ 35 2、要求------------------------------------------ 35

气象数据处理方法

(1)复杂地形下气温空间化模拟模型首先考虑海拔高度、经度、纬度对气温空间分布影响，再进一步考虑坡度、坡向这些微观地形因子对气温空间分布的影响。根据地形调节统计模型，即在考虑微观地形(坡度、坡向)情况下，面辐射与地形存在着函数关系，其实际气温可表示为： T T=T H cosi/cosz (1) 式中，T T为地形调节统计模型模拟的气温；T H为常规统计模型模拟的气温；i为地球面法线与太阳光线之间的角度。其中，T H可根据式(2)求得，i可根据式(3)求得 T H=a0+ a1λ+ a2φ+ a3h (2) 式中，λ为经度，φ为纬度，h为海拔高度，a0为常数，a1、a2、a3为偏回归系数。 cosi=cosαcosz+sinαsinzcos(ф-β) (3) 式中，α为坡度，z为太阳天顶角，ф为太阳方位角，β为坡向。对于中国的地理位置特点和气温模拟方法，可将太阳天顶角z设为45°，太阳方位角ф设为180°(为正午时间)，所以公式(1)归纳为： T T=T H(cosα-sinαcosβ) (2) “回归分析计算+残差插值”模型构建用于降水数据处理以2006年4月为例，得到各气象站点4月降水量与经纬度、海拔高度的线性关系式： P=-66.840+4.518*lat-1.324*long+0.001*ele(r2=0.456) (4) 式中：lat为气象站点的经度，long为气象站点的纬度，ele为气象站点的海拔高度，P为月降水。由DEM提取经度、纬度、坡度、坡向 1.dem栅格转点 2.把Data frame propoties显示单位设置为度分秒 3投影

4生成经纬度 5点转栅格（生成经度）

气象统计方法实习报告

目录实习一求500hPa高度场气候场、距平场和均方差场 -------------------------------- 3 1、资料介绍 ------------------------------------------------------------------------------------------------- 3 2．要求-------------------------------------------------------------------------------------------------------- 3 3、实习结果 ------------------------------------------------------------------------------------------------- 3 1）、FORTRAN源程序 ---------------------------------------------------------------------------------- 3 (2)、grads文件 --------------------------------------------------------------- 5 （3）、实习结果 ------------------------------------------------------------------------------------- 5 实习二计算给定数据资料的简单相关系数和自相关系数---------------------------- 7 1、资料介绍 ------------------------------------------------------------------------------------------------- 7 2、要求-------------------------------------------------------------------------------------------------------- 7 3、实习结果 ------------------------------------------------------------------------------------------------- 7 （1）、Fortran源程序 ------------------------------------------------------------------------------ 7 （2）、程序运行结果：---------------------------------------------------------------------------- 9 实习三分析中国夏季降水线性趋势的分布特征---------------------------------------- 9 1.资料介绍及要求： --------------------------------------------------------------------------------------- 9 2.实习结果 -------------------------------------------------------------------------------------------------- 9 （1）.matlab程序------------------------------------------------------------------------------------- 9 （2）.程序运行结果 -------------------------------------------------------------------------------- 10 实习四求给定数据的一元线性回归方程------------------------------------------------ 10 1、资料介绍及要求 --------------------------------------------------------------------------------------- 10

多元统计分析期末复习试题

第一章：多元统计分析研究的内容（5点） 1、简化数据结构（主成分分析） 2、分类与判别（聚类分析、判别分析） 3、变量间的相互关系（典型相关分析、多元回归分析） 4、多维数据的统计推断 5、多元统计分析的理论基础第二三章：二、多维随机变量的数字特征 1、随机向量的数字特征随机向量X 均值向量：随机向量X 与Y 的协方差矩阵：当X=Y 时Cov （X ，Y ）=D （X ）；当Cov （X ，Y ）=0 ，称X ，Y 不相关。随机向量X 与Y 的相关系数矩阵： )',...,,(),,,(2121P p EX EX EX EX μμμ='=Λ)')((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ

2、均值向量协方差矩阵的性质 (1).设X ，Y 为随机向量，A ，B 为常数矩阵 E （AX ）=AE （X ）； E （AXB ）=AE （X ）B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ，Y 独立，则Cov(X,Y)＝０，反之不成立． (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地，当为对角阵时，相互独立。 (2).若，Ａ为sxp 阶常数矩阵，d 为s 阶向量，ＡＸ＋d ～ . 即正态分布的线性函数仍是正态分布． (3).多元正态分布的边缘分布是正态分布，反之不成立． (4).多元正态分布的不相关与独立等价．例３．见黑板．三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的（简单）样本”的理解---独立同截面． (2)多元分布样本的数字特征---常见多元统计量样本均值向量＝样本离差阵Ｓ＝样本协方差阵Ｖ＝ S ;样本相关阵Ｒ (3) ,Ｖ分别是和的最大似然估计； (4)估计的性质是的无偏估计； ,Ｖ分别是和的有效和一致估计；；Ｓ～，与Ｓ相互独立；第五章聚类分析：一、什么是聚类分析：聚类分析是根据“物以类聚”的道理，对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚，甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法：系统聚类法（直观易懂）、动态聚类法（快）、有序聚类法（保序）...... Q-型聚类分析（样品）R-型聚类分析（变量）变量按照测量它们的尺度不同，可以分为三类：间隔尺度、有序尺度、名义尺度。二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换（优缺点） 1、中心化变换（平移变换）：中心化变换是一种坐标轴平移处理方法，它是先求出每个变量的样本平均值，再从原始数据中减去该变量的均值，就得到中心化变换后的数据。不改变样本间的相互位置，也不改变变量间的相关性。 2、标准化变换：首先对每个变量进行中心化变换，然后用该变量的标准差进行标准化。经过标准化变换处理后，每个变量即数据矩阵中每列数据的平均值为0，方差为1，且也不再具有量纲，同样也便于不同变量之间的比较。 3、极差正规化变换（规格化变换）：规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值，这两者之差称为极差，然后从每个变量的每个原始数据中减去该变量中的最小值，再除以极差。经过规格化变换后，数据矩阵中每列即每个变量的最大数值为1，最小数值为0，其余数据取值均在0－1之间；且变换后的数据都不再具有量纲，便于不同的),(~∑μP N X μ∑μp X X X ,,,21Λ),(~∑μP N X ) ,('A A d A N s ∑+μ)()1(,, n X X ΛX )',,,(21p X X X Λ)')(()()(1X X X X i i n i --∑=n 1X μ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

气象统计方法实习BD

实习一：气候场、距平场、均方差场编程如下: parameter(ii=37,jj=17,mon=12,year=4) real var(ii,jj,mon,year),ave(ii,jj,mon),jp(ii,jj,mon,year) real s(ii,jj,mon) integer i,j,iy,m open(5,file='d:\ex1\h500.dat') open(6,file='d:\ex1\ave.grd',form='binary') open(7,file='d:\ex1\jp.grd',form='binary') open(8,file='d:\ex1\s.grd',form='binary') open(12,file='d:\ex1\outall.grd',form='binary' open(9,file='d:\ex1\ave.txt') open(10,file='d:\ex1\jp.txt') open(11,file='d:\ex1\s.txt') ！读数据 DO iy=1,4 do m=1,12 !ccc read h500 read(5,1000) read(5,2000) ((var(i,j,m,iy),i=1,ii),j=1,jj)

enddo enddo ！计算气候场 do j=1,jj do i=1,ii do m=1,12 ave(i,j,m)=var(i,j,m,1)+var(i,j,m,2)+var(i,j,m,3)+var(i,j,m,4) ave(i,j,m)=ave(i,j,m)/4.0 enddo enddo enddo ！计算距平场 do iy=1,4 do m=1,12 do j=1,jj do i=1,ii jp(i,j,m,iy)=var(i,j,m,iy)-ave(i,j,m) enddo enddo enddo enddo ！计算均方差场

气象数据处理流程

气象数据处理流程1.数据下载 1.1.登录中国气象科学数据共享服务网 1.2.注册用户 1.3.选择地面气象资料 1.4.选择中国地面国际交换站日值数据选择所需数据点击预览（本次气象数据为：降水量、日最高气温、日最低气温、平均湿度、辐射度、积雪厚度等；地区为：黑龙江省、吉林省、辽宁省、内蒙古）下载数据并同时下载文档说明 1.5.网站数据粘贴并保存为TXT文档 2.建立属性库 2.1.存储后的TXT文档用Excel打开并将第一列按逗号分列 2.2.站点数据处理 2.2.1.由于站点数据为经纬度数据为方便插值数据设置分辨率（1公里）减少投影变换次数，先将站点坐标转为大地坐标并添加X、Y列存储大地坐标值后将各项数据按照站点字段年月日合成总数据库（注意：数据库存储为DBF3格式，个字段均为数值型坐标需设置小数位数）为填补插值后北部和东部数据的空缺采用最邻近法将漠河北部、富锦东部补齐2点数据。

2.2.2.利用VBA程序 Sub we() i = 6 For j = 1 To 30 Windows("").Activate Rows("1:1").Select Field:=5, Criteria1:=i Field:=6, Criteria1:=j Windows("").Activate Rows("1:1").Select Windows("book" + CStr(j)).Activate Range("A1:n100").Select Range("I14").Activate ChDir "C:\Documents and Settings\王\桌面" Filename:="C:\Documents and Settings\王\桌面\6\" & InputBox("输入保存名", Title = "保存名字", "20070" + CStr(i) + "0" + CStr(j)), _ FileFormat:=xlDBF4, CreateBackup:=False SaveChanges:=True Next j End Sub 将数据库按照日期分为365个文件 3.建立回归模型增加点密度由于现有的日辐射值数据不能覆盖东三省（如图），需要对现有数据建模分析，以增加气象数据各点密度。已有数据10个太阳辐射站点，为了实现回归模型更好拟合效果，将10个样本全部作为回归参数。利用SPSS软件建模步骤：

气象统计方法复习资料

学习内容： Chapter 1-气象资料及其表示方法 Chapter 2-选择最大信息的预报因子 Chapter 3-气候稳定性检验 Chapter 4-气候趋势分析 Chapter 5-一元线性回归 Chapter 6-多元线性回归 Chapter 7-逐步回归 Chapter-8-气象变量场时空结构分离复习题： 1、气象统计预报是利用统计学方法对气象（气候）样本进行分析来估计和推测总体的规律性。 2、突变可分为：均值突变、变率突变、趋势突变。 3、气候统计诊断分析与天气统计诊断分析的不同点是研究对象不同，一个是（气候特征），一个是（天气特征）。相同点是数据资料都必须是（长时间）的观测数据。 4、（）需要对结论进行一系列的推断，分析结论的可信程度以及是否为因果关系。 A 统计分析； B统计诊断； 5、采用统计诊断的方法研究天气、气候现象，可以用于哪些方面（）<多选>。 A 了解区域性或者全球性天气、气候现象的时空分布特征、变化规律及异常程度； B 探索气候变量及其与其它物理因素之间的联系； C 对数值模拟结果与实际变化状况之间的差异进行统计诊断，为改进模式提供线索和指导； 6、对天气、气候现象进行统计诊断分析，一般分为四步。首先，（）；其次，（）；再次，（）；最后，（）。 A科学综合和诊断； B选择诊断方法； C资料预处理；D收集资料； 7、气候统计预测，一般分为四步。首先，（）；其次，（）；再次，（）；最后，（）。 A建立统计模型； B统计检验； C预测结论； D收集资料； 8、统计预测模型在利用大量（）观测资料对气候系统内部或与其它变量之间关系的变化规律及特征分析基础上建立的，用于对（）状态进行估计。在这一预测过程中，假设气候变化的成因和物理机制至少在（

气象统计实习报告 (2)

气象统计实习报告专业：大气科学班级：xxxx级x班学号：2012130xxxx 姓名：

*实习一求500hPa高度场气候场、距平场和均方差场一、实习结果 1981.1距平场 1981.1 500hpa高度场在欧亚大陆为正距平，在印度洋和太平洋为负距平。

1981.1气候场 1982.1的气候场呈现明显的沿纬度的上升而下降的趋势。 1981.1均方差场 1981.1的均方差场在欧亚大陆的南侧有最小值，在10N~20N的南侧岁纬度而降低，在其北侧随纬度升高。二、相关的fortran程序，gs文件（1）Fortran程序: program main parameter(nx=37,ny=17,mo=12,yr=4) real var(nx,ny,mo,4)!数据 real vars(nx,ny,mo)!4年气候态 real jp(nx,ny, mo,4)!距平 real fc(nx,ny,mo)!方差 real jfc(nx,ny,mo)!均方差 integer i,j,m,y,irec real::summ=0.0 !*********************求均方差********************* do m=1,12 do i=1,37 do j=1,17 do y=1,4

summ=summ+jp(i,j,m,y)**2 enddo fc(i,j,m)=summ/4!方差 jfc(i,j,m)=sqrt(fc(i,j,m))!均方差 summ =0.0 enddo enddo enddo !****************************************** open(11,file='d:\shixi\vars.grd',form='binary' ) open(12,file='d:\shixi\jp.grd',form='binary' ) open(13,file='d:\shixi\jfc.grd',form='binary' ) do m=1,12 write(11)((vars(i,j,m),i=1,nx),j=1,ny) enddo do m=1,12 write(13)((jfc(i,j,m),i=1,nx),j=1,ny) enddo do y=1,4 do m=1,12 write(12)((jp(i,j,m,y),i=1,nx),j=1,ny) enddo enddo close(11) close(12) close(13) End （2）Gs程序 1.距平场 'open e:\anomaly.ctl' 'set gxout shaded' 'd xiaobao' 'set gxout contour' 'd xiaobao' 'draw title 1982年1月' 'enable print e:\anomaly.gmf' 'print' 'disable print' 2.气候场 'open e:\climate.ctl' 'set gxout shaded' 'd xiaobao'

多元统计分析期末复习试题

第一章：多元统计分析研究的容（5点） 1、简化数据结构（主成分分析） 2、分类与判别（聚类分析、判别分析） 3、变量间的相互关系（典型相关分析、多元回归分析） 4、多维数据的统计推断 5、多元统计分析的理论基础第二三章：二、多维随机变量的数字特征 1、随机向量的数字特征随机向量X均值向量：随机向量X与Y的协方差矩阵：当X=Y时Cov（X，Y）=D（X）；当Cov（X，Y）=0 ，称X，Y不相关。随机向量X与Y的相关系数矩阵： 2、均值向量协方差矩阵的性质 (1).设X，Y为随机向量，A，B 为常数矩阵 E（AX）=AE（X）； E（AXB）=AE（X）B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ，Y 独立，则Cov(X,Y)＝０，反之不成立． (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地，当为对角阵时，相互独立。 (2).若，Ａ为sxp 阶常数矩阵，d 为s 阶向量，ＡＸ＋d ～ . 即正态分布的线性函数仍是正态分布． (3).多元正态分布的边缘分布是正态分布，反之不成立． (4).多元正态分布的不相关与独立等价．例３．见黑板．三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的（简单）样本”的理解---独立同截面． (2)多元分布样本的数字特征---常见多元统计量样本均值向量＝样本离差阵Ｓ＝样本协方差阵Ｖ＝ S ;样本相关阵Ｒ (3) ,Ｖ分别是和的最大似然估计； (4)估计的性质是的无偏估计； ,Ｖ分别是和的有效和一致估计；；Ｓ～，与Ｓ相互独立；第五章聚类分析：一、什么是聚类分析：聚类分析是根据“物以类聚”的道理，对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚，甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法：系统聚类法（直观易懂）、动态聚类法（快）、有序聚类法（保序）...... Q-型聚类分析（样品）R-型聚类分析（变量）变量按照测量它们的尺度不同，可以分为三类：间隔尺度、有序尺度、名义尺度。二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换（优缺点） 1、中心化变换（平移变换）：中心化变换是一种坐标轴平移处理方法，它是先求出每个变量的样本平均值，再从原始数据中减去该变量的均值，就得到中心化变换后的数据。不改变样本间的相互位置，也不改变变量间的相关性。 2、标准化变换：首先对每个变量进行中心化变换，然后用该变量的标准差进行标准化。经过标准化变换处理后，每个变量即数据矩阵中每列数据的平均值为0，方差为1，且也不再具有量纲，同样也便于不同变量之间的比较。 3、极差正规化变换（规格化变换）：规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值，这两者之差称为极差，然后从每个变量的每个原始数据中减去该变量中的最小值，再除以极差。经过规格化变换后，数据矩阵中每列即每个变量的最大数值为1，最小数值为0，其余数据取值均在0－1之间；且变换后的数据都不再具有量纲，便于不同的变量之间的比较。 4、对数变换：对数变换是将各个原始数据取对数，将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。三、样品间相近性的度量研究样品或变量的亲疏程度的数量指标有两种：距离，它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

多元统计分析期末考试考点整理共5页

多元统计分析题型一定义、名词解释题型二计算（协方差阵、模糊矩阵）题型三解答题一、定义二名词解释 1、多元统计分析：多元统计分析是运用数理统计的方法来研究多变量（多指标）问题的理论和方法，是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理，对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类，使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量：是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值，是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地，所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量：多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量三、计算题解：答：

答：题型三解答题 1、简述多元统计分析中协差阵检验的步骤答：第一，提出待检验的假设和H1；第二，给出检验的统计量及其服从的分布；第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。 2、简述一下聚类分析的思想答：聚类分析的基本思想，是根据一批样品的多个观测指标，具体地找出一些能够度量样品或指标之间相似程度的统计量，然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类，把不相似的归为其他类。直到把所有的样品（或指标）聚合完毕. 3、多元统计分析的内容和方法答：1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量，使研究问题得到简化但损失的信息又不太多。（1）主成分分析（2）因子分析（3）对应分析等 2、分类与判别,对所考察的变量按相似程度进行分类。（1）聚类分析：根据分析样本的各研究变量，将性质相似的样本归为一类的方法。（2）判别分析：判别样本应属何种类型的统计方法。