信号统计分析典型习题

信号统计分析典型习题
信号统计分析典型习题

工艺过程的统计分析一

工艺过程的统计分析 一:概述 在生产实际中,影响加工精度的原始误差很多,这些原始误差往往使综合地交错在一起对加工精度产生综合影响的,且其中不少原始误差的影响往往带有随机性。对于一个受多个随机性质原始误差影响的工艺系统,只有用概率统计的方法来进行分析,才能得出正确的、符合实际的结果。 (一)系统性误差与随机性误差 系统性误差可分为常值系统性误差和变值系统性误差两种。在顺序加工一批工件中,其大小和方向皆不变的误差,称为常值系统性误差。例如,铰刀直径大小的误差,测量仪器的一次对零误差等。在顺序加工一批工件中,其大小和方向遵循某一规律变化的误差,称为变值系统性误差。例如,由于刀具的磨损引起的加工误差,机床和刀具或工件的受热变形引起的加工误差等。显然,常值系统性误差与加工顺序无关,而变值系统性误差则与加工顺序有关。 在顺序加工一批工件中,有些误差的大小和方向使无规则变化着的,这些误差称为随机误差。例如加工余量不均匀、材料硬度不均匀、夹紧力时大时小等原因引起的 加工误差。 对于常值系统性误差,若能掌握其大小和方向,就可以通过调整消除;对于变值系统性误差,若能掌握其大小和方向随时间变化的规律,则可通过自动补偿消除;唯队随机性误差,只能缩小它们的变动范围,而不可能完全消除。由概率论与数理统计血可知,随机性误差的统计规律可用它的概率分布表示。 (二)机械制造中常见的误差分布规律

偏态 分布 在用试切法车削轴径或孔径时,由于操作者为了尽量避免产生不 可修复的废品,主观地(而不是随机地)使轴颈加工得宁大勿小, 则它们得尺寸误差就呈偏态分布。 机械加工误差 分布规律 (三)正态分布 1.正态分布的数学模型、特征参数和特殊点机械加工 中,工件的尺寸误差是由很多相互独立的随机误差综合作 用的结果,如果其中没有一个随机误差是起决定作用的, 则加工后工件的尺寸将呈正态分布,其密度方程中,有两 个特征参数:一个算术平均值只影响曲线的位置,而不影 响曲线的形状;另一个均方根偏差(标准差)σ 只影响曲 线的形状,而不影响曲线的位置,均方根偏差愈大,曲线 愈平坦,尺寸就愈分散,精度就愈差。因此,均方根偏差 反映了机床加工精度的高低,算术平均值反映了机床调整 位置的不同。 2.标准正态分布 算术平均值为 0,均方根偏差为 1 的正态分布为标准正态分布。 3.工件尺寸再某区间内的概率 生产上感兴趣的往往不是工件为某一尺寸的概率是多大,而是加工工件尺寸落在某一 区间(x1≤x≤x2)内的概率是多大,如右图示。通过分析可知,非标准正态分布概率 密度函数的积分,经标准化变换后,可用标准正态分布概率密度函数的积分表示,为 了计算的需要,可制作一个标准化正态分布概率密度函数的积分表。通过计算可知, 正态分布的分散范围为 这就是工程上经常用到的“±3σ 原则”,或称“6σ 原 则”。

多元统计分析模拟考题及答案.docx

一、判断题 ( 对 ) 1 X ( X 1 , X 2 ,L , X p ) 的协差阵一定是对称的半正定阵 ( 对 ( ) 2 标准化随机向量的协差阵与原变量的相关系数阵相同。 对) 3 典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4 多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据 分析方法。 ( 错)5 X (X 1 , X 2 , , X p ) ~ N p ( , ) , X , S 分别是样本均值和样本离 差阵,则 X , S 分别是 , 的无偏估计。 n ( 对) 6 X ( X 1 , X 2 , , X p ) ~ N p ( , ) , X 作为样本均值 的估计,是 无偏的、有效的、一致的。 ( 错) 7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对) 8 因子载荷阵 A ( ij ) ij 表示第 i 个变量在第 j 个公因子上 a 中的 a 的相对重要性。 ( 对 )9 判别分析中, 若两个总体的协差阵相等, 则 Fisher 判别与距离判别等价。 (对) 10 距离判别法要求两总体分布的协差阵相等, Fisher 判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、 样本相关系数矩阵. 2、 设 是总体 的协方差阵, 的特征根 ( 1, , ) 与相应的单 X ( X 1,L , X m ) i i L m 位 正 交 化 特 征 向 量 i ( a i1, a i 2 ,L ,a im ) , 则 第 一 主 成 分 的 表 达 式 是 y 1 a 11 X 1 a 12 X 2 L a 1m X m ,方差为 1 。 3 设 是总体 X ( X 1, X 2 , X 3, X 4 ) 的协方差阵, 的特征根和标准正交特征向量分别 为: 1 2.920 U 1' (0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U 2' (0.9544, 0.0984,0.2695,0.0824) 3 0.049 U 3' (0.2516,0.7733, 0.5589, 0.1624) 4 0.007 U 4' ( 0.0612,0.2519,0.5513, 0.7930) ,则其第二个主成分的表达式是

多元统计分析期末试题

一、填空题(20分) 1、若),2,1(),,(~)(n N X p 且相互独立,则样本均值向量X 服从的分布 为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ,总体),(~ p N X ,对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ,兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是: x y 10,多元回归的数学模型是: p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 二、计算题(60分) 1、设三维随机向量),(~3 N X ,其中 200031014,问1X 与2X 是否独立?),(21 X X 和3X 是否独立?为什么? 解: 因为1),cov(21 X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵 22211211,),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ,而012 ,所以),(21 X X 和3X 是不相关的,而正态分布不相关与相互

多元统计分析试题(2012)

近几年,中国房地产业得到了长足的发展,但房地产价格的上涨一直饱受争议,甚至有逃离“北、上、广”的言论,这也从侧面反映了房地产价格的区域性特征,下表为2008年中国31个省、市、自治区房地产业的相关统计数据,试根据这些数据进行聚类分析。 表1中指标说明如下: X1:房屋平均销售价格; X2:住宅平均销售价格; X3:别墅、高档公寓平均销售价格; X4:经济适用房平均销售价格; X5:办公楼平均销售价格; X6:商业营业用房平均销售价格 X7:其他平均销售价格; X8:商品房销售面积; X9:住宅销售面积 表1

为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,指标及原始数据见表2,试建立判别函数,并判定另外4个待判样品属于哪类? 表2 X1:0岁组死亡概率X4:55岁组死亡概率 X2:1岁组死亡概率X5:80岁组死亡概率 X3:10岁组死亡概率X6:平均预期寿命 题3 利用主成分分析综合评价全国重点水泥企业的经济效益。原始数据见表3。 表3

题4 反映城镇居民消费支出状况的指标主要有食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信以及教育文化娱乐服务等八项消费支出指标,数据如下表4所示。以2008年为例进行说明。选取反映我国各省、市、自治区的城镇居民人均消费支出8个指标作为原始变量,运用SPSS软件,对全国31个中心城市的人均消费水平水平作因子分析。

题5、在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量。自变量如下:x 1 ——农业增 加值(亿元),x 2——工业增加值(亿元),x 3 ——建筑业增加值(亿元),x 4 ——人口数(万人),x 5 ——社会 消费总额(亿元),x 6 ——受灾面积(万公顷)。据《中国统计年鉴》获得1979—1998共20个年分的统计数据,见表5。由定性分析知,所选自变量都与变量y有较强的相关性,试做出一个较为理想的回归方程。 表5

统计学_第二阶段练习复习过程

统计学_第二阶段练习

江南大学现代远程教育第二阶段练习题 考试科目:《统计学》第6章至第9章(总分100分) 学习中心(教学点)批次:层次: 专业:学号:身份证号: 姓名:得分: 一、单项选择题(共20小题,每小题2分,共计40分) 1.根据概率的统计定义,可用以近似代替某一事件的概率的是 ( A )。 A 大量重复试验中该随机事件出现的次数占试验总次数的比重 B 该随机事件包含的基本事件数占样本空间中基本事件总数的比重 C 大量重复随机试验中该随机事件出现的次数 D 专家估计该随机事件出现的可能性大小 2.下列事件中不属于严格意义上的随机事件的是 ( D )。 A 从一大批合格率为90%的产品中任意抽出的一件产品是不合格品 B 从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品 C 从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品 D 从一大批合格率为100%的产品中任意抽出的一件产品是合格品 3.假设A B为两个互斥事件,则下列关系中,不一定正确的是 ( B )。 A P(A+B)=P(A)+P(B) B P(A)=1-P(B) C P(AB)=0 D P(A|B)=0 4.同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为 ( C )。仅供学习与交流,如有侵权请联系网站删除谢谢2

A 0.125 B 0.25 C 0.375 D 0.5 5.下列由中心极限定理得到的有关结论中,正确的是 ( D )。 A 只有当总体服从正态分布时,样本均值才会趋于正态分布 B 只要样本容量n充分大,随机事件出现的频率就等于其概率 C 无论样本容量n如何,二项分布概率都可以用正态分布近似计算 D 不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布 6.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( B ) A前者小于后者 B前者大于后者 C两者相等 D无法确定哪一个大 7.在其他条件保持不变的情况下,抽样平均误差( B ) A随着抽样数目的增加而加大 B随着抽样数目的增加而减少 C随着抽样数目的减少而减少 D不会随抽样数目的改变而变动 8.允许误差反映了样本指标与总体指标之间的( D ) A抽样误差的平均数 B抽样误差的标准差 C抽样误差的可靠程度 D抽样误差的可能范围 9.根据组(群)间方差的资料计算抽样平均误差的抽样组织方式是( D ) A纯随机抽样 B机械抽样 C类型抽样 D整群抽样 仅供学习与交流,如有侵权请联系网站删除谢谢3

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

多元统计分析模拟试题教学提纲

多元统计分析模拟试 题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐 步判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、 极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 = 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转 化为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

多元统计分析模拟考题及答案

一、判断题 ( 对 )112(,,,)p X X X X '=L 的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5),(~),,,(21∑'=μp p N X X X X Λ,,X S 分别是样本均值和样本离差阵,则, S X n 分别是,μ∑的无偏估计。 ( 对)6),(~),,,(21∑'=μp p N X X X X Λ,X 作为样本均值μ的估计,是 无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等 价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设∑是总体1(,,)m X X X =L 的协方差阵,∑的特征根(1,,)i i m λ=L 与相应的单 位正交化特征向量 12(,,,)i i i im a a a α=L ,则第一主成分的表达式是 11111221m m y a X a X a X =+++L ,方差为 1λ。 3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别 为:' 112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- ' 221.024(0.9544,0.0984,0.2695,0.0824)U λ==- '330.049(0.2516,0.7733,0.5589,0.1624)U λ==--

多元统计分析期末试题及答案.doc

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

多元统计分析期末复习试题

第一章: 多元统计分析研究的内容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X 均值向量: 随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。 随机向量X 与Y 的相关系数矩阵: )',...,,(),,,(2121P p EX EX EX EX μμμ='=Λ)')((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ

2、均值向量协方差矩阵的性质 (1).设X ,Y 为随机向量,A ,B 为常数矩阵 E (AX )=AE (X ); E (AXB )=AE (X )B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的),(~∑μP N X μ∑μp X X X ,,,21Λ),(~∑μP N X ) ,('A A d A N s ∑+μ)()1(,, n X X ΛX )',,,(21p X X X Λ)')(()()(1X X X X i i n i --∑=n 1X μ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

多元统计分析期末复习试题

第一章: 多元统计分析研究的容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X均值向量: 随机向量X与Y的协方差矩阵: 当X=Y时Cov(X,Y)=D(X);当Cov(X,Y)=0 ,称X,Y不相关。 随机向量X与Y的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X,Y为随机向量,A,B 为常数矩阵 E(AX)=AE(X); E(AXB)=AE(X)B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 4、对数变换:对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。 三、样品间相近性的度量 研究样品或变量的亲疏程度的数量指标有两种:距离,它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

多元统计分析模拟考题及答案

、判断题 (对)1X (兀公2丄,X p)的协差阵一定是对称的半正定阵 (对)2标准化随机向量的协差阵与原变量的相关系数阵相同。 (对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 (对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。(错)5X (X-X2,,X p) ~ N p( , ),X,S分别是样本均值和样本离 S 差阵,则X,—分别是,的无偏估计。 n (对)6X (X「X2, ,X p) ~ N p( , ),X作为样本均值的估计,是无偏的、有效的、一致的。 (错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 (对)8因子载荷阵A (a j)中的a ij表示第i个变量在第j个公因子上的相对重要性。 (对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设是总体X (X」,X m)的协方差阵,的特征根i(i 1,L ,m)与相应的单 位正交化特征向量i (盼无丄,a m),则第一主成分的表达式是 y1 Q1X1 812X2 L QmX m 方差为1。 3设是总体X (X1,X2,X3, X4)的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U;(0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U2(0.9544, 0.0984,0.2695,0.0824) 3 0.049 U3(0.2516,0.7733, 0.5589, 0.1624) 0.007U4 ( 0.0612,0.2519,0.5513, 0.7930),则其第二个主成分的表达式是 4

多元统计分析试题(A卷)(答案)

《多元统计分析》试卷 1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__ 距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ==,总体), (~∑μp N X ,对样品进行分类 常用的距离有:明氏距离,马氏距离 2 ()ij d M =)()(1 j i j i x x x x -∑'--,兰氏距离()ij d L = 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型 是: εββββ++++=p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 一、填空题(每空2分,共40分) 二、计算题(每小题10分,共40分)

1、设三维随机向量),(~3∑μN X ,其中??? ?? ??=∑200031014,问1X 与2X 是否独立? ),(21'X X 和3X 是否独立?为什么? 解: 因为1),cov(21=X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵??? ? ??∑∑∑∑=∑22211211 ,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不 相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。 2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样 本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。 解:样品与样品之间的明氏距离为:????????? ? ??=02 5 .36 7 05.14505 .25.30 105 432154 321) 0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法) 得距离阵 ??????? ? ?? =025.3705.1505.30} ,{},{54 32154321) 1(x x x x x x x x x x D 类与类的最短距离是 1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距

多元统计分析试卷A答案

东 北 大 学 秦 皇 岛 分 校 课程名称: 多元统计分析 试卷类型: 答案 考试形式:开 授课专业: 数学与应用数学 考试日期: 2012年12月12日 试卷:共 3 页 一、填空题:(每空2分,共30分) 1、设(1)(2)(,)p N ??=????:X X μX ∑(2)p ≥,(1)(2)??=????μμμ,11122122??=?? ??∑∑∑∑∑,其中(1)X ,(1) μ为1r ?,11∑为r r ?,则(1):X (1)11(,)r N μ∑,(2):X (2)22(,)p r N -μ∑ 2、系统聚类分析的方法很多,其中的五种分别为最短距离法、最长距离法、重心法、类平均法、离差平方和法。 3、若p 维随机向量~(,)p X N μ∑,~(,)p W W n ∑,且X 与W 相互独立,则 1()()~n X W X μμ-'--2(,)T p n , 2 1(,)~n p T p n pn -+(,1)F p n p -+。 4、i X 与前个主成分的全相关系数的平方和21 (,)m k i k Y X ρ=∑称为12,,,m Y Y Y L 对原始变量 i X 的方差贡献率,在因子分析中也称之为共同度。 5、Q 型因子分析研究样品之间的相关关系,R 型因子分析研究变量之间的相关关系。 6、Fisher 判别法的基本思想是投影,并利用方差分析的思想来导出判别函数。 二、判断题(每题2分,共10分) 1、( √ )随机向量12(,,,)p X X X 'L 的协方差阵()D X =∑是对称非负定阵。 2、( × )因子载荷矩阵A 是对称阵。 3、( × )聚类分析中快速聚类法指的就是模糊聚类法。 4、( √ )设(,)p N :X μ∑,(,)p W n :W ∑,且X 与W 相互独立,则 12()()(,)n T p n -':X μW X μ--。 5、( × )主成分分析中,从相关矩阵出发求解的主成分一定会比从协方差矩阵出发求解的主成分更可信。 装 订 线装 订 线 内 不 要 答 题 学 号 姓 名 班 级

多元统计分析期末试题

1 、填空题(20分) 1、 若X Q ~ N p (g ,(a =1,2,…n)且相互独立,则样本均值向量X 服从的分布为X ~ N p (g^|。 2、 变量的类型按尺度划分有 _间隔尺度_、_有序尺度_、名义尺度_。 3、 判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有 —距离判别法_、Fisher 判别法、 Bayes 判别法、逐步判别法。 4、 Q 型聚类是指对_样品-进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、 设样品X i =(X i1,X i2^ X ip )',(i =1,2,…n),总体X~N p (」「),对样品进行分类常用的距离有: 明氏距离d j (q)=(壬|Xy q i j i j 6、 因子分析中因子载荷系数a j 的统计意义是—第i 个变量与第j 个公因子的相关系数。 7、 一元回归的数学模型是:y 曆x 童,多元回归的数学模型是 8、 对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、 典型相关分析是研究两组变量之间 相关关系的一种多元统计方法。 、计算题(60分) '4 1 1、设三维随机向量X~N 3(?2),其中送=1 3 e 0 独立?为什么? 解:因为cov(X 1,X 2^1,所以X 1与X 2不独立。 把协差矩阵写成分块矩阵瓦=f 11 ;12丨,(X 1,X 2/的协差矩阵为瓦 11 因为 —21 - 22 cov((X 1,X 2),X 3)=為12,而' 12 =0,所以(X 1, X 2)和X 3是不相关的,而正态分布不相关与相互独 立是等价的,所以(X 1,X 2)和X 3是独立的。 0,问X 1与X 2是否独立? 2> (X 1,X 2)和X 3是否

多元统计分析试题及答案.doc

xxx 大学期末试卷(A 卷) 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:120 分钟 一、填空题(5×6=30) 22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 (), 123设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111 X σ = 的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.83511 00.4170.8940.02700.8940.44730.8350.4470.1032013 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 二、计算题(5×11=50) 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立?

多元统计分析模拟考试试题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1) 判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。 2) Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3) 主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4) 因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法 5) 聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6) 分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7) 误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为P P=√P?P P 8) 最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9) 主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综 合指标的多元统计方法。 10) 在进行主成分分析时,我们认为所取的m(m

14) 将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共 因子组成的,另一部分是每个变量独自具有的因素,即特殊因子 15) 判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一个以上, 解释变量必须是可测量的 16) 当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计分析方法 17) 多元正态分布是一元正态分布的推广 18) 多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多元分析的 基础 19) 因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各 变量的线性组合。 20) 统计距离包括欧氏距离和马氏距离两类 1) 因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度。 (√)(p147) 2) 主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法。(×)(p24) 3) 判别分析其被解释变量为属性变量,解释变量是度量变量。(√)(p90) 4) Logistic回归对于自变量有要求,度量变量或者非度量变量都不可以进行回归。(×) (p220) 5) 在系统聚类过程中,聚合系数越大,合并的两类差异越小。(×) (P59)

多元统计分析试卷

一.填空题(每空2分,共30分) 1.若--------(看不清)且相互独立,则样本均值向量X 2服从的分布为_______ 2.聚类分析是判别样品所属类型的一种统计方法,常用的聚类分析方法有距离判别法、Fisher 判别法、Bavers 判别法、逐步判别法。 3.主成份同因子分析之间的差异在于方差,_____。 4.设样本-------,总体-----,对样本进行分类常用的工具有:马氏距离--=_______,相关系数_______,它们之间的关系如何_______。 5.因子分析中的因子载荷系数共性方差的统计意义是_______。 6.典型相关分析是研究两组变量之间_______的一种多元统计方法。 7.刻画两个变量之间相关程度的通过统计指标是_______。 8.数据标准化对因子分析的结构分解有什么影响_______。 二.计算题(每小题12分,共60分) 1.设三维随机变量-----,其中???? ? ??=∑210140005,问1X 与2X 是否独立?---和1X 是否独立?为 什么? 2.设抽了五个样品,每个样品只测了一个指标,它们分别是1 1 2 3 5 4 5,若样本间采用欧式,试用平均距离法对其进行分类,要求给出聚类图。 3.设变量321,,X X X 的相关阵为???? ? ??=00.135.045.035.000.163.045.063.000.1R ,R 的特征值和单位化特征向量分 别为T T T l l l 18.0,64.0,75.0,37.03, 84.0,49.0,22.0,68.0,51.0,59.0,63.0,96.122211--==--====λλλ (1)取公共因子个数为2,求因子载荷矩阵A 。 (2)计算变量共同度—及公共因子2F 的方差贡献,并说明其统计意义。 4.设三元总体X 的协方差阵为???? ??????=∑841,从∑出发,求总体主成份321,,F F F ,求前两个主成份的累计贡献率。 5.考虑两个数据集 1π ??????????=745 27 51X ,2π ???? ??????=84105972X 32=π 计算线性判别函数。 三.简单题(10分) 简述多元统计的分类思想,结合你本专业谈谈能用到哪些地方。

相关文档
最新文档