多元统计学多元统计分析试题(A卷)(答案)

多元统计学多元统计分析试题(A卷)(答案)
多元统计学多元统计分析试题(A卷)(答案)

《多元统计分析》试卷

一:1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布

2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。

3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。

4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。

5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距

离,马氏距离2

()ij

d M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L

6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。

7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:

εββββ++++=p p x x x y 22110。

8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。

9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

二:1、设三维随机向量),(~3∑μN X ,其中???

?

? ??=∑200031014,问1X 与2X 是否独立?),(21'X X 和3

X 是否独立?为什么?

解: 因为1),cov(21=X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵???

?

??∑∑∑∑=∑22211211

,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相互独

立是等价的,所以),(21'X X 和3X 是独立的。

2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样本间采用明氏

距离,试用最长距离法对其进行分类,要求给出聚类图。

解:样品与样品之间的明氏距离为:?????????

? ??=02

5

.36

7

05.14505.25.3010

5

432154

321)

0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵

???????

?

?

?

=025.3705.1505.30}

,{},{54

32154321)

1(x x x x x x x x x x D 类与类的最短距离是1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵

???????

?

?

?

=05.3705),{0}

,{},{},{5

432154321)

2(x x x x x x x x x x D 类与类的最短距离是3.5,故把543},{X X X 与合并为一类,计算类与类之间距离(最长距离法)得

距离阵????

? ??

=07},,{0},{},,{},{5432154321)

3(x x x x x x x x x x D 分类与聚类图(略)(请你们自己做)

3、设变量123,,X X X 的相关阵为 1.000.630.450.63 1.000.35,0.450.35 1.00R R ??

?

= ? ???

的特征值和单位化特征向量分别为

()111.96,0.63,0.59,0.51;T l λ==20.68,λ=()20.22,0.49,0.84;T

l =--

30.37,λ=()30.75,0.64,0.18T

l =--

(1) 取公共因子个数为2,求因子载荷阵A 。

(2) 计算变量共同度2i h 及公共因子j F 的方差贡献,并说明其统计意义。

解:因子载荷阵?????

?

?

?--=68.084.096.151.068

.049.096.159.068

.022.096.163.0A

变量共同度:2221)68.022.0()96.163.0(-+=h =

2222)68.049.0()96.159.0(-+=h =

2223)68.084.0()96.151.0(+=h =

公共因子j F 的方差贡献:

2221)96.151.0()96.159.0()96.163.0(++=S 2222)68.084.0()68.049.0()68.022.0(+-+-=S

统计意义(省略)(学生自己做)

4、设三元总体X 的协方差阵为???

?

?

??=∑600030001,从∑出发,求总体主成分123,,F F F ,并求前两个主成

分的累积贡献率。

解:

特征方程0||=∑-E λ,得特征根:1,3,6321===λλλ

61=λ的特征方程:0000030005321=????? ??????? ??x x x ,得特征向量???

?? ??=1001u

31=λ的特征方程:0300000002321=????? ??????? ??-x x x ,得特征向量???

?? ??=0102u

11=λ的特征方程:0500020000321=????? ??????? ??--x x x ,得特征向量???

?

? ??=0013u

31x F = 22x F = 13x F =

前两个主成分的累积贡献率

9.010

9

= 三、简述题:简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。 (省略)(学生自己做)

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

多元统计分析与R语言建模考试试卷

.. .. 多元统计分析及R 语言建模考试试卷 一、简答题(共5小题,每小题6分,共30分) 1. 常用的多元统计分析方法有哪些? (1)多元正态分布检验 (2)多元方差-协方差分析 (3)聚类分析 (4)判别分析 (5)主成分分析 ______________ 课程类别 必修[ ] 选修[ ] 考试方式 开卷[ ] 闭卷[ ]

(7)对应分析 (8)典型相关性分析 ( 9)定性数据建模分析 (10)路径分析(又称多重回归、联立方程) (11)结构方程模型 (12)联合分析 (13)多变量图表示法 (14)多维标度法 2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。 简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。 复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。复相关系数为R0.12…n的取值围为0≤R0.12…n≤1。复相关系数值愈大,变量间的关系愈密切。 典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

多元统计分析模拟考题及答案.docx

一、判断题 ( 对 ) 1 X ( X 1 , X 2 ,L , X p ) 的协差阵一定是对称的半正定阵 ( 对 ( ) 2 标准化随机向量的协差阵与原变量的相关系数阵相同。 对) 3 典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4 多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据 分析方法。 ( 错)5 X (X 1 , X 2 , , X p ) ~ N p ( , ) , X , S 分别是样本均值和样本离 差阵,则 X , S 分别是 , 的无偏估计。 n ( 对) 6 X ( X 1 , X 2 , , X p ) ~ N p ( , ) , X 作为样本均值 的估计,是 无偏的、有效的、一致的。 ( 错) 7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对) 8 因子载荷阵 A ( ij ) ij 表示第 i 个变量在第 j 个公因子上 a 中的 a 的相对重要性。 ( 对 )9 判别分析中, 若两个总体的协差阵相等, 则 Fisher 判别与距离判别等价。 (对) 10 距离判别法要求两总体分布的协差阵相等, Fisher 判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、 样本相关系数矩阵. 2、 设 是总体 的协方差阵, 的特征根 ( 1, , ) 与相应的单 X ( X 1,L , X m ) i i L m 位 正 交 化 特 征 向 量 i ( a i1, a i 2 ,L ,a im ) , 则 第 一 主 成 分 的 表 达 式 是 y 1 a 11 X 1 a 12 X 2 L a 1m X m ,方差为 1 。 3 设 是总体 X ( X 1, X 2 , X 3, X 4 ) 的协方差阵, 的特征根和标准正交特征向量分别 为: 1 2.920 U 1' (0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U 2' (0.9544, 0.0984,0.2695,0.0824) 3 0.049 U 3' (0.2516,0.7733, 0.5589, 0.1624) 4 0.007 U 4' ( 0.0612,0.2519,0.5513, 0.7930) ,则其第二个主成分的表达式是

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

多元统计分析试题及答案

华南农业大学期末试卷(A 卷) 2006学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:120 分钟 学号 姓名 年级专业 题号 一 二 三 四 五 六 七 八 总分 得分 评阅人 一、填空题(5×6=30) 22121212121~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ???+-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1, ,16(,),(,) 15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 (), 123设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111 X σ = 的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.83511 00.4170.8940.02700.8940.44730.8350.4470.1032013 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

多元统计分析试题(A卷)

广西科技大学 2013 — 2014 学年第 2 学期课程考核试题 考核课程 多元统计分析 ( A 卷)考核班级 统计101、102班 学生数 114 印数 120 考核方式 闭卷 考核时间 120 分钟 一、填空题(每空3分,共15分) 1、设 2~(,) X N μ∑,其中 12(,)X x x ' =, 12(,)μμμ' =, 2 11ρσρ ?? ∑= ??? ,则 1212ov(,)C x x x x +-= 。 2、设A 和B 为常数矩阵,ov(,)C x y =∑,则ov(,)C Ax By = 。 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。根据分类对象的不同,聚类分析分为 聚类和 聚类。 4、因子分析中,因子载荷矩阵A 中元素ij a 的统计意义 是 。 5、为研究两组变量12,,,p x x x L 和 12,,,q y y y L 之间的相关关系,一般采用 方法。 二、简述题(每小题10分,共20分) 1、简述系统聚类法的基本思想。 2、简述主成分分析和因子分析的基本思想,并比较二者的异同点。 三、(10分)设随机向量X 的协方差矩阵为 1643()442329V X -?? ? =-- ? ?-?? 求其相关系数矩阵R 。 四、(15分)设3121~(,),110X N A μ-?? ∑= ?-?? ,其中 ()1642111,441214μ-?? ? =-∑=-- ? ?-?? , 求Y AX =的分布.

五、(15分)已知两个总体1π,2π的概率密度分别为1()f x 和2()f x ,且总体的先验概率分布为120.6,0.4p p ==,误判损失为(1|2)12c =个单位, (2|1)4c =个单位。 (1) 建立最小平均误判代价()判别规则; (2) 设有一新样品0x 满足1020()0.36,()0.24f x f x ==,判定0x 的归属问题。 六、(10分)设三元总体123(,,)X x x x '= 的协方差矩阵为 4121932325?? ? ∑=- ? ?-?? 试求总体的主成分以及各主成分的贡献率。 七、(15分)某学校体检中获得的30位学生身体的四项指标,数据见下表。 对数据做主成分分析,利用软件运行,得到如下输出结果:

多元统计分析模拟试题教学提纲

多元统计分析模拟试 题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐 步判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、 极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 = 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转 化为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

统计学试题及答案分析-共20页

统计学考试题一 一、 单项选择题(请将正确答案的番号写在括号内,每小题1分,共20分) 1. 统计学名称来源于 A .政治算术学派 B .国势学派 C .数理统计学派 D .社会经济统计学派 2. 统计学是一门关于研究客观事物数量方面和数量关系的 A .社会科学 B .自然科学 C .方法论科学 D .实质性科学 3. 几位学生的统计学考试成绩分别为55,60,70,80,85,60,这几个数字是 A .指标 B .变量 C .标志 D .变量值 4. 重点调查中的重点单位就是 A .有关国际名声的单位 B .在总体中其单位数目占绝大比重的单位 C .特殊的单位 D .其单位数虽少,但被调查的标志值在总体标志值中占绝大比重的单位 5. 调查某大学学生学习情况,则总体是 A .该大学所有学生 B .该大学每一名学生的学习成绩C .该大学每一名学生 D .以上都不正确 6. 某公司员工的工资分为:(1)800元以下;(2)800~1500元;(3)1500~2019元;(4) 2019元以上,则第四组的组中值近似为 A .2019元 B .1750元 C . 2250元 D .2500元 7. 分配数列是 A .按数量标志分组的数列 B .按品质标志分组的数列 C .按指标分组的数列 D . 按数量标志或品质标志分组的数列 8. 统计表的形式构成由总标题、横行标题、纵栏标题 A .数据资料 B .主词 C .宾此 D .以上都不正确 9. 反映同类现象在不同时期发展变化一般水平的指标是 A .算术平均数 B .序时平均数 C .众数 D . 调和平均数 10. 某企业5月份计划要求成本降低3%,实际降低5%,其成本计划完成程度为 A .97.94% B .166.67% C .101.94% D .1.94% 11. 若两总体的计量单位不同,在比较两总体的离散程度时,应采用 A .全距 B .平均差 C .标准差 D .标准差系数 12. 下列指标中,属于强度相对数的是 A .某企业的工人劳动生产率 B .人均国民收入 C .某种商品的平均价格 D .某公司的平均工资 13. 拉氏指数所用的同度量因素是固定在 A .基期 B .报告期 C .固定时期 D .任意时期 14. 某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为 A .113.3% B .13% C .106.8% D .10% 15. 我国消费价格指数的编制方法 A .∑∑= 0q p q p K K p p B . ∑∑= 1 1111 q p K q p K p p C .∑∑= 1q p q p K p D .∑∑= 1 011q p q p K p

多元统计分析模拟考题及答案

一、判断题 ( 对 )112(,,,)p X X X X '=L 的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5),(~),,,(21∑'=μp p N X X X X Λ,,X S 分别是样本均值和样本离差阵,则, S X n 分别是,μ∑的无偏估计。 ( 对)6),(~),,,(21∑'=μp p N X X X X Λ,X 作为样本均值μ的估计,是 无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等 价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设∑是总体1(,,)m X X X =L 的协方差阵,∑的特征根(1,,)i i m λ=L 与相应的单 位正交化特征向量 12(,,,)i i i im a a a α=L ,则第一主成分的表达式是 11111221m m y a X a X a X =+++L ,方差为 1λ。 3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别 为:' 112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- ' 221.024(0.9544,0.0984,0.2695,0.0824)U λ==- '330.049(0.2516,0.7733,0.5589,0.1624)U λ==--

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

秋季多元统计分析考试答案

《多元统计分析》课程试卷答案 A 卷 2009年秋季学期 开课学院:理 考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟 班级 姓名 学号 散卷作废。 一、(15分)设()∑????? ??=,~3321μN x x x X ,其中????? ??-=132μ,??? ? ? ??=∑221231111, 1.求32123x x x +-的分布; 2. 求二维向量???? ??=21a a a ,使3x 与??? ? ??'-213x x a x 相互独立。 解:1.32123x x x +-()CX x x x ???? ? ? ??-=321123,则()C C C N CX '∑,~μ。(2分) 其中:μC ()13132123=????? ??--=,()9123221231111123=??? ? ? ??-????? ??-='∑C C 。(4分) 所以32123x x x +-()9,13~N (1分) 2. ????? ?????? ??'-213 3x x a x x =AX x x x a a ????? ? ?????? ??--3212 1110 ,则()A A A N AX '∑,~2μ。(1分) 其中: 订 线 装

μA ???? ??++-=???? ? ??-???? ??--=132113********* a a a a ,(1分) ??? ? ??+--+++--+--='???? ??--???? ? ?????? ??--='∑242232222211002212311111100 2121222121212121 a a a a a a a a a a a a a a A A (2分) 要使3x 与???? ??'-213x x a x 相互独立,必须02221=+--a a ,即2221=+a a 。 因为2221=+a a 时24223212122 21 +--++a a a a a a 0>。所以使3x 与??? ? ??'-213x x a x 相互独立,只要 ???? ??=21a a a 中的21,a a 满足2221=+a a 。 (4分) 二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为 ??? ? ? ??=3861096X ,给定显著性水平05.0=α, 1. 求均值向量μ和协方差矩阵∑的无偏估计 2. 试检验,38:H 0???? ??=μ .38:H 1??? ? ??≠μ (已知F 分布的上α分位数为19)2,2(F ,5.199)1,2(F ,51.18)2,1(F 0.050.050.05===) 解:1、??? ? ??==∑=68X n 1X n 1i i (3分) ???? ??--='--=∑=9334)X X ()X X (1-n 1S i n 1i i (3分) 2、,38:H 0???? ??=μ .38:H 1??? ? ??≠μ…(1分)

多元统计分析期末试题及答案.doc

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

统计分析考试试题及答案解析

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 统计分析考试试题及答案解析 一、单选题(本大题17小题.每题1.0分,共17.0分。请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。) 第1题 某国国内生产总值2009年为2008年的109.1%,这是( )。 A 比例相对数 B 动态相对数 C 比较相对数 D 计划完成相对数 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 动态相对数是指用指标的当前状态数值除上期水平、历史最好水平和上年同期水平的结果。题中,指标是当前状态数值除上期水平数值所得的结果,属于动态相对数。 第2题 移动平均修匀方法较多地应用于( )。 A 含有季节影响的时间数列 B 无季节影响的时间数列 C 项数较少的时间数列 D 预测未来 【正确答案】:A 【本题分数】:1.0分 【答案解析】 [解析] 移动平均修匀较多地被应用于含有季节影响的时间数列,如果让移动平均的项数等于季节周期的长度,则所得到的移动平均数列中消除了季节影响。 第3题

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 指数平滑平均数的计算公式是( )。 A S t =αx 0+(1-α)S t-1 B S t =αx t+1+(1-α)S t-1 C S t )=αx t-1+(1-α)S t-1 D S t =αx t +(1-α)S t-1 【正确答案】:D 【本题分数】:1.0分 第4题 某产品单位成本计划今年比去年降低10%,实际降低15%,则计划完成相对数为 ( )。 A 150% B 94.4% C 104.5% D 66.7% 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 计划完成相对数是指用指标的当前状态数值除计划水平的结果。计划完成相对数以降低率的形式时,计划完成相对数=(1-实际降低率)/(1-计划降低率)×100%=(1-15%)/(1-10%)×100%=94.4%。 第5题 评价某一指标的当前状态的基本方法是找出一个( )作为“参照物”,将指标的当前状态与之进行比较。 A 标准水平 B 发展水平 C 一般水平 D 相对水平

多元统计分析期末复习试题

第一章: 多元统计分析研究的内容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X 均值向量: 随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。 随机向量X 与Y 的相关系数矩阵: )',...,,(),,,(2121P p EX EX EX EX μμμ='=Λ)')((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ

2、均值向量协方差矩阵的性质 (1).设X ,Y 为随机向量,A ,B 为常数矩阵 E (AX )=AE (X ); E (AXB )=AE (X )B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的),(~∑μP N X μ∑μp X X X ,,,21Λ),(~∑μP N X ) ,('A A d A N s ∑+μ)()1(,, n X X ΛX )',,,(21p X X X Λ)')(()()(1X X X X i i n i --∑=n 1X μ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

多元统计分析模拟试题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A 卷 判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步 判另0法 Q 型 聚类分析是对样品的分类,R 型聚类分析是对变量」i 勺分类。 主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极 大似然法 聚类分析包括系统聚类法、模糊聚类分析、K ?均值聚类分析 分组 数据的Logistic 回归存在 异方差性,需要采用加权最小二乘估计 误差项的路径系数可山多元回归的决定系数算岀,他们之间的关系为 主成分分析是利用軽的思想,在损失很少的信息前提下,把多个指标转化 为儿个综合指标的多元统计方法。 在进行主成分分析时,我们认为所取的m (m

多元统计分析期末考试考点整理

二名词解释 1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量 三、计算题 解:

答: 答:

题型三解答题 1、简述多元统计分析中协差阵检验的步骤 答: 第一,提出待检验的假设和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 2、简述一下聚类分析的思想 答:聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕. 3、多元统计分析的内容和方法 答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等

相关文档
最新文档