数理统计作业四

合集下载

【精品】概率与数理统计作业

【精品】概率与数理统计作业

概率论与数理统计作业1(§1.1~§1.2)一、填空题1.设A、B、C表示三个随机事件,试将下列事件用A、B、C表示出来:(1)仅A发生;(2)A、B、C都不发生;(3)A、B、C不都发生;(4)A不发生,且B、C中至少有一个事件发生;(5)A、B、C中至少有两个事件发生;(6)A、B、C中最多有一个事件发生。

2.对飞机进行两次射击,每次射一弹,设事件A={第一次击中飞机},B={第二次击中飞机},试用A、B表示下列事件:(1)恰有一弹击中飞机;(2)至少有一弹击中飞机;(3)两弹都击中飞机。

3.设A、B、C是任意的三个随机事件,写出以下概率的计算公式:(1)=BP(AB)AP;)(P;(2)=(A=-)(3)=BP。

A⋃⋃)(C4.某市有50%住户订日报,65%住户订晚报,85%住户至少订这两种报纸中的一种,则同时订这两种报纸的住户所占的百分比是。

5.设A、B、C是三个随机事件,且25PB=CP,=AP).0(=)()((=)=BCP,则:(ABPP,0)125).0AC(=(1)A、B、C中都发生的概率为;(2)A、B、C中至少有一个发生的概率为;(3)A、B、C都不发生的概率为。

6.设()()P AB P AB =,且()P A p =,则()P B = .二、单项选择题1.以A 表示事件“甲种产品畅销,乙种产品滞销”,则其对立事件A 为[]。

(A )“甲种产品滞销,乙种产品畅销”;(B )“甲、乙两种产品均畅销”;(C )“甲种产品滞销”;(D )“甲种产品滞销或乙种产品畅销”。

2.对于事件A 、B 有A B ⊂,则下述结论正确的是[]。

(A )A 与B 必同时发生;(B )A 发生,B 必发生;(C )B 发生,A 必发生;(D )B 不发生,A 必不发生。

3.对于任意两事件A 、B ,与B B A =⋃不等价的是[]。

(A )B A ⊂;(B )A B ⊂;(C )φ=B A ;(D )φ=B A 。

概率论与数理统计第四章

概率论与数理统计第四章

E (b) b E (aX ) aE ( X )
2. E(X+Y) = E(X)+E(Y);
推广 : E [ X i ] E ( X i )
i 1 i 1 n n
E ( ai X i ) ai E ( X i )
i 1 i 1
n
n
3. 设X、Y独立,则 E(XY)=E(X)E(Y);
例2.(X,Y)服从二维正态分布,其概率密度为 1 f ( x, y ) 2 21 2 1
1 y 1 2 x 1 y 2 y 2 2 exp{ [( ) 2 ( )( )( ) ]} 2 1 1 2 2 (1 )
证明: XY
Cov(kX, kY)=k2Cov(X,Y)
■相关系数
定义 设D(X)>0, D(Y)>0, 称
XY
Cov( X , Y ) X EX Y EY E[ ] D( X ) D(Y ) DX DY
为随机变量X和Y的相关系数(标准协方差)
X Y E( X Y ) XY
练习
1.设离散型随机变量(X,Y)的分布列为 Y 0 1 2 X 则E(XY)=( ) 0 1/3 1/6 1/9 1 0 1/6 1/9 2 0 0 1/9
2.设随机变量X的概率密度为
e x f ( x) 0 x0 其它
Y=e-2X,则EY=( )
■数学期望的性质
1. 设a,b是常数,则E(aX+b)=aE(X)+b;
对正态分布而言,X、Y相互独立 与互不相关是等价的。
例4.设随机变量(X,Y)~N(1, 1, 9, 16, -0.5) 令
第四章 随机变量的数字特征

概率论与数理统计配套习题

概率论与数理统计配套习题

Z
=
1, 0,
如果 X + Y 为零或偶数; 如果 X + Y 为奇数.
第三章 连续型随机变量及其分布 第五次作业
3.1 设随机变量 X 服从二项分布 B(2,0.4) .试求 X 的分布函数,并作出它的图像.
8
学号
专业
姓名
作业号
3.4
cx3, 已知随机变量 X 的密度函数为 f (x) =
0 < x < 1; 确定常数 c 的值,并求出 P(−1 < X < 0.5) 与分布函数.

数为 λ p 的泊松分布.[提示: P(Y= k=) ∑ P( X= n)P(Y= k X= n) .] n=k
7
学号
专业
姓名
作业号
2.26 已知 X 与Y 的联合概率函数如下.(1)分别求U = max{X ,Y},V = min{X ,Y}的概率函数;(2)试
求U 与V 的联合概率函数.
X
Y -2 -1 0 1 4
1.27 已知甲袋中装有 a 只红球, b 只白球;乙袋中装有 c 只红球, d 只白球.试求下列事件的概率:(1)合并 两只口袋,从中随机地取一只球,该球是红球;(2)随机地取一只袋,再从该袋中随机地取一只球,该球是红 球;(3)从甲袋中随机地取出一只球放人乙袋,再从乙袋中随机地取出一只球,该球是红球.
1.15 某商店出售晶体管,每盒装 100 只,且已知每盒混有 4 只不合格品.商店采用“缺一赔十”的销售方 式:顾客买一盒晶体管,如果随机地取 1 只发现是不合格品,商店要立刻把 10 只合格品的晶体管放在盒子 中,不合格的那只晶体管不再放回.顾客在一个盒子中随机地先后取 3 只进行测试,试求他发现全是不合格 品的概率.

概率论与数理统计(专升本)阶段性作业4

概率论与数理统计(专升本)阶段性作业4

概率论与数理统计(专升本)阶段性作业4本页仅作为文档页封面,使用时可以删除This document is for reference only-rar21year.March概率论与数理统计(专升本)阶段性作业4单选题1. 设一批零件的长度服从, 其中均未知,现从中随机抽取16个零件,测得样本均值,样本标准差,, 则的置信度为0.90的置信区间是 _______(4分)(A) :(B) :(C) :(D) :您的回答:C正确2. 设总体~,其中已知,是的一个样本,则不是统计量的是 _______(4分)(A) :(B) :(C) :(D) :您的回答:C正确3. 设…,是总体的一个样本,则有 _______(4分)(A) :(B) :(C) :(D) : 以上三种都不对您的回答:D正确4. 设随机变量服从正态分布,对给定的,数满足,若,则等于 _______(4分)(A) :(B) :(C) :(D) :您的回答:C正确5. 设…,是总体的样本,并且,令,则_______(4分)(A) :(B) :(C) :(D) :您的回答:B正确6. 设总体~,…, 是的一个样本,则 _______(4分)(A) : ~(B) :~(C) : ~(D) :~您的回答:B正确7. 设是总体的一个样本,则的无偏估计是 _______(4分)(A) :(B) :(C) :(D) :您的回答:C正确8. 设总体~,是的一个样本,则 _______(4分)(A) :(B) :(C) :(D) :您的回答:C正确9. 为总体的未知参数,的估计量是,则 _______(4分)(A) : 是一个数,近似等于(B) : 是一个随机变量(C) :(D) :您的回答:B正确10. 样本取自标准正态分布总体, 分别为样本均值及样本标准差, 则 _______(4分)(A) :(B) :(C) :(D) :您的回答:D正确11. 设随机变量和都服从标准正态分布,则 _______(4分)(A) : 服从正态分布(B) : 服从分布(C) : 和都服从分布(D) : 服从分布您的回答:C正确12. 若总体,其中已知,当置信度保持不变时,如果样本容量增大,则的置信区间 _______(4分)(A) : 长度变大(B) : 长度变小(C) : 长度不变(D) : 长度不一定不变您的回答:B正确13. 一个容量为的样本(或称子样)是一个 _______(4分)(A) : 随机变量(B) : 维向量(C) : 维随机向量(D) : 答案B或C您的回答:D正确填空题14. 在数理统计中,简单随机样本必须满足两条基本原则,即随机性与___(1)___ .(4分)(1).参考答案: 独立性解题思路:简单随机样本的基本定义.15. 在参数估计中,区间估计与点估计的最大区别在于不仅给出了一个包含参数的区间而且还给出了参数落在该区间内的___(2)___ .(4分)(1).参考答案: 概率解题思路:从两者的定义出发考虑.16. 评判一个点估计量优劣的标准通常用一致性、有效性与什么性来进行___(3)___ .(4分) (1).参考答案: 无偏性解题思路:评判标准的三条定义.17. 重复独立试验所对应的抽样方法称为___(4)___ .(4分)(1).参考答案: 简单随机抽样18. 在数理统计中,我们把研究的对象全体称之为___(5)___ .(4分)(1).参考答案: 总体解题思路:数理统计的基本概念.19. 设为总体的一个样本,为一个连续函数,如果中___(6)___ ,则称为一个统计量.(4分)(1).参考答案: 不包含任何未知参数20. 极大似然估计法是在___(7)___ 已知情况下的一种点估计方法.(4分)(1).参考答案: 总体分布形式21. 在数理统计中,参数估计通常用点估计法和什么估计法___(8)___ (4分)(1).参考答案: 区间估计解题思路:参数估计的基本方法内容22.在区间估计中,样本容量、置信区间的宽度和置信水平之间有着密切的联系.当样本容量确定时,其置信区间的宽度会随着置信水平的增加而___(9)___ .(4分)(1).参考答案: 增加解题思路:置信水平的增加,说明包含参数的概率增加,可信度加大了,则必然导致置信区间增加23. 在参数估计中,极大似然估计的原理是,如果在随机试验中事件A发生了,则参数在各个可能的取值中,应选择使A发生的概率___(10)___ 的那个值.(4分)(1).参考答案: 最大解题思路:由极大似然估计的定义中寻找答案.判断题24. 样本与样本观察值是两个不同的概念。

概率统计与数理分析 习题

概率统计与数理分析 习题
4、选择题
(1)设 为三个事件,则“ 中至少有一个不发生”这一事件可表示为( )
A B
C D
(2)设三个元件的寿命分别为 ,并联成一个系统,则只要有一个元件正常工作则系统能正常工作,事件“系统的寿命超过 ”可表示为( )
(A) ; (B) ;
(C)事件 与事件 相互独立; (D)事件 与事件B互逆。
(2)设 , , ,则 。
(A) 事件 与 互不相容; (B)事件 与 互逆;
(C) 事件 与 不相互独立; (D)事件 与 相互独立。
(3)一种零件的加工由两道工序组成,第一道工序的废品率为p,第二道工序的废品率为q,则该零件加工的成品率为( )
4、 已知甲乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品,从甲箱任取3件放入乙箱,然后再从乙箱中任取一件产品,求该产品为次品的概率。
5、 一箱产品,A,B两厂生产分别个占60%,40%,其次品率分别为1%,2%。现在从中任取一件为次品,问此时该产品是哪个厂生产的可能性最大?
3. 设随机变量 与 相互独立,试完成下表:
Y
1/8
1/8
1/6 1
4.设 和 是两个相互独立的随机变量, 在(0,1)内服从均匀分布, 的概率密度为 .
(1) 求 与 的联合概率密度;
(A) (B) (C) (D)
2、已知 , , 。
(1)若事件 与 互不相容,求 ;
(2)若事件 与 相互独立,求 ;
3、对同一目标进行三次独立射击,第一次、第二次、第三次射击的命中率分别为0.4,0.5,0.7。求在这三次射击中,恰好有一次击中目标的概率。
求 的概率密度。

概率论与数理统计作业与解答

概率论与数理统计作业与解答

概率论与数理统计作业及解答第一次作业 ★ 1.甲.乙.丙三门炮各向同一目标发射一枚炮弹•设事件ABC 分别表示甲.乙.丙 击中目标.则三门炮最多有一门炮击中目标如何表示• 事件E 丸事件A, B,C 最多有一个发生},则E 的表示为E =ABC ABC ABC ABC;或工 ABU AC U B C;或工 ABU ACU BC;或工 ABACBC ;或工 ABC_(AB C ABC A BC ).(和 A B 即并AU B,当代B 互斥即AB 二'时.AU B 常记为AB)2. 设M 件产品中含m 件次品.计算从中任取两件至少有一件次品的概率★ 3.从8双不同尺码鞋子中随机取6只.计算以下事件的概率A 二{8只鞋子均不成双}, B={恰有2只鞋子成双}, C 珂恰有4只鞋子成双}.C 6 (C 2 )6 32C 8C 4(C 2)4 800.2238, P(B) 8 皆 0.5594,P(A) 8/143★ 4.设某批产品共50件.其中有5件次品•现从中任取3件•求 (1) 其中无次品的概率-(2)其中恰有一件次品的概率‘ /八 C 5 1419 C :C 5 99⑴冷0.724.⑵虫产0.2526. C 50 1960C 503925. 从1〜9九个数字中•任取3个排成一个三位数•求 (1) 所得三位数为偶数的概率-(2)所得三位数为奇数的概率•4(1) P {三位数为偶数} = P {尾数为偶数}=-,9⑵P {三位数为奇数} = P {尾数为奇数} = 5,9或P {三位数为奇数} =1 -P {三位数为偶数} =1 -彳=5.9 96. 某办公室10名员工编号从1到10任选3人记录其号码 求(1)最小号码为5的概率 ⑵ 最大号码为5的概率 记事件A ={最小号码为5}, B={最大号码为5}.1 12 C m C M m C mm(2M - m -1)M (M -1)6 —C 16143P(C)二 C 8CJC 2)300.2098.143C 16C 2 iC 2⑴ P(A)=# 詁;(2) P(B )X =C 10 12C 107. 袋中有红、黄、白色球各一个 每次从袋中任取一球.记下颜色后放回 共取球三次 求下列事件的概率:A={全红} B ={颜色全同} C ={颜色全不同} D ={颜色不全同} E ={无 黄色球} F ={无红色且无黄色球} G ={全红或全黄}.1 11A 3!2 8P (A)=3^2?P (B )=3P (A )=9, P(C^#=?=9, P(DH ^P(BH?28 1 1 2P(E)亏方P(F)亏审 P(G r 2P(A)盲☆某班n 个男生m 个女生(m^n 1)随机排成一列•计算任意两女生均不相邻的概率☆ •在[0 ■ 1]线段上任取两点将线段截成三段•计算三段可组成三角形的概率14第二次作业1.设 A B 为随机事件 P(A)=0.92 ■ P(B)=0.93 P(B|Z)=0.85 求 ⑴ P(A|B) (2) P (AU B) ■ (1) 0.85 =P(B| A) =P(A B )P (AB ),P (A B )=0.85 0.08=0.068,P(A) 1-0.92P(AB)二 P(A) -P(AB)二 P(A) - P(B) P(AB) = 0.92 -0.93 0.068 = 0.058,P(A| B): = P(AB) = 0.。

概率论与数理统计作业

概率论与数理统计作业

概率论与数理统计作业第一章随机事件与概率1. 将一枚均匀的硬币抛两次,事件C B A ,,分别表示“第一次出现正面”,“两次出现同一面”,“至少有一次出现正面”。

试写出样本空间及事件C B A ,,中的样本点。

解:{}反正正、正反、反正、反=Ω{}正正、正反=A ,{}正正=B ,{}正正、正反、反正=C2.设31)(=A P ,21)(=B P ,试就以下三种情况分别求)(A B P :(1)AB =∅,(2)B A ⊂,(3)81)(=AB P解:(1)5.0)()()()()(==-=-=B P AB P B P AB B P A B P(2)6/13/15.0)()()()()()(=-=-=-=-=A P B P AB P B P AB B P A B P (3)375.0125.05.0)()()()(=-=-=-=AB P B P AB B P A B P3.某人忘记了电话号码的最后一个数字,因而随机的拨号,求他拨号不超过三次而接通所需的电话的概率是多少?如果已知最后一个数字是奇数,那么此概率是多少?解: 记H 表拨号不超过三次而能接通。

Ai 表第i 次拨号能接通。

注意:第一次拨号不通,第二拨号就不再拨这个号码。

103819810991109101)|()|()()|()()()(2131211211321211=⨯⨯+⨯+=++=∴++=A A A P A A P A P A A P A P A P H P A A A A A A H 三种情况互斥Θ如果已知最后一个数字是奇数(记为事件B )问题变为在B 已发生的条件下,求H 再发生的概率。

)|||)|(321211B A A A B A A B PA B H P ++=)|()|()|()|()|()|(2131211211A A B A P A B A P B A P A B A P B A P B A P ++= 53314354415451=⨯⨯+⨯+=4.进行一系列独立试验,每次试验成功的概率均为,试求以下事件的概率: (1)直到第r 次才成功;解:由于1122===⎰⎰+∞+∞∞-c dx x c dx x c ,故1=c 3.一办公室内有5台计算机,调查表明在任一时刻每台计算机被使用的概率为0.6,计算机是否被使用相互独立,问在同一时刻(1) 恰有2台计算机被使用的概率是多少? (2) 至少有3台计算机被使用的概率是多少? (3) 至多有3台计算机被使用的概率是多少? (4) 至少有1台计算机被使用的概率是多少?解: (1)2304.04.06.0}2{3225===C X P(2)66304.06.04.06.01}5{}4{1}3{5445=--==-=-=≥C X P X P X P(3)233532254154.06.04.06.04.06.0}3{}2{}1{}3{C C C X P X P X P X P ++⋅==+=+==≤ =0.0768+0.2304+0.1728=0.48(4)98976.04.01}0{1}1{5=-==-=≥X P X P4.设随机变量K 在区间 (0, 5) 上服从均匀分布, 求方程 42x + 4Kx + K + 2 = 0 有实根的概率。

概率论与数理统计作业(山东建筑大学作业纸)

概率论与数理统计作业(山东建筑大学作业纸)

概率论与数理统计作业(山东建筑大学作业纸)概率论与数理统计作业(山东建筑大学作业纸)概率论与数理统计作业4(§2.1~§2.3)一、填空题b(其中k 1,2,...)可以作为离散型随机变量的概率分布.k(k 1)12. 同时掷3枚质地均匀的硬币,则至多有1枚硬币正面向上的概率为.2-23. X~P(2),则P(X 2) 0.594 1-3e1. 常数b=时,pk二、选择题设随机变量X是离散型的,则可以成为X的分布律0 x2x3x4x5 1 x1(A) (是任意实数)(B) pp1 p0.10.30.30.2 0.2e 33ne 33n(C) P{X n} (n 1,2,.....) (D) P{X n} (n 0,1,2,...)n!n!三、计算题1.一批零件中有9个合格品与3个废品。

安装机器时从中任取1个。

如果每次取出的废品不再放回去,求在取得合格品以前已取出的废品数的概率分布。

解:设X表示取得合格品以前已取出的废品数,P3kP91则X=0,1,2,3;P(X k) k 1P12.2.解:设X表示射击次数,则X=1,2,3;P(X.k) p 1 p1 k3.20个产品中有4个次品,(1)不放回抽样,抽取6个产品,求样品中次品数的概率分布;(2)放回抽样,抽取6个产品,求样品中次品数的概率分布。

解:(1) 不放回抽样,设X表示样品中次品数,则X=0,1,2,3, 4;X~H(6,4,20)k4 kC4C16P(X k) 6C20.(1) 放回抽样,设X表示样品中次品数,则X=0,1,2,3, 4;X~B (6,0.2)k0.2 0.8 P(X k) C6k6 k.概率分布表如下概率论与数理统计作业(山东建筑大学作业纸)4. 一批产品分一,二,三级, 其中一级品是二级品的两倍, 三级品是二级品的一半, 从这批产品中随机地抽取一个检验质量, 设X表示抽出产品的级数,写出它的概率函数. 解:X=1,2,3;一、填空题~§2.7)1.设随机变量X的密度函数0 x 1 xf(x) 2 x1 x 2,则P X 1.50其它0.875 ;PX 1.50 . 2. 设随机变量X的密度函数为1k 1 2 1 x 2f x x其它0则k 2 .二、判断题1可否是连续随机变量X的分布函数,如果X的可能值充满区间:1 x2(1), ;10 1. 解:不可以. 因F limx 1 x2(2),0 .函数解:可以.110;F0 lim 1.x 1 x2x 01 x2且F(x)在,0 上单调非减,F lim1 ,x 0故令F x 1 x2可以是连续随机变量X的分布函数x 0 1三、计算题1.已知随机变量1)确定常数X只能取-1,0,1,2四个值,相应概率依次为c;__解:1, c .2c4c8c16c162)计算P(X 1|X 0);P X 1 X 0 P X 1 解:P X 1X 0PX 0PX 1 PX 1 PX 21357,,,,2c4c8c16c概率论与数理统计作业(山东建筑大学作业纸) 1=8 25.2c 8c 16c3)求X的分布函数并做出其图像x 8137 1 x 0 解:F x 200 x 137 30 1 x 2 37 1x 2 0x 1 1 x 12. 设离散型随机变量X的分布函数为F(x) 0.4 0.71 x 3,求X的分布列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.用主成分分析方法探讨城市工业主体结构。

表1是某市工业部门13个行业8项指标的数据。

1)试用主成分分析方法确定8项指标的样本主成分(综合变量);若要求损失信息不超过15%,应取几个主成分;并对这几个主成分进行解释;2)利用主成分得分对13个行业进行排序和分类。

解:先将给出的的数据导入到Spass软件对导入的数据进行因子分析得到KMO 與 Bartlett 檢定Kaiser-Meyer-Olkin 測量取樣適當性。

.463Bartlett 的球形檢定大約卡方96.957 df 28 顯著性.000首先进行KMO检验和巴特利球体检验,KMO检验系数=0.96957>0.5 P值<0.05,所以能进行因子分析。

循环平方和载入,累加达到85%,所以取三个指标,即累加达到86.657%旋轉元件矩陣a元件1 2 3年末固定资产净值.975 -.084 .108职工人数.965 -.093 .044工业总产值.989 .090 .093全员劳动产率.121 .822 .204百元固定原资产值实-.169 .906 -.181现产值资金利税率-.088 .931 .021标准燃料消费量-.020 -.700 -.289能源利用效果.141 .139 .961擷取方法:主體元件分析。

轉軸方法:具有 Kaiser 正規化的最大變異法。

a. 在 4 疊代中收斂循環。

由旋转矩阵分析可知,八个指标分为三类第一类:年末固定资产净值,职工人数,工业总产值第二类:全员劳动产率,百元固定原资产值实现产值,资金利税率,标准燃料消费量第三类:能源利用效果(2)对原始数据进行归一化处理,计算相应的得分,结果如下:最后的结果如上表最后一列所示,根据数值的正负号分成两类,利用主成分得分对13个行业进行排序和分类如下:第一类:1(冶金) 4(化学) 5(机械) 8(食品) 13(文教)第二类:9(纺织) 6(建材)7(森工)10(缝纫)11(皮革)12(造纸)2(电力) 3(煤炭)2.下表是某年美国50州每10万人中各种类型犯罪的犯罪率数据,分析找出主要的犯罪类型、列出主成分与原始变量的线性关系式,分析解释主成分及其特征,排序说明每州主要的犯罪类型。

解:将上表中各项数据导入到SPSS,进行因子分析。

KMO检验和巴特利球体检验,KMO检验系数=0.763>0.5P值<0.05,所以能进行因子分析。

元件矩陣a元件1 2 3杀人罪.666 -.619 .279强奸罪.885 -.156 -.261抢劫罪.822 .185 .369斗殴罪.833 -.321 -.079偷盗罪.764 .344 -.471汽车犯.580 .694 .290罪擷取方法:主體元件分析。

a. 擷取 3 個元件。

分析元件矩阵可以知道主要的犯罪类型为:强奸罪,抢劫罪,斗殴罪。

主成分与原始变量的线性关系式:F1= 0.666X1+0.885X2+0.822X3+0.833X4+0.764X5+0.580X6F2= -0.619X1-0.156X2+0.185X3-0.321X4+0.344X5+0.694X6F3=0.279X1-0.261X2+0.369X3-0.079X4-0.471X5+0.290X6循环平方和累加三项后达87.62%达到要求,分析主成分分为三类。

旋轉元件矩陣a元件1 2 3杀人罪.948 .058 .060强奸罪.593 .699 .190抢劫罪.505 .235 .732斗殴罪.732 .494 .150偷盗罪.097 .888 .356汽车犯罪-.033 .251 .915擷取方法:主體元件分析。

轉軸方法:具有 Kaiser 正規化的最大變異法。

a分为三类,第一类:杀人罪,偷盗罪第二类:强奸罪,斗殴罪第三类:抢劫罪,汽车犯罪(3)经过归一化处理,并与相应的系数相乘,得到如下结果:3.采用因子分析法对美国50州的六种犯罪率数据进行分析,找出公共因子(假定2个),列出六种犯罪与公共因子的关系式,推导公共因子与六种犯罪的关系式,计算因子得分与综合得分,并对各州犯罪率按综合得分排序解释。

解:对于第二题采用因子分析法得出以下结论:X 1=0.805C1+0.036C2X 2=0744C1+0.478C2X 3=0.472C1+0.633C2X 4=0.789C1+0.324C2X 5=0.345C1+0.633C2X 6=0.026C1+0.803C2C 1=0.805X1+0.744X2+0.472X3+0.789X4+0.345X5+0.026X6C 2=0.036X1+0.478X2+0.633X3+0.324X4+0.663X5+0.803X64.某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。

下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。

解:将上述数据输入到SPSS软件,用因子分析法找出其简化的指标系统。

因子1由价格、发动机、功率和燃料容量相关性较大,主要表征发动机及其相关性能。

因子2有轴距1、轴距2、宽、长、燃料效率表征车的物理特征以及燃料的化学性质。

5.根据某年我国31个省市自治区的6项主要经济指标数据,进行因子分析,找出公因子并进行适当的解释,计算各地区的因子得分并进行排序。

解:31个省市自治区的6项主要经济指标数据,进行因子分析。

KMO检验和巴特利球体检验,KMO检验系数=0.763>0.5P值<0.05,所以能进行因子分析。

分析结果如下图所示:因子1主要由财政收入、固定资产投资、年末人口数及社会消费品零售总额。

主要表征宏观的经济指标;因子2 由人均GDP和居民消费水平,主要表征微观的指标回归到居民层面生活水平。

地区的因子得分并进行排序:广东江苏山东上海浙江北京河南辽宁河北四川福建天津湖北湖南安徽内蒙古5.12 4.38 4.32 4.14 3.74 3.35 2.53 2.45 2.28 2.10 1.88 1.87 1.83 1.75 1.52 1.39 黑龙江山西吉林广西江西陕西重庆云南新疆贵州甘肃海南宁夏青海西藏1.35 1.32 1.19 1.16 1.13 1.13 1.10 1.06 0.77 0.63 0.55 0.39 0.36 0.28 0.106.以第5题数据为例,采用分层聚类法分析聚类过程,并对结果详细解释。

解:对于第五题给出的数据进行聚类分析表(1)表(2)表(3)表(4)结果分析如下表(1)、表(2)、表(3)、表(4)显示共31个省市自治区进入聚类分析采用相关系数测量技术,先显示各变量间的相关系数这对于后面选择典型变量是十分有用的然后显示类间平均链锁法的合并进程即第一步7与22 被合并它们之间的相关系数最大为202098.45第二步21 与30 合并其间相关系数为212741.530第三步20 与25 合并其间相关系数为290480.620第四步14 与第三步合并其间相关系数为373585.330第五步4 与8合并其间相关系数为437582.580第六步21 与29 合并其间相关系数为573991.825第七步28 与31 合并第八步17 与18合并第九步14 与27合并。

具体结果看树状图.图(4) 显示按类间平均链锁法变量合并过程的冰柱图如上所示7.以第5题数据为例,采用K均值聚类法计算聚类中心,将每个省级单元归入相应类别。

解:将第五题做K均值聚类法计算。

首先将数据输入到spss软件,设置相关分析。

得出以下结论:表(1)表(2)表(3)表(4)表(5)数据输出如上图所示,表(1) 到表(3) 显示首先系统根据要求的按4 类聚合确定初始聚类的各变量中心点未经K-means 算法叠代其类别间距离并非最优经叠代运算后类别间各变量中心值得到修正。

表4 ,表5显示对聚类结果的类别间距离进行方差分析方差分析表明类别间距离差异的概率值均人均GDP ,财政收入,固定资产投资,居民消费水平,社会消费品零售总额均<0.001,年末总人口=0.004在0.001——0.005之间 即聚类效果好,这样原有31个省市自治区聚合成4 类第一类含原有10 类第二类含原有5 类第三类含原有1 类第四类含原有15 类具体结果系统以变量名QCL_1 存于原始数据文件中如下图所示:北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重庆2 1 1 1 4 1 4 4 2 2 2 1 1 4 2 1 1 134 4 4贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆4 4 4 4 4 4 4 4在原始数据文件中我们可清楚地看到聚类结果参照各项指标将每个省级单元归入相应类别:第一类:天津,河北,山西,辽宁,安徽,福建,河南,湖北,湖南。

第二类:北京,上海,江苏,浙江,山东。

第三类:广东第四类:内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆。

8某体育训练项目采用6个指标(x1-x6)评价运动员的竞技水平,分成两个级别,数据记录如下表。

准,然后利用这一标准对未知类别的新运动员进行分类。

解:(1)Fisher判别法分類函數係數LEVEL1 2X2 97.943 84.673 X5 .321 .168 X6 4.372 8.499 常數-267.004 -282.903費雪 (Fisher) 線性區別函數9. 某品牌家电在两个城市销售,其中A城市有6个商场、B城市有8个商场销售,下表是各商场一年的销售量,试分析该品牌家电在这两个城市的销售量是否有显著差异?(a=0.05)解:将数据输入到R软件,并进行显著性分析有:> sale<-data.frame(Y=c(545,489,505,585,539,449,+ + + 560,551,535,479,476,545,602,495),X=factor(rep(1:2,c(6,8))))> sale.aov<-aov(Y~X,data=sale)> summary(sale.aov)Df Sum Sq Mean Sq F value Pr(>F)X 1 470 470 0.226 0.643Residuals 12 24943 2079分析结论可知,X因素的P值为0.643>>0.05即影响不显著的10.某项录用考试有面试和笔试两部分,抽取由8名考生组成的样本,其中成绩如下表,计算秩相关系数并进行显著性检验。

相关文档
最新文档