数理统计第一章补充作业

数理统计第一章补充作业
数理统计第一章补充作业

第一章补充作业

1. 下表是经过整理后得到的分组样本

试写出此分组样本的经验分布函数。

2. 假若某地区30名2000年某专业毕业生实习期满后的月薪数据如下:

909 1086 1120 999 1320 1091

1071 1081 1130 1336 967 1572

825 914 992 1232 950 775

1203 1025 1096 808 1224 1044

871 1164 971 950 866 738

(1) 构造该批数据的频率分布表(分6组);

(2) 画出直方图。

3. 某公司对其250名职工上班所需时间进行了调查,下面是其不完整的频率分布表:

所需时间(分)频率

0~10 0.10

10~20 0.24

20~30

30~40 0.18

40~50 0.14

(1) 试将频率分布表补充完整。

(2) 该公司上班所需时间在半小时以内有多少人?

4. 根据调查, 某集团公司的中层管理人员的年薪数据如下(单位:千元):

40.6 39.6 43.8 36.2 40.8

38.6 39.6 40.0 34.7 41.7

44.9 45.4 37.0 35.1 36.7

37.1 37.7 39.2 36.9 44.5

试画出茎叶图。

5. 设总体以等概率取1,2,3,4,5,现从中抽取一个容量为4的样本,试分别求)1(x 和)4(x 的分布。

6. 设161,,x x 是来自)4,8(N 的样本,试求下列概率 (1))10()16(>x P (2))5()1(>x P

7. 根据调查, 某集团公司的中层管理人员的年薪数据如下(单位:千元):

40.6 39.6 43.8 36.2 40.8 37.3 39.2 42.9 38.6 39.6 40.0 34.7 41.7 45.4 36.9 37.8 44.9 45.4 37.0 35.1 36.7 41.3 38.1 37.9 37.1 37.7 39.2 36.9 44.5 40.4 38.4 38.9 39.9 42.2 43.5 44.8 37.7 34.7 36.3 39.7 42.1

41.5

40.6

38.9

42.2

40.3

35.8

39.2

试画出箱线图

数理统计课后答案.doc

数理统计 一、填空题 1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。不含任何未知参数 2、设母体 ),,(~2 N X 已知,则在求均值 的区间估计时,使用的随机变量为 n X 3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 025.010 1 5u 4、假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 0H :05.0 p 6、某地区的年降雨量),(~2 N X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 的矩估计值为 。 1430.8 7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 2 *2 2*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS ,已知)4(~),20(~22 2221 ,则__________, b a 。 用 )1(~)1(22 2 * n S n ,1,5 b a 8、假设随机变量)(~n t X ,则 2 1 X 服从分布 。)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2 X P ,则____ 。 用),1(~2 n F X 得),1(95.0n F

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

概率论与数理统计(含答案)

对外经济贸易大学远程教育学院 2006-2007学年第一学期 《概率论与数理统计》期末复习大纲 (附参考答案) 一、复习方法与要求 学习任何数学课程,要求掌握的都是基本概念、基本定理、基本方法,《概率论与数理统计》同样.对这些基本内容,习惯称三基,自己作出罗列与总结是学习的重要一环,希望尝试自己完成. 学习数学离不开作题,复习时同样.正因为要求掌握的是基本内容,将课件中提供的练习题作好就可以了,不必再找其他题目. 如开学给出的学习建议中所讲: 作为本科的一门课程,在课件中我们讲述了大纲所要求的基本内容.考虑到学员的特点,在学习中可以有所侧重.各章内容要求与所占分值如下: 第一章介绍的随机事件的关系与运算,概率的基本概念与关系. 约占20分. 第二章介绍的一维随机变量的分布. 约占20分. 第三章二维随机变量的分布,主要要求掌握二维离散型随机变量的联合分布律、边缘分布律以及随机变量独立的判别. 约占15分. 第四章介绍的随机变量的数字特征. 约占20分. 第五章的中心极限定理. 约占5分. 分布); 第六章介绍的总体、样本、统计量等术语;常用统计量的定义式与分布(t分布、2 正态总体样本函数服从分布定理. 约占7分. 第七章的矩估计与一个正态总体期望与方差的区间估计. 约占8分. 第八章一个正态总体期望与方差的假设检验. 约占5分. 对上述内容之外部分,不作要求. 二、期终考试方式与题型 本学期期终考试采取开卷形式,即允许带教材与参考资料. 题目全部为客观题,题型有判断与选择.当然有些题目要通过计算才能得出结果.其中判断题约占64分,每小题2分;选择题约占36分,每小题3分.

数理统计作业三

第一部分统计基础与概率计算(共10题,10分/题) 1.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红 灯的事件就是相互独立的,且红灯持续24秒而绿灯持续36秒。试求她途中遇到红灯的次数的概率分布及其期望值与方差、标准差。 解:读题可知每个路口遇到红灯的概率就是P=24/(24+36)=0、4 假设遇到红灯的次数为X,则,X~B(3,0、4),概率分布如下 0次遇到红灯的概率P0=(1-0、4)3=0、216 1次遇到红灯的概念P1=(1-0、4)2*0、4=0、432 2次遇到红灯的概念P2=(1-0、4)*0、42=0、288 3次遇到红灯的概念P3=0、43=0、064 期望:E(x)=nP=0、4*3=1、2 方差:D(X)=δ2=nPq=0、4*3*(1-0、4)=0、72 标准差: 2、一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用): (1)至少获利50万元的概率; (2)亏本的概率; (3)支付保险金额的均值与标准差。 解:设被保险人死亡数为X,X~B(20000,0、0005) 2.总收入为2万×50=100万,要获利至少50万,则赔付的保险金额应该不超过50万,也就就 是被保险的人当中死亡人数不能超过10人,精确点就就是用二项分布来做,但就是由于20000这个数比较大,就可以用正态近似来做,就就是认为死亡人数服从与原二项分布的均值方差相同的正态分布,结用正态函数表示。概率为P(X≤10)=0、58304

应用数理统计作业题及参考答案(第二章)(2)

第二章 参数估计(续) P68 2.13 设总体X 服从几何分布:{}()1 1k P X k p p -==-,12k = ,,,01p <<,证明 样本均值1 1 n i i X X n == ∑是()E X 的相合、无偏和有效估计量。 证明: 总体X 服从几何分布, ∴()1= E X p ,()2 1-= p D X p . 1 () ()1 11 11 11==????===??== ? ????? ∑ ∑ n n i i i i E X E X E X n E X n n n p p . ∴样本均值11n i i X X n == ∑ 是()E X 的无偏估计量。 2 () 2222 1 11 1111==--???? ===??= ? ?????∑ ∑n n i i i i p p D X D X D X n n n n p np . ()()()()11 11 ln ln 1ln 1ln 1-??=-=+--??;X f X p p p p X p . () 111ln 111111f X p X X p p p p p ?--= - =+?--;. () () 2 11 2 2 2 ln 11 1f X p X p p p ?-=- + ?-;. ()()()()21112 2 2 22ln 11 1111f X p X X I p E E E p p p p p ???? ?? ?--=-=--+=+???????--?????? ? ?? ? ; () ()() ()12 2 2 2 2 211 11 111111111??-= + -= + ?-=+? ?---?? p E X p p p p p p p p ()()() () 2 2 2 111 1 111-+= + = = ---p p p p p p p p p .

概率与数理统计

简介: 全书共分9章:随机事件与概率,一维随机变量及其分布,多维随机变量及其分布,随机变量的数字特征,极限定理,统计量及抽样分布,参数估计,假设检验,方差分析与回归分析.本书科学、系统地介绍了概率论与数理统计的基本内容,重点介绍了概率论与数理统计的方法及其在经济管理中的应用,每章均配有习题,书末附有习题的参考答案. 图书目录: 第一章随机事件与概率 §1.1随机试验与样本空间;§1.2随机事件及其概率;一、随机事件;二、事件间的关系与运算;三、频率与概率;§1.3古典概型;§1.4概率的基本性质;§1.5条件概率与事件的独立性;一、条件概率;二、乘法定理;三、全概率公式;四、贝叶斯公式;五、事件的独立性;§1.6贝努里概型;数学家简介--费马;习题一 第二章一维随机变量及其分布 §2.1一维随机变量;§2.2离散型随机变量;一、离散型随机变量及其分布律;二、常用的离散型随机变量的分布;§2.3随机变量的分布函数;§2.4连续型随机变量;一、连续型随机变量及其密度函数;二、常用的连续型随机变量的分布;§2.5随机变量函数的分布;一、离散型随机变量函数的分布;二、连续型随机变量函数的分布;数学家简介--帕斯卡贝叶斯;习题二 第三章多维随机变量及其分布 §3.1二维随机变量;一、二维随机变量及其联合分布函数;二、二维离散型随机变量及其分布;三、二维连续型随机变量及其分布;§3.2条件分布;§3.3随机变量的独立性;数学家简介--雅各布·贝努里;习题三 第四章随机变量的数字特征 §4.1数学期望;一、离散型随机变量的数学期望;二、连续型随机变量的数学期望;三、随机变量函数的数学期望;四、数学期望的性质;§4.2方差;一、方差的定义;二、方差的性质;§4.3协方差与相关系数;一、协方差;二、相关系数;数学家简介--棣莫弗;习题四 第五章极限定理 §5.1切比雪夫不等式;§5.2大数定律;§5.3中心极限定理;数学家简介--拉普拉斯;习题五 第六章统计量及抽样分布 §6.1总体与样本;一、总体与样本;二、统计量;§6.2样本分布函数;一、频率分布表; 二、直方图;三、样本分布函数;§6.3常用统计量的分布;一、正态总体样本的线性函数的分布;二、χ2分布;三、t分布;四、F分布;数学家简介--切比雪夫;习题六| 第七章参数估计 §7.1点估计;一、矩估计法;二、极大似然估计法;§7.2估计量的评价标准;一、无偏性;二、有效性;三、一致性;§7.3区间估计;一、正态总体均值的区间估计;二、正态总体方差的区间估计;三、非正态总体均值的区间估计;四、单边置信区间;数学家简介--马尔柯夫;习题七

重庆大学研究生数理统计大作业

NBA球员科比单场总得分与上场时间的线性回归分析 摘要 篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。 正文 一、问题描述 随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。 倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。 因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。 二、数据描述 抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

数理统计学作业

数理统计学作业 专业:飞行器设计 姓名:刘炜华 学号: 20130302002 2013年9月

1.数据的采集及说明 1.1数据的搜集方法及说明 当复合材料结构开始大量应用之后,在实际使用中可以积累大量的故障统计数据,航空公司在对故障数据进行收集和统计之后,可以对故障数据作故障率直方图和故障频率分布图来进行故障频率信息的统计和分析。 表 1是一架飞机在某段时间内故障间隔飞行小时,下面以该数据集为基础简单估计该架飞机在该时间段内的故障率曲线分布。 表1某飞机一段时间内故障间隔飞行小时 1.2.数据整理 1.表中共有 100 个维修数据,找出其中的最大值为max 652L =小时,最小值为 min 1L =小时; 2.计算组数: 根据经验公式:1 3.32lg k n =+, 计算得1 3.32lg 1 3.32lg1008k n =+=+≈, 所以将数据分为8组; 3.计算组距: max min 6521 828 L L t k --?= =≈; 4.根据公式计算并将所得的结果列成表2: 频率:/j j W f n =

表2故障频率分析过程计算结果 5.计算得:202.98X =,167.0697S =; 根据公式3 1 13 () 1.1035(1)n i i X X V n S =-= =-∑ 6.计算峰度: 根据公式4 1 24 () 3.4853(1)n i i X X V n S =-= =-∑ 1.3.直方图与折线图 图1-1故障频数直方图

图1-2故障频率折线图 图1-3故障频率直方图 图1-4累计频率折线图

从频率直方图即图3中可以看出,靠近左侧的数据出现较多。通过比较频率曲线和指数分布曲线可以看出,该图显示故障呈现典型的指数分布,所以说明趋势方程是指数函数。趋势线方程代表故障频数随时间的发展趋势,据此可以预测未来某一时间段内的故障数,来实现故障相关维修成本的估算。 1.4.经验分布函数 根据定义得出,总体X 的经验分布函数为: 0,1 (),1652,1,2,...,991001,652 n x k F x x k x

应用数理统计大作业1——逐步回归法分析终

应用数理统计大作业1——逐步回归法分析终 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

应用数理统计多元线性回归分析 (第一次作业) 学院:机械工程及自动化学院 姓名: 学号: 2014年12月

逐步回归法在AMHS物流仿真结果中的应 用 摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。 关键词:逐步回归;残差;SPSS;AMHS;物流仿真

目录 1、引言 (1) 2、逐步回归法原理 (4) 3、模型建立 (6) 3.1确定自变量和因变量 (6) 3.2分析数据准备 (6) 3.3逐步回归分析 (7) 4、结果输出及分析 (9) 4.1输入/移去的变量 (9) 4.2模型汇总 (10) 4.3方差分析 (10) 4.4回归系数 (11) 4.5已排除的变量 (12) 4.6残差统计量 (13) 4.7残差分布直方图和观测量累计概率P-P图 (14) 5、异常情况说明 (15) 5.1异方差检验 (15) 5.2残差的独立性检验 (17) 5.3多重共线性检验 (17) 6、结论 (18) 参考文献 (20)

1、引言 回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。 SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。 本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ 未知,n X X X ,,,2 1 为其样本,2≥n ,则下列说法中正 确的是( )。 (A )∑=-n i i X n 1 2 2 ) (μσ是统计量 (B )∑=n i i X n 1 22 σ是统计量 (C )∑=--n i i X n 1 2 2 ) (1μσ是统计量 (D )∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,) 9(~2 χY ,则Y X 3服从 ( )。 )(A ) 1,0(N )(B ) 3(t )(C ) 9(t )(D ) 9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16) Y χ,则Y 服 从( )。 )(A )1,0(N )(B (4) t )(C (16) t )(D (1,4) F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下 列是μ的无偏估计的是( ). ) (A ∑-=-1 1 1 1 n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 2 1 )(D ∑-=1 1 1n i i X n 5、设4 3 2 1 ,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( ).

() (1) D t n- 10、设 1,, n X X ???为来自正态总体2 (,) Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。 (A) ()2 1 2 n i i Xμ σ = - ∑ (B) ()2 1 2 n i i Xμ σ = - ∑ (C) () ∑ = - n i i X X 1 2 2 1 σ (D) ()2 1 2 n i i X X σ = -∑ 11、在假设检验中,下列说法正确的是()。 (A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯; (D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。 12、对总体2 ~(,) X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区 间,意义是指这个区间()。 (A)平均含总体95%的值(B)平 均含样本95%的值

数理统计第二次作业

数理统计第二次作业 ? 1. 某百货公司连续40 天的商品销售额如下(单位:万元): 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(数据见练 习1 数据.xls —练习 1.1 )解:频数分布表及直方图如下:由直方图可以看出,该百货公司连续 40 天的销售额近似服从单峰对称的正态分布。 2. 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100 只进行测试,所 得结果如下: 700 706 716 715 728 712 719 722 685 691 709 708 691 690 684 692

705 707 718 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 (1) 利用计算机对上面的数据进行排序; (2) 以组距为10 进行等距分组,整理成频数分布表,并绘制直方图;(3) 绘制茎叶图,并与直方图作比较. 解( 1)排序如下 (2)频数分布表及频数分布直方图如下:从直方图可以看出,灯泡的使用寿命近似服从单 峰对称的正态分布。 (3)茎叶图如下 与频数分布表比较可知:当频数分布表频数分布间隔为10,且从整10 开始,则茎叶 图各茎所含叶片数与对应频数区间所含项数相等。 3. 某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产 5 件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:设A =优质率达95%, C =优质率为80%, B =试验所生产的5件全部优质。 P(A) = 0.4 , P(A ) = 0.6 , P(B|A)=0.955 , P(B|A )=0.85 ,所求概率为:P (A I B ) P(A) ?P(B I A) P(A) ?P(B II A)+P(A ) ?P(B I A ) 0.50612 0.30951 0.6115 决策者会倾向于采用新的生产管理流程。

概率论与数理统计公式整理超全免费版

第1章随机事件及其概率 (1)排列组合公式 )! ( ! n m m P n m- =从m个人中挑出n个人进行排列的可能数。 )! (! ! n m n m C n m- =从m个人中挑出n个人进行组合的可能数。 (2)加法和乘法原理加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。 (3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个) 顺序问题 (4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 (5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用ω来表示。 基本事件的全体,称为试验的样本空间,用Ω表示。 一个事件就是由Ω中的部分点(基本事件ω)组成的集合。通常用大写字母A,B,C,…表示事件,它们是Ω的子集。 Ω为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 (6)事件的关系与运算①关系: 如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):B A? 如果同时有B A?,A B?,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:A B,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者B A,它表示A发生而B不发生的事件。 A、B同时发生:A B,或者AB。A B=?,则表示A与B不可能同时发生,称 事件A与事件B互不相容或者互斥。基本事件是互不相容的。 Ω-A称为事件A的逆事件,或称A的对立事件,记为A。它表示A不发生的

吉林大学2015概率论与数理统计大作业完整版

吉林大学网络教育 大作业 1.仪器中有三个元件,它们损坏的概率都是0.2,并且损坏与否相互独立.当一个元件损坏时, 仪器发生故障的概率为0.25,当两个元件损坏时,仪器发生故障的概率为0.6,当三个元件损坏时,仪器发生故障的概率为0.95, 当三个元件都不损坏时,仪器不发生故障.求:(1)仪器发生故障的概率;(2)仪器发生故障时恰有二个元件损坏的概率. (1)解:设A 表示事件“仪器发生故障”,i=1,2,3 P(A)= )/()(3 1 B B i i i A P P ∑=, P(B1)=3*0.2*0.80.2=0.384,P(B2)=3*0.22*0.8=0.096,P(B3)=0.23=0.008 所以P(A)=0.384*0.25+0.096*0.6+0.008*0.95+0.1612 (2) P(B 2/A)= ) ()(2A P A p B =0.96*0.6/0.1612=0.3573 2.设连续型随机变量X 的分布函数为 0, ,()arcsin ,,(0)1, ,x a x F x A B a x a a a x a ≤-??? =+-<<>?? ≥?? 求:(1)常数A 、B .(2)随机变量X 落在,22a a ?? - ??? 内的概率.(3)X 的概率密度函数. 解:(1)F (a+0)=A-2πB=0,F (a-0) =A+2πB=1 所以A=0.5 B=π 1 (2)P{-2a

西安交大数理统计作业(完整版)

第一章 1.1 X~N(μ,2 σ) 则X~N(μ, 2 n σ ),所以X-μ~N(0, 2 n σ ) P{X-μ <1}= P{ = 0.95 N(0,1),而(0.975) 1.96 Φ= 所以n最小要取[2 1.96x2σ]+1 1.2 (1)至800小时,没有一个元件失效 这个事件等价于P{ 123456 X X X X X X>800}的概率 由已知X服从指数分布,可求得P{ 123456 X X X X X X>800}=7.2 e-(2)至3000小时,所有六个元件都失效的概率 等价与P{ 123456 X X X X X X<3000}的概率 可求得P{ 123456 X X X X X X<3000}= 4.56 (1) e- - 1.5 2 1 () n i i X a = - ∑=2 1 [()()] n i i X X X a = -+- ∑ =22 111 ()2()()() n n n i i i i i X X X a X X X a === -+--+- ∑∑∑ 因为 1 () n i i X X = - ∑=0 所以2 1 () n i i X a = - ∑=22 11 ()() n n i i i X X X a == -+- ∑∑ =22 1 () n i nS X a = +- ∑ 所以当a=X时,2 1 () n i i X a = - ∑有最小值且等于2nS 1.6 (1)由 1 1n i i X X n= =∑

有等式的左边= 221 12n n i i i i X X n μμ==-+∑∑ 等式的右边= 22221122n n i i i i X X X nX nX nX n μμ==-++-+∑∑ = 22 2 2 211 22n n i i i i X nX nX nX X n μμ==-++-+∑∑ = 221 1 2n n i i i i X X n μμ==-+∑∑ 左边等于右边,结论得证。 (2) 等式的左边= 22 11 2n n i i i i X X X nX ==-+∑∑=221 n i i X nX =-∑ 等式的右边= 221 n i i X nX =-∑ 左边等于右边,结论得证。 1.7 (1)由11n n i i X X n ==∑ 及 22 1 1()n n i n i S X X n ==-∑ 有左边=1111111111()1111 n n n n n i i n i i i i X X X X X X n n n n ++++=====+=+++++∑∑∑ 111 ()111 n n n n n nX X X X X n n n ++= +=+-+++=右边 左边等于右边,结论得证。 (2)由 左边=12 21 11 1()1n n i n i S X X n +++==-+∑ 121111[()]11 n i n n n i X X X X n n ++==---++∑ 121111[()()]11 n i n n n i X X X X n n ++==---++∑ 12 2112 1121[()()()()]11(1) n i n i n n n n n i X X X X X X X X n n n +++==----+-+++∑

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显着影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显着性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显着性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显着水平下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一

概率论与数理统计心得体会

概率课感想与心得体会 笛卡尔说过:“有一个颠扑不破的真理,那就是当我们不能确定什么是真的时候,我们就应该去探求什么是最最可能的。”随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时为统计学的发展提供了理论基础。 概率起源于现实生活,应用于现实生活,如我们讨论了摸球问题,掷硬币正反面的试验,拍骰子问题等等。都是接近生活实践的概率应用实例。 同时,通过概率课还了解了概率的意义,概率是用来度量随机事件发生可能性大小的一个量,而实际结果是事件发生或不发生这两种情况中的一种。但是我们不能根据随机事件的概率来断定某次试验出现某种结果或者不出现某种结果。同时,我们还可以利用概率来判定游戏规则,譬如,在各类游戏中,如果每个人获胜的概率相等,那么游戏就是公平的,这就是说,要保证所制定的游戏规则是公平的,需要保证每个人获胜的概率相等。概率教学中的试验或游戏结果,如果不进行足够多的次数,是很难得出比较接近概率的频率的,也就是说当试验的次数很多的时候,频率就逐渐接近一个稳定的值,这个稳定的值就是概率。我们说,当进行次数很多的时候,时间发生的次数所占的总次数的比例,即频率就是概率。换句话说,就是时间发生的可能性最大。 概率不仅在生活上给了我们很大的帮助,同时也能帮我们验证某些理论知识,譬如投针问题: ()行直线相交的概率. 平的针,试求该针与任一一根长度为线,向此平面上任意投的一些平行平面上画有等距离为a L L a <

我们解如下: 平行线的距离; :针的中心到最近一条 设:X 此平行线的夹角.:针与? 上的均匀分布;, 服从区间则随机变量?? ? ?? ? 20a X []上的均匀分布;服从区间随机变量π?,0相互独立.与并且随机变量?X ()的联合密度函数为 ,所以二维随机变量?X ()??? ??≤≤≤≤=. , 02 02 其它,,π?π?a x a x f {} 针与任一直线相交设:=A , . sin 2? ?? ???<=?L X A 则所以, ()? ?????<=?sin 2L X P A P 的面积的面积 D A =.22 sin 20 a L a d L ππ??π == ?

北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判 别分析 应用数理统计第二次大作业 学院名称 学号 学生姓名 摘要 我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因

变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。 关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型 1、引言 财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。 本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。 1.1 聚类分析 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。 系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就

最新数理统计大作业题目和答案--0348资料

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ未知,n X X X ,,,21 为其样本, 2≥n ,则下列说法中正确的是( ) 。 (A ) ∑=-n i i X n 1 2 2 )(μσ是统计量 (B ) ∑=n i i X n 1 22 σ是统计量 (C ) ∑=--n i i X n 1 2 2 )(1μσ是统计量 (D ) ∑=n i i X n 1 2 μ 是统计量 2、设两独立随机变量)1,0(~N X ,)9(~2 χY ,则 Y X 3服从( )。 )(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16)Y χ )。 )(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ). ) (A ∑ -=-1 1 1 1n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是 ( ). (A )3/X σ; (B ) 4 1 4 i i X =∑; (C )σ-1X ; (D ) 4 221 /i i X σ=∑ 6、设总体),(~2 σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则 下列正确的是( ). 2() ~(,)A X N μσ 2() ~(,) B n X N μσ 222 1 1 () ()~()n i i C X n μχσ=-∑ () ~()D t n 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本,则下列随机变量不是统计量为( ) ( A ) . 12X X + ( B ) {}max ,15i X i ≤≤

数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (4) 1.1、数据的收集方法及说明 (4) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (6) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验( 2 χ拟合优度检验) (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

相关文档
最新文档