5.数理统计实验

5.数理统计实验
5.数理统计实验

工程数学

Gxxxxxxxxxxxx xxxxxx

E-mail: xxxxxxxxxxxxxx Tel: xxxxxxxxxxx

5数理统计实验:

5.1.实验目的与要求

●学会对数据的参数进行评估和作相应的假设检验

●学会对分布进行检验和数据的秩检验

●建立相应的统计模型,并用R软件求解

●对计算结果进行分析和讨论

5.2.基本实验

5.2.1.区间估计

已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:小时)为

1067 919 1196 785 1126 936 918 1156 920 948

(1)试问这批灯泡中大约95%的灯泡至少使用多少小时;

(2)求这批灯泡能够使用1000小时以上的概率。略。

解:

(1)由点估计与参数估计未知参数和σ^2,可以求出均值与方差;

输入程序:

X<-c(1067,919,1196,785,1126,936,918,1156,920,948)

t.test(X,al="g")

运行结果:

结果分析:

有95%的灯泡至少可以使用920个小时。

(2)

输入程序:

x<-c(1067,919,1196,785,1126,936,918,1156,920,948) pnorm(1000,mean(x),sd(x))

运行结果:

结果分析:

灯泡能够使用1000小时以上的概率为1-0.5087941=0.4912059,即49.12%

5.2.2.假设检验I

正常男子血小板计数均值为225 x 109/L,今测得20名男性油漆作业工人的血小板计数值(单位:109/ L)

220 188 162 230 145 160 238 188 247 113

126 245 164 231 256 183 190 158 224 175

问油漆工人的血小板计数与正常成年男子有无差异,并说明油漆作业对人体血小板计数是否有影响。

解:

对于自然状态下的男子血小板的数目可以假设服从于正态分布,由点估计与参数估计未知参数和σ^2,可以求出均值、均值区间与方差;设原假设为H0:225,对立假设H1:225

输入程序:

X<-c(220,188,162,230,145,160,238,188,247,113,

126,245,164,231,256,183,190,158,224,175)

t.test(X,mu=225)

运行结果:

结果分析:

可以得出均值为= 192.15,方差σ^2=1694.728;

均值区间为(172.3827,211.9173)由此可以得出对于油漆工人而言正常男子血小板数为225单位,油漆工人明显低于正常的数量,则可以得知结论油漆作业对人体血小板数量有严重影响。5.2.3.假设检验II

为研究国产四类新药阿卡波糖胶囊效果,某医院用40名II型糖尿病病人进行同期随机对照实验。试验者将这些病人随机等分到试验组(阿卡波糖胶囊组)和对照组(拜唐苹胶囊组),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值如表下:

试验组-0.70 -5.60 2.00 2.80 0.70 3.50 4.00 5.80 7.10 -0.50

2.50 -1.60 1.70

3.00 0.40

4.50 4.60 2.50 6.00 -1.40

对照组 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 -1.10

6.0 .80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 -2.00

(1)假设数据服从正态分布,试用t检验(讨论方差相同和方差不同两种情况)和成对t检验来判断:国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果是否相同?并分析三种检验方法各自的优

越性。

(2)检验试验组和对照组的数据的方差是否相同?

解:

(1)方差相同,方差不同,成对检验3种情况

输入程序:

X<-c(-0.70, -5.60, 2.00, 2.80, 0.70, 3.50, 4.00, 5.80, 7.10, -0.50,

2.50,-1.60, 1.70,

3.00, 0.40,

4.50, 4.60, 2.50, 6.00, -1.40)

Y<-c(3.70, 6.50, 5.00, 5.20, 0.80, 0.20, 0.60, 3.40, 6.60, -1.10,

6.00, 3.80, 2.00, 1.60, 2.00, 2.20, 1.20, 3.10, 1.70, -2.00)

t.test(X, Y, var.equal=TRUE)

t.test(X, Y)

t.test(X, Y, paired=TRUE)!

运行结果:

结果分析:

方差相同结果

X<-c(-0.70, -5.60, 2.00, 2.80, 0.70, 3.50, 4.00, 5.80, 7.10, -0.50,2.50,-1.60, 1.70, 3.00, 0.40,

4.50, 4.60, 2.50, 6.00, -1.40)

Y<-c(3.70, 6.50, 5.00, 5.20, 0.80, 0.20, 0.60, 3.40, 6.60, -1.10, 6.00, 3.80, 2.00, 1.60, 2.00,

2.20, 1.20,

3.10, 1.70, -2.00)

t.test(X, Y, var.equal=TRUE)

方差不同结果

t.test(X, Y)

成对检验结果

t.test(X, Y,paired=TRUE)

结果分析:

由此可得:效果相同,统计区别不明显,三种检验方式的优越性,方差相同的情况区间最小。

(2)X,Y组单独检验运行程序

输入程序:

t.test(X)

运行结果:

输入程序:

t.test(Y)

运行结果:

结果分析:

由此可得,X组P值为0.007077,Y组为0.0001112

5.2.4.假设检验III

某医院研究乳腺癌家族史对于乳腺癌发病率的影响。假设调查了10000名50-54岁的妇女,她们的母亲曾有乳腺癌。发现她们在那个生存期的某个时刻有400例乳腺癌,而全国在该年龄段的妇女乳腺癌的患病率为2%,这组数据能否说明乳腺癌的患病率与家庭遗传有关。

解:

根据题意,假设检验采用二项分布总体,调用binom.test函数。

输入程序:

binom.test(400, 10000, 0.02)

运行结果:

结果分析:

由此可得,p-value <2.2e-16<0.05,所以拒绝接受原假设,认为这些数据说明乳腺癌的患病率与家族史有关。

5.2.5.分布检验I

Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为

黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16

实际实验值为:黄圆315粒,黄皱101粒,绿圆108粒,绿皱32粒,共556粒,问此结果是否符合自由组合规律?

解:

由题黄圆:黄皱:绿圆:绿皱= :::

此问题可以用Pearson拟合优度2 检验,令:09331

H: P1=,P2=,P3=,P4=

16161616输入程序:

chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)

运行结果:

结果分析:

程序运行结果表明,p-value = 0.9254>0.05,可以认为此结果是符合自由组合规律的。

5.2.

6.分布检验II

观察每分钟进入某商店的人数X,任取200分钟,所得数据表5.1所示。试分析,能否认为每分钟顾客数X服从Poisson分布(α= 0.1)。

表5.1每分钟进人商店顾客人数的频数

解:

输入程序:

1)

X<-0:5;Y<-c(92,68,28,11,1,0);

q<-ppois(X, mean(rep(X,Y)));

n<-length(Y)

p<-numeric(n);

p[1]<-q[1];

p[n]<-1-q[n-1];

for (i in 2:(n-1)) p[i]<-q[i]-q[i-1];

chisq.test(Y,p=p);

2)

Z<-c(92,68,28,12);

n<-length(Z);

p<-p[1:n-1];

p[n]<-1-q[n-1];

chisq.test(Z,p=p)

运行结果:

1)

2)

结果分析:

因为2

Pearson 检验要求在分组后,每组中的频数至少要大于等于5,而后两组中出现的频数是1,0,均小于5。由此可以得知p-value = 0.8227>>0.1,因此,能认为每分钟顾客人数X服从Poisson分布。

5.2.7.列联表检验I

向120名女性和120名男性做调查,了解他们关于给谁买节日礼物最难的看法,调查结果如表5.2所示,试分析:女性和男性在关于给谁买节日礼物最难的看法上有没有显著差异。

解:

根据题意,输入数据,用chisq.test()函数检验:

输入程序:

x<-scan()

28 34 23 7 13 15 42 13 9 11 7 20

X<-matrix(x, nc=4, byrow=T)

chisq.test(X)

运行结果:

结果分析:

从计算结果得,p-value = 2.311e-08小于0.05,所以女性和男性在关于给谁买节日礼物最难的看法上有显著差异

5.2.8.列联表检验II

为研究人脑的左右半球恶性肿瘤的发病率是否有显著差异,对人脑恶性肿瘤和良性肿瘤的发育情况做了调查,调查结果如表5.3所示,试进行分析。

解:

输入数据,用chisq.test()函数检验:

输入程序:

x <- matrix(c(9, 1, 3, 3), nc = 2)

chisq.test(x,correct = FALSE)

运行结果:

用fisher.test()作独立精准检验,R程序:

x<-c(9,1,3,3)

dim(x)<-c(2,2)

fisher.test(x)

结果分析:

P的平均值,p-value = 0.1181,平且估计区间包含有1,可得出结论,说明两个变量是独立的,左右半球恶性肿瘤的发病率没有显著差异。

5.2.9.Wilcoxon秩和检验I

(1)为了了解新的数学教学方法的效果是否比原来方法的效果有所提高,从水平相当的10名学生中随机地各选5名接受新方法和原方法的教学试验。充分长一段时间后,由专家通过各种方式(如考试提问等)对10名学生的数学能力予以综合评估(为公正起见,假定专家对各个学生属于哪一组并不知道),并按其数学能力由弱到强排序,结果如表5.4所示。对α= 0.05,检验新方法是否比原方法显著地提高了教学效果。

表5.4学生数学能力排序结果

(2)若新方法与原方法得到排序结果改为表5.6所示的情形,能否说明新方法比原方法显著提高了教学效果?

表5.5学生数学能力排序结果

解:

(1)由题可以得出如下的wilcox.test()函数R程序

输入程序:

x<-c(3, 5, 7, 9, 10)

y<-c(1, 2, 4, 6, 8)

wilcox.test(x, y, alternative="greater")

运行结果:

结果分析:

由p-value = 0.1111>=0.05所以无法确定新方法有提高新效果

(2)由新的表格可以得到新的R程序

输入程序:

x<-c(4, 6, 7, 9, 10)

y<-c(1, 2, 3, 5, 8)

wilcox.test(x, y, alternative="greater")

运行结果:

结果分析:

p-value = 0.04762<0.05则可以得出新方法有一定程度的提高效果

5.2.10.Wilcoxon秩和检验II

为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法.经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好五个等级。两组中处于不同等级的患者人数如表5.6所示。试分析,由此结果能否认为新方法的疗效显著地优于原疗法(α=0.05)。

表5.6不同方法治疗后的结果

解:

由此调用wilcox.test()函数可以得出R程序

输入程序:

x<-c(0, 1, 9, 7, 3)

y<-c(2, 2, 11, 4, 1)

wilcox.test(x, y, alternative="greater",paired=TRUE)

运行结果:

结果分析:

p-value = 0.05则可以得出新疗法组有明显的度的提高效果

5.3.加分实验(产品装箱问题)

A厂把加工好的螺母封装成盒,标准为200个/盒。封装好的产品卖给用户。如果盒中的个数少于200,会造成用户的生产线停顿,用户会因此向该厂索赔。

(l)封装生产线采用称重计数的方式:已知螺母的重量X~N( X100, 4)(单位:克),封装时电脑自动称量盒中螺母的重量,并由此估计螺母的个数,显示在屏幕上.控制人员通过终端设定每盒中应该装填的螺母数,就可以开动由电脑控制的封装线了.为了尽量避免出现不足的情况,控制人员设定的装填个数一般比200

数理统计实验指导1报告

数理统计实验实验指导书一 理学院实验中心 数学专业实验室编写

实验一常见的概率分布以及分位数 【实验类型】综合性 【实验学时】4 【实验内容】 1、会利用 MATLAB 软件计算离散型随机变量的概率、连续型随机变量概率密度值, 以及产生离散型随机变量的概率分布(即分布律); 2、会利用 MATLAB 软件画出各种常见分布图形; 2、会利用 MATLAB 软件计算分布函数值, 或计算形如事件{X≤x}的概率; 3、给出概率p和分布函数, 会求上α分位点, 或求解概率表达式中的待定参数。 【实验前的预备知识】 1、掌握常见离散型随机变量的分布律及性质; 2、掌握常见连续型随机变量的分布密度函数及性质; 3、理解上分位数的定义及求法 4、掌握基本的描绘函数的MATLAB编程法。 【实验方法或步骤】 1、通用MATLAB函数计算概率分布律及密度函数值 命令通用函数计算概率密度函数值 函数pdf 或者namepdf 格式:Y=pdf(‘name',K,A,B)或者:namepdf (K,A,B) 说明(1)上述函数表示返回在X=K处、参数为A、B、C的概率值或密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表1。 (2)第一个函数名加' ',第二个无需加。 表1 常见分布函数表

例1事件A在每次试验中发生的概率是0.3, 计算在10次试验中A恰好发生6次的概率. 解: p=pdf('bino',6, 10, 0.3)或者p=binopdf(6, 10, 0.3) p = 0.0368 结果表明:参数是n=10,概率是p=0.3的二项分布在X=6处的概率为0.0368. 例2 事件A在每次试验中发生的概率是0.3, 求在4次试验中A发生次数的概率分布. 解: p=pdf('bino',0:4,4,0.3) %0: 4产生步长为 1 的等差数列 0, 1, 2, 3, 4. 或者p=binopdf(0:4,4,0.3) p = 0.2401 0.4116 0.2646 0.0756 0.0081 计算的结果是: 参数是n=4, 概率是p=0.3的二项分布的分布律(当x=0,1,2,3,4 时). 例 3 设随机变量X服从参数是3的泊松分布, 求概率P{X=6}. 解: p=pdf('poiss',6,3) 或者p=poisspdf(6,3) p = 0.0504 结果表明:参数是λ=3 的泊松分布在x=6处的概率为0.0504. 例4 写出参数为 3 的泊松分布的前6项的概率分布. 解:p=pdf('poiss',0:5,3)或者p=poisspdf(0:5,3) % 0:5 产生步长为 1的等差数列0,1,2,3,4,5. p = 0.0498 0.1494 0.2240 0.2240 0.1680 0.1008 计算的结果是, 参数为λ=3的泊松分布的前6项的概率(当x=0,1,2,3,4,5时). 例5设随机变量X服从区间[2, 6]上的均匀分布, 求X=4 时的概率密度值. 解:y=unifpdf(4,2,6) 或y=pdf('unif',4,2,6) y = 0.2500 例6 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。 解:在命令窗口中输入: pdf('norm',0.6578,0,1)或者normpdf(0.6578,0,1) ans = 0.3213 例7 自由度为8的卡方分布,在点2.18处的密度函数值。 解: pdf('chi2',2.18,8)或者chi2pdf(2.18,8) ans = 0.0363 2、常见分布的密度函数作图 函数:plot(x,y) 或plot(x,y) 以x 元素为横坐标值,y 元素为纵坐标值绘制曲线。 例:1、二项分布 x = 0:10; y = binopdf(x,10,0.5); plot(x,y,'+') 2、泊松分布

5.数理统计实验.

工程数学 Gxxxxxxxxxxxx xxxxxx E-mail: xxxxxxxxxxxxxx Tel: xxxxxxxxxxx 5数理统计实验: 5.1.实验目的与要求 ●学会对数据的参数进行评估和作相应的假设检验 ●学会对分布进行检验和数据的秩检验 ●建立相应的统计模型,并用R软件求解 ●对计算结果进行分析和讨论 5.2.基本实验 5.2.1.区间估计 已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:小时)为 1067 919 1196 785 1126 936 918 1156 920 948 (1)试问这批灯泡中大约95%的灯泡至少使用多少小时; (2)求这批灯泡能够使用1000小时以上的概率。略。 解: (1)由点估计与参数估计未知参数和σ^2,可以求出均值与方差; 输入程序: X<-c(1067,919,1196,785,1126,936,918,1156,920,948)

t.test(X,al="g") 运行结果: 结果分析: 有95%的灯泡至少可以使用920个小时。 (2) 输入程序: x<-c(1067,919,1196,785,1126,936,918,1156,920,948) pnorm(1000,mean(x),sd(x)) 运行结果: 结果分析:

灯泡能够使用1000小时以上的概率为1-0.5087941=0.4912059,即49.12% 5.2.2.假设检验I 正常男子血小板计数均值为225 x 109/L,今测得20名男性油漆作业工人的血小板计数值(单位:109/ L) 220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无差异,并说明油漆作业对人体血小板计数是否有影响。 解: 对于自然状态下的男子血小板的数目可以假设服从于正态分布,由点估计与参数估计未知参数和σ^2,可以求出均值、均值区间与方差;设原假设为H0:225,对立假设H1:225 输入程序: X<-c(220,188,162,230,145,160,238,188,247,113, 126,245,164,231,256,183,190,158,224,175) t.test(X,mu=225) 运行结果:

数理统计学实验报告

数理统计学实验报告 院: 专业:班级:学号: 学生姓名: 指导教师姓名: 实验日期:

实验1 用表中的资料,按以下要求绘制图表: (一)用表中1950、1960、1970、1980四年三类产品的出口金额绘制分组柱形图,然后将图复制到Word文档。 (二)用表中1950和1980两年三类产品的出口金额占总金额的百分比,分别绘制两幅饼图, 然后将图复制到Word文档; (三)用1950、1960、1970、1980四年三类产品出口金额绘制折线图, 然后将图复制到Word文档。 (四)将以上一张表、三幅图联系起来,结合我国当时的历史背景写一篇300字左右的统计分析报告。 (一)

(二)1950: 1980: (三)

(四) 总结 建国初期,我国对外贸易仅限于原苏联和东欧等前社会主义国家,对外贸易规模极其有限,基本上处于封闭半封闭状态。1950年,出口额极少,以农副产品为主的出口占我国出口总额的百分之五十八,而工矿产品的出口极少只占百分之九。随着经济发展,出口额增长,工矿产品的出口额增长迅速,而出口产品以农副产品加工品为主。改革开放以来,我国走上了对外开放之路,从大规模“引进来”到大踏步“走出去”,一跃而成为世界对外贸易大国。工矿产品的出口量急剧增长,以工矿产品为主的出口额占总出口额的百分之五十,而农副产品的出口持续减少。

通过office软件制图分析可以清楚明确的看出我国出口经济的发展情况,通过对比可以发现,我国在改革开放之后出口经济大力发展,并以农副产品向工矿产品转变,并以工矿产品为主的出口经济产生。

数理统计学实验报告 院:理学院 专业:统计学班级:1301 学号:33 学生姓名:孙思敏 指导教师姓名:王剑君 实验日期:2015-5-26 实验2 一、统计分组与直方图 某市50家商城某年营业额如下:(单位:百万元)

数理统计实验

§13.6 概率统计实验 [学习目标] 1. 会用Mathematica 求概率、均值与方差; 2. 能进行常用分布的计算; 3. 会用Mathematica 进行期望和方差的区间估计; 4. 会用Mathematica 进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica 自带的统计程序包,其中有实现常用统计计算的各种外部函数。 一、 样本的数字特征 1. 一元的情况 Mathematica 的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic 程序包子集中,位于目录 D :\Mathematica\4.0\AddOns\StandardPackages\Statistics 下。通过查看Help ,可以找到包含所需外部函数的程序文件名。 在程序文件DescriptiveStatistics.m 中,含有实现一元数理统计基本计算的函数,常用的有: SampleRange[data] 求表data 中数据的极差(最大数减最小数)。 Median[data] 求中值。 Mean[data] 求平均值∑=n i i x n 1 1。 Variance[data] 求方差(无偏估计)∑=--n i i x x n 1 2)(11。 StandardDeviation[data] 求标准差(无偏估计)∑=--n i i x x n 12)(11。 VarianceMLE[data] 求方差∑=-n i i x x n 1 2)(1。 StandardDeviationMLE[data] 求标准差∑=-n i i x x n 1 2)(1。 实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help 浏览。 例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、 最小值、均值、方差、标准差等。 解:In[1]:= << Statistics `DescriptiveStatistics` In[2]:= data = {6.5,3.8,6.6,5.7,6.0,6.4,5.3};

天津理工大学概率论与数理统计第五章习题答案详解

第 5 章 大数定律与中心极限定理 一、 填空题: 1.设随机变量μξ=)(E ,方差2 σξ=)(D ,则由切比雪夫不等式有≤≥-}|{|σμξ3P 9 1 . 2.设n ξξξ,,, 21是 n 个相互独立同分布的随机变量, ),,,(,)(,)(n i D E i i 218===ξμξ对于∑== n i i n 1ξξ,写出所满足的切彼雪夫不等式 2 28εεξεμξn D P =≤ ≥-)(}|{| ,并估计≥ <-}|{|4μξP n 21 1- . 3. 设随机变量129,,,X X X 相互独立且同分布, 而且有1i EX =, 1(1,2,,9)i DX i == , 令9 1 i i X X ==∑, 则对任意给定的0ε>, 由切比雪夫不等式 直接可得{} ≥<-ε9X P 2 9 1ε- . 解:切比雪夫不等式指出:如果随机变量X 满足:()E X μ=与2()D X σ=都存在, 则对任意给定的0ε>, 有 22{||}P X σμεε-≥≤, 或者2 2{||}1.P X σμεε -<≥- 由于随机变量129,,,X X X 相互独立且同分布, 而且有 1,1(1,2,9),i i EX DX i === 所以 99 9111()()19,i i i i i E X E X E X μ===??===== ???∑∑∑ 99 9 2 111()()19.i i i i i D X D X D X σ===??===== ???∑∑∑ 4. 设随机变量X 满足:2 (),()E X D X μσ==, 则由切比雪夫不等式, 有{||4}P X μσ-≥ 1 16 ≤ . 解:切比雪夫不等式为:设随机变量X 满足2 (),()E X D X μσ==, 则对任意 的0ε>, 有22{||}.P X σμεε-≥≤由此得 221 {||4}.(4)16 P X σμσσ-≥≤=

概率论与数理统计实验报告

概率论与数理统计 实验报告 概率论部分实验二 《正态分布综合实验》

实验名称:正态分布综合实验 实验目的:通过本次实验,了解Matlab在概率与数理统计领域的应用,学会用matlab做概率密度曲线,概率分布曲线,直方图,累计百分比曲线等简单应用;同时加深对正态分布的认识,以更好得应用之。 实验内容: 实验分析: 本次实验主要需要运用一些matlab函数,如正态分布随机数发生器normrnd函数、绘制直方图函数hist函数、正态分布密度函数图形绘制函数normpdf函数、正态分布分步函数图形绘制函数normcdf等;同时,考虑到本次实验重复性明显,如,分别生成100,1000,10000个服从正态分布的随机数,进行相同的实验操作,

故通过数组和循环可以简化整个实验的操作流程,因此,本次实验程序中要设置数组和循环变量。 实验过程: 1.直方图与累计百分比曲线 1)实验程序 m=[100,1000,10000]; 产生随机数的个数 n=[2,1,0.5]; 组距 for j=1:3 for k=1:3 x=normrnd(6,1,m(j),1); 生成期望为6,方差为1的m(j)个正态分布随机 数 a=min(x); a为生成随机数的最小值 b=max(x); b为生成随机数的最大值 c=(b-a)/n(k); c为按n(k)组距应该分成的组数 subplot(1,2,1); 图形窗口分两份 hist(x,c);xlabel('频数分布图'); 在第一份里绘制频数直方图 yy=hist(x,c)/1000; yy为各个分组的频率 s=[]; s(1)=yy(1); for i=2:length(yy) s(i)=s(i-1)+yy(i); end s[]数组存储累计百分比 x=linspace(a,b,c);

数理统计第五章

第五章 1.通过原点的一元回归的线性模型为i i i Y x βε=+,1,2,,i n =??? 其中各i ε相互独立,并且都服从正态分布()2 0,N σ 。试由n 组观测值(),i i x y ,1,2,,i n =???,用最小二乘法估计 β,并用矩法估计2 σ。 解: 对一元回归的线性模型为i i i Y x βε=+ i n = ??? 离差平方和为 ()2 1 n i i i Q y x β== -∑ 对Q 求β的偏导数,并令其为0,即 ()1 0n i i i i y x x β=-=∑ 变换得 2 1 1 1 1n n i i i i i x y x n n β=== ∑∑ 解此方程得 2 xy x β∧ = 因为 22D E σεε== i i i y x εβ=- 所以 2 2 1 1n i i i y x n σβ∧∧ =??= - ??? ∑ () () () 22212 2 22 2 2 2 222 1222 n i i i i i y x y x n y xy x xy xy x y x x ββββ∧∧=∧ ∧??= -+ ???=-+=-+ ∑ () 2 2 2 xy y x =- 其中 1 1 n i i i xy x y n == ∑ 2 2 1 1 n i i x x n == ∑ 2 2 1 1 n i i y y n == ∑

2.在考察硝酸钠的可溶性程度时,对一系列不同温度观察它在100m l 的水中溶解的硝酸钠的重量,获得观察结果如下: 从经验和理论知i Y 和i x 之间有下述关系式i i i Y x αβε=++,1,2,,9i =??? 其中各i ε相互独立,并且都服从正态分布()2 0,N σ。试用最小二乘法估计参数,αβ ,并 用矩法估计2σ。 解: 将 26x = 90.14y = 2736.511xy = 2 451.11x m = 2 342.665 y m = 代入得 22 2 2 2 2 2736.51126 90.14 0.8706 451.11 90.140.870626 67.5088 342.665 0.8706 451.11 0.7487 x y x xy x y m y x m m βαβσ β∧ ∧ ∧ ∧ ∧--?= = ==-=- ?==-=-?= 3.为了得到一元线性回归分析的简化计算法,作变换101 ,,1,2,,, i i i i x c y c u v i n d d --= = =???且010,0d d ≠≠。若原经验回归直线方程为y x αβ∧ ∧ ∧ =+变换后经验回归直线方程为 ' ' v u αβ∧ ∧∧=+试证' ' ' 000011 1 ,d d d c c d d ββααβ∧ ∧∧ ∧∧= =+- ,并且 2 2 ''2 01 1 n n i i i i i i y x d v u αβαβ∧∧ ∧∧==?? ? ?--=-- ? ?? ??? ∑∑ 证明: ' 002 2 1 1 d d uv u v d d u u β∧-= - ()() () 01 2 1 1 n i i i n i i u u v v d d u u ==--= -∑∑

【生物数学】数理统计实验

第十一章数理统计实验 11.1 Excel基本操作 11.1.1 单元格操作 1. 单元格的选取 Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示. 2. 选取单元格范围(矩形区域) 可以按如下两种方式选取单元格范围. (1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可. (2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键. 3. 选取特殊单元格 在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况. 第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可. - 300 -

第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可. 4. 公式中的数值计算 要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号. 提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式. (2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式. 公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和. =(B4+25)/SUM(D5:F5) 5. 公式中的语法 公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel 从等号(=)开始,从左到右计算公式.可以通过修改公式语法来控制计算的顺序.例如,公式=5+2*3的结果为11,将2 乘以3(结果是6),然后再加上5.因为Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括 - 300 -

概率论与数理统计第五章习题解答.dot资料

第五章 假设检验与一元线性回归分析 习题详解 5.01 解:这是检验正态总体数学期望μ是否为32.0 提出假设:0.32:, 0.32:10≠=μμH H 由题设,样本容量6n =, 21.12=σ,1.121.10==σ,所以用U 检验 当零假设H 0成立时,变量:)1,0(~61 .10 .320 N X n X U -= -= σμ 因检验水平05.0=α,由05.0}|{|=≥λU P ,查表得96.1=λ 得到拒绝域: 96.1||≥u 计算得: 6.31)6.318.310.326.310.306.32(6 1=+++++?=x 89.061 .10 .326.310 0-=-= -= n x u σμ 因 0.89 1.96u =< 它没有落入拒绝域,于是不能拒绝H 0,而接受H 0,即可以认为 0.32=μ,所以可以认为这批机制砖的平均抗断强度μ显著为 32.0kg/cm 2。 5.02 解:这是检验正态总体数学期望μ是否大于10 提出假设:10:, 10:10>≤μμH H 即:10:, 10:10>=μμH H 由题设,样本容量5n =,221.0=σ,1.01.020==σ,

km x 万1.10=,所以用U 检验 当零假设H 0成立时,变量:)1,0(~51 .010 N X n X U -= -= σμ 因检验水平05.0=α,由05.0}{='≥λU P ,查表得64.1'=λ 得到拒绝域: 64.1≥u 计算得: 24.251 .010 1.100 =-= -= n x u σμ 因 2.24 1.64u => 它落入拒绝域,于是拒绝零假设 H 0,而接受备择假设H 1,即可认为10>μ 所以可以认为这批新摩托车的平均寿命μ有显者提高。 5.03 解:这是检验正态总体数学期望μ是否小于240 提出假设:240:,240:10<≥μμH H 即:240:, 240:10<=μμH H 由题设,样本容量6n =,6252=σ,256250==σ,220=x ,所以用U 检验 当零假设H 0成立时,变量:)1,0(~625 240 N X n X U -= -= σμ 因检验水平05.0=α,由05.0}{='-≤λU P ,查表得64.1'=λ 得到拒绝域: 64.1-≤u 计算得:959.1625 240 2200 -=-= -= n x u σμ 因 1.959 1.64u =-<-

第五节数理统计的基础知识

第五章数理统计的基础知识 在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。 但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。 例如:1、某种电子元件的寿命服从什么分布是完全不知道的。 2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1) 分布,但其中的参数p未知。 对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。 数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。 数理统计研究的内容非常广泛,可分为两大类: 一是:怎样有效地收集、整理有限的数据资料。 二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。 第一节数理统计的基本概念 一、总体与总体的分布 在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系. 在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。 例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。 但在实际问题中,我们仅仅关心灯泡的使用寿命(记X表示该批灯泡的寿命)。则X就是我们研究的总体(所有灯泡寿命的集合),每一个灯泡的寿命就是一个个体。 再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。 由此给出定义: 总体:对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。 个体:每一个可能的观测值称为个体。 对不同的个体,X的取值一般是不同的。例如在试验中观察若干个个体就会得到X的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X是一个随机变量或随机向量,而X的分布也就完全描述了我们所关心的指标,即总体的分布。 为方便起见,以后我们将X的可能取值的全体组成的集合称为总体,或直接称随机变量X为总体,X的分布也就是总体的分布。 例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。

概率论与数理统计数学实验

概率论与数理统计数学实验 目录 实验一几个重要的概率分布的MATLAB实现 p2-3 实验二数据的统计描述和分析 p4-8 实验三参数估计 p9-11 实验四假设检验 p12-14 实验五方差分析 p15-17 实验六回归分析 p18-27实验一几个重要的概率分布的MATLAB实现 实验目的 (1) 学习MATLAB软件与概率有关的各种计算方法 (2) 会用MATLAB软件生成几种常见分布的随机数 (3) 通过实验加深对概率密度,分布函数和分位数的理解 Matlab统计工具箱中提供了约20种概率分布,对每一种分布提供了5种运算功能,下表给出 了常见8种分布对应的Matlab命令字符,表2给出了每一种运算功能所对应的Matlab命令字符。 当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。 N,在x=处的概率密度。 例1 求正态分布()2,1- 解:在MATLAB命令窗口中输入: normpdf,-1,2) 结果为:

例2 求泊松分布()3P ,在k=5,6,7处的概率。 解:在MATLAB 命令窗口中输入: poisspdf([5 6 7],3) 结果为: 例3 设X 服从均匀分布()3,1U ,计算{}225P X .-<<。 解:在MATLAB 命令窗口中输入: unifcdf,1,3)-unifcdf(-2,1,3) 结果为: 例4 求概率995.0=α 的正态分布()2,1N 的分位数αX 。 解:在MATLAB 命令窗口中输入: norminv,1,2) 结果为: 例5 求t 分布()10t 的期望和方差。 解:在MATLAB 命令窗口中输入: [m,v]=tstat(10) m = 0 v = 例6 生成一个2*3阶正态分布的随机矩阵。其中,第一行3个数分别服从均值为1,2,3;第二行3个数分别服从均值为4,5,6,且标准差均为的正态分布。 解:在MATLAB 命令窗口中输入: A=normrnd([1 2 3;4 5 6],,2,3) A = 例7 生成一个2*3阶服从均匀分布()3,1U 的随机矩阵。 解:在MATLAB 命令窗口中输入: B=unifrnd(1,3,2,3) B =

浙大版概率论与数理统计答案---第五章

第五章 大数定律及中心极限定理 注意: 这是第一稿(存在一些错误) 1、 解(1)由于{0}1P X ≥=,且()36E X =,利用马尔科夫不等式,得 () {50}0.7250 E X P X ≥≤ = (2)2 ()2D X =,()36E X =,利用切比雪夫不等式,所求的概率为: 223 {3240}1(364)10.75164 P X P X <<=--≥≥-== 2、解:()500,0.1i X B :, 500500121 1500111610%5%192.8%5000.05125i i i i D X P X ==?? ???? ?-<≥-==???? ∑∑ 3、 解 ξ服从参数为的几何分布,1 1(),(2,3,4)2n P n n ξ-?? === ? ?? L 可求出2 ()()3,()2n E nP n D ξξξ∞ == ===∑ 于是令 ()2 a b E ξ+=,2b a ε-=,利用切比雪夫不等式,得 有2 () ()1(())175%D P a b P E ξξξξεε <<=--≥≥-= 从而可以求出()3()3a E b E εξεξε==-=-=+=+4、解:()()()() ()() () 1,,n n n X n n n x F x P X x P X x X x F x a =≤=≤≤==L ,()0,x a ∈。 则() ()()() ()1 1 n n n X n nx p x n F x p x a --==,()0,x a ∈。 ()()10 1 n n a X n nx n E x x dx a a n -=?=+? , ()()()() 2 12 22 121n n a X n nx n n D x x dx a a a n n n -??=?-= ?+??++? 。

数理统计学实验报告

数理统计学实验报告院: 专业:班级:学号: 学生姓名: 指导教师姓名: 实验日期: 实验1 1950~1983年我国三类产品出口总额及其构成 年份出口总额其中

用表中的资料,按以下要求绘制图表: (一)用表中1950、1960、1970、1980四年三类产品的出口金额绘制分组柱形图,然后将图复制到Word文档。 (二)用表中1950和1980两年三类产品的出口金额占总金额的百分比,分别绘制两幅饼图, 然后将图复制到Word文档; (三)用1950、1960、1970、1980四年三类产品出口金额绘制折线图, 然后将图复制到Word文档。 (四)将以上一张表、三幅图联系起来,结合我国当时的历史背景写一篇300字左右的统计分析报告。 (一)

(二)1950:

1980: (三) (四) 总结

建国初期,我国对外贸易仅限于原苏联和东欧等前社会主义国家,对外贸易规模极其有限,基本上处于封闭半封闭状态。1950年,出口额极少,以农副产品为主的出口占我国出口总额的百分之五十八,而工矿产品的出口极少只占百分之九。随着经济发展,出口额增长,工矿产品的出口额增长迅速,而出口产品以农副产品加工品为主。改革开放以来,我国走上了对外开放之路,从大规模“引进来”到大踏步“走出去”,一跃而成为世界对外贸易大国。工矿产品的出口量急剧增长,以工矿产品为主的出口额占总出口额的百分之五十,而农副产品的出口持续减少。 通过office软件制图分析可以清楚明确的看出我国出口经济的发展情况,通过对比可以发现,我国在改革开放之后出口经济大力发展,并以农副产品向工矿产品转变,并以工矿产品为主的出口经济产生。

数理统计第5章部分习题解答

第五章习题 5.1.假设X 和Y 为随机变量,且满足E [X ]=-2, E [Y ]=2, Var[X ]=1, Var[Y ]=9, X 与Y 的相关系数,X Y r =-0.5.试由切比雪夫不等式确定满足不等式{6}P X Y +≥c ≤的最小正数c 之值. 解: 因为 {][][]220 [][][]2cov(,) [][]2(,E X Y E X E Y Var X Y Var X Var Y X Y Var X Var Y r X Y +=+=-+=+=++=++ 192(0.5)7=++?-=. 2[] (()[]6)6Var X Y P X Y E X Y ++-+≥≤由切比雪夫不等式:,有 2 77 (6)=636 P X Y +≥≤ . 得 7 36 c =. 5.2.设12,X X 为随机变量且0, []1(1,2)i i EX Var X i ===. 证明:对任意的0,λ>有2 2 121 {2}P X X λλ +≥≤ . 证明: 不妨设12(,)X X 为二维连续型随机变量,其密度函数为12,X X f . 由于1222221 2 ,[]()(,)X X E X X x y f x y dxdy +∞+∞ -∞ -∞ += +?? , 1212222222 221 2,,22(2)(,)(,)2X X X X x y x y x y P X X f x y dxdy f x y dxdy λ λ λλ +≥+≥++≥= ≤ ?? ?? 1222 ,22221212221122(,)2111[][][]22211([]([]))([]([]))22X X x y f x y dxdy E X X E X E X Var X E X Var X E X λλλλλλ+∞ +∞ -∞-∞+≤=+=+=+++?? 111 (10)(10)22λλλ =+++=.

数理统计实验报告材料

实验课程数理统计实验地点数学专业实验室时间 2014.11.30 班级 姓名学号 成绩指导老师 太原工业学院理学系

实验一描述性统计 【实验目的】 熟悉Excel软件在数理统计中的应用; 【实验内容】 一.熟悉办公软件Excel中数据分析工具箱里的描述性统计分析; 二.会绘制直方图表并进行分析。 【实验所使用的仪器设备与软件平台】 计算机 Excel2003 【实验方法与步骤】 选取一个例子,查看常见的统计量,并绘制直方图。(参数自己设定)。 (1)求平均月薪; (2)求最低月薪和最高月薪; (3)构造该批数据的频率分布表(分6组); (4)画出直方图; (5)求出处于中间50%的月薪范围 【实验结果及分析】

所以:(1).平均月薪: 1044.333 (2).最低月薪为:738,最高月薪:157 (3). 738 频率累积 % 850 4 13.33% 1000 10 46.67% 1150 9 76.67% 1300 4 90.00% 1450 2 96.67% 其他 1 100.00% (4). (5). 四分位数最小值738 第一个四分位数923 中位数1034.5 第三个四分位数1127.5 最大值1572 中间50%的月薪范围是923~1127.5

实验二单个正态总体参数的区间估计 【实验目的】 熟悉Excel软件在数理统计中的应用 【实验内容】 一.熟悉办公软件Excel中数据分析工具箱里的区间估计; 二.进行单整体总体参数的区间估计。 【实验所使用的仪器设备与软件平台】 计算机 Excel2003 【实验方法与步骤】 选取一个例子,进行单个正态总体参数的区间估计。 已知某种材料的抗压强度X~N(μ,σ2),现随机抽取10个试件进行抗压 (2)求σ2的置信水平为0.95的置信区间. 【实验结果及分析】 (1) 列1 平均457.5 标准误差11.13678 中位数463 众数#N/A 标准差35.21758 方差1240.278 峰度-0.28669 偏度-0.38939 区域116 最小值394 最大值510 求和4575 观测数10 最大(1) 510

数理统计——假设检验

解:由题意可知,样本数据来自于服从指数分布的总体假设检验:H0:θ≥1100,H1:θ<1100;α=0.05 其拒绝域的形式为:χ2≤χ2α2n=χ20.0520=31.41 统计量为χ2=2nx θ=20?942.8 1100 =17.14<31.41 所以拒绝H0,所以不能够认为这批货物平均寿命不低于1100h 程序代码: function [ d ] = kaf( A,T,a ) %UNTITLED2 Summary of this function goes here % Detailed explanation goes here n=length(A); c=sum(A)/n; x=chi2inv(1-a,n); X=2*n*c/T; if x

解:假设检验:H0:μ≥μ0=1000,H1:μ<μ0;α=0.05 因为本题是左侧检验问题,故其拒绝域为:Z=0 σ/n ≤?z0.025=?1.96 而统计量Z=0 σ/n = 100/24 =-3.9754<-1.96 所以拒绝H0 程序代码:function [ d ] = kaf( A,u,a,s ) %UNTITLED2 Summary of this function goes here % Detailed explanation goes here n=length(A); c=sum(A)/n; z=norminv(a/2); Z=(c-u)*sqrt(n)/s; if z

数理统计第一次实验报告

一.实验题目 实验1:经验分布函数 (1)取25=1μσ=及,n=100,产生n 个服从()2,N μσ分布的随机数作为取自正态总体()2,N μσ的样本值1,,n x x L ,在同一坐标下画出它的经验分布函数,并与总体分布函数进行比较。 (2)改变n ,重做实验(1),体会格列文科定理的内涵。 实验2:直方图 假定某班60个男生身高(单位:cm ),数据如下: 166,169,181,173,165,169,170,163,175,164,171,162,156,159,173,168,167,165,172,170,180,177,161,170,164,163,172,167,157,165,168,174,165,168,162,163,159,163,167,173,161,160,165,160,173,164,166,152,163,164,176,160,164,167,158,172,167,168,167,170 现在希望通过这些数据来确定该班身高的分布。 解:基本步骤: 第一步:找出数据的最大值181,最小值152,极差R=181-152=29; 第二步:分组定组距。分组没有通用原则,通常数据个数50n ≥时,分成10组以上,当50n ≤时,一般5组左右。分组数m 确定后,可按1 R R d m m <≤ -来确定组距d 。 第三步:定分点,定区间: 取起点a=151.5,终点181.5,从而作图区间为[151.5,181.5](取各组的边界值比身高多一位小数,为的是使每个身高都落在一个组的内部)。 第四步:列出样本值落入各组的频数和频率。 第五步:做频率直方图。 直方图是最常用的一种表现数据的方法,它通常把值域分成若干相等的区间,于是数据就按区间分成若干组,每组做成一个矩形,其高和该组中数据的多少成比例,其底为所属区间,这些矩形就是直方图,它给数据的分布一个直观的形象。直方图以组距为底,以频率为高作矩形。 可以想象,若得到的数据很多,这时,直方图的分组增多,组距变得很小,

概率论与数理统计实验报告

电子31 JL21405106 杨路生 概率论与数理统计 实验报告 1:n个人中至少有两人生日相同的概率是多少?通过计算机模拟此结果。 n个人生日的组合为a=365^n,n个人中没有生日相同的组合为b=365*364*......*(365-n+1),则n个人中至少有两个人生日相同的概率为1-b/a。 编程: n=input('请输入总人数n='); a=365^n; m=n-1; b=1; for i=0:1:m b=b*(365-i); end f=1-b/a 输出结果:(令n=50)

结果:当人数为50人时,输出结果为0.9704,此即说明50人中至少有两人生日相同的概率为0.9704。 2:设x~N(μ,σ2),(1)当μ=1.5,σ=0.5时,求p{1.8

概率论与数理统计第五章课后习题及参考答案

概率论与数理统计第五章课后习题及参考答案 1.用切比雪夫不等式估计下列各题的概率. (1)废品率为03.0,1000个产品中废品多于20个且少于40个的概率; (2)200个新生儿中,男孩多于80个而少于120个的概率(假设男孩和女孩的概率均为5.0). 解:(1)设X 为1000个产品中废品的个数,则X ~)1000,03.0(B ,有 30)(=X E ,1.29)(=X D , 由切比雪夫不等式,得 ) 3040303020()4020(-<-<-=<

相关文档
最新文档