数学建模课后作业第六章
第六章.数理统计实验
6.2 基本实验
1.区间估计
解:(1)由点估计与参数估计未知参数μ和σ^2,可以求出均值与方差;
由题目条件可以得出如下的R程序:
> x<-c(1067,919,1196,785,1126,936,918,1156,920,948)
> n<-length(x)
> x.sd<-sd(x)
> x.mean<-mean(x); x.mean
[1] 997.1
> x.var<-sum((x-x.mean)^2)/n; x.var
[1] 15574.29
即μ=997.1,σ^2=15574.29
令大约95%的灯泡至少使用的时间为x小时,可以得出如下的等式:由标准正态分布表可以得出:
Ф(
x?μδ
)=0.05,可以得出
x?μ
σ
=-1.645可以得出x=791.809小时。
(2)当使用时间至少为1000小时:查阅标准正态分布表 可以得出对应的概率为1-Ф(1000?μ
δ
)=1-Ф(
1000?997.1124.797
)=1-Ф
(0.02324)=1-0.5106=0.4894
即由题可以得出使用时间在1000小时以上的概率为48.94%。 2.假设检验I
解:对于自然状态下的男子血小板的数目可以假设服从于正态分布,由点估计与参数估计未知参数μ和σ^2,可以求出均值、均值区间与方差;
x<-c(113,126,145,158,160,162,164,175,183,188,188,190,220,224,230,231,238,245,247,256) > n<-length(x) > x.sd<-sd(x)
> x.mean<-mean(x); x.mean [1] 192.15
> x.var<-sum((x-x.mean)^2)/n; x.var [1] 1694.728
> tmp<-x.sd/sqrt(n)*qt(1-0.05/2,n-1)
> a<-x.mean-tmp;a
[1] 172.3827
> b<-x.mean+tmp;b
[1] 211.9173
可以得出均值为μ= 192.15,方差σ^2=1694.728;
均值区间为(172.3827,211.9173)由此可以得出对于油漆工人而言正常男子血小板数为225单位,油漆工人明显低于正常的数量,则可以得知结论油漆作业对人体血小板数量有严重影响。
3.假设实验II
解(1
可以得到如下的R程序:
> x<-c(113,120,138,120,100,118,138,123)
> y<-c(138,116,125,136,110,132,130,110)
> t.test(x,y,var.equal=TRUE)
Two Sample t-test
data: x and y
t = -0.566, df = 14, p-value = 0.5804
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-16.164884 9.414884
sample estimates:
mean of x mean of y
121.250 124.625
的双侧置信区间为[-16.164884,9.414884]。因为0在置信区间内(或者因为p-value=0.5248>0.05),所以可以认为实验组与对照组的均值没有显著差异。
(2)当两组疗法的方差未知时;
可以得出对应的R程序分析
补充铁剂疗法:
> x<-c(113,120,138,120,100,118,138,123)
> y<-c(138,116,125,136,110,132,130,110)
> var.test(x,y)
F test to compare two variances
data: x and y
F = 1.2278, num df = 7, denom df = 7, p-value = 0.7935 alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2458103 6.1327511
sample estimates:
ratio of variances
1.2278
程序运行结果表明,饮食疗法与补充铁剂疗法的方差比置信度为0.95的置信区间为[0.2458103,6.1327511];因为1在置信区间内,故认为实验组与对照组的方差是相同的。
(3)由成对数据模型,可以得出如下的问题分析:
> x<-c(113,120,138,120,100,118,138,123)
> ks.test(x,"pnorm",mean=mean(x),sd=sqrt(var(x)))
One-sample Kolmogorov-Smirnov test
data: x
D = 0.1944, p-value = 0.9229
alternative hypothesis: two-sided
警告信息:
In ks.test(x, "pnorm", mean = mean(x), sd = sqrt(var(x))) : Kolmogorov - Smirnov检验里不应该有连结
程序运行结果表明,p-value为0.9229>0.05,可以认为检验数据来自正态分布的总体。
饮食疗法:
> y<-c(138,116,125,136,110,132,130,110)
> ks.test(x,"pnorm",mean=mean(x),sd=sqrt(var(x)))
One-sample Kolmogorov-Smirnov test
data: x
D = 0.1944, p-value = 0.9229
alternative hypothesis: two-sided
警告信息:
In ks.test(x, "pnorm", mean = mean(x), sd = sqrt(var(x))) : Kolmogorov - Smirnov检验里不应该有连结
程序运行结果表明,p-value为0.9229>0.05,可以认为检验数据来自正态分布的总体。
问题分析:通过Kolmogorov-Smirnov检验来检验:
> x<-c(113,120,138,120,100,118,138,123)
> y<-c(138,116,125,136,110,132,130,110)
> ks.test(x,y)
Two-sample Kolmogorov-Smirnov test
data: x and y
D = 0.375, p-value = 0.6272
alternative hypothesis: two-sided
警告信息:
In ks.test(x, y) : 无法精確計算带连结的p值
p-value为0.6272>0.05,故认为两方法的效果相同
综上可以得知第三种分析方法比较精确而且考虑到了其他的情况,可以认为结果比较真实可靠。
4.假设实验III
解:二项分布总体的假设检验
令 H0:P=P0=14.7%,H1:P≠14.7%
> binom.test(57,400,p=0.147)
Exact binomial test
data: 57 and 400
number of successes = 57, number of trials = 400, p-value = 0.8876
alternative hypothesis: true probability of success is not equal to 0.147
95 percent confidence interval:
0.1097477 0.1806511
sample estimates:
probability of success
0.1425
程序运行结果表明,p-value = 0.8876>0.05,所以接受原假设,认为该市老年人口比重为14.7%。
5.分步检验I
=9.84375
16:3.15625
16
:3.375
16
:1
16
此问题可以用Pearson
> chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)
Chi-squared test for given probabilities
data: c(315, 101, 108, 32)
X-squared = 0.47, df = 3, p-value = 0.9254
程序运行结果表明,p-value = 0.9254>0.05,可以认为此结果是符合自由组合规律的。
6.分步检验II
解:由题目可以得出如下的R程序:
> X<-0:5;Y<-c(92,68,28,11,1,0)
> q<-ppois(X, mean(rep(X,Y)));
> n<-length(Y)
> p<-numeric(n);
> p[1]<-q[1];
> p[n]<-1-q[n-1];
> for (i in 2:(n-1))
+ p[i]<-q[i]-q[i-1]
> chisq.test(Y,p=p)
Chi-squared test for given probabilities
data: Y
X-squared = 2.1596, df = 5, p-value = 0.8267
警告信息:
In chisq.test(Y, p = p) : Chi-squared近似算法有可能不准
5,而后两组中出现的频数是1,0,均小于5。
> Z<-c(92,68,28,12)
> n<-length(Z); p<-p[1:n-1]; p[n]<-1-q[n-1]
> chisq.test(Z,p=p)
Chi-squared test for given probabilities
data: Z
X-squared = 0.9113, df = 3, p-value = 0.8227
由此可以得知p-value = 0.8227>>0.1,因此,能认为每分钟顾客人数X服从Poisson分布。
7.列联表检验 I
解:对此作2x2列联表作独立性检验;
可以得出如下的R程序:
> x<-c(358,229,2492,2745)
> dim(x)<-c(2,2)
> chisq.test(x,correct = FALSE)
Pearson's Chi-squared test
data: x