数学建模课后作业第六章

第六章.数理统计实验

6.2 基本实验

1.区间估计

解：（1）由点估计与参数估计未知参数μ和σ^2,可以求出均值与方差；

由题目条件可以得出如下的R程序：

> x<-c(1067,919,1196,785,1126,936,918,1156,920,948)

> n<-length(x)

> x.sd<-sd(x)

> x.mean<-mean(x); x.mean

[1] 997.1

> x.var<-sum((x-x.mean)^2)/n; x.var

[1] 15574.29

即μ=997.1，σ^2=15574.29

令大约95%的灯泡至少使用的时间为x小时，可以得出如下的等式：由标准正态分布表可以得出：

Ф（

x?μδ

）=0.05,可以得出

x?μ

=-1.645可以得出x=791.809小时。

（2）当使用时间至少为1000小时：查阅标准正态分布表可以得出对应的概率为1-Ф（1000?μ

）=1-Ф（

1000?997.1124.797

）=1-Ф

（0.02324）=1-0.5106=0.4894

即由题可以得出使用时间在1000小时以上的概率为48.94%。 2.假设检验I

解：对于自然状态下的男子血小板的数目可以假设服从于正态分布，由点估计与参数估计未知参数μ和σ^2,可以求出均值、均值区间与方差；

x<-c(113,126,145,158,160,162,164,175,183,188,188,190,220,224,230,231,238,245,247,256) > n<-length(x) > x.sd<-sd(x)

> x.mean<-mean(x); x.mean [1] 192.15

> x.var<-sum((x-x.mean)^2)/n; x.var [1] 1694.728

> tmp<-x.sd/sqrt(n)*qt(1-0.05/2,n-1)

> a<-x.mean-tmp;a

[1] 172.3827

> b<-x.mean+tmp;b

[1] 211.9173

可以得出均值为μ= 192.15，方差σ^2=1694.728；

均值区间为（172.3827,211.9173）由此可以得出对于油漆工人而言正常男子血小板数为225单位，油漆工人明显低于正常的数量，则可以得知结论油漆作业对人体血小板数量有严重影响。

3.假设实验II

解（1

可以得到如下的R程序：

> x<-c(113,120,138,120,100,118,138,123)

> y<-c(138,116,125,136,110,132,130,110)

> t.test(x,y,var.equal=TRUE)

Two Sample t-test

data: x and y

t = -0.566, df = 14, p-value = 0.5804

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-16.164884 9.414884

sample estimates:

mean of x mean of y

121.250 124.625

的双侧置信区间为[-16.164884，9.414884]。因为0在置信区间内（或者因为p-value=0.5248>0.05），所以可以认为实验组与对照组的均值没有显著差异。

（2）当两组疗法的方差未知时;

可以得出对应的R程序分析

补充铁剂疗法：

> x<-c(113,120,138,120,100,118,138,123)

> y<-c(138,116,125,136,110,132,130,110)

> var.test(x,y)

F test to compare two variances

data: x and y

F = 1.2278, num df = 7, denom df = 7, p-value = 0.7935 alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

0.2458103 6.1327511

sample estimates:

ratio of variances

1.2278

程序运行结果表明，饮食疗法与补充铁剂疗法的方差比置信度为0.95的置信区间为[0.2458103，6.1327511]；因为1在置信区间内，故认为实验组与对照组的方差是相同的。

（3）由成对数据模型，可以得出如下的问题分析：

> x<-c(113,120,138,120,100,118,138,123)

> ks.test(x,"pnorm",mean=mean(x),sd=sqrt(var(x)))

One-sample Kolmogorov-Smirnov test

data: x

D = 0.1944, p-value = 0.9229

alternative hypothesis: two-sided

警告信息：

In ks.test(x, "pnorm", mean = mean(x), sd = sqrt(var(x))) : Kolmogorov - Smirnov检验里不应该有连结

程序运行结果表明，p-value为0.9229>0.05，可以认为检验数据来自正态分布的总体。

饮食疗法：

> y<-c(138,116,125,136,110,132,130,110)

> ks.test(x,"pnorm",mean=mean(x),sd=sqrt(var(x)))

One-sample Kolmogorov-Smirnov test

data: x

D = 0.1944, p-value = 0.9229

alternative hypothesis: two-sided

警告信息：

In ks.test(x, "pnorm", mean = mean(x), sd = sqrt(var(x))) : Kolmogorov - Smirnov检验里不应该有连结

程序运行结果表明，p-value为0.9229>0.05，可以认为检验数据来自正态分布的总体。

问题分析:通过Kolmogorov-Smirnov检验来检验：

> x<-c(113,120,138,120,100,118,138,123)

> y<-c(138,116,125,136,110,132,130,110)

> ks.test(x,y)

Two-sample Kolmogorov-Smirnov test

data: x and y

D = 0.375, p-value = 0.6272

alternative hypothesis: two-sided

警告信息：

In ks.test(x, y) : 无法精確計算带连结的p值

p-value为0.6272>0.05，故认为两方法的效果相同

综上可以得知第三种分析方法比较精确而且考虑到了其他的情况，可以认为结果比较真实可靠。

4.假设实验III

解:二项分布总体的假设检验

令 H0：P=P0=14.7%，H1：P≠14.7%

> binom.test(57,400,p=0.147)

Exact binomial test

data: 57 and 400

number of successes = 57, number of trials = 400, p-value = 0.8876

alternative hypothesis: true probability of success is not equal to 0.147

95 percent confidence interval:

0.1097477 0.1806511

sample estimates:

probability of success

0.1425

程序运行结果表明，p-value = 0.8876>0.05，所以接受原假设，认为该市老年人口比重为14.7%。

5.分步检验I

=9.84375

16：3.15625

：3.375

：1

此问题可以用Pearson

> chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)

Chi-squared test for given probabilities

data: c(315, 101, 108, 32)

X-squared = 0.47, df = 3, p-value = 0.9254

程序运行结果表明，p-value = 0.9254>0.05，可以认为此结果是符合自由组合规律的。

6.分步检验II

解：由题目可以得出如下的R程序：

> X<-0:5;Y<-c(92,68,28,11,1,0)

> q<-ppois(X, mean(rep(X,Y)));

> n<-length(Y)

> p<-numeric(n);

> p[1]<-q[1];

> p[n]<-1-q[n-1];

> for (i in 2:(n-1))

+ p[i]<-q[i]-q[i-1]

> chisq.test(Y,p=p)

Chi-squared test for given probabilities

data: Y

X-squared = 2.1596, df = 5, p-value = 0.8267

警告信息：

In chisq.test(Y, p = p) : Chi-squared近似算法有可能不准

5，而后两组中出现的频数是1，0，均小于5。

> Z<-c(92,68,28,12)

> n<-length(Z); p<-p[1:n-1]; p[n]<-1-q[n-1]

> chisq.test(Z,p=p)

Chi-squared test for given probabilities

data: Z

X-squared = 0.9113, df = 3, p-value = 0.8227

由此可以得知p-value = 0.8227>>0.1，因此，能认为每分钟顾客人数X服从Poisson分布。

7.列联表检验 I

解：对此作2x2列联表作独立性检验；

可以得出如下的R程序：

> x<-c(358,229,2492,2745)

> dim(x)<-c(2,2)

> chisq.test(x,correct = FALSE)

Pearson's Chi-squared test

data: x