r语言与统计分析 第五章课后答案
学习使用R编程语言进行统计分析和数据建模

学习使用R编程语言进行统计分析和数据建模导论在现代数据分析和统计学中,R编程语言已经成为了一种非常受欢迎的工具。
它是一种免费开源的软件,具有强大的统计分析和数据建模功能。
本文将介绍如何学习使用R编程语言进行统计分析和数据建模,并探讨一些实际应用案例。
第一章:R语言的基础知识在开始学习R编程语言之前,我们首先要了解一些基础知识。
R语言是一种具有面向对象特性的编程语言,它可以用于数据处理、统计分析、数据可视化等领域。
在这一章节中,我们将介绍R语言的安装方法,基本语法,常用函数和数据结构等内容。
第二章:常用数据处理技巧数据处理是数据分析的第一步,它包括数据清洗、数据转换、数据合并等过程。
在R语言中,有许多常用的数据处理函数和技巧可以帮助我们完成这些任务。
在这一章节中,我们将介绍如何使用R语言对数据进行清洗和转换,以及如何使用函数和包来处理缺失值、异常值等常见问题。
第三章:统计分析方法R语言提供了众多的统计分析函数和方法,可以帮助我们进行描述统计、假设检验、方差分析等各种分析。
在这一章节中,我们将介绍如何使用R语言进行常见统计分析,如线性回归、逻辑回归、聚类分析等,并演示如何从结果中提取有用的信息。
第四章:数据可视化方法数据可视化是将数据转化为图形和图表的过程,有助于我们更好地理解和分析数据。
R语言提供了许多功能强大的数据可视化包,如ggplot2、lattice等。
在这一章节中,我们将介绍如何使用R语言进行数据可视化,并演示如何创建散点图、柱状图、折线图等图形。
第五章:高级数据建模技术除了基本的统计分析外,R语言还可以用于更高级的数据建模任务,如机器学习、深度学习等。
在这一章节中,我们将介绍一些常用的数据建模方法,如决策树、随机森林、神经网络等,并演示如何使用R语言构建和评估这些模型。
第六章:实际应用案例最后,我们将通过一些实际应用案例来展示R语言在统计分析和数据建模中的应用。
这些案例包括金融风险评估、医疗数据分析、市场营销策略等。
大数据基础--R语言(刘鹏《大数据》课后习题答案)

⼤数据基础--R语⾔(刘鹏《⼤数据》课后习题答案)1.R语⾔是解释性语⾔还是编译性语⾔? 解释性语⾔2.简述R语⾔的基本功能。
R语⾔是⼀套完整的数据处理、计算和制图软件系统,主要包括以下功能: (1)数据存储和处理功能,丰富的数据读取与存储能⼒,丰富的数据处理功能。
(2)数组运算⼯具 (3)完整连贯的统计分析⼯具 (4)优秀的统计制图功能3.R语⾔通常⽤在哪些领域? ⼈⼯智能、统计分析、应⽤数学、计量经济、⾦融分析、财经分析、⽣物信息学、数据可视化与数据挖掘等。
4.R语⾔常⽤的分类和预测算法有哪些? (1)K-近邻算法,如果⼀个样本与特征空间中的K个最相似(特征空间最近邻)的样本中的⼤多数属于某⼀个类别,则该样本也属于这⼀类别。
(2)决策树,是⼀种依托于分类、训练上的预测树,根据已知预测、归类未来。
(3)⽀持向量机,是⼀个⼆分类的办法,即将数据集中的数据分为两类。
5.简述如何利⽤R程序包进⾏数据分析、建模和数据预测。
数据集加载->数据集中的数据分析->⽆效数据处理->预测模型的构建->模型的评价与选择->实际需求预测->完成对应⽤需求的实现预测6.如何使⽤“聚类”和“分类”对数据样本进⾏分组。
“聚类”和“分类”都可以从历史数据纪录中⾃动推导出给定数据的推⼴描述,从⽽能对未来数据进⾏预测。
不同的是,“分类”算法需要⽤训练样本构造分类器,且样本数据集中的每个样本除了具有类别特征向量外,还需要类别标记。
⽽“聚类”的样本没有标记,需要由聚类学习算法来⾃动确定。
7.SparkR DataFrame的作⽤有哪些? (1)它允许数据科学家分析⼤规模数据集,并通过R Shell交互的在SparkR上运⾏作业。
(2)数据来源⾮常⼴泛,可处理多种类型数据。
(3)⾼拓展性,可以轻易⽤于TB级数据的处理及⽔平服务器的拓展。
(4)会查询优化器⾃动优化,可为计算加速制定智能的决策。
(5)对RDD API的⽀持,可⾼效地进⾏分布式数据计算与分析,解决⼤规模数据集带来的挑战。
《统计分析和SPSS的应用(第五版)》课后练习答案(第5章)

《统计分析和SPSS的应用(第五版)》(薛薇)课后练习答案第5章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;)采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异);单个样本统计量N 均值标准差均值的标准误成绩11 73.73 9.551 2.880单个样本检验检验值 = 75t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限成绩-.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。
《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)-精选版

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;)采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异);单个样本统计量N 均值标准差均值的标准误成绩11 73.73 9.551 2.880单个样本检验检验值 = 75t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限成绩-.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。
T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。
R语言编程基础 第5章 初级绘图

直方图 密度图 箱线图
小提琴图 条形图
分布 分布 分布
分布 分布
boxplot
vioplot barplot
dotchart
pie plot pairs corrgram
Cleveland点图
饼图 根据作图对象而异,最简 单的是散点图 散点图矩阵 相关图
分布
分布 关系(对散点图),图 形不同功能不同 关系 关系
4
常见的函数
QQ图 马赛克图 星状图 向日葵散点图 等高图 热图 假设检验 假设检验 突出特征 突出特征 聚类 聚类
qqplot mosaicplot stars sunflowerplot contour heatmap
5
分析数据分布情况
直方图
直方图(Histogram)又称质量分布图,是统计报告图的一种,由一系列高度不等的纵向条纹或者线段表 示数据分布的情况,一般用横轴表示数据所属类别,纵轴表示数量或者占比。用直方图可以比较直观地看 出产品质量特性的分布状态,便于判断其总体质量分布情况。
初级绘图
目录
1
2 3 4
绘制基础图形 修改图形参数 绘制组合图形
保存图形
2
绘制基础图形
分析数据第一件要做的事情就是观察它。对于每个变量需要注意的是最常见的值,值域,不寻常的观测, 多个变量的关系,是否符合模型假设等,R提供了丰富的数据可视化函数来展示数据。
3
常见的函数
函数 图形 功能
hist
数据点就被视作离群点,在图中直接以点的形式表示出来 箱子的宽度 箱子的宽度与样本量的平方根是否成比例,默认FALSE,不成比例,若 为TRUE则成比例 设置图形是否带刻槽,默认为FALSE,如果改为 TRUE则绘制矩阵样本 x 的带刻槽的凹盒图
统计建模与R软件第五章课后习题答案

统计建模与R软件第五章习题答案(假设检验)Ex5.1> x<-c(220, 188, 162, 230, 145, 160, 238, 188, 247, 113, 126, 245, 164, 231, 256, 183, 190, 158, 224, 175)> t.test(x,mu=225)One Sample t-testdata: xt = -3.4783, df = 19, p-value = 0.002516alternative hypothesis: true mean is not equal to 22595 percent confidence interval:172.3827 211.9173sample estimates:mean of x192.15原假设:油漆工人的血小板计数与正常成年男子无差异。
备择假设:油漆工人的血小板计数与正常成年男子有差异。
p值小于0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异。
上述检验是双边检验。
也可采用单边检验。
备择假设:油漆工人的血小板计数小于正常成年男子。
> t.test(x,mu=225,alternative="less")One Sample t-testdata: xt = -3.4783, df = 19, p-value = 0.001258alternative hypothesis: true mean is less than 22595 percent confidence interval:-Inf 208.4806sample estimates:mean of x192.15同样可得出油漆工人的血小板计数小于正常成年男子的结论。
Ex5.2> pnorm(1000,mean(x),sd(x))[1] 0.5087941> x[1] 1067 919 1196 785 1126 936 918 1156 920 948> pnorm(1000,mean(x),sd(x))[1] 0.5087941x<=1000的概率为0.509,故x大于1000的概率为0.491.要点:pnorm计算正态分布的分布函数。
r语言与统计分析第五章课后答案

r语言与统计分析第五章课后答案第五章5.1设总体某是用无线电测距仪测量距离的误差,它服从(α,β)上的均匀分布,在200次测量中,误差为某i的次数有ni次:某i:3579111315171921Ni:21161526221421221825求α,β的矩法估计值α=u-β=u+程序代码:某=eq(3,21,by=2)y=c(21,16,15,26,22,14,21,22,18,25)u=rep(某,y)u1=mean(u)=var(u)1=qrt()a=u1-qrt(3)某1b=u1+qrt(3)某1b=u1+qrt(3)某1得出结果:a=2.217379b=22.402625.2为检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50L,化验每升水中大肠杆菌的个数(假设1L水中大肠杆菌的个数服从泊松分布),其化验结果如下表所示:试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率达到最大大肠杆菌数/L:0123456水的升数:1720222100γ=u是最大似然估计程序代码:a=eq(0,6,by=1)b=c(17,20,10,2,1,0,0)c=a某bd=mean(c)得出结果:d=7.1428575.3已知某种木材的横纹抗压力服从正态分布,现对十个试件做横纹抗压力试验,得数据如下:482493457471510446435418394469(1)求u的置信水平为0.95的置信区间程序代码:某=c(482493457471510446435418394469)t.tet(某)得出结果:data:某t=6.2668,df=9,p-value=0.0001467alternativehypothei:truemeaninotequalto095percentconfidenceinterval:7.66829916.331701ampleetimate:meanof某12由答案可得:u的置信水平为0.95的置信区间[7.66829916.331701](2)求σ的置信水平为0.90的置信区间程序代码:chiq.var.tet<-function(某,var,alpha,alternative="two.ided"){ option(digit=4)reult<-lit()n<-length(某)v<-var(某)reult$var<-vchi2<-(n-1)某v/varreult$chi2<-chi2p<-pchiq(chi2,n-1)reult$p.value<-pif(alternative=="le")reult$p.value<-pchaiq(chi2,n-1,loer.tail=F)eleif(alternative=="two.ider")reult$p.value<-2某min(pchaiq(chi2,n-1),pchaiq(chi2,n-1,lower.tail=F))reult$conf.int<-c((n-1)某v/qchiq(alpha/2,df=n-1,lower.tail=F),(n-1)某v/qchiq(alpha/2,df=n-1,lower.tail=T))reult}某<-c(482,493,457,471,510,446,435,418,394,469)y=var(某)chiq.var.tet(某,0.048^2,0.10,alternative="two.ide")得出结果:$conf.int:659.83357.0由答案可得:σ的置信水平为0.90的置信区间[659.83357.0]5.4某卷烟厂生产两种卷烟A和B现分别对两种香烟的尼古丁含量进行6次试验,结果如下:A:252823262922B:282330352127若香烟的尼古丁含量服从正态分布(1)问两种卷烟中尼古丁含量的方差是否相等(通过区间估计考察)(2)试求两种香烟的尼古丁平均含量差的95%置信区间程序代码:某=c(25,28,23,26,29,22)Y=c(28,23,30,35,21,27)Var.tet(某,y)data:某andyF=0.2992,numdf=5,denomdf=5,p-value=0.2115alternativehypothei:trueratioofvarianceinotequalto195percentconfidenceinterval:0.041872.13821ampleetimate:ratioofvariance0.2992由答案可得:其方差不相等,方差区间为[0.041872.13821](2)5.5比较两个小麦品种的产量,选择24块条件相似地实验条,采用相同的耕作方法做实验,结果播种甲品种的12块实验田的单位面积产量和播种乙品种的12块试验田的单位面积产量分别为:A:628583510554612523530615573603334564B:535433398470567480498560503426338547假定每个品种的单位面积产量服从正态分布,甲品种产量的方差为2140,乙品种产量的方差为3250,试求这两个品种平均面积产量差的置信水平为0.95的置信上限和置信水平为0.90的置信下限。
R语言与统计分析第五章习题答案说课材料

R语言与统计分析第五章习题答案x<-c(3,5,7,9,11,13,15,17,19,21)y<-c(21,16,15,26,22,14,21,22,18,25)e=sum(x*y)/sum(y) #样本期望d=(sum(x*x*y)/sum(y))-e^2 #样本方差a=(8*e+sqrt(64*e^2-4*4*(4*e^2-12*d)))/8 #估计结果b=(8*e-sqrt(64*e^2-4*4*(4*e^2-12*d)))/8ab#5.2x<-c(0,1,2,3,4,5,6)y<-c(17,20,10,2,1,0,0)e=2.718281828459f<-function(λ)(e^(-50*λ)*λ^50)/(2^10*6^2*24) #似然函数optimize(f,c(0,2),maximum=TRUE)#5.3x<-c(482,493,457,471,510,446,435,418,394,469) #0.95置信区间t.test(x)$conf.intchisq.var.test<-function(x,var,alpha,alternative="two.sided"){options(digits=4)result<-list()n<-length(x)v<-var(x)result$var<-vchi2<-(n-1)*v/varresult$chi2<-chi2p<-pchisq(chi2,n-1)result$p.value<-pif(alternative=="less")result$p.value<-pchaisq(chi2,n-1,lower.tail=F)else if (alternative=="two.sider")result$p.value<-2*min(pchaisq(chi2,n-1),pchaisq(chi2,n-1,lower.tail=F)) result$conf.int<-c((n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=F),(n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=T))resultchisq.var.test(x,var(x),0.90,alternative="two.side")$conf.int #0.90置信区间#5.4x<-c(25,28,23,26,29,22)y<-c(28,23,30,35,21,27)chisq.var.test(x,var(x),0.95,alternative="two.side")$conf.int #卷烟A方差0.95置信区间chisq.var.test(y,var(y),0.95,alternative="two.side")$conf.int #卷烟B方差0.95置信区间#方法二两方差比0.95的置信区间var.test(x,y)two.sample.ci<-function(x,y,conf.level=0.95,sigma1,sigama2){ #样本方差作为整体方差options(digits=4)m=length(x)n=length(y)xbar=mean(x)-mean(y)alpha=1-conf.levelzstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)xbar+c(-zstar,+zstar)}sigma1<-var(x)sigma2<-var(y)two.sample.ci(x,y,conf.level=0.95,sigma1,sigma2)#5.5x<-c(628,583,510,554,612,523,530,615,573,603,334,564)y<-c(535,433,398,470,567,480,498,560,503,426,338,547)two.sample.ci<-function(x,y,conf.level=0.95,sigma1,sigama2){options(digits=4)m=length(x)n=length(y)xbar=mean(x)-mean(y)alpha=1-conf.levelzstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)xbar+c(-zstar,+zstar)}sigma1=2140sigma2=3250a<-two.sample.ci(x,y,conf.level=0.95,sigma1,sigma2)b<-two.sample.ci(x,y,conf.level=0.90,sigma1,sigma2)a[2] #置信水平为0.95的置信上限b[1] #置信水平为0.90的置信下限#5.6x<-c(15.2,14.5,,15.5,14.8,15.1,15.6,14.7)y<-c(15.2,15.0,14.8,15.2,15.0,14.9,15.1,14.8,15.3)var.test(x,y) #x方差与y方差的比值极大,说明x方差大于y方差#5.7prop.test(224,400,conf.level=0.99,correct=TRUE)#5.8size.norm2<-function(s,alpha,d,m){t0<-qt(alpha/2,m,lower.tail=FALSE)n0<-(t0*s/d)^2t1<-qt(alpha/2,n0,lower.tail=FALSE)n1<-(t1*s/d)^2while(abs(n1-n0)>0.5){n0<-(qt(alpha/2,n1,lower.tail=FALSE)*s/d)^2n1<-(qt(alpha/2,n0,lower.tail=FALSE)*s/d)^2}n1}size.norm2(10,0.05,2,100)#5.8size.bin<-function(d,p,conf.level=0.95){alpha=1-conf.level((qnorm(1-alpha/2))/d)^2*p*(1-p)}size.bin(0.01,0.05,0.90)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章5.1 设总体x是用无线电测距仪测量距离的误差,它服从(α,β)上的均匀分布,在200次测量中,误差为xi的次数有ni次:Xi:3 5 7 9 11 13 15 17 19 21Ni:21 16 15 26 22 14 21 22 18 25求α,β的矩法估计值α=u-√3sβ=u+√3s程序代码:x=seq(3,21,by=2)y=c(21,16,15,26,22,14,21,22,18,25)u=rep(x,y)u1=mean(u)s=var(u)s1=sqrt(s)a=u1-sqrt(3)*s1b=u1+sqrt(3)*s1b=u1+sqrt(3)*s1得出结果:a= 2.217379b= 22.402625.2为检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50L,化验每升水中大肠杆菌的个数(假设1L水中大肠杆菌的个数服从泊松分布),其化验结果如下表所示:试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率达到最大大肠杆菌数/L:0 1 2 3 4 5 6水的升数:17 20 10 2 1 0 0γ=u是最大似然估计程序代码:a=seq(0,6,by=1)b=c(17,20,10,2,1,0,0)c=a*bd=mean(c)得出结果:d= 7.1428575.3已知某种木材的横纹抗压力服从正态分布,现对十个试件做横纹抗压力试验,得数据如下:482 493 457 471 510 446 435 418 394 469(1)求u的置信水平为0.95的置信区间程序代码:x=c(482 493 457 471 510 446 435 418 394 469 )t.test(x)得出结果:data: xt = 6.2668, df = 9, p-value = 0.0001467alternative hypothesis: true mean is not equal to 095 percent confidence interval:7.668299 16.331701sample estimates:mean of x12由答案可得:u的置信水平为0.95的置信区间[7.668299 16.33170 1](2)求σ的置信水平为0.90的置信区间程序代码:chisq.var.test<-function(x,var,alpha,alternative="two.sided"){options(digits=4)result<-list()n<-length(x)v<-var(x)result$var<-vchi2<-(n-1)*v/varresult$chi2<-chi2p<-pchisq(chi2,n-1)result$p.value<-pif(alternative=="less")result$p.value<-pchaisq(chi2,n-1,loer.tail=F)else if(alternative=="two.sider")result$p.value<-2*min(pchaisq(chi2,n-1),pchaisq(chi2,n-1,lower.tail=F))result$conf.int<-c((n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=F),(n-1)*v/qchisq(alpha/2,df=n-1,lower.tail=T))result}x<-c(482,493,457,471,510,446,435,418,394,469)y=var(x)chisq.var.test(x,0.048^2,0.10,alternative="two.side")得出结果:$conf.int: 659.8 3357.0由答案可得:σ的置信水平为0.90的置信区间[659.8 3357.0] 5.4某卷烟厂生产两种卷烟A和B 现分别对两种香烟的尼古丁含量进行6次试验,结果如下:A:25 28 23 26 29 22B:28 23 30 35 21 27若香烟的尼古丁含量服从正态分布(1)问两种卷烟中尼古丁含量的方差是否相等(通过区间估计考察)(2)试求两种香烟的尼古丁平均含量差的95%置信区间(1)程序代码:X=c(25,28,23,26,29,22)Y=c(28,23,30,35,21,27)Var.test(x,y)得出结果:F test to compare two variancesdata: x and yF = 0.2992, num df = 5, denom df = 5, p-value = 0.2115 alternative hypothesis: true ratio of variances is not equa l to 195 percent confidence interval:0.04187 2.13821sample estimates:ratio of variances0.2992由答案可得:其方差不相等,方差区间为[0.04187 2.13821](2)5.5 比较两个小麦品种的产量,选择24块条件相似地实验条,采用相同的耕作方法做实验,结果播种甲品种的12块实验田的单位面积产量和播种乙品种的12块试验田的单位面积产量分别为:A:628 583 510 554 612 523 530 615 573 603 334 564B:535 433 398 470 567 480 498 560 503 426 338 547假定每个品种的单位面积产量服从正态分布,甲品种产量的方差为2140,乙品种产量的方差为3250,试求这两个品种平均面积产量差的置信水平为0.95的置信上限和置信水平为0.90的置信下限。
程序代码:two.sample.ci=function(x,y,conf.level=0.95,sigma1.sigma2) {options(digits=4)m=length(x); n=length(y)xbar=mean(x)-mean(y)alpha=1-conf.levelzstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)xbar+c(-zstar, +zstar)}x=c(628,583,510,554,612,523,530,615,573,603,334,564)y=c(535,433,398,470,567,480,498,560,503,426,338,547)sigma1=2140sigma2=3250two.sample.ci(x,y,conf.level=0.95,sigma1.sigma2)得到结果:31.29 114.37程序代码:two.sample.ci=function(x,y,conf.level=0.95,sigma1.sigma2) {options(digits=4)m=length(x); n=length(y)xbar=mean(x)-mean(y)alpha=1-conf.levelzstar=qnorm(1-alpha/2)*(sigma1/m+sigma2/n)^(1/2)xbar+c(-zstar, +zstar)}x=c(628,583,510,554,612,523,530,615,573,603,334,564)y=c(535,433,398,470,567,480,498,560,503,426,338,547)sigma1=2140sigma2=3250two.sample.ci(x,y,conf.level=0.90,sigma1.sigma2)得到结果:37.97 107.695.6有两台机床生产同一型号的滚珠,根据以往经验知,这两台机床生产的滚珠直径都服从正态分布,现分别从这两台机床生产的滚珠中随机地抽取7个和9个,测得它们的直径如下:机床甲:15.2 14.5 15.5 14.8 15.1 15.6 14.7机床乙:15.2 15.0 14.8 15.2 15 14.9 15.1 14.8 15.3试问机床乙生产的滚珠的方差是否比机床甲生产的滚珠直径的方差小?程序代码:x=c(5.2,14.5,15.5,14.8,15.1,15.6,14.7)y=c(15.2,15.0,14.8,15.2,15,14.9,15.1,14.8,15.3)var.test(x,y)得出结果:F test to compare two variancesdata: x and yF = 430.1, num df = 6, denom df = 8, p-value = 2.723e-09 alternative hypothesis: true ratio of variances is not equa l to 195 percent confidence interval:92.47 2408.54sample estimates:ratio of variances430.1由结果可得:其甲机床的滚珠半径远超出乙机床的滚珠半径5.7某公司对本公司生产的两种自行车型号A,B的销售情况进行了了解,随机选取了400人询问他们对A B的选择,其中有224人喜欢A,试求顾客中喜欢A的人数比例p的置信水平为0.99的区间估计。
方程代码:Binom.test(224,400,conf.level=0.99)得出结果:Exact binomial testdata: 224 and 400number of successes = 224, number of trials = 400, p-value = 0.01866alternative hypothesis: true probability of success is not equal to 0.599 percent confidence interval:0.4944077 0.6241356sample estimates:probability of success0.56由结果可得:顾客中喜欢a的人数比例p的置信水平为0.99的区间估计:[0.4944077 0.6241356]5.8某公司生产了一批新产品,产品总体服从正态分布,现估计这批产品的平均重量,最大允许误差为1,样本标准差s=10,试问在0.95的置信水平下至少要抽取多少个产品程序代码:Size,norm2=function(s,alpha,d,m){t0=qt(alpha/2,m,lower.tail = FALSE)n0=(t0*s/d)^2t1=qt(alpha/2,n0,lower.tail = FALSE)n1=(t1*s/d)^2while(abs(n1-n0)>0.5){n0=(qt(alpha/2,n1,lower.tail = FALSE)*s/d)^2n1=(qt(alpha/2,n0,lower.tail = FALSE)*s/d)^2}n1}Size.norm2(10,0.01,2,100)得出结果:98.44268由结果可得,在0.95的置信水平下至少要抽取99个产品5.9根据以往的经验,船运大量玻璃器皿,损坏率不超过5%,现要估计某船中玻璃器皿的损坏率,要求估计与真值间不超过1%,且置信水平为0.90,那么要抽取多少样本验收可满足上诉要求程序代码:size.bin=function(d,p,conf.level){alpha=1-conf.level((qnorm(1-alpha/2))/d)^2*p*(1-p)}size.bin(0.01,0.05,0.90)得出结果:1285.133由结果可得:要抽取1285个样本验收可满足上诉要求。