统计学-基于R第3版习题答案(第二章)
统计学(第三版课后习题答案

Hah 和网速是无形的1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.02.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组 天数(天)-25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 L U 。
(2)17.21 s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学基于R第版习题答案(第二章)

习题2、1(1)简单频数分布表:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_1、RData")> summary(exercise2_1)行业性别满意度电信业:38 男:58 不满意:75航空业:19 女:62 满意 :45金融业:26旅游业:37二维列联表:> mytable1<-table(exercise2_1$行业,exercise2_1$满意度)> addmargins(mytable1) # 增加边界与不满意满意 Sum电信业 25 13 38航空业 12 7 19金融业 11 15 26旅游业 27 10 37Sum 75 45 120三维列联表:> mytable1<-ftable(exercise2_1, row、vars = c("性别","满意度"), col、var="行业");mytable1 行业电信业航空业金融业旅游业性别满意度男不满意 11 7 7 11满意 6 3 7 6女不满意 14 5 4 16满意 7 4 8 4(2)条形图:> count1<-table(exercise2_1$行业)> count2<-table(exercise2_1$性别)> count3<-table(exercise2_1$满意度)> par(mfrow=c(1,3),mai=c(0、7,0、7,0、6,0、1),cex=0、7,cex、main=0、8)> barplot(count1,xlab="行业",ylab="频数")> barplot(count2,xlab="性别",ylab="频数")> barplot(count3,xlab="满意度",ylab="频数")帕累托图:> count1<-table(exercise2_1$行业)> par(mai=c(0、7,0、7,0、1,0、8),cex=0、8)> x<-sort(count1,decreasing = T)> bar<-barplot(x,xlab="行业",ylab="频数",ylim=c(0,1、2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值> y<-cumsum(x)/sum(x) # cumsum累计求与> par(new=T)> plot(y,type="b",lwd=1、5,pch=15,axes=F)> axis(4) # 右Y轴> mtext("累积频率",side=4,line=3)> mtext("累积分布曲线",line=-2、5,cex=0、8,adj=0、75)复式条形图:> mytable1<-table(exercise2_1$满意度,exercise2_1$行业)> barplot(mytable1,xlab="行业",ylab="频数",legend=rownames(mytable1),args、legend=list(x= 13), beside = T)脊形图:> library(vcd)马赛克图:> mosaicplot(~性别+行业+满意度,data=exercise2_1,col=2:3)(3)饼图:> count1<-table(exercise2_1$行业)> name<-names(count1)> label1<-paste(name," ",percent,"%",sep="")> par(pin=c(3,3),mai=c(0、1,0、4,0、1,0、4),cex=0、8) # 圆得大小> pie(count1,labels=label1,init、angle = 90)扇形图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-count1/sum(count1)*100> labs<-paste(name," ",percent,"%",sep="")> library(plotrix)> fan、plot(count1,labels=labs,ticks=200)2、2(1)分10组,绘制频数分布表> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_2、RData")> library(actuar)> v<-as、vector(exercise2_2$灯泡寿命)> gd1<-grouped、data(v, breaks = 10, right = FALSE)> table1<-data、frame(gd1);table1Var、1 v1 [2600, 2800) 12 [2800, 3000) 43 [3000, 3200) 124 [3200, 3400) 135 [3400, 3600) 276 [3600, 3800) 207 [3800, 4000) 198 [4000, 4200) 4(2)直方图> d<-exercise2_2$灯泡寿命> hist(d,breaks=10,xlab="寿命",ylab="频数")茎叶图:> stem(exercise2_2$灯泡寿命)The decimal point is 2 digit(s) to the right of the |26 | 028 | 96830 | 9932 | 788899013456934 | 11222334445555936 | 444556778838 | 2245556667005566940 | 0010172、3(1)箱线图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_3、RData")> boxplot(exercise2_3[,-1],xlab="城市",ylab="气温",cex、lab=0、8,cex、axis=0、6) # 从第二列开始,到最后小提琴图:> library(vioplot)> x1<-exercise2_3$北京> x2<-exercise2_3$沈阳> x3<-exercise2_3$上海> x4<-exercise2_3$南昌> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))> table1_1<-melt(exercise2_3,id、vars=c("月份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度"))> dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)> library(lattice)> dotplot(温度~城市,data=table1_1,pch=19)> dp1<-densityplot(~温度,group=城市,data=table1_1,auto、key=list(columns=1,x=0、01,y=0、9 5,cex=0、6),cex=0、5)> plot(dp1)> library(sm)> sm、density、pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)(3)轮廓图> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","广州","海口","重庆","昆明"))> legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名雷达图:> table1<-data、frame(t(exercise2_3[,2:11])) #行列进行转换,并数据框> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例(4)星图:> matrix1<-as、matrix(exercise2_3[,2:11])> rownames(matrix1)<-exercise2_3[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(t(matrix1),nrow、plot = 5,ncol、plot = 2,face、type = 0) effect of variables:modified item Var"height of face " "1月""width of face " "2月""structure of face" "3月""height of mouth " "4月""width of mouth " "5月""smiling " "6月""height of eyes " "7月""width of eyes " "8月""height of hair " "9月""width of hair " "10月""style of hair " "11月""height of nose " "12月""width of nose " "1月""width of ear " "2月""height of ear " "3月"2、4(1)散点图:> plot(地区生产总值,最终消费支出,xlab="",ylab='最终消费支出')> abline(lm(最终消费支出~地区生产总值,data=exercise2_4))> abline(lm(最终消费支出~固定资产投资,data=exercise2_4),col="blue")气泡图:> r<-sqrt(最终消费支出/pi)> symbols(最终消费支出,地区生产总值,circles=r, inches=0、3, fg="white",bg="lightblue",ylab="最终消费支出",xlab="地区生产总值")> text(最终消费支出,地区生产总值,rownames(exercise2_4))> mtext("气泡大小=最终消费支出",line=-2、5,adj=0、1)(2)星图:> matrix1<-as、matrix(exercise2_4[,2:4])> rownames(matrix1)<-exercise2_4[,1]> stars(matrix1,key、loc=c(7,2,5),cex=0、8)脸谱图:> library(aplpack)> faces(matrix1,nrow、plot = 6,ncol、plot = 6,face、type = 0)2、5时序图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_5、RData")> table1<-ts(exercise2_5,start=2004)> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")> lines(table1[,3],type="b")2、6洛伦茨曲线:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题与习题数据(公开资源)\\exercise\\ ch2\\exercise2_6、RData")> library(DescTools)> Lc(exercise2_6$不同阶层人口数得收入额*10000/exercise2_6$不同收入阶层得人口数,exercise2_6$不同收入阶层得人口数) # 标红为组中值,收入/人数$p[1] 0、0000000 0、3478261 0、6086957 0、8260870 0、9565217 1、0000000$L[1] 0、00000000 0、06060606 0、15151515 0、33333333 0、63636364 1、00000000$L、general[1] 0 20000 50000 110000 210000 330000$Gini[1] 0、6232632[1] 1250、00 2500、00 6000、00 16666、67 60000、00$n[1] 80 60 50 30 10attr(,"class")[1] "Lc"> plot(Lc(exercise2_6$不同阶层人口数得收入额*10000/exercise2_6$不同收入阶层得人口数,exercise2_ 6$不同收入阶层得人口数),xlab="人数比例",ylab="收入比例",col=4,panel、first=grid(10,10,col="gr ay70"))结论:>0、4, 收入差距巨大。
李金昌《统计学》(第3版)练习与思考答案

李⾦昌《统计学》(第3版)练习与思考答案练习与思考答案第⼀章⼀、判断题1.√2.×3.×4.×5.√6.√7.√8.×9.√10.×⼆、单项选择题1.B2.C3.B4.D5.D6.C三、简答题(略)第⼆章⼀、判断题1.×2.×3.×4.√5.×6.×7.×8.×⼆、单项选择题1.C2.A3.B4.A5.C三、简答题(略)四、计算题(4)钟型分布。
五、实践题(略)第三章⼀、判断题1.×2.√3.×4.×5.×6.×7.×8.×9.×10.√⼆、单项选择题1.B2.C3.C4.B5.C6.D7.A8.C9.C 10.C 11. D 12.D三、简答题(略)四、计算题1、平均时速=109.09(公⾥/时)2、顾客占了便宜,因为如果两条鲫鱼分开买,则平均价格为16.92元/公⽄。
在这次买卖中,顾客所占的便宜是11元-10.4元=0.6元。
原因是鲫鱼重量有权数作⽤。
3、(1)平均每个企业利润额=203.70(万元);(2)全公司平均资⾦利润率=13.08%。
4、(1)全⼚总合格率、平均合格率和平均废品率分别是92.17%、97.32%和2.68%;(采⽤⼏何平均法)(2)全⼚总合格率、平均合格率和平均废品率分别是97.31%、97.31%和2.69%;(采⽤调和平均法)(3)全⼚总合格率、平均合格率和平均废品率分别是97.38%、97.38%和2.62%。
(采⽤算术平均法)5、(1)算术平均数x =76.3043;四分位数L Q =70.6818,M Q =75.9091和U Q =82.5;众数o m =75.38;(2)全距R=50;平均差 A.D.=7.03;四分位差d Q =11.82,异众⽐率r V =51.11%;⽅差2s =89.60;标准差s =9.4659;(3)偏度系数(1)k S =0.0977,(2)k S =0.1154,(3)k S =0.0454;(4)峰度系数β=2.95;(5)12.41%12.5%s s V V ==⼄甲;。
统计学课后习题答案(统计学第三版_高等_袁卫、庞皓、曾五一、贾俊平)

第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
《基础统计(第三版)习题集》答案

《基础统计(第三版)习题集》答案第一章概论一、解释概念1. 总体和总体单位——凡是客观存在的并至少具有某一相同性质而结合起来的许多个别事物构成的整体,当它作为统计的研究对象时,就称为统计总体,简称总体。
构成总体的每一个事物,就称为总体单位。
2. 标志和标志表现——标志是说明总体单位特征的名称。
标志表现是标志的属性或数量在总体各单位的具体体现。
3. 品质标志和数量标志——品质标志是表明总体单位的质的特征的名称。
数量标志是表明总体单位的量的特征的名称。
4. 不变标志和可变标志——同一总体中各个总体单位上的表现都一样的标志就称为不变标志。
同一总体中各个总体单位上的表现不完全相同的标志就称为可变标志。
5. 指标和指标体系——指标是说明总体数量特征的概念及其综合数值,故又称为综合指标。
指标体系就是若干个反映社会经济现象数量特征的相对独立又相互联系的统计指标所组成的整体。
二、填充内容1. 统计资料、统计学、统计学2. 总体性、社会性、数量关系、数量界限3. 数字、概率论、大量观察法4. 总体、方法论5. 信息、监督、信息6. 统计数学模型、统计逻辑模型7. 静态统计推断、动态统计推断8. 同质、相对9. 离散变量、连续变量10. 定性规范、指标数值三、选择答案1. (b)2. (b)3. (c)4. (c)5. (a)6. (c)7. (a b)8. (b d)9. (b)10.(a)11. (a)12. (a)13. (b)14. (a)15. (c)16. (c)17. (d)18. (c)19. (a b c d)20. (c)四、判断改错1.(√)2.(×)但需要对个别事物进行调查研究。
3.(√)4.(×)这部分家庭的生活状况对全国的城市居民家庭总体具有代表性。
5.(×)统计分组法是统计工作的基本方法。
6.(×)我国所有的企业能够构成总体。
7.(√)8.(√)9.(√)10.(×)定比尺度中的“0”,表示“没有”或该事物不存在、未发生;定距尺度中的“0”,表示一个有特定内涵的数值,不表示“没有”。
统计学第三版课后习题答案_高等教育出版社

附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100(3)条形图(略)2.2 (1)频数分布表如下:按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (A班分散,且平均成绩较A班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学第三版书后答案第二章

第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)x=xn∑=822330=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e=2722732+=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:Q L=261+2732724-=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:Q U=291-2732724-=290.75(万元)。
(2)未分组数据的标准差计算公式为:s =302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。
手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。
(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。
统计学第三版答案

方法A
方法B
方法C
164
129
125
167
130
126
168
129
126
165
130
127
170
131
126
3.3在某地区随机抽取120家企业,按利润额进行分组后结果如下:
按利润额分组(万元)
企业数(个)
300以下
19
300~400
30
400~500
42
500~600
18
600以上
11
合计
120
计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:
=426.67(万元); (万元)。
8.65
10.10
9.43
10.12
9.39
9.54
8.51
9.70
10.03
9.49
9.48
9.36
9.14
10.09
9.85
9.37
9.64
9.68
9.75
绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?
详细答案:
正态概率图如下:
由正态概率图可以看出,汽车耗油量基本服从正态分布。
14
14
690~700
26
26
700~710
10~730
10
10
730~740
3
3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题2.1(1)简单频数分布表:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData")> summary(exercise2_1)行业性别满意度电信业:38 男:58 不满意:75航空业:19 女:62 满意 :45金融业:26旅游业:37二维列联表:> mytable1<-table(exercise2_1$行业,exercise2_1$满意度)> addmargins(mytable1) # 增加边界和不满意满意 Sum电信业 25 13 38航空业 12 7 19金融业 11 15 26旅游业 27 10 37Sum 75 45 120三维列联表:> mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业性别满意度男不满意 11 7 7 11满意 6 3 7 6女不满意 14 5 4 16满意 7 4 8 4(2)条形图:> count1<-table(exercise2_1$行业)> count2<-table(exercise2_1$性别)> count3<-table(exercise2_1$满意度)> par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8)> barplot(count1,xlab="行业",ylab="频数")> barplot(count2,xlab="性别",ylab="频数")> barplot(count3,xlab="满意度",ylab="频数")帕累托图:> count1<-table(exercise2_1$行业)> par(mai=c(0.7,0.7,0.1,0.8),cex=0.8)> x<-sort(count1,decreasing = T)> bar<-barplot(x,xlab="行业",ylab="频数",ylim=c(0,1.2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值> y<-cumsum(x)/sum(x) # cumsum累计求和> par(new=T)> plot(y,type="b",lwd=1.5,pch=15,axes=F)> axis(4) # 右Y轴> mtext("累积频率",side=4,line=3)> mtext("累积分布曲线",line=-2.5,cex=0.8,adj=0.75)复式条形图:> mytable1<-table(exercise2_1$满意度,exercise2_1$行业)> barplot(mytable1,xlab="行业",ylab="频数",legend=rownames(mytable1),args.legend=list(x= 13), beside = T)脊形图:> library(vcd)> spine(行业~满意度,data=exercise2_1,xlab="满意度", ylab="行业",margins=c(4,3.5,1,2.5))马赛克图:> mosaicplot(~性别+行业+满意度,data=exercise2_1,col=2:3)(3)饼图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-prop.table(count1)*100> label1<-paste(name," ",percent,"%",sep="")> par(pin=c(3,3),mai=c(0.1,0.4,0.1,0.4),cex=0.8) # 圆的大小> pie(count1,labels=label1,init.angle = 90)扇形图:> count1<-table(exercise2_1$行业)> name<-names(count1)> percent<-count1/sum(count1)*100> labs<-paste(name," ",percent,"%",sep="")> library(plotrix)> fan.plot(count1,labels=labs,ticks=200)2.2(1)分10组,绘制频数分布表> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_2.RData")> library(actuar)> v<-as.vector(exercise2_2$灯泡寿命)> gd1<-grouped.data(v, breaks = 10, right = FALSE)> table1<-data.frame(gd1);table1Var.1 v1 [2600, 2800) 12 [2800, 3000) 43 [3000, 3200) 124 [3200, 3400) 135 [3400, 3600) 276 [3600, 3800) 207 [3800, 4000) 198 [4000, 4200) 4(2)直方图> d<-exercise2_2$灯泡寿命> hist(d,breaks=10,xlab="寿命",ylab="频数")茎叶图:> stem(exercise2_2$灯泡寿命)The decimal point is 2 digit(s) to the right of the |26 | 028 | 96830 | 055788235679932 | 788899013456934 | 1133566779911222334445555936 | 03356660002444556778838 | 2245556667005566940 | 0010172.3(1)箱线图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_3.RData")> boxplot(exercise2_3[,-1],xlab="城市",ylab="气温",b=0.8,cex.axis=0.6) # 从第二列开始,到最后小提琴图:> library(vioplot)> x1<-exercise2_3$北京> x2<-exercise2_3$沈阳> x3<-exercise2_3$上海> x4<-exercise2_3$南昌> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))(2)点图:> library(reshape)> table1_1<-melt(exercise2_3,id.vars=c("月份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度"))> dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)> library(lattice)> dotplot(温度~城市,data=table1_1,pch=19)核密度图:> library(lattice)> dp1<-densityplot(~温度,group=城市,data=table1_1,auto.key=list(columns=1,x=0.01,y=0.95, cex=0.6),cex=0.5)> plot(dp1)> library(sm)> pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)(3)轮廓图> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","广州","海口","重庆","昆明"))> legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名雷达图:> library(fmsb)> table1<-data.frame(t(exercise2_3[,2:11])) #行列进行转换,并数据框> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例(4)星图:> matrix1<-as.matrix(exercise2_3[,2:11]) > rownames(matrix1)<-exercise2_3[,1]> stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图:> library(aplpack)> faces(t(matrix1),nrow.plot = 5,ncol.plot = 2,face.type = 0)effect of variables:modified item Var"height of face " "1月""width of face " "2月""structure of face" "3月""height of mouth " "4月""width of mouth " "5月""smiling " "6月""height of eyes " "7月""width of eyes " "8月""height of hair " "9月""width of hair " "10月""style of hair " "11月""height of nose " "12月""width of nose " "1月""width of ear " "2月""height of ear " "3月"2.4(1)散点图:> plot(地区生产总值,最终消费支出,xlab="",ylab='最终消费支出')> abline(lm(最终消费支出~地区生产总值,data=exercise2_4))> points(固定资产投资,最终消费支出,ylab='最终消费支出',pch=2,col="blue")> abline(lm(最终消费支出~固定资产投资,data=exercise2_4),col="blue")气泡图:> r<-sqrt(最终消费支出/pi)> symbols(最终消费支出,地区生产总值,circles=r, inches=0.3, fg="white",bg="lightblue",ylab="最终消费支出",xlab="地区生产总值")> text(最终消费支出,地区生产总值,rownames(exercise2_4))> mtext("气泡大小=最终消费支出",line=-2.5,adj=0.1)(2)星图:> matrix1<-as.matrix(exercise2_4[,2:4]) > rownames(matrix1)<-exercise2_4[,1]> stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图:> library(aplpack)> faces(matrix1,nrow.plot = 6,ncol.plot = 6,face.type = 0)2.5时序图:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_5.RData")> table1<-ts(exercise2_5,start=2004)> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")> lines(table1[,3],type="b")2.6洛伦茨曲线:> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_6.RData")> library(DescTools)> Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_6$不同收入阶层的人口数) # 标红为组中值,收入/人数$p[1] 0.0000000 0.3478261 0.6086957 0.8260870 0.9565217 1.0000000$L[1] 0.00000000 0.06060606 0.15151515 0.33333333 0.63636364 1.00000000$L.general[1] 0 20000 50000 110000 210000 330000$Gini[1] 0.6232632$x[1] 1250.00 2500.00 6000.00 16666.67 60000.00$n[1] 80 60 50 30 10attr(,"class")[1] "Lc"> plot(Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_ 6$不同收入阶层的人口数),xlab="人数比例",ylab="收入比例",col=4,panel.first=grid(10,10,col="gr ay70"))结论:>0.4,收入差距巨大。