统计学课堂项目(学生用)

统计学课堂项目(学生用)
统计学课堂项目(学生用)

统计学课堂项目

(学生版)

信息学院统计学课堂项目建设课题组

2004.11.18

项目一:描述统计分析

一、实验目的

掌握运用SPSS统计分析软件整理原始数据并分析其基本特征。

二、实验内容

1、对原始数据进行统计分组(简单分组、复合分组、单项分组和组距分组)和累计次数;

2、简单统计图绘制和分布曲线绘制;

3、基本指标计算(最大值、最小值、算术平均数、中位数、众数、全距、标准差、峰度、偏度

等)。

三、实验要求

数据:某班统计学期末考试成绩

序号 学号 性别 分数 序号学号 性别 分数

1 022******* 女 77 460220110932女 74

2 022******* 男 79 470220110944女 66

3 022011131

4 男 66 480220110945男 79

4 022******* 女 69 490220111003男 61

5 022******* 女 47 500220111008男 76

6 022******* 女 48 510220111014男 84

7 022******* 男 66 520220111015男 83

8 022******* 男 30 530220111018女 74

9 022******* 男 72 540220111022女 78

10 022******* 男 52 550220111024女 62

11 022******* 男 67 560220111025男 72

12 022******* 女 64 570220111032女 75

13 022******* 女 58 580220111034女 82

14 022******* 男 60 590220111035男 80

15 022******* 男 66 600220111038男 33

16 022******* 女 69 610220111041女 76

17 022******* 女 40 620220111042男 70

18 022******* 男 72 630220111045男 73

19 022******* 女 75 640220111046女 73

20 022******* 男 77 650220111101男 81

21 022******* 男 84 660220111107女 60

22 022******* 男 60 670220111109男 75

23 022******* 女 59 680220111111男 62

24 022******* 女 70 690220111112女 74

25 022******* 女 74 700220111113男 92

26 022******* 男 39 710220111114女 59

27 022******* 男 72 720220111118女 53

28 022******* 女 69 730220111120男 48

29 022******* 男 65 740220111128女 41

30 022******* 女 48 750220111134男 71

31 022******* 女 60 760220111138女 70

32 022******* 女 72 770220111145男 83

33 022******* 男 42 780220111148男 59

34 022******* 男 58 790220111203女 62

35 022******* 男 51 800220111206男 85

36 022******* 男 56 810220111208女 83

37 022******* 女 62 820220111239男 69

38 022******* 女 68 830220111242男 75

39 022******* 女 71 840220111249女 76

40 022******* 男 48 850220111301女 40

41 022******* 男 56 860220111302男 68

42 022******* 女 76 870220111303男 75

43 022******* 男 59 880220111308女 60

44 022******* 男 47 890220111310男 67

45 022******* 男 62

1、按照“性别”标志进行分组。

2、按照“分数”进行分组:60分以下、60-70分、70-80分、80-90分,90分以上;并绘制直

方图和正态曲线。

3、进行分数和性别的双变量分析,并绘制对比条形图。

4、基本指标计算:

(1)在原始数据基础上,计算分数的算术平均数、中位数、标准差等;

(2)在组距数列基础上,计算统计学算术平均分数、中位数、众数、标准差等;

(3)在性别分组数列基础上,比较男同学和女同学的成绩高低。

项目二:相关与回归分析

一、实验目的

1、掌握简单相关分析方法,并根据相关系数判断两变量的相关关系。

2、掌握回归分析方法,并对回归结果进行分析。

二、实验内容和要求

现有杭州市区1978-2002年的GDP、居民年人均可支配收入和年人均消费支出的数据资料,如下:

年份 GDP(万元) 年人均可支配收入(元) 年人均消费支出(元)

1978 141995 338 301

1979 167206 396 365

1980 208220 521 491

1981 229243 540 513

1982 248297 532 532

1983 282171 578 535

1984 353781 729 679

1985 448574 1026 908

1986 513639 1169 1072

1987 605234 1260 1118

1988 708474 1565 1515

1989 772208 1764 1615

1990 896496 1985 1685

1991 1092037 2128 1894

1992 1400617 2580 2296

1993 2057297 3525 3183

1994 2731046 5249 4559

1995 3600744 6301 5559

1996 4565711 7206 6095

1997 5238807 7896 6766

1998 5687426 8465 7235

1999 6049378 9085 7424

2000 6778498 9668 7790

2001 11951694 10896 8968

2002 13668231 11778 9215

要求:

1、分别求人均可支配收入与GDP、人均消费性支出与GDP、人均可支配收入与人均消费支出的相关系数。

2、画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并找出方程的估计标准误差。

3、画出GDP与人均可支配收入的散点图,求人均可支配收入倚GDP的直线回归方程。解释方程

结果,并找出方程的估计标准误差。

4、画出GDP与人均消费支出的散点图,求人均消费支出倚GDP的直线回归方程。解释方程结果,

并找出方程的估计标准误差。

5、若将GDP的单位改为亿元,再做第3和第4题,观察单位变化对回归方程的影响。

6、求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。

7、求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。

*8、求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:一个变量Y对另一个变量X的弹性系数E定义为:E=Y的增长率÷X的增长率)。

一、实验目的

在掌握动态数列基本知识基础上,进一步掌握如何运用SPSS统计分析软件进行实际数据的分析。

二、实验内容

1)动态数列逐期、累计增长量计算;

2)动态数列定基、环比发展速度计算;

3)最小平方法和移动平均法计算动态数列长期趋势。

三、实验要求

数据:浙江省GDP(数据来源:《中国统计年鉴2003》)

浙江省1990年—2003年GDP

年 份 GDP(亿元)

1990 897.99

1991 1081.75

1992 1365.06

1993 1909.49

1994 2666.86

1995 3524.79

1996 4146.06

1997 4638.24

1998 4987.50

1999 5364.89

2000 6036.34

2001 6748.15

2002 7796.00

2003 9200.00

1)计算浙江省GDP的环比发展速度和定基发展速度;

2)计算浙江省GDP的逐期增长量和累计增长量;

3)采用移动平均法分别计算浙江省GDP跨距3年和跨距4年的移动平均值;

4)采用最小平方法配合浙江省GDP直线趋势方程。

一、实验目的

在掌握动态数列基本知识基础上,进一步掌握如何运用SPSS统计分析软件进行实际数据的分析。

二、实验内容

时间数列的季节变动测定。

三、实验要求

数据:数据:某商场1986年至1997年糖果销售量如下表:

某商场糖果销售季度资料

年份(year) 季节(quarter) 销售量(sales)(Kg)

1986 1 3017.60

1986 2 3043.54

1986 3 2094.35

1986 4 2809.84

1987 1 3274.80

1987 2 3163.28

1987 3 2114.31

1987 4 3024.57

1988 1 3327.48

1988 2 3493.48

1988 3 2439.93

1988 4 3490.79

1989 1 3685.08

1989 2 3661.23

1989 3 2378.43

1989 4 3459.55

1990 1 3849.63

1990 2 3701.18

1990 3 2642.38

1990 4 3585.52

1991 1 4078.66

1991 2 3907.06

1991 3 2828.46

1991 4 4089.50

1992 1 4339.61

1992 2 4148.60

1992 3 2916.45

1992 4 4084.64

1993 1 4242.42

1993 2 3997.58

1993 3 2881.01

1993 4 4036.23

1994 1 4360.33

1994 2 4360.53

1994 3 3172.18

1994 4 4223.76

1995 1 4690.48

1995 2 4694.48

1995 3 3342.35

1995 4 4577.63

1996 1 4965.46

1996 2 5026.05

1996 3 3470.14

1996 4 4525.94

1997 1 5258.71

1997 2 5189.58

1997 3 3596.76

1997 4 3881.60 要求测定此商场糖果销售的季节比率。

项目四:统计指数

一、实验目的

根据平均指标指数的计算公式,掌握居民消费价格指数的编制方法。

二、实验内容及要求

现有某市2003年的居民消费价格指数的数据资料,如下:

平均价格(元)

名 称

基期 报告期 权数

个体指数%

(比上年同期)

居民消费价格总指数 --1000

一、食品 --455

1.粮食 --84

(1)细粮 --985

大米 2.645 2.505747

面粉 2.658 2.73334

糯米 3.143 3.28314

挂面 4.419 4.855205

(2)粗粮 --15

玉米面 6.000 5.550500

小米 4.261 3.648500

2.淀粉及薯类 -- 4 111.0

3.干豆类及豆制品 --35 98.5

4.油脂类 --23 114.9

5.肉禽及其制品 --195 97.6

6.蛋类 --18 98.6

7.水产品 --150 96.0

8.菜 --101 102.9

9.调味品 ―-10 96.8

10.糖 --12 99.4

11.茶及饮料 --62 96.9

12.干鲜瓜果 --73 120.6

13.糕点饼干面包 --53 102.2

14.奶及奶制品 --31 100.2

15.在外用膳食品 --125 99.7

16.其它食品及食品加工服务 --24 97.6

二、烟酒及用品 --68 100.4

三、衣着 --116 101.1

四、家庭设备用品及服务 --71 96.6

五、医疗保健及个人用品 --66 97.5

六、交通和通信 --75 99.4

七、娱乐教育文化用品及服务 --87 101.3

八、居住 62 102.5要求:

1、根据表中各粮食的报告期和基期价格,计算其个体价格指数。

2、计算细粮小类和粗粮小类的价格指数。

3、计算粮食中类的价格指数。

4、计算食品大类的价格指数。

5、计算居民消费价格总指数。

项目五:抽样调查

一、实验目的

抽样推断是指按随机原则从总体中抽取部分单位组成样本,对样本单位进行分析得出统计量(样本指标),并运用数理统计方法,对参数(总体指标)作出一定可靠程度的估计。其常用的抽样组织方式有简单随机抽样(纯随机抽样)、类型抽样(分层抽样)、等距抽样(机械抽样或系统抽样)、整群抽样和多阶段抽样等。本章内容主要通过运用统计软件(SPSS),对研究对象按照不同的组织形式进行抽样,计算其抽样误差并对总体作出一定可靠程度的推断。通过学习:(1)学会运用不同的抽样组织方式抽取样本;(2)掌握不同抽样组织方式抽样误差的计算及总体参数的推断;(3)能熟练地运用统计方法和统计软件(SPSS)解决抽样调查中可能遇到的一系列实际问题。

二、实验资料和要求

我国2002年277个地级城市人均教育费支出的有关资料如下表:

序号所属省份省份代号城市名称人均教育费支出(元)

1北京1北京773.25

2天津2天津502.78

3河北3秦皇岛332.41

4河北3沧州264.88

5河北3廊坊262.71

6河北3石家庄262.65

7河北3承德250.20

8河北3衡水248.28

9河北3张家口211.26

10河北3邢台208.66

11河北3保定204.03

12河北3唐山175.59

13河北3邯郸160.93

14山西4晋城281.38

15山西4大同208.53

16山西4长治205.49

17山西4朔州192.93

18山西4阳泉184.51

19山西4太原158.38

20山西4忻州117.22

21山西4临汾109.74 22山西4晋中107.36 23山西4运城77.54 24内蒙古5呼和浩特243.16 25内蒙古5鄂尔多斯186.18 26内蒙古5包头179.67 27内蒙古5乌海176.55 28内蒙古5赤峰165.84 29内蒙古5海拉尔155.23 30内蒙古5通辽114.86 31辽宁6大连294.09 32辽宁6本溪283.06 33辽宁6沈阳273.30 34辽宁6辽阳235.46 35辽宁6丹东229.67 36辽宁6铁岭221.34 37辽宁6朝阳216.53 38辽宁6营口210.29 39辽宁6抚顺197.20 40辽宁6锦州194.06 41辽宁6阜新176.16 42辽宁6盘锦147.90 43辽宁6葫芦岛145.07 44吉林7四平229.89 45吉林7通化208.10 46吉林7长春196.23 47吉林7白城187.98 48吉林7白山187.18 49吉林7松原170.06 50吉林7辽源167.87 51吉林7吉林149.09 52黑龙江8黑河376.07 53黑龙江8哈尔滨319.96 54黑龙江8齐齐哈尔203.65 55黑龙江8鹤岗189.00 56黑龙江8双鸭山187.63 57黑龙江8牡丹江177.23 58黑龙江8佳木斯162.90 59黑龙江8绥化145.81 60黑龙江8大庆134.84

61黑龙江8七台河127.54 62黑龙江8鸡西127.33 63黑龙江8伊春115.64 64上海9上海914.80 65江苏10无锡356.41 66江苏10南京296.25 67江苏10苏州288.54 68江苏10常州266.86 69江苏10镇江262.98 70江苏10扬州256.21 71江苏10南通246.28 72江苏10连云港240.19 73江苏10泰州235.25 74江苏10盐城212.05 75江苏10宿迁185.08 76江苏10徐州174.57 77江苏10淮安112.01 78浙江11丽水489.86 79浙江11宁波379.61 80浙江11温州371.45 81浙江11舟山364.65 82浙江11杭州346.49 83浙江11绍兴306.88 84浙江11台州305.14 85浙江11金华266.62 86浙江11嘉兴253.28 87浙江11衢州251.43 88浙江11湖州227.12 89安徽12合肥208.27 90安徽12滁州195.67 91安徽12鞍山192.15 92安徽12蚌埠188.37 93安徽12黄山185.17 94安徽12安庆171.97 95安徽12芜湖171.49 96安徽12马鞍山159.22 97安徽12池州153.84 98安徽12铜陵148.06 99安徽12淮北129.63 100安徽12宣城124.71

101安徽12巢湖116.83 102安徽12宿州104.63 103安徽12淮南98.57 104安徽12六安95.62 105安徽12阜阳91.36 106安徽12亳州91.03 107福建13厦门740.76 108福建13泉州358.44 109福建13福州348.17 110福建13三明329.59 111福建13龙岩321.65 112福建13漳州273.50 113福建13莆田216.73 114福建13南平211.02 115福建13宁德169.01 116江西14鹰潭188.35 117江西14九江167.83 118江西14吉安148.01 119江西14南昌131.95 120江西14景德镇128.47 121江西14萍乡127.99 122江西14新余124.98 123江西14抚州114.15 124江西14赣州108.79 125江西14上饶100.28 126江西14宜春92.61 127山东15青岛473.50 128山东15威海312.46 129山东15济宁263.01 130山东15潍坊255.12 131山东15济南238.39 132山东15烟台225.87 133山东15淄博215.19 134山东15滨州198.34 135山东15德州191.71 136山东15东营173.59 137山东15临沂164.83 138山东15莱芜152.79 139山东15泰安150.30 140山东15日照147.86

141山东15枣庄137.36 142山东15聊城133.79 143山东15菏泽111.73 144河南16周口401.77 145河南16安阳238.63 146河南16许昌234.66 147河南16郑州232.20 148河南16新乡229.82 149河南16濮阳211.49 150河南16三门峡206.39 151河南16漯河193.02 152河南16焦作181.80 153河南16开封173.12 154河南16鹤壁168.79 155河南16平顶山168.20 156河南16驻马店157.59 157河南16洛阳154.17 158河南16南阳125.03 159河南16信阳122.72 160河南16商丘93.90 161湖北17武汉213.47 162湖北17黄冈208.25 163湖北17十堰203.16 164湖北17宜昌199.15 165湖北17黄石152.72 166湖北17荆门138.09 167湖北17荆州134.57 168湖北17咸宁120.64 169湖北17鄂州113.11 170湖北17孝感93.96 171湖北17襄樊85.41 172湖北17随州79.16 173湖南18怀化307.75 174湖南18娄底185.58 175湖南18株洲182.09 176湖南18长沙180.01 177湖南18张家界153.65 178湖南18彬州151.31 179湖南18邵阳134.91 180湖南18常德133.44

181湖南18益阳128.50 182湖南18永州127.53 183湖南18湘潭103.14 184湖南18岳阳81.74 185湖南18衡阳68.64 186广东19汕头797.01 187广东19东莞769.54 188广东19深圳638.24 189广东19珠海561.19 190广东19广州553.82 191广东19佛山522.08 192广东19中山463.16 193广东19惠州423.38 194广东19揭阳411.65 195广东19江门275.54 196广东19梅州258.68 197广东19肇庆243.92 198广东19韶关208.18 199广东19潮州200.49 200广东19清远187.15 201广东19阳江175.88 202广东19河源159.02 203广东19茂名153.97 204广东19汕尾147.96 205广东19湛江54.62 206广东19云浮51.46 207广西20梧州309.09 208广西20桂林302.37 209广西20柳州262.26 210广西20北海246.92 211广西20百色199.85 212广西20防城港181.79 213广西20南宁178.35 214广西20崇左176.27 215广西20河池159.81 216广西20玉林144.00 217广西20来宾129.72 218广西20贺州104.73 219广西20贵港99.87 220广西20钦州89.48

221海南21海口206.40 222海南21三亚178.54 223重庆22重庆204.34 224四川23成都184.99 225四川23攀枝花166.27 226四川23乐山139.87 227四川23绵阳139.58 228四川23德阳135.19 229四川23南充129.55 230四川23广元114.33 231四川23宜宾112.58 232四川23自贡111.88 233四川23泸州101.33 234四川23内江101.25 235四川23资阳97.70 236四川23眉山91.08 237四川23遂宁84.66 238四川23雅安80.78 239四川23达州73.13 240四川23巴中68.33 241四川23广安68.06 242贵州24贵阳190.07 243贵州24六盘水161.47 244贵州24安顺128.47 245贵州24遵义97.40 246云南25昆明251.07 247云南25玉溪232.23 248云南25昭通168.77 249云南25曲靖151.28 250云南25白银144.66 251云南25保山121.96 252陕西26延安172.17 253陕西26宝鸡137.67 254陕西26榆林135.42 255陕西26西安135.41 256陕西26安康129.87 257陕西26商洛126.84 258陕西26咸阳125.43 259陕西26铜川116.29 260陕西26汉中103.79

261陕西26渭南73.87

262甘肃27庆阳216.60

263甘肃27兰州182.87

264甘肃27天水177.78

265甘肃27酒泉160.34

266甘肃27平凉157.20

267甘肃27武威150.83

268甘肃27金昌150.29

269甘肃27张掖131.19

270甘肃27嘉峪关47.28

271青海28西宁116.89

272宁夏29固原193.33

273宁夏29银川187.11

274宁夏29吴忠142.72

275宁夏29石嘴山131.16

276新疆30克拉玛依795.38

277新疆30乌鲁木齐187.83

总计277277277277

要求:

(1)按简单随机抽样的方式以20%的比例抽取样本;

(2)先将总体各单位(各城市)按照地理位置分为东部地区、中部地区和西部地区,然后按类型抽样的方式以20%的比例抽取样本;

(3)按人均教育费支出的高低排队以20%的比例抽取样本;

(4)以省份为单位进行整群抽样,抽取比例仍为20%;

(5)分别计算上述不同抽样组织方式的抽样误差,并以95.45%的概率保证程度推断全国人均教育费支出的范围;

(6)若人均教育费支出按高、中、低的标准为:400元以上、200—400元、200元以下,以同样的概率保证程度分别就上述不同抽样组织方式推算全国人均教育费支出低标准的比例范围。

(注:城市按地理位置分组:①东部地区:北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西、海南12个省、自治区和直辖市;②中部地区:山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南9个省和自治区;③西部地区:四川、贵州、云南、西藏、陕西、甘肃、宁夏、青海、新疆9个省和自治区。)

三、实验报告内容及要求

1、简单随机抽样

(1)抽样结果(用表格列示);

(2)抽样平均数和成数的计算过程和结果;

(3)抽样误差的计算(平均数和成数);

(4)估计总体参数的范围(平均数和成数)。

2、 类型抽样

(1)按照地理位置(东部地区、中部地区和西部地区)将各城市进行分组(用表格列示分组结果);

(2)按20%的比例从各组中抽取样本(用表格列示);

(3)其他内容与简单随机抽样要求相同。

3. 机械抽样

(1)按人均教育费支出的高低排队,并以20%的比例抽取样本(用表格列示);

(2)其他内容及要求同前。

4. 整群抽样

(1)以省为单位进行整群抽样,抽取比例仍为20%(用表格列示);

(2)其他内容及要求同前。

5. 对比四种不同抽样组织方式抽样误差的计算和总体参数的推算结果,并说明抽样误差大小的

原因。

项目六:统计学综合性实验

一、教学目的

通过该实验项目的学习所要达到的目标是:

熟悉一个社会调查项目的全部操作过程,主要包括:制定调查方案、确定抽样框、设计调查问卷、预调查、问卷的修改、进行正式调查、问卷编码、数据录入及分析报告的撰写等,加深对抽样调查的全过程的理解,使所学过的理论知识与社会实际有效地结合,提高学生分析问题、解决问题的能力。

二、实验项目背景

(一)基于对某省六所高校2001级全日制高校新生的问卷调查,分析影响高考成功的主要因素,探索高考成功的经验与规律,为广大考生、家长、学校及有关管理部门提供有效的案例,也为高校的素质教育和管理提供决策的依据。

(二)调查方案设计与实施

1、调查方案设计

本项研究选择某省六所高校2001级新生为调查对象。调查项目包括学生的个人信息,包括学校类型(1=医科大学.2=师范大学,3=财经大学,4=农业大学,5=综合大学,6=工业大学)、年龄、高考总分、性别(1=男,2=女)、是否为独生子女(1=是,2=否)、是否应届生(1=应届生,2=往届生)、父亲的职业(1=干部.2=工人,3=农民,4=个体,5=其他)、母亲的职业(1=干部.2=工人,3=农民,4=个体,5=其他)、家庭所在地(1=城市.2=农村,3=其他)、家庭人均月收入(1=300元以下.2=300-600元,3=600-900元,4=900元以上)、家庭住房建筑面积等项目;还包括影响高考成功因素的20个问题——努力学习、学习方法、复习方法、老师指导、同学帮助、父母教育、身体健康、考前心态、考场心态、临场发挥、记忆力、思维能力、想象能力、考试策略技巧、学习态度、自学能力、学习基础、班级学习气氛、考前营养、考试居住环境,每个题均为5级分制,1分表示影响很小,2分表示影响较小,3分表示影响一般,4分表示影响较大,5分表示影响很大。也即分数的高低决定了每项因素对高考成功影响程度的大小。

2、调查项目分析,量表效度和信度分析

编制预试问卷,进行预试。对设计的20个问题,先抽取200个样本进行预分析(为样本容量的20%)。

⑴对200个受试者项目总得分进行项目分析。对总分高于27%和低于27%的两个组进行均值差异的显著性检验,检验结果表明,所有题项的CR值均达到显著水准,说明这20个问题能鉴别受试者的反映程度,无需剔除问题。

⑵对量表的结构有效度进行因素分析。用多元统计中的因素分析方法,按特征值大于1的原则,把20个项目缩减为少数六个彼此相关的因素——环境饮食因素、身心健康因素、个人能力因素、学习方法因素、他人帮助因素、基础及技巧因素。对总量表和六个层面的量表进行信度分析。信度分析结果表明:总分量表信度系数为0.827,六个分量表的信度系数分别为——环境因素0.74、身心健康因素0.73、能力因素0.67、学习方法因素0.65、他人帮助因素0.68、基础及技巧因素0.54。本量表除第六个分量表(基础及技巧因素)信度稍低外,其余分量表的信度系数均在0.65以上,代表此量表信度较佳,可以用于正式调查。

统计学课堂练习.

課堂作业 第一章 1、统计的三种含义中,做为基础的是( B A统计分析B统计工作C统计学D统计资料 2、专业技术人员的职称是(A品质标志B数量标志C质量指标D数量指标 3、属于数量标志的是(D A性别B民族C健康状况D年龄 4、在全国人口普查中,总体单位是(B A每一户B每个人C每个地区的人D全国人口数目 5、统计学是(B A实质性科学B方法论科学C纯自然科学D社会学科学 6、属于质量指标的是( A国内生产总值B利税总额C劳动生产率D社会商品零售总额 7、属于数量指标的是(A帄均工资B人均可支配收入C资金利税率D粮食总产量 8、比利时统计学家凯特勒对统计理论最大的贡献是将(引入了统计学。 9、统计的三种含义分别是(、(、( 10、名词解释:描述统计、推断统计11、简述统计学的研究对象 12、简述统计学的三种含义之间的关系 1. 搜集第一手资料的主要方法是(B A、业务记录

B、统计调查 C、统计表 D、整理表 2、某地为了推广先进企业的生产经营管理经验,对效益最好的几个企业进行调查,这种调查属于(C A、重点调查 B、抽样调查 C、典型调查 D、普查 3、在统计调查阶段,对有限总体(D A、只能进行全面调查 B、只能进行非全面调查 C、既不能进行全面调查,也不能进行非全面调查 D、全面调查和非全面调查都能进行 4、了解我国城乡居民生活状况,最合适的调查方式是(D A、普查 B、抽样调查 C、重点调查 D、典型调查

5、人口普查规定统一的标准时点是为了(A A. 避免登记的重复和遗漏 B. 具体确定调查单位 C. 确定调查对象的范围 D. 统一调查时间,一起行动 6、抽样调查和重点调查均为非全面调查,二者的基本区别在于(D A、组织方式不同 B、作用不同 C、灵活程度不同 D、选取调查单位的方法不同 7、统计报表按填报单位区分为(C A、国家、部门和地方的统计报表 B、定期报表和年报报表 C、基层报表和综合报表 D、单一表和一览表 8、重点调查所选的重点单位,必须是在调查对象中(A A、具有较大标志值的那一部分调查单位 B、具有代表性的调查单位 C、按随机原则选出的调查单位

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学导论第二版习题详解

统计学导论(第二版)习题详解 第一章 一、判断题 一、判断题 1.统计学是数学的一个分支。 答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。 2.统计学是一门独立的社会科学。 答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。 3.统计学是一门实质性科学。 答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。 4.统计学是一门方法论科学。 答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。 5.描述统计是用文字和图表对客观世界进行描述。 答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。 6.对于有限总体不必应用推断统计方法。 答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。 7.经济社会统计问题都属于有限总体的问题。 答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 8.理论统计学与应用统计学是两类性质不同的统计学。 答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学课堂习题 (1).docx

试卷A 一、单选题 1.按地理区域划片进行的区域抽样,其抽样方法属于(D) A.纯随机抽样 B.等距抽样 C.类型抽样 D.整群抽样 2.已知整体平均数为200,离散系数为0.05,则总体方差(C) A.根号10 B.10 C.100 D.0.1 3.当抽样允许误差固定时,抽样估计的可靠性将随样本单位数n的增大(B) A.保持不变 C.随之扩大 C.随之变小 D.无法定论 4.对职工的生活水平状况进行分组研究,正确的选择分组标志应当用(C) A.职工月工资总额的多少 B.职工的人均月岗位津贴及奖金的多少 C.职工家庭成员平均月收入额的多少 D.职工人均月收入额的多少 5. 已知环比增长速度为0.08,0.09,0.1,则平均增长速度计算公式是(D) A.(0.08+0.09+0.1)/3 B.0.08×0.09×0.01 C.(1.08×1.09×1.1-1)开3次方 D.(1.08×1.09×1.1)开3次方-1

6.简单直线回归方程中的回归系数b不能反应的是(C) A.两个变量的相关方向 B.两个变量之间的数量变动系数 C.两个变量之间的计量单位 D.自变量增减一个单位,则因变量平均增减多少 7.下列只能属于属性变量的是(C) A.干部年龄 B.干部工龄 C.干部职称 D.干部工资 8.抽样调查分组时,若组内差异大,组间差异小,适宜的方法是(A) A. 整群抽样 B.类型抽样 C.等距抽样 D.多阶段抽样 9.已知三个商店苹果的单价和销售量,要求计算3个店苹果的平均价,应该采用(B) A.简单算术平均数 B.加权算术平均数 C.几何平均数 C.加权调和平均数 10.本书指的抽样误差的定义是(D) A.总体指标与相应的抽样指标之间的抽样误差的可能程度 B.抽样平均数的标准差 C.总体指标与相应的抽样指标之间抽样误差的可能程度 D. 所在样本的可能估计值与所要估计的总体真值之间的平均差异 11.某10位举重运动员体重分别是:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足(D)

统计学李金昌版习题答案详解

练习与思考答案 第一章 一、判断题 1.√ 2.× 3.× 4.× 5.√ 6.√ 7.√ 8.× 9.√10.× 二、单项选择题 1.B 2.C 3.B 4.D 5.D 6.C 三、简答题(略) 第二章 一、判断题 1.× 2.× 3.× 4.√ 5.× 6.× 7.× 8.× 二、单项选择题 1.C 2.A 3.B 4.A 5.C 三、简答题(略) 四、计算题 (4)钟型分布。 五、实践题(略) 第三章 一、判断题 1.× 2.√ 3.× 4.× 5.× 6.× 7.× 8.× 9.×10.√ 二、单项选择题 1.B 2.C 3.C 4.B 5.C 6.D 7.A 8.C 9.C 10.C 11. D 12.D 三、简答题(略) 四、计算题 1、平均时速=109.09(公里/时) 2、顾客占了便宜,因为如果两条鲫鱼分开买,则平均价格为16.92元/公斤。在这次买卖中,顾客所占的便宜是11元-10.4元=0.6元。原因是鲫鱼重量有权数作用。 3、(1)平均每个企业利润额=203.70(万元); (2)全公司平均资金利润率=13.08%。 4、(1)全厂总合格率、平均合格率和平均废品率分别是92.17%、97.32%和

2.68%;(采用几何平均法) (2)全厂总合格率、平均合格率和平均废品率分别是97.31%、97.31%和2.69%;(采用调和平均法) (3)全厂总合格率、平均合格率和平均废品率分别是97.38%、97.38%和2.62%。(采用算术平均法) 5、(1)算术平均数x =76.3043;四分位数L Q =70.6818,M Q =75.9091和 U Q =82.5;众数o m =75.38; (2)全距R=50;平均差 A.D.=7.03;四分位差d Q =11.82,异众比率 r V =51.11%;方差2s =89.60;标准差s =9.4659; (3)偏度系数(1)k S =0.0977,(2)k S =0.1154,(3)k S =0.0454; (4)峰度系数β=2.95; (5)12.41%12.5%s s V V ==乙甲;。甲班平均成绩更有代表性。 6、小号、中号和大号三款校服大概应分别准备544、128、128套。 7、若是非变量结果为1的比重为P ,则是非变量的平均数为P 、方差为 (1)P P - 8、甲、乙、丙三位同学该三门课程的标准化成绩的总和分别为1.27,0.52和1.63,所以,丙同学更具有竞争优势。 第四章 一、判断题 1.√ 2.× 3.√ 4.× 5.× 6.× 7.× 8.√ 9.× 10.× 二、单项选择题 1.C 2.D 3.C 4.C 5.C 三、简答题(略) 四、计算题 1、(1)样本均值的抽样分布为: i x : 3 3.67 4.33 5 5.67 6.33 7 i π:0.1 0.1 0.2 0.2 0.2 0.1 0.1 (2)样本均值抽样分布的期望为:()E x =5;方差为:()V x =1.33; (3)抽样标准误为:()SE x =1.1547; (4)概率保证程度95%时的抽样极限误差为:?=2.2632;

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何%( (1-4%)/(1-8%)*100%=96%/92%*100%=%结果表明:超额完成%(%-100%) ) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为(元)众数为(元) 求中位数: 先求比例:(1500-720)/(1770-720)= 分割中位数组的组距:(800-700)*= 加下限700+= 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)= 分割众数组的组距:*(800-700)= 加下限:700+= 年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: /人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为(元) 众数为(元) 求中位数: 先求比例:(50-20)/(65-20)= 分割中位数组的组距:(800-600)*= 加下限:600+= 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少% (上年实际完成= 本年实际计划比上年增长 ()/==%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高 (2)哪个单位工人的生产水平整齐 % 3.33V %7.44V /8.1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学课后习题

第二章统计数据调查与整理 9.对50只灯泡的耐用时数进行测试,所得数据如下: (单位:小时) 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求: (1)根据上述资料编制次数分布数列,并计算向上累计与向下累计频数与频率。 (2)根据所编制的次数分布数列,绘制直方图、折线图。 (3)根据图形说明灯泡耐用时数的分布属于何种类型。 最大值=651 最下限=650 最小值=1120 最上限=1150 全距=1120-651=469 组数=5,组距=100 组限人数频率%向上累计 频数 向上累计 频率% 向下累计 频数 向下累计 频率% 650-75010、02 1 0、0250 1 750-850 40、08 5 0、149 0、98 850-950300、635 0、745 0、9 950-1050120、2447 0、9415 0、3 1050-115030、0650 1 3 0、06 10.某服装厂某月每日的服装产量如下表所示。 某服装厂X月X日服装产量表 将表中资料编制成组距式分配数列,用两种方式分组,各分为五组,.比较哪一种分组较为合理。等距式分组(不考虑异常数据) 组限频次 0-505 50-1003 100-15012 150-2007

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学例题讲解

统计学例题讲解 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

第四章计算变异指标;比较平均指标的代表性。 例题:某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性 解: 第十一章:计算相关系数、建立回归方程并解释回归系数的含义、预测因变量的估计 值。 4.计算相关系数;建立直线回归方程并指出回归系数的含义;利用建立的方程预测因变量的估计值。 例题: 要求: (2)配合回归方程,指出产量每增加1000件时,单位成本 平均变动多少 (3)假定产量为6000件时,单位成本为多少元 ∑x2=79 n=6 ∑x=21 ∑y=426 ∑y2=30268 ∑xy=1481

(1) 相关系数: 2 222 )(1 )(1 1 ∑∑ ∑∑∑∑∑-?-?- = y n y x n x y x n xy r = 说明产量x 和单位成本y 之间存在着高度负相关关系。 (2)设直线回归方程为y c =a+bx n=6 ∑x =21 ∑y =426 ∑x 2 =79 ∑ y 2 =30268 ∑xy =1481 = (1481-1/6*21*426)/(79-1/6*21*21)= x b y a -==426/6-*21/6= 则y c = 在这里说明回归系数b 的含义 ,即产量每增加1000件时, 单位成本平均降低元 . (3)假定产量为6000件,即x=6时,单位成本为: 则y c = =元) . 即单位成本为: 元. 2.根据企业产品销售额(万元)和销售利润率(%)资料计算出如下数据: n=7 ∑x =1890 ∑y = ∑x 2=535500 ∑y 2= ∑xy =9318 要求: (1) 确定以利润率为因变量的直线回归方程. (2)解释式中回归系数的经济含义. (3)当销售额为500万元时,利润率为多少 参考答案: (1) 确定以利润率为因变量的直线回归方程: Y=+ (2)解释式中回归系数的经济含义: 产品销售额每增加1万元,销售利润率平均增加%. 第十四章:数量指标综合指数、质量指标综合指数的计算; 从相对数和绝对数角度对总量指标的变动进行因素分析。 5.计算综合指数及平均指数(加权、调和)并同时指出变动绝对值、计算平均数指数。 例题1 (1)计算两种产品总成本指数及总成本变动的绝对额;

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

相关文档
最新文档