《统计学》-第10章-习题答案

1. 收集我国31个省(区、市)2007年反映经济发展情况的八项指标的数据,具体采用的指标包括:地区生产总值、工业总产值、固定资产投资、职工平均工资、居民消费水平、货物周转量、居民消费价格指数、商品零售价格指数。并对这八项指标利用主成分分析法进行降维。

数据请见2012ChinaEcoDevp.asv。该数据是2012年我国31个省(区、市)地区生产总值(亿元)、大中型工业资产总值(亿元)、按登记注册类型分全社会固定资产投资(亿元)、镇私营单位就业人员平均工资(元)、居民消费水平(元)、货物周转量(亿吨公里)、居民消费价格指数、商品零售价格指数这八项指标。

SPSS各选项操作是按照课本中的步骤,此处省。

得到的相关系数矩阵见表1,从表中的数据来看,变量之间存在着较大的相关性,最大的值能达到0.965,所以对该组数据进行主成分分析时有意义的。

表一相关矩阵

地区居民消费水平(元)地区生

产总值

(亿元)

按登记

注册类

型分全

社会固

定资产

投资(亿

元)

镇私营

单位就

业人员

平均工

资(元)

货物周

转量(亿

吨公里)

居民消

费价格

指数

商品零

售价格

指数

地区居

民消费

水平

(元)

地区居民消费

水平(元)

1.000 .374 .074 .721 .595 1.000 .374 .074 地区居民消费

水平(元)

.374 1.000 .879 .340 .575 .374 1.000 .879 地区居民消费

水平(元)

.074 .879 1.000 .120 .504 .074 .879 1.000 地区居民消费

水平(元)

.721 .340 .120 1.000 .216 .721 .340 .120 地区居民消费

水平(元)

.595 .575 .504 .216 1.000 .595 .575 .504 地区居民消费

水平(元)

.044 -.311 -.389 .090 -.229 .044 -.311 -.389 地区居民消费

水平(元)

-.417 -.112 .007 -.313 -.072 -.417 -.112 .007 地区居民消费

水平(元)

.449 .965 .826 .407 .580 .449 .965 .826

表2是SPSS输出的一项表格,称为“解释的总方差”。表中的第二列是各个主成分对应的特征值,第三列是各主成分对解释原始变量总方差的贡献率,第四列是时方差的累积贡献

率。按照“特征值大于1”的原则,SPSS提取了三个主成分,即表中的前三个主成分。这三

个成分共解释原始变量总方差的84.562%。其中特征值的大小也可以在碎石图(图1)中可以看出。

表2 解释的总方差

图1 碎石图

主成份的系数并不能直接从SPSS 的输出结果中找到。根据因子分析与主成份分析的关系,主成份的系数可以由成份矩阵除以相应的特征值的平方根得到,见表4。SPSS 输出的成份矩阵见表3, 而相应的特征值已经在表2中 给出。

表3 成份矩阵

表4 成份系数矩阵

第一主成份中,地区生产总值、固定资产投资值,货物周转量的系数及大中型工业资产比较大,可以看成是影响一个地区经济发展的生产能力指标;第二主成份中,居民消费水平、平均工资的系数比较大,那么第二主成份可以看成是影响一个地区经济发展的消费情况;第三主成份主要反映了消费价格指数和商品零售价格指数。

则第一主成份=0.3218*地区居民消费水平+0.4373*地区生产总值+0.4049*按登记注册类型分全社会固定资产投资+0.2684*镇私营单位就业人员平均工资+0.3787*货物周转量-0.1945

成份

1

2

3

地区居民消费水平(元) 0.3218 0.5490

0.0908 地区生产总值 (亿元) 0.4737 -0.2074

0.1014 按登记注册类型分全社会固定资产投资(亿元) 0.4049 -0.4156

0.0503 镇私营单位就业人员平均工资(元)

0.2684 0.5243

0.1384 货物周转量(亿吨公里) 0.3787 0.0062

0.1226 居民消费价格指数 -0.1945

0.2483

0.6984 商品零售价格指数 -0.1611 -0.3585 0.6640

大中型工业资产(亿元)

0.4783 -0.1319 0.1296

*居民消费价格指数-0.1611*商品零售价格指数+0.4783*大中型工业资产;第二主成份和第三主成份的表达式类似。

在计算主成份得分时,要注意对原始的八个变量进行标准化后再代入到上述公式中。

2. 对第1题的数据进行因子分析,解释分析结果的经济意义,并比较主成分分析和因子分析的结果。

在进行数据降维的因子分析模块中,因子提取的方法是主成份法,因子载荷矩阵旋转采用的是最大方差法。表5的“公因子方差”表显示了各个变量的共同度。从表中可以看出,除了“货物周转量”变量外其他变量的共同度都比较高。

表5 公因子方差

初始提取

地区居民消费水平(元) 1.000 .911

地区生产总值 (亿元) 1.000 .938

1.000 .916

按登记注册类型分全社会固

定资产投资(亿元)

1.000 .761

镇私营单位就业人员平均工

资(元)

货物周转量(亿吨公里) 1.000 .564

居民消费价格指数 1.000 .874

商品零售价格指数 1.000 .882

大中型工业资产(亿元) 1.000 .919

提取方法:主成份分析。

对于因子分析,因子进行了旋转,其旋转之后的方差贡献率见表2的第8-10列。从表中可以看出,经过旋转的因子其方差贡献率发生了改变。但是累积方差贡献率没有变化,这表明旋转后的因子并未对原始数据产生更多的解释,但是旋转后的成份矩阵其值更接近于1或者0。旋转前的成份矩阵见表6,旋转后的成份见表7.

表6 成份矩阵

成份矩阵a

成份

1 2 3

地区居民消费水平(元).627 .712 .103

地区生产总值 (亿元) .923 -.269 .115

.789 -.539 .057

按登记注册类型分全社会固

定资产投资(亿元)

镇私营单位就业人员平均工

.523 .680 .157

资(元)

货物周转量(亿吨公里).738 .008 .139

居民消费价格指数-.379 .322 .792

商品零售价格指数-.314 -.465 .753

大中型工业资产(亿元).932 -.171 .147

提取方法 :主成份。

a. 已提取了 3 个成份。

表7 旋转成份矩阵

成份

1 2 3

地区居民消费水平(元).222 .924 -.086

地区生产总值 (亿元) .943 .195 -.099

.944 -.111 -.111

按登记注册类型分全社会固

定资产投资(亿元)

.159 .858 -.006

镇私营单位就业人员平均工

资(元)

货物周转量(亿吨公里).658 .360 -.045

居民消费价格指数-.326 .236 .844

商品零售价格指数.094 -.434 .828

大中型工业资产(亿元).910.291 -.076

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

a. 旋转在 5 次迭代后收敛。

从旋转后的成份矩阵看,第一个因子在地区生产总值、固定资产投资值,货物周转量的系数及大中型工业资产比较大,;第二个因子主要反映了居民消费水平和平均工资的系数比较大;第三因子主要反映了消费价格指数和商品零售价格指数。利用表7,可以得到

地区居民消费水平=0.222*因子1+0.924*因子2-0.086*因子3;

地区生产总值=0.943*因子1+0.195*因子2-0.099*因子3;

……

因子得分系数矩阵见表8。通过该表可以得到

因子1=-0.043*地区居民消费水平+0302*地区生产总值+0.339*固定资产投资-0.049*平均工资+0.186*货物周转量-0.058*居民消费价格指数+0.172*商品零售价格指数+0.281*大中型工业资产

因子2和因子3的计算同因子1.

成份得分系数矩阵

成份

1 2 3

地区居民消费水平(元)-.043 .459 .018

地区生产总值 (亿元) .302 -.018 .035

按登记注册类型分全社会固

.339 -.182 .007

定资产投资(亿元)

-.049 .437 .066

镇私营单位就业人员平均工

资(元)

货物周转量(亿吨公里).186 .108 .057

居民消费价格指数-.058 .219 .612

商品零售价格指数.172 -.190 .600

大中型工业资产(亿元).281 .039 .056

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

构成得分。

至此,我们可以看出,选取的三个主成份和我们找出的三个因子都分别解释相同的变量。

3. 对第1题的数据,采用因子分析法对我国各地区的经济发展状况进行综合评价,并进行排序。

按照公式

31

3

21

2

11

1

F F F F ∑∑∑===+

+

=

p

i i

p

i i

p

i i

λ

λλ

λλ

λ,其中321F F F ,,是各地区的因子得分。这个因子得分

在进行因子分析中已在数据中被保存为新的变量FAC1_1, FAC1_2, FAC1_3。 通过计算,我们得到各地区的综合得分为

地区 综合得分 排名 北 京 0.310037 9 天 津 0.458487 6 河 北 0.235904 11 山 西 -0.38257 24 内蒙古 0.259328 10 辽 宁 0.499239 5 吉 林 -0.58435 30 黑龙江 -0.19458 20 上 海 0.597299 4 江 苏 1.092139 2 浙 江 0.428751 7 安 徽 -0.092 16 福 建 -0.10016 17 江 西 -0.33029 22 山 东 0.688747 3 河 南 0.175285 12 湖 北 0.12795 13 湖 南 -0.46145 26 广 东 1.138237 1 广 西 -0.06575 15 海 南 -0.31265 21 重 庆 -0.34909 23 四 川 -0.1941 19 贵 州 -0.53916 28 云 南 -0.44498 25 西 藏 0

14 陕 西 -0.16248 18 甘 肃 -0.49009 27 青 海 -0.55833 29 宁 夏

-1.06624

31

新疆0.316865 8

北京排名居然第9,有点怪异,请教各位亲~~

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与S P S S的应用(第五版)》(薛薇) 课后练习答案 第10章SPSS的聚类分析 1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求: 1)根据凝聚状态表利用碎石图对聚类类数进行研究。 2)绘制聚类树形图,说明哪些省市聚在一起。 3)绘制各类的科研指标的均值对比图。 4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。 采用欧氏距离,组间平均链锁法 利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4类。 步骤:分析→分类→系统聚类→按如下方式设置…… 结果: 凝聚计划 阶段 组合的集群 系数 首次出现阶段集群 下一个阶段集群 1 集群 2 集群 1 集群 2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 20 25 1053.423 0 0 5 4 4 12 1209.922 0 0 15 5 8 20 1505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 30 1 2 293834.503 0 29 0 将系数复制下来后,在EXCEL中建立工作表。 选中数据列,点击“插入”菜单→拆线图……

应用统计学(第二版)(参考答案)第10章习题答案

第10章习题答案 一、思考题(略) 二、选择题 1、A; 2、B; 3、B; 4、D; 5、A; 6、A; 7、CD; 8、CD; 9、BCE; 10、CD。 三、计算题 1、(1)计算的各商品物价和销售量个体指数列示于下表。 各商品物价和销售量个体指数表 计量 单位 甲乙丙 双件双 (2)三种商品的销售额指数与增加额分别为:132.3%与767600元; (3)三种商品物价综合指数为113.13%,由于物价变动对销售额的影响365000元;(4)三种商品的销售量综合指数为116.94,,由于销售量变动对销售额的影响402600元。

2、调和平均数形式计算。 三种商品的综合物价指数为106.5%。 3、销售量增长了15.8%。 4、物价指数为112.36%。 5、今年和去年相比,该市零售总额指数:149.88%; 零售价指数:111.5%; 零售量指数:134.42%。 零售量变动对零售额的影响为2960万元;零售价变动对零售额的影响为1330万元。 6、(1)零售物价上涨了7.3%; (2)为维持上年的消费水平,由于零售物价上涨消费者多支出了396亿元; (3)若零售物价保持不变,消费者因提高消费水平导致零售量增长而增加的零售额为475亿元。 7、物价上涨使食品销售额增加510.77万元;食品销售量变化使销售额增加273.31万元。 8、该地区3种水果的价格指数为:96.09%;由于价格变动使居民开支减少5.29万元。 9、解:编制计算表如下表10-7(a )所示。 表10-7(a ) 某厂成本指数计算表 45 52 产品的总平均成本(z )=[∑产品单位成本(z )×产品产量(q)]/∑产品产量(q) 产品的总平均成本指数=产品结构变动指数×产品单位成本变动指数 11 101 1 11 11000 00 01 1 0z q q z q q z q q z z q q z q q z q q z = = ?∑∑∑∑∑∑∑∑∑∑∑∑

统计学习题答案 第10章 统计指数

第10章统计指数——练习题 ●1. 给出某市场上四种蔬菜的销售资料如下表: ⑵再用帕氏公式编制四种蔬菜的销售量总指数和价格总指数; ⑶比较两种公式编制出来的销售量总指数和价格总指数的差异。 解:设销售量为q,价格为p,则价值量指标、数量指标、质量指标三者关系为:销售额=销售量×价格 qp = q×p 于是,对已知表格标注符号,并利用Excel计算各综合指数的构成元素如下: 于是代入相应公式计算得: ⑴用拉氏公式编制总指数为:

四种蔬菜的销售量总指数 1000 2124 104.16% , 2039.2 q q p L q p = = =∑∑ 四种蔬菜的价格总指数 010 2196.8 107.73%2039.2 p q p L q p == =∑∑ ⑵ 用帕氏公式编制总指数: 四种蔬菜的销售量总指数为 11 01 2281 103.83% 2196.8 q q p P q p = = =∑∑ 四种蔬菜的价格总指数为 111 2281 107.39%2124 p q p P q p = = =∑∑ ⑶ 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数>帕氏指数 在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。 帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算 期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。 ●2.依据上题的资料,试分别采用埃奇沃斯公式、理想公式和鲍莱公式编制销售量指数;然后,与拉氏指数和帕氏指数的结果进行比较,看看它们之间有什么关系。 解:采用埃奇沃斯公式编制销售量指数为: 1011 011 10 1 ()() 212422814405 103.9896% 2039.22196.84236 q q p p q p q p E q p p q p q p ++== +++= ==+∑∑∑∑∑∑ 采用理想公式编制销售量指数为: 103.994869% q F = == 采用鲍莱公式编制销售量指数为:

《统计学》教材课后习题答案

《统计学》课后习题答案 第一章 一、单选:1~5 DCCDB 6~10 BDADB 11~15 ABCAC 二、多选: 8、ACE 2、BC 3、BE 4、CE 5、BDE 6、ABCDE 7、ABDE 8、ABD 三、判断:1~5 ×√×√×6~10 √√××√ 第二章 一、单选:1~5 CDD B A 6~8 DAC 二、多选:1、BCDE 2、ABD 3、DE4、ACD5、CD 三、判断:1~5√√√×× 6 × 第三章 一、单选:1~5 DD B CC 6 B 二、多选:1、AC 2、ABD3、AE4、BE 5、CD 三、判断:1~5 √××√× 五、计算 1、把题中数值按大小顺序排序: 25 26 29 30 31 32 33 34 34 35 36 36 36 37 37 38 38 39 40 41 42 42 43 43 43 44 45 46 47 49 全距:49 - 25 = 24 表3-1 某生产车间30名工人日加工零件次数分布表 按零件分组(件)频数(人)频率(%)组中值 25~30 30~35 35~40 40~45 45~50 3 6 9 8 4 10 20 30 27 13 27.5 32.5 37.5 42.5 47.5 合计30 100 — 2. 把题中数值按大小顺序排序: 20 20 20 21 21 21 21 21 21 21 22 22 22 22 22 22 22 22

22 22 23 23 23 23 23 23 24 24 24 24 全距:24 - 20 = 4 表3-2 某企业30名工人在一个工作间内生产的零件数量次数分布表按零件数分组(件)工人数(人)比重(%) 20 21 22 23 24 3 7 10 6 4 10.0 23.3 33.3 20.0 13.4 合计30 100.0 3、把题中数值按大小顺序排序: 49 54 57 57 60 61 64 65 67 68 70 71 72 72 72 73 75 75 76 76 78 79 81 81 81 82 83 84 85 86 86 87 87 87 89 89 89 90 95 97 全距:97 - 49 = 48 表3-3 某班40名学生统计学考试成绩次数分布表 按等级分组频数(人)频率(%) 不及格及格中 良 优4 6 12 15 3 10.0 15.0 30.0 37.5 7.5 合计40 100.0 (2) 表3-4 某班40名学生统计学考试成绩次数分布表按成绩分组(分)频数(人)频率(%) 60以下60~70 70~80 4 6 12 10.0 15.0 30.0

《统计学》-第10章-习题答案

1. 收集我国31个省(区、市)2007年反映经济发展情况的八项指标的数据,具体采用的指标包括:地区生产总值、工业总产值、固定资产投资、职工平均工资、居民消费水平、货物周转量、居民消费价格指数、商品零售价格指数。并对这八项指标利用主成分分析法进行降维。 数据请见2012ChinaEcoDevp.asv。该数据是2012年我国31个省(区、市)地区生产总值(亿元)、大中型工业资产总值(亿元)、按登记注册类型分全社会固定资产投资(亿元)、镇私营单位就业人员平均工资(元)、居民消费水平(元)、货物周转量(亿吨公里)、居民消费价格指数、商品零售价格指数这八项指标。 SPSS各选项操作是按照课本中的步骤,此处省。 得到的相关系数矩阵见表1,从表中的数据来看,变量之间存在着较大的相关性,最大的值能达到0.965,所以对该组数据进行主成分分析时有意义的。 表一相关矩阵 地区居民消费水平(元)地区生 产总值 (亿元) 按登记 注册类 型分全 社会固 定资产 投资(亿 元) 镇私营 单位就 业人员 平均工 资(元) 货物周 转量(亿 吨公里) 居民消 费价格 指数 商品零 售价格 指数 地区居 民消费 水平 (元) 地区居民消费 水平(元) 1.000 .374 .074 .721 .595 1.000 .374 .074 地区居民消费 水平(元) .374 1.000 .879 .340 .575 .374 1.000 .879 地区居民消费 水平(元) .074 .879 1.000 .120 .504 .074 .879 1.000 地区居民消费 水平(元) .721 .340 .120 1.000 .216 .721 .340 .120 地区居民消费 水平(元) .595 .575 .504 .216 1.000 .595 .575 .504 地区居民消费 水平(元) .044 -.311 -.389 .090 -.229 .044 -.311 -.389 地区居民消费 水平(元) -.417 -.112 .007 -.313 -.072 -.417 -.112 .007 地区居民消费 水平(元) .449 .965 .826 .407 .580 .449 .965 .826 表2是SPSS输出的一项表格,称为“解释的总方差”。表中的第二列是各个主成分对应的特征值,第三列是各主成分对解释原始变量总方差的贡献率,第四列是时方差的累积贡献 率。按照“特征值大于1”的原则,SPSS提取了三个主成分,即表中的前三个主成分。这三

2015年《统计学》第十章 时间序列分析习题及满分答案

2015年《统计学》第十章时间序列分析习题及满分答案 一、单项选择: 1.时间数列中,每项指标数值可以相加的是(B ) A.绝对数时间数列 B. 时期数列 C. 时点数列 D.相对数或平均数时间数列 2. 下列属于时点数列的是(D) A. 某厂各年工业产值 B.某厂各年劳动生产率 C.某厂各年生产工人占全部职工的比重 D.某厂各年年初职工人数 3.发展速度与增长速度的关系是( B ) A. 环比增长速度等于定基发展速度-1 B. 环比增长速度等于环比发展速度-1 C. 定基增长速度的连乘积等于定基发展速度 D. 环比增长速度的连乘积等于环比 发展速度 4.年距增长速度是(C) A. 报告期水平/基期水平 B. (报告期水平— 基期水平)/基期水平 C. 年距增长量/去年同期发展水平 D. 环比增长量/前一时期水平 5.几何平均法平均发展速度数值的大小(C)

A. 不受最初水平和最末水平的影响 B. 只受中间各期发展水平的影响 C. 只受最初水平和最末水平的影响,不受中间各期发展水平的影响 D. 既受最初水平和最末水平的影响,也受中间各期发展水平的影响 6.某厂第一季度三个月某种产品的实际产量分别为500件、612件、832件、分别超计划0%、2%和4%,则该厂第一季度平均超额完成计划的百分数为 ( C ) A. 102% B. 2% C. 2.3% D. 102.3% 7.时期数列中的每个指标数值是(B)。 A、每隔一定时间统计一 次 B、连续不断统计而取得 C、间隔一月统计一次 D、定期统计一次 8.一般平均数与序时平均数的共同之处是(A)。 A、两者都是反映现象的一般水平 B、都是反映同一总体的一般水平 C、共同反映同质总体在不同时间上的一般水平 D、都可以消除现象波动的影响 9.某企业1997年产值比1990年增长了1倍,比1995年增长了0.5倍,则1995年比1990年增长了( A )。 A、0.33 B、0.5 C、 0.75 D、1 10.假设有如下资料:则该企业一季度平均完成计划为(B)。 一月二月三月某产品实际完成数 500

《统计分析与SPSS的应用(第五版)》课后理解练习答案解析(第10章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第10章SPSS的聚类分析 1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求: 1)根据凝聚状态表利用碎石图对聚类类数进行研究。 2)绘制聚类树形图,说明哪些省市聚在一起。 3)绘制各类的科研指标的均值对比图。 4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。 采用欧氏距离,组间平均链锁法 利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4类。步骤:分析→分类→系统聚类→按如下方式设置……

结果: 凝聚计划 阶段 组合的集群 系数 首次出现阶段集群 下一个阶段集群1 集群2 集群1 集群2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 20 25 1053.423 0 0 5 4 4 12 1209.922 0 0 15 5 8 20 1505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28

《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本

统计分析与spss的应用第三版 第10章课后习题详细答案

统计分析与spss的应用(第三版)第10章课后习题详细答案 1、(1) 聚类分析的第1步,1号样本(广西瑶族)和3号样本(广西侗族)聚为一小类,它们的个体距离(欧氏距离)是3.722,这个小类将在下面第2步用到。 聚类分析的第2步,8号个体(贵州苗族)与第1步聚成的小类(1号和3号聚成的小类)又聚成一小类,它们的距离(个体与小类的距离,采用组间平均链锁距离)是9.970,这个小类将在下面第4步用到。 聚类分析的第3步,5号样本和7号样本聚成小类,它们的距离(个体与个体的距离)是11.556,这个小类将在第5步用到。 聚类分析的第4步,6号与第2步形成的小类(1号3号8号聚成的小类)聚为小类,它们的距离(个体与小类的距离)为18.607,这个小类将在第6步用到。 聚类分析的第5步,4号样本与第3步聚成的小类聚为小类,它们的距离(个体与小类的距离)为20.337,这个小类将在第6步用到。 聚类分析的第6步,第4步聚成的小类与第5步聚成的小类聚成小类,它们的距离(小类与小类的距离,采用组间平均链锁距离)是22.262,这个小类将在下面第7步中用到。聚类分析的第7步,2号样本与第6步中聚成的小类聚成小类。它们的距离(个体与小类的距离)是31.020。 经过7步,8个样本最后聚成了一大类。 (2) (3) 广西瑶族与广西侗族、贵州苗族、基诺族为一类,土家族与崩龙族、白族为一类,湖南侗族自成一类 2、(1)凝聚状态表

随着类数目不断减少,类间距离在逐渐增大。3类后,聚间距离迅速增大,形成极为平坦的碎石路。所以考虑聚成3类。 (2)

北京自成一类,江苏广东上海湖南湖北聚为一类,剩余的聚省为一类。

北京师范大学《统计学》课后习题答案

统计学书稿习题答案 第一章 二、单选题 1.D; 2. C; 3.B; 4. C; 5.B; 6.A 第二章 二、单选题 1.D; 2.B; 3.D; 4.A; 5.C; 6.B; 7.D; 8.B; 9.A 第三章 二、单选题 1.A; 2.D; 3.C; 4.B; 5.D 三、计算题 1.累计次数分布和频率分布数列如下: 2.图略。 第四章 二、单选题 1.C; 2.B; 3.B; 4.B; 5.D; 6.C; 7.D; 8.B; 9.A;10.D;11.C;12.D;13.D;14.A;15.B;

16.A ;17.C ;18.C ;19.B ;20.C ;21.D ;22.B ;23.C ;24.B ;25.B ;26.B ;27.A ;28.B ; 29.A ;30.C ;31.B ;32.A ;33.C 三、计算题 1. 101.82% 2. 97.83% 3. (3)、(5)为结构相对指标,(6)为计划完成程度相对指标,(7)为动态相对指标。 5. 产品产量计划完成程度为108%,提前完成五年计划的时间为三个季度。 6. 3.64级 7. 十月份平均每人日生产量为57件/人,十一月份平均每人日生产量为64件/人。 8. 甲市场的平均价格1.2元/kg ,乙市场的平均价格1.18元/kg 。 9. 76.1X =分,e M =76.09分,o M =75.88分 10. 20个商店的平均完成销售计划指标为101.75%,20个商店的平均流通费用率12.38%。 11. 54.75X =,σ=2.85 12. 甲企业:633X =元,σ=112.3,V σ=17.74% 乙企业:613X =元,σ=111.05,V σ=18.12% 13. 甲品种:999X =斤,σ=68.91斤,V σ=6.9% 乙品种:998X =斤,σ=162.71斤,V σ=16.3%

管理统计学习题参考答案第十章

第十章 1. 解: 基本原理:观察值(如个别销售量)之间存在着差异,差异的产生来自于两个方面:一个方面是由因 素中的不同水平造成的,例如不同方案带来不同的销售量,对此我们可以称为系统性差异;另一个方面是由于抽选样本的随机性而产生的差异,例如,相同的方案在不同的分销市场的销售量也不同,可称为随机性误差。两个方面产生的差异可以用两个方差来计量,一个称为水平之间的方差,一个称为水平内部的方差。前者即包括系统性因素,也包括随机性因素。后者仅包括随机性因素。如果不同的水平(方案A 、B 、C 、D )对结果(销售量)没有影响,那么在水平之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方差就应该近似,两个方差的比值就会接近于1。反之,如果不同的水平对结果产生影响,在水平之间的方差中就不仅包括了随机性差异,也包括了系统性差异。这时,该方差就会大于水平内方差,两个方差的比值就会显著地大于1许多,当这个比值大到某个程度,或者说达到某临界点,就可以作出判断,说不同的水平之间存在着显著性差异。因此,方差分析就是通过组间方差与组内方差的比较,作出接受原假设或拒绝原假设的判断。小概率原理仍然是方差分析的指导思想。方差分析的步骤包括建立假设、计算F 统计量(组间方差与组内方差的比值)、给定置信水平、查表确定临界值、比较判断等。 2. 解:从方差分析的目的看,是要检验各个水平的均值u 1、u 2、u 3、u 4是否相等,而实现这个目的的手段 是通过方差的比较。 3. 解: 222)()()(∑∑∑∑∑∑-+-=-x x x x x x j j ij ij 即 SST=SSE+SSA 对总离差平方和(SST )来说,它是n 个离差平方2 ij )x -(x 之和,共同拥有一个平均数,也就失去了一个自由度,其自由度应为n-1。因为它只有一个约束条件,即 0=-=∑∑)(x x SST ij 对水平离差平方和(SSA )来说,本例是4组水平(即四种不同方案)离差平方2 )(x x j -之和,共同拥有一个平均数,也失去1个自由度,其自由度为14-。用r 表示组数,则有1144-=-=r , r 。它也有一个约束条件,即要求 0)(=-∑∑x x j

统计学第十章答案解析

第十章习题 10.1 H0:三个总体均值之间没有显著差异。 H1: 三个总体均值之间有显著差异。 答:方差分析可以看到,由于P=0.1078>0.01, 所以接受原假设H0。说明了三个总体均值之间没有显著差异。 10.2 H 0 :五个个总体均值之间相等。 H1: 五个总体均值之间不相等。

P=1.02E-05<0.01, H0 值之间不相等。 10.3 H 0 :四台机器的装填量相等。 H1: 四台机器的装填量不相等 答:方差分析可以看到,由于P=0.00068<0.01, 所以拒接原假设H0。说明了四台机器装填量不相同。

10.4 H 0 :不同层次管理者的满意度没有差异。 H1: 不同层次管理者的满意度有差异 P=0.000849<0.05, H0理者的满意度有差异。 10.5 H0:3 个企业生产的电池平均寿命之间没有显著差异。 H1: 3 个企业生产的电池平均寿命之间有显著差异 单因素方差分析

多重比较 因变量: VAR00002 *. 0.05 答:方差分析可以看到,由于P=0.00031<0.01, 所以拒接原假设H0。说明了不同 3 个企业生产的电池平均寿命之间有显著差异。

通过SPSS分析(1,2,3代表A,B,C公司),通过显著性对比可知道A和B以及B和C 公司有差异。 10.6 H0:不同培训方式对产品组装的时间没有显著影响。 答:方差分析可以看到,由于P=0.00196<0.05, 所以拒接原假设H0。说明了不同培训方式对产品组装的时间没有显著影响。 10.8

H 0:u 1=u 2=u 3=u 4=u 5 H 1:u i (i=1,2,3,4,5) 不全相等 H 0:u 1=u 2=u 3 1i 对于行因素, P=0.000236<0.01, 所以拒绝原假设。说明不同供应商生产的轮胎对磨损 程度有显著影响。 对于列因素, p=2.39E-06<0.01 ,所以拒绝原假设,说明不同车速对磨损程度有显著 影响。 10.9 行因素(供应商) 列因素(车速) 行因素(品种) H 0:不同品种对收获量没有显著影响。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

统计分析与SPSS的应用(第五版) 》(薛薇) 课后练习答案 第10 章SPSS 的聚类分析 1、根据“高校科研研究.sav 数”据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求: 1)根据凝聚状态表利用碎石图对聚类类数进行研究。 2)绘制聚类树形图,说明哪些省市聚在一起。 3)绘制各类的科研指标的均值对比图。 4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。 采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4 类。 步骤:分析分类系统聚类按如下方式设置,,

结果: 阶段 组合的集群 系数 首次出现阶段集群 下一个阶段 集群 1 集群 2 集群 1 集群 2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 20 25 1053.423 0 0 5 4 4 12 1209.922 0 0 1 5 5 8 20 1505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 30 1 2 293834.503 0 29 0

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第10章SPSS的聚类分析 1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求: 1)根据凝聚状态表利用碎石图对聚类类数进行研究。 2)绘制聚类树形图,说明哪些省市聚在一起。3)绘制各类的科研指标的均值对比图。 4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。 采用欧氏距离,组间平均链锁法 利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成4类。 步骤:分析→分类→系统聚类→按如下方式设置……

结果: 凝聚计划 阶段 组合的集群 系数 首次出现阶段集群 下一个阶段集群 1 集群 2 集群 1 集群 2 1 26 30 328.189 0 0 2 2 26 29 638.295 1 0 7 3 20 25 1053.423 0 0 5 4 4 12 1209.922 0 0 15 5 8 20 1505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20

统计学第四章、第十章课后练习答案贾俊平第四版

?统计学?第四版统计学? 第四章练习题答案 4.1 〔1 〕众数:M0=10; 中位数:中位数位置=n+1/2= 5.5 ,Me=10 ;平均数: x= ∑x n i = 96 = 9 .6 10 2 (2)QL 位置=n/4=2.5, QL=4+7/2=5.5;QU 位置=3n/4=7.5,QU=12 〔3〕s = ∑( xi ? x ) n ?1 = 156.4 = 4.2 9 〔4〕由于平均数小于中位数和众数,所以汽车销售量为左偏分布。4.2 〔1〕从表中数据可以看出,年龄出现频数最多的是19 和23,故有个众数,即M0=19 和M0=23。将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13 个位置上的数值为23,所以中位数为Me=23 〔2〕QL 位置=n/4=6.25, QL==19;QU 位置=3n/4=18.75,QU=26.5 ∑x (3)平均数x = n i = 600/25=24,标准差s = ∑( xi ? x ) n ?1 2 = 1062 = 6.65 25 ? 1 〔4〕偏态系数SK=1.08,峰态系数K=0.77 〔5〕分析:从众数、中位数和平均数来看,网民年龄在23-24 岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。4.3 〔1〕茎叶图如下:茎 5 6 7 叶5 678 13488 频数1 3 5 2 ∑x 〔2〕x = n i = 63/9=7, s = ∑( xi ? x ) n ?1 = 4.08 = 0.714 8 〔3〕由于两种排队方式的平均数不同,所以用离散系数进展比拟。第一种排队方式:

《统计学》练习题-客观题

第一章 总论 、单项选择 (在每小题的四个备选答案中,选出一个正确答案)1. 在下列叙述中,不正确的是( )。 A . “ statistics ”可以表示统计学 C. “statistics ”可以表示统计资料 2. 政治算术学派的创始人( )。 A. 提出“统计学“的科学命名了 C. 将概率论引入到统计学研究中 3. 在下列叙述中,关于推断统计的描述是( A •—个饼图描述了某医院治疗的癌症类型, B. 从一个果园中抽取 36个橘子的样本, C •一个大型城市在元月份的平均汽油价格 B. “ statistics "可以表示统计数据 D. “ statistics "可以表示统计检验 B. 创立了数量对比分析的方法 E. 开展了国际性的统计学术交流 )。 其中 2%是肾癌, 19%是乳腺癌 用该样本的平均重量估计果园中橘子的平均重量D. 反映大学生统计学成绩的条形图 4. 为了统计职工工资收入的一般水平,从全部职工中抽出足够多的职工进行调查,这个方 法体现了 统计的( )。 10. 某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了 200 名新生在教科书上的花费, 发现他们每个学期平均在教科书上的花费是 250 元。在研究 中,该研究人员感兴趣的变量是( )。 11. 根据样本计算的用于描述总体特征的度量工具(如均值)被称为( A. 参数 B 总体 C 样本 12. 为了估计全国高中生的平均身高, 从 20个城市选取了 100 所中学进行调查。 在该研究中, 样本是( )。 13. 性别的数据所采用的计量尺度是( )。 14. 考分的数据所采用的计量尺度是( )。 A.平均法 B.综合法 C.分组法 D.大量观察法 5. 以下各项属于品质标志的有( )。 A. 工龄 B.健康状况 6. 连续变量( )。 A. 表现形式为整数 C 取值连续不断,不能一一列举 7. 下列项目中属离散性变量的是( )。 C. 工资水平 D.劳动 时间利用率 B. ------------- 取值可 列举 A. 资产占有量 B.经济类型 8. 统计指标( )。 A. 都是可计量的 B.都是数量指标 9. 总体单位组成统计总体的条件是( C.生产经宫方向 D.职工人数 C.都有具体数值 D.都表现为绝对数 C 依存性 D.差异性 A. 该大学一年级新生的教科书费 用 C. 该大学一年级新生的教科书数 B. 该大学的学生数 D. 大学生的生活成 本 )。 D 统计量 所中学 个城市 C.全国的高中生 所中学的高中生 B .定序尺度 C.定类尺度 D.定比尺度 A .定距尺度 B .定序尺度 C.定类尺度 D.定比尺度

统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

相关主题
相关文档
最新文档