统计学第二版课后答案

附录1：各章练习题答案第1章绪论（略）

第2章统计数据的描述

2.1 （1）属于顺序数据。

（2）频数分布表如下：

服务质量等级评价的频数分布

服务质量等级家庭数（频率）频率%

A1414

B2121

C3232

D1818

E1515

合计100100

（3）条形图（略）

2.2 （1）频数分布表如下：

40个企业按产品销售收入分组表

按销售收入分组（万元）企业数

（个）

频率

（%）

向上累积向下累积

企业数频率企业数频率

100以下100～110 110～120 120～130 130～140 140以上

12.5

22.5

30.0

17.5

10.0

7.5

12.5

35.0

65.0

82.5

92.5

100.0

87.5

65.0

35.0

17.5

7.5

合计40 100.0 ————（2）某管理局下属40个企分组表

按销售收入分组（万元）企业数（个）频率（%）

先进企业良好企业一般企业落后企业11

27.5

22.5

合计40 100.0 2.3 频数分布表如下：

某百货公司日商品销售额分组表

按销售额分组（万元）频数（天）频率（%）

25～30 30～35 4

10.0

15.0

35～40 40～45 45～50 15

37.5

22.5

15.0

合计40 100.0 直方图（略）。

2.4 （1）排序略。

（2）频数分布表如下：

100只灯泡使用寿命非频数分布

按使用寿命分组（小时）灯泡个数（只）频率（%）

650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

合计100 100 直方图（略）。

（3）茎叶图如下：

65 1 8

66 1 4 5 6 8

67 1 3 4 6 7 9

68 1 1 2 3 3 3 4 5 5 5 8 8 9 9

69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9

70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9

71 0 0 2 2 3 3 5 6 7 7 8 8 9

72 0 1 2 2 5 6 7 8 9 9

73 3 5 6

74 1 4 7

2.5 （1）属于数值型数据。

（2）分组结果如下：

分组天数（天）

-25~-20 6

-20~-15 8

-15~-10 10

-10~-5 13

-5~0 12

0~5 4

5~10 7

合计60

（3）直方图（略）。

2.6 （1）直方图（略）。

（2）自学考试人员年龄的分布为右偏。 2.7 （1）茎叶图如下：

A 班

树茎

B 班

数据个数

树叶

数据个数

0 3 59 2 1 4 4 0448

4 2 97

5 122456677789 12 11 97665332110

6 011234688 9 23 98877766555554443332100

7 00113449 8 7 6655200 8 123345 6 6

632220

011456

0 10 000 3

（2）A 班考试成绩的分布比较集中，且平均分数较高；B 班考试成绩的分布比A 班分散，且平均成绩较A 班低。

2.8 箱线图如下：（特征请读者自己分析）

Min-Max 25%-75%

Median v alue

各城市相对湿度箱线图

北京

长春

南京

郑州

武汉

广州

成都

昆明

兰州

西安

2.9 （1）x =274.1（万元）；Me=272.5 ；Q L =260.25；Q U =291.25。

（2）17.21=s （万元）。

2.10 （1）甲企业平均成本＝19.41（元），乙企业平均成本＝18.29（元）；原因：尽管两个企

业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了

总平均成本。

2.11 x =426.67（万元）；48.116=s （万元）。 2.12 （1）（2）两位调查人员所得到的平均身高和标准差应该差不多相同，因为均值和标准差

的大小基本上不受样本大小的影响。

（3）具有较大样本的调查人员有更大的机会取到最高或最低者，因为样本越大，变化的范围就可能越大。

2.13 （1）女生的体重差异大，因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。（2）男生：x =27.27（磅），27.2=s （磅）；女生：x =22.73（磅），27.2=s （磅）；（3）68%；

（4）95%。

2.14 （1）离散系数，因为它消除了不同组数据水平高地的影响。（2）成年组身高的离散系数：024.01

.1722.4==

s v ；

幼儿组身高的离散系数：032.03

.713.2==

s v ；

由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。

2.15 下表给出了一些主要描述统计量，请读者自己分析。

方法A 方法B 方法C 平均 165.6 平均 128.73 平均 125.53 中位数 165 中位数 129 中位数 126 众数 164 众数 128 众数 126 标准偏差 2.13 标准偏差 1.75 标准偏差 2.77 极差 8 极差 7 极差 12 最小值 162 最小值 125 最小值 116 最大值

170

最大值

132

最大值

128

2.16 （1）方差或标准差；（2）商业类股票；（3）（略）。 2.17 （略）。

第3章概率与概率分布

3.1设A ＝女性，B ＝工程师，AB ＝女工程师，A+B ＝女性或工程师（1）P(A)＝4/12＝1/3 （2）P(B)＝4/12＝1/3 （3）P(AB)＝2/12＝1/6

（4）P(A+B)＝P(A)＋P(B)－P(AB)＝1/3＋1/3－1/6＝1/2

3.2求这种零件的次品率，等于计算“任取一个零件为次品”（记为A ）的概率()P A 。考虑逆事件A =“任取一个零件为正品”，表示通过三道工序都合格。据题意，有：

()(10.2)(10.1)(10.1)0.648P A =---=

于是 ()1()10.6480.352P A P A =-=-=

3.3设A 表示“合格”，B 表示“优秀”。由于B ＝AB ，于是

)|()()(A B P A P B P ＝＝0.8×0.15＝0.12

3.4 设A ＝第1发命中。B ＝命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。

)|()()|()()(A B P A P A B P A P B P +＝＝0.8×1＋0.2×0.5＝0.9 脱靶的概率＝1－0.9＝0.1

或（解法二）：P (脱靶)＝P (第1次脱靶)×P(第2次脱靶)＝0.2×0.5＝0.1 3.5 设A ＝活到55岁，B ＝活到70岁。所求概率为：

()()0.63(|)0.75()

()

0.84

P AB P B P B A P A P A ＝

＝＝＝

3.6这是一个计算后验概率的问题。

设A ＝优质率达95％，A ＝优质率为80％，B ＝试验所生产的5件全部优质。

P(A)＝0.4，P (A )＝0.6，P (B|A )=0.955， P(B |A )=0.85

，所求概率为：

6115.050612

.030951.0)

|()()|()()

|()()|(＝＝＝

A B P A P A B P A P A B P A P B A P +

决策者会倾向于采用新的生产管理流程。

3.7 令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品，B 表示次品。由题意得：P (A 1)＝0.25，P (A 2)＝0.30， P (A 3)＝0.45；P (B |A 1)＝0.04，P (B |A 2)＝0.05，P (B |A 3)＝0.03；因此，所求概率分别为：

（1）)|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++＝＝0.25×0.04＋0.30×0.05＋0.45×0.03＝0.0385 （2）3506.00385

.00135.00.03

0.450.050.300.040.2503

.045.0)|(3＝＝＋＋＝

????B A P

3.8据题意，在每个路口遇到红灯的概率是p ＝24/(24+36)＝0.4。

设途中遇到红灯的次数＝X ，因此，X ～B(3，0.4)。其概率分布如下表：

x i 0 1 2 3 P (X = x i )

0.216

0.432

0.288

0.064

期望值（均值）＝1.2（次），方差＝0.72，标准差＝0.8485（次） 3.9 设被保险人死亡数＝X ，X ～B (20000，0.0005)。

（1）收入＝20000×50（元）＝100万元。要获利至少50万元，则赔付保险金额应该不超过50万元，等价于被保险人死亡数不超过10人。所求概率为：P(X ≤10)＝0.58304。（2）当被保险人死亡数超过20人时，保险公司就要亏本。所求概率为： P(X >20)＝1－P(X ≤20)＝1－0.99842＝0.00158 （3）支付保险金额的均值＝50000×E (X ) ＝50000×20000×0.0005（元）＝50（万元）支付保险金额的标准差＝50000×σ(X )

＝50000×(20000×0.0005×0.9995)1/2＝158074（元）

3.10 （1）可以。当n 很大而p 很小时，二项分布可以利用泊松分布来近似计算。本例中，λ= np =20000×0.0005=10，即有X ～P (10)。计算结果与二项分布所得结果几乎完全一致。

（2）也可以。尽管p 很小，但由于n 非常大，np 和np(1-p)都大于5，二项分布也可以利用正态分布来近似计算。

本例中，np=20000×0.0005=10，np(1-p)=20000×0.0005×(1-0.0005)=9.995，即有X ～N (10,9.995)。相应的概率为： P (X ≤10.5)＝0.51995，P(X ≤20.5)＝0.853262。

可见误差比较大（这是由于P 太小，二项分布偏斜太严重）。

【注】由于二项分布是离散型分布，而正态分布是连续性分布，所以，用正态分布来近似计算二项分布的概率时，通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点，这就是所谓的“连续性校正”。

（3）由于p ＝0.0005，假如n =5000，则np ＝2.5<5，二项分布呈明显的偏态，用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。 3.11（1）)6667.1()30

200

150()150(-<-<

合格率为1-0.04779＝0.95221或95.221％。

(2) 设所求值为K ，满足电池寿命在200±K 小时范围内的概率不小于0.9，即有：

|200|

(|200|){||}0.930

X K P X K P Z --<=<≥＝

即：{}0.9530

K P Z <

≥，K /30≥1.64485,故K ≥49.3456。

3.12设X ＝同一时刻需用咨询服务的商品种数，由题意有X ～B(6,0.2)

（1）X 的最可能值为：X 0＝[(n+1)p]＝[7×0.2]＝1 （取整数）

（2）∑=--

=≤-=>2

668

.02

.01)2(1)2(k k

k C X P X P

＝1-0.9011＝0.0989

第4章抽样与抽样分布

4.1 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50

4.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 4.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4.4 a. 101, 99 b. 1 c. 不必

4.5 趋向正态

4.6. a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938

4.7. a. 406, 1.68, 正态分布 b. 0.001 c. 是，因为小概率出现了 4.8. a. 增加 b. 减少

4.9. a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06 4.10 a. 0.015 b. 0.0026 c. 0.1587

4.11. a. (0.012, 0.028) b. 0.6553, 0.7278 4.12. a. 0.05 b. 1 c. 0.000625

第5章参数估计

5.1 （1）79.0=x σ。（2）E =1.55。

5.2 （1）14.2=x

σ。（2）E =4.2。（3）（115.8,124.2）。

5.3 （2.88,3.76）；(2.80,3.84)；(2.63,4.01)。 5.4 （7.1,12.9）。 5.5 （7.18,11.57）。

5.6

（18.11%,27.89%）；（17.17%,22.835）。

5.7 (1)（51.37%,7

6.63%）；（2）36。

5.8 （1.86,17.74）；（0.19,19.41）。

5.9 （1）2±1.176；（2）2±3.986；（3）2±3.986；（4）2±3.587；（5）2±3.364。 5.10 （1）75.1=d ，63.2=d s ；（2）1.75±4.27。 5.11 （1）10%±

6.98%；（2）10%±8.32%。 5.12 （4.06,14.35）。

5.13 48。 5.14 139。 5.15 57。 5.16 769。

第6章假设检验

6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”，所

以原假设与备择假设应为：1035:0≤μH ，1035:1>μH 。

6.2 π＝“某一品种的小鸡因为同类相残而导致的死亡率”，04.0:0≥πH ，04.0:1<πH 。 6.3 65:0=μH ，65:1≠μH 。

6.4 （1）第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克，但检验

结果却提供证据支持店方倾向于认为其重量少于60克；

（2）第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克，但检验结果却没有提供足够的证据支持店方发现这一点，从而拒收这批产品；（3）连锁店的顾客们自然看重第二类错误，而供应商更看重第一类错误。

6.5 （1）检验统计量n

s x z /μ

-=，在大样本情形下近似服从标准正态分布；

（2）如果05.0z z >，就拒绝0H ；

（3）检验统计量z ＝2.94>1.645，所以应该拒绝0H 。 6.6 z ＝3.11，拒绝0H 。 6.7 z ＝1.93，不拒绝0H 。 6.8 z ＝7.48，拒绝0H 。 6.9 2χ＝206.22，拒绝0H 。 6.10 z ＝-5.145，拒绝0H 。 6.11 t ＝1.36，不拒绝0H 。 6.12 z ＝-4.05，拒绝0H 。 6.13 F ＝8.28，拒绝0H 。 6.14 （1）检验结果如下：

t-检验: 双样本等方差假设

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20

合并方差 28.73684211

假设平均差 0 df 38

t Stat -5.427106029 P(T<=t) 单尾 1.73712E-06 t 单尾临界 1.685953066 P(T<=t) 双尾

3.47424E-06

t 双尾临界 2.024394234

t-检验: 双样本异方差假设

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20 20

假设平均差 0 df 37

t Stat -5.427106029 P(T<=t) 单尾 1.87355E-06 t 单尾临界 1.687094482 P(T<=t) 双尾 3.74709E-06 t 双尾临界

2.026190487

（2）方差检验结果如下：

F-检验双样本方差分析

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20 20 df 19

0.722940991 P(F<=f) 单尾 0.243109655 F 单尾临界

0.395811384

第7章方差分析与试验设计

7.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P )，不能拒绝原假设。 7.2 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P )，拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ，拒绝原假设； 85.58.16.424.44=<=-=-LSD x x C A ，不能拒绝原假设； 85.56.126.4230=>=-=-LSD x x C B ，拒绝原假设。

7.3 方差分析表中所缺的数值如下表：

差异源 SS df MS F P-value F crit 组间 420 2 210 1.478 0.245946

3.354131

组内 3836 27 142.07 — — — 总计

4256

—

554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P )，不能拒绝原假设。

7.4 有5种不同品种的种子和4种不同的施肥方案，在20快同样面积的土地上，分别采用5种

种子和4种施肥方案搭配进行试验，取得的收获量数据如下表：

2592.32397.705.0=>=F F 种子(或05.00033.0=<=-αvalue P )，拒绝原假设。 4903.32047.905.0=<=F F 施肥方案(或05.00019.0=<=-αvalue P )，拒绝原假设。

7.5 9443.60727.005.0=<=F F 地区(或05.09311.0=>=-αvalue P )，不能拒绝原假设。

9443.61273.305.0=<=F F 包装方法(或05.01522.0=>=-αvalue P )，不能拒绝原假

设。

7.6 1432.575.1005.0=>=F F 广告方案(或05.00104.0=<=-αvalue P )，拒绝原假设。

9874.5305.0=<=F F 广告媒体

(或05.01340.0=>=-αvalue P )，不能拒绝原假设。

1432.575.105.0=<=F F 交互作用(或05.02519.0=>=-αvalue P )，不能拒绝原假设。

第8章相关与回归分析

8.1（1）利用Excel 计算结果可知,相关系数为 0.948138XY r =，说明相关程度较高。（2）计算t 统计量

20.948138102

2.6817398.4368510.317859

11.948138

r n t r

o -?-=

=--

给定显著性水平=0.05，查t 分布表得自由度n-2=10-2=8的临界值2t α为2.306，

显然2t t α>，表明相关系数 r 在统计上是显著的。 8.2 利用Excel 中的”数据分析”计算各省市人均GDP 和第一产业中就业比例的相关系数为:-0.34239，这说明人均GDP 与第一产业中就业比例是负相关，但相关系数只有-0.34239，表明二者负相关程度并不大。相关系数检验：

在总体相关系数0=ρ的原假设下，计算t 统计量：

20.34239312

1.962411(0.34239)

r n t r

--?-=

=----

查t 分布表，自由度为31-2=29，当显著性水平取05.0=α时，2αt =2.045；当显著性水平取0.1α=时，2αt =1.699。

由于计算的t 统计量的绝对值1.9624小于2αt =2.045，所以在05.0=α的显著性水平下，不能拒绝相关系数0=ρ的原假设。即是说，在05.0=α的显著性水平下不能认为人均GDP 与第一产业中就业比例有显著的线性相关性。

但是计算的t 统计量的绝对值1.9624大于2αt =1.699，所以在0.1α=的显著性水平下,可以拒绝相关系数0=ρ的原假设。即在0.1α=的显著性水平下，可以认为人均GDP 与第一产业中就业比例有一定的线性相关性。

8.3 设当年红利为Y ，每股帐面价值为X

建立回归方程 12i i i Y X u ββ=++

估计参数为 ^

0.4797750.072876i i Y X =+

参数的经济意义是每股帐面价值增加1元时，当年红利将平均增加0.072876元。

序号6的公司每股帐面价值为19.25元，增加1元后为20.25元，当年红利可能为：

0.4797750.07287620.25 1.955514i Y =+?=(元)

8.4 （1）数据散点图如下：

00.20.40.60.811.21.465

航班正点率(%)

投诉率（次/10万名乘客）

（2）根据散点图可以看出，随着航班正点率的提高，投诉率呈现出下降的趋势，两者之间存在着一定的负相关关系。

（3）设投诉率为Y ，航班正点率为X

建立回归方程 12i i i Y X u ββ=++

估计参数为 ^

6.0178

0.07i i Y X =-

（4）参数的经济意义是航班正点率每提高一个百分点，相应的投诉率（次/10万名乘客）下降0.07。

（5）航班按时到达的正点率为80%，估计每10万名乘客投诉的次数可能为：

4187.08007.00178.6?=?-=i

Y （次/10万） 8.5 由Excel 回归输出的结果可以看出：（1）回归结果为

23332.993090.0716190.1687270.179042

i i i i Y X X X =+++ （2）由Excel 的计算结果已知：1234,,,ββββ 对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -= ,所以各个自变量都对Y 有明显影响。

由F=58.20479, 大于临界值0.05(41,224) 3.16F --=，说明模型在整体上是显著的。

8.6 （1）该回归分析中样本容量是14+1=15

（2）计算RSS=66042-65965=77

ESS 的自由度为k-1=2，RSS 的自由度 n-k=15-3=12

（3）计算：可决系数 2

65965/660420.9988

R ==

修正的可决系数 2

1511(10.9988)

0.9986

153

R -=-

?-=- （4）检验X2和X3对Y 是否有显著影响

/(1)65965/2329825140.11/()

77/12

6.4166

ESS k F RSS n k -=

(5) F 统计量远比F 临界值大，说明X2和X3联合起来对Y 有显著影响，但并不能确定X2和X3各自对Y 的贡献为多少。

8.7

8.8 （1）用Excel 输入Y 和X 数据，生成2X 和3X 的数据，用Y 对X 、2X 、3X 回归，估计参数结果为

1726.737.8796468740.00895 3.7124906i i Y X X E X =-+-+-

t=(-1.9213) (2.462897) (-2.55934) (3.118062) 20.973669R = 20.963764

R =

（2）检验参数的显著性：当取0.05α=时，查t 分布表得0.025(124) 2.306t -=，与t 统计

量对比，除了截距项外，各回归系数对应的t 统计量的绝对值均大于临界值，表明在这样的显著性水平下，回归系数显著不为0。

（3）检验整个回归方程的显著性：模型的20.973669R =,20.963794R =，说明可决系数较高，对样本数据拟合较好。由于F=98.60668，而当取0.05α=时，查F 分布表得0.05(41,124) 4.07F --=，因为F=98.60668>4.07，应拒绝0234:0H βββ===，说明X 、

2X 、3

X 联合起来对Y 确有显著影响。

（4）计算总成本对产量的非线性相关系数：因为2

0.973669R =因此总成本对产量的非线

性相关系数为2

0.973669R =或R=0.9867466

（5）评价：虽然经t 检验各个系数均是显著的，但与临界值都十分接近，说明t 检验只是勉强通过，其把握并不大。如果取0.01α=，则查t 分布表得0.005(124) 3.3554t -=，这时各个参数对应的t 统计量的绝对值均小于临界值，则在0.01α=的显著性水平下都应接受0:0j H β=的原假设。

8.9 利用Excel 输入X 、y 和Y 数据，用Y 对X 回归，估计参数结果为

x Y

314.073.5?-= t 值=（9.46）（-6.515） 794.02

=R 775.02

整理后得到：x

e y

314.09693.307?-?=

来源平方和自由度方差来自回归 2179.56 1 2179.56 来自残差 99.11 22 4.505 总离差平方和 2278.67

第9章时间序列分析

9.1 （1）30× 31.06×21.05= 30×1.3131 = 39.393（万辆）

（2）9

9(302)/(30 1.078)12/1.07817.11%??-=

（3）设按7.4%的增长速度n 年可翻一番

则有 1.07460/30

n == 所以 n = log2 / log1.074 = 9.71（年）

故能提前0.29年达到翻一番的预定目标。

9.2 （1）（1）以1987年为基期，2003年与1987年相比该地区社会商品零售额共增长： %86.2313186.213186.31%)8.61(%)2.81(%)101(555==-=-+?+?+ （2）年平均增长速度为

1%)

8.61(%)2.81(%)101(15

55-+?+?+=0.0833=8.33%

(3) 2004年的社会商品零售额应为

509.52)0833.01(307

=+?（亿元）

9.3 （1）发展总速度%12.259%)81(%)101(%)121(343=+?+?+

平均增长速度=%9892.91%12.25910=-

（2）8.561%)61(5002=+?（亿元）

（3）平均数∑

===

5.1424

5704

1j j y y （亿元），

2002年一季度的计划任务：625.1495.142%105=?（亿元）。

9.4 (1)用每股收益与年份序号回归得^

0.3650.193t Y t =+。预测下一年(第11年)的每股收益为

488.211193.0365.0?11

=?+=Y 元 (2)时间数列数据表明该公司股票收益逐年增加，趋势方程也表明平均每年增长0.193元。是

一个较为适合的投资方向。

9.5 （1）移动平均法消除季节变动计算表

年别季别鲜蛋销售量四项移动平均值

移正平均值（T ?）

2000年

一季度 13.1 — 二季度 13.9 10.875 — 三季度 7.9 10.3 10.5875 四季度 8.6 9.7 10 2001年

一季度 10.8 10.15 9.925 二季度 11.5 10.75 10.45 三季度 9.7 11.7 11.225 四季度 11 13.2 12.45 2002年

一季度 14.6 14.775 13.9875 二季度 17.5 16.575 15.675 三季度 16 17.525 17.05 四季度 18.2 18.15 17.8375 2003年

一季度

18.4

18.375

18.2625

二季度 20 18.325

18.35 三季度 16.9

四季度

（2）t T t

?+=63995.09625.8? （3）趋势剔出法季节比例计算表（一）

年别季别时间序列号t

鲜蛋销售量

预测鲜蛋销售量趋势剔除值 2000年

一季度 1 13.1 9.332352941 1.403718878 二季度 2 13.9 9.972205882 1.39387415 三季度 3 7.9 10.61205882 0.74443613 四季度 4 8.6 11.25191176 0.764314561 2001年

一季度 5 10.8 11.89176471 0.908191531 二季度 6 11.5 12.53161765 0.917678812 三季度 7 9.7 13.17147059 0.736440167 四季度 8 11 13.81132353 0.796447927 2002年

一季度 9 14.6 14.45117647 1.010298368 二季度 10 17.5 15.09102941 1.159629308 三季度 11 16 15.73088235 1.0171076 四季度 12 18.2 16.37073529 1.111739923 2003年

一季度 13 18.4 17.01058824 1.081679231 二季度 14 20 17.65044118 1.133116153 三季度 15 16.9 18.29029412 0.923987329

四季度

18.93014706

0.950864245

上表中，其趋势拟合为直线方程t T t

?+=63995.09625.8?。趋势剔出法季节比例计算表（二）

季度年度

一季度二季度三季度四季度 2000年 1.403719 1.393874 0.744436 0.764315 — 2001年 0.908192 0.917679 0.73644 0.796448 — 2002年 1.010298 1.159629 1.017108 1.11174 — 2003年 1.081679 1.133116 0.923987 0.950864 — 平均 1.100972 1.151075 0.855493 0.905842 4.013381 季节比率%

1.097301

1.147237

0.852641

0.902822

4．00000

根据上表计算的季节比率，按照公式KL

t t t S T Y -?=???计算可得： 2004年第一季度预测值：

7723.21097301.1)1763995.09625.8(???1

1717=??+=?=S T Y 2004年第二季度预测值：

49725.23147237.1)1863995.09625.8(???2

1818=??+=?=S T Y 2004年第三季度预测值：

009.18852641.0)1963995.09625.8(???3

1919=??+=?=S T Y 2004年第四季度预测值：

6468.19902822.0)2063995.09625.8(???4

2020=??+=?=S T Y 9.6 (1)用原始资料法计算的各月季节比率为:

月份 1月 2月 3月 4月 5月 6月季节比率 0.9195 0.7868 0.9931 1.0029 1.0288 1.0637 月份 7月 8月 9月 10月 11月 12月季节比率

0.9722

0.9851

1.0407

1.0350

1.0765

1.0958

平均法计算季节比率表：

年别月份 2000年

2001年

2002年

2003年

平均季节比率%

1月 4.78 5.18 6.46 6.82 5.80875 0.9195 2月 3.97 4.61 5.62 5.68 4.97025 0.7868 3月 5.07 5.69 6.96 7.38 6.2735 0.9931 4月 5.12 5.71 7.12 7.40 6.33575 1.0029 5月 5.27 5.90 7.23 7.60 6.49925 1.0288 6月 5.45 6.05 7.43 7.95 6.7195 1.0637 7月 4.95 5.65 6.78 7.19 6.1415 0.9722 8月 5.03 5.76 6.76 7.35 6.223 0.9851 9月 5.37 6.14 7.03 7.76 6.574 1.0407 10月 5.34 6.14 6.85 7.83 6.53825 1.0350 11月 5.54 6.47 7.03 8.17 6.80025 1.0765 12月 5.44

6.55

7.22

8.47

6.9225 1.0958 平均

6.317208

1.0000

季节比率的图形如下：

季节比率

0.00

0.200.400.600.801.001.201

季节比率

(2)用移动平均法分析其长期趋势

年月

序号

工业总产值(亿

元)

移动平均

移正平均

Jan-00 1 4.78 Feb-00 2 3.97 Mar-00 3 5.07 Apr-00 4 5.12 May-00 5 5.27

Jun-00

5.45

5.13

Jul-00 7 4.95 5.17

Aug-00 8 5.03 5.22

Sep-00 9 5.37 5.27

Oct-00 10 5.34 5.32

Nov-00 11 5.54 5.37

Dec-00 12 5.44 5.11 5.43

Jan-01 13 5.18 5.14 5.49

Feb-01 14 4.61 5.20 5.55

Mar-01 15 5.69 5.25 5.62

Apr-01 16 5.71 5.30 5.69

May-01 17 5.90 5.35 5.77

Jun-01 18 6.05 5.40 5.87

Jul-01 19 5.65 5.46 5.97

Aug-01 20 5.76 5.52 6.06

Sep-01 21 6.14 5.58 6.18

Oct-01 22 6.14 5.65 6.29

Nov-01 23 6.47 5.73 6.40

Dec-01 24 6.55 5.82 6.51

Jan-02 25 6.46 5.93 6.60

Feb-02 26 5.62 6.01 6.68

Mar-02 27 6.96 6.12 6.74

Apr-02 28 7.12 6.23 6.80

May-02 29 7.23 6.35 6.85

Jun-02 30 7.43 6.46 6.89

Jul-02 31 6.78 6.55 6.91

Aug-02 32 6.76 6.64 6.93

Sep-02 33 7.03 6.71 6.96

Oct-02 34 6.85 6.77 6.98

Nov-02 35 7.03 6.82 7.02

Dec-02 36 7.22 6.88 7.06

Jan-03 37 6.82 6.91 7.10

Feb-03 38 5.68 6.91 7.15

Mar-03 39 7.38 6.94 7.23

Apr-03 40 7.40 6.97 7.31

May-03 41 7.60 7.00 7.41

Jun-03 42 7.95 7.04

Jul-03 43 7.19 7.08

Aug-03 44 7.35 7.12

Sep-03 45 7.76 7.19

Oct-03 46 7.83 7.27

Nov-03 47 8.17 7.36

Dec-03 48 8.47 7.46

原时间序列与移动平均的趋势如下图所示：

0.00

1.00

2.00

3.00

4.00

5.00

6.00

7.00

8.001

移动平均原时间序列

9.7 （1）采用线性趋势方程法：t T i

0065.70607.460?+= 剔除其长期趋势。趋势分析法剔除长期趋势表：

年月序号工业总产值(亿元)

长期趋势值剔除长期趋势 Jan-83 1 477.9 467.0672 1.023193 Feb-83 2 397.2 474.0737 0.837844 Mar-83 3 507.3 481.0802 1.054502 Apr-83 4 512.2 488.0867 1.049404 May-83 5 527 495.0932 1.064446 Jun-83 6 545 502.0997 1.085442 Jul-83 7 494.7 509.1062 0.971703 Aug-83 8 502.5 516.1127 0.973625 Sep-83 9 536.5 523.1192 1.025579 Oct-83 10 533.5 530.1257 1.006365 Nov-83 11 553.6 537.1322 1.030659 Dec-83 12 543.9 544.1387 0.999561 Jan-84 13 518 551.1452 0.939861 Feb-84 14 460.9 558.1517 0.825761 Mar-84 15 568.7 565.1582 1.006267 Apr-84 16 570.5 572.1647 0.997091 May-84 17 590 579.1712 1.018697 Jun-84 18 604.8 586.1777 1.031769 Jul-84 19 564.9 593.1842 0.952318 Aug-84 20 575.9 600.1907 0.959528 Sep-84 21 613.9 607.1972 1.011039 Oct-84 22 614 614.2037 0.999668 Nov-84 23 646.7 621.2102 1.041032 Dec-84 24 655.3 628.2167 1.043111 Jan-85 25 645.7 635.2232 1.016493 Feb-85 26 562.4 642.2297 0.875699 Mar-85 27 695.7 649.2362 1.071567 Apr-85

712

656.2427

1.084964

May-85 29 723.1 663.2492 1.090239

Jun-85 30 743.2 670.2557 1.108831

Jul-85 31 678 677.2622 1.001089

Aug-85 32 676 684.26870.987916

Sep-85 33 703 691.2752 1.016961

Oct-85 34 685.3 698.28170.981409

Nov-85 35 703.3 705.28820.997181

Dec-85 36 722.4 712.2947 1.014187

Jan-86 37 681.9 719.30120.948003

Feb-86 38 567.6 726.30770.781487

Mar-86 39 737.7 733.3142 1.005981

Apr-86 40 739.6 740.32070.999027

May-86 41 759.6 747.3272 1.016422

Jun-86 42 794.8 754.3337 1.053645

Jul-86 43 719 761.34020.944387

Aug-86 44 734.8 768.34670.956339

Sep-86 45 776.2 775.3532 1.001092

Oct-86 46 782.5 782.3597 1.000179

Nov-86 47 816.5 789.3662 1.034374

Dec-86 48 847.4 796.3727 1.064075

剔除长期趋势后分析其季节变动情况表：

年份

1983年1984年1985年1986年季节比率% 月份

1月 1.023193 0.939861 1.016493 0.948003 0.981888 2月0.837844 0.825761 0.875699 0.781487 0.830198 3月 1.054502 1.006267 1.071567 1.005981 1.034579 4月 1.049404 0.997091 1.084964 0.999027 1.032622 5月 1.064446 1.018697 1.090239 1.016422 1.047451 6月 1.085442 1.031769 1.108831 1.053645 1.069922 7月0.971703 0.952318 1.001089 0.944387 0.967374 8月0.973625 0.959528 0.987916 0.956339 0.969352 9月 1.025579 1.011039 1.016961 1.001092 1.013668 10月 1.006365 0.999668 0.981409 1.000179 0.996905 11月 1.030659 1.041032 0.997181 1.034374 1.025812 12月0.999561 1.043111 1.014187 1.064075 1.030234 （3）运用分解法可得到循环因素如下图：

0.8

0.850.90.9511.05

1.11.151

第10章统计指数

10.1 %73.1072.20398.2196 , %16.1042.20392124

00010

001==∑∑===∑∑=q p q p L p q p q L p q ；

%39.1072124

2281 , %83.1038

.219622811

0111

011==

∑∑=

q p q p P p q p q P p q 。

10.2 %

99.10342364405

8.21962.20392281

2124==

++=

q E ；%99.103%83.103%16.104=?=q F ；

%00.1042

%83.103%16.104=+=q

B 。

10.3 %27.93125550

117100 , %83.92101800945001

0111

011==∑∑='==∑∑=p q p

q P z q z q P q q 。

10.4 %

73.1072

.20398.21960

000==

∑∑=

q p q p i A p p ；%

39.1072124

22811111==

∑∑=

i q p q p H

；

01.1070

=∏=

∑q p q p p p i G 。

10.5 V P L p q =?；%

86.111%39.107%16.104=? ；8

.241157

8.84=+。

10.6 ⑴2.43%12360

=?；⑵0.24%67.6360 , %67.106%105%112=?=÷；

⑶2.19%5%

67.106360

=??；⑷2.432.190.24 , %112%105%67.106=+=?。

10.7 ⑴3483

.220904908

, 6967.220905636

, 3816.219604668

10==

假定x x x

⑵3816

.26967

.23483.26967.23816.23483.2=

?，%23.113%84.114%60.98=? ⑶

3816

.26967.21960

20904668

5636?

%23.113%63.106%74.120?= ， 6.6586.309968+≈

10.8 依据有关公式列表计算各企业的工业经济效益综合指数如下：

各企业经济效益综合指数一览表(标准比值法)

参评指标标准比值或个体指数(%) 权数 A 企业 B 企业 C 企业 D 企业

E 企业

产品销售率

77.35 92.33 97.97

92.74 87.61 15 资金利税率

90.04

104.06 99.63

84.87 103.32

成本利润率90.37 112.96 99.88 101.07 82.05 15

增加值率87.24 100.00 98.28 87.59 92.07 10

劳动生产率93.47 101.85 116.84 109.59 87.03 10

资金周转率87.43 101.09 114.75 103.83 98.36 20

综合指数87.73 102.41 104.03 95.01 94.03 ──

排名 5 2 1 3 4 ──10.9依据有关公式列表计算各企业的工业经济效益综合指数如下表：

各企业经济效益综合指数一览表(改进的功效系数法)

参评指标

阈值改进的功效系数

权数满意值不允许值 A企业B企业C企业D企业E企业

产品销售率95.50 74.50 60.00 89.52 100.00 90.29 80.76 15

资金利税率14.10 11.50 70.77 100.00 90.77 60.00 98.46 30

成本利润率9.50 6.90 70.77 100.00 83.08 84.62 60.00 15

增加值率29.00 25.30 60.00 100.00 94.59 61.08 75.14 10

劳动生产率7250 5400 68.65 79.89 100.00 90.27 60.00 10

资金周转率 2.10 1.60 60.00 80.00 100.00 84.00 76.00 20

综合指数────65.50 91.97 93.95 74.97 78.05 ──

排名──── 5 2 1 4 3 ──上面两种方法给出的综合评价结果的差异表现在D、E两个企业的综合经济效益排名不同。原因在于两种方法的对比标准不同(以下具体说明)。

第11章统计决策

11.1（1）根据最大的最大收益值准则，应该选择方案一。

（2）根据最大的最小收益值准则，应该选择方案三。

（3）方案一的最大后悔值为250，方案二的最大后悔值为200，方案三的最大后悔值为300，所以根据最小的最大后悔值准则，应选择方案二。

（4）当乐观系数为0.7时，可得：方案一的期望值为220，方案二的期望值为104，方案三的期望值为85。根据折中原则，应该选择方案一。

（5）假设各种状况出现的概率相同，则三个方案的期望值分别为：116.67、93.33、83.33 按等可能性准则，应选择方案一。

11.2（1）略

（2）三个方案的期望值分别为：150万元、140万元和96万元。但方案一的变异系数为1.09，方案二的变异系数为0.80，根据期望值准则结合变异系数准则，应选择方案二。

（3）宜采用满意准则。选择方案二。

(4) 宜采用满意准则。选择方案三。

11.3 钥匙留在车内为A,汽车被盗为E。

P(A/E)=（0.2*0.05）/ （0.02*0.05+0.8*0.01）= 55.56%。

11.4 （1）买到传动装置有问题的车的概率是30%。

（2）修理工判断车子有问题为B1,，车子真正有问题为A1,

P(A1/B1)=(0.3*0.9)/(0.3*0.9+0.7*0.2)= 66%

（3）修理工判断车子没有问题为B2，车子真正有问题为A1

P(A1/B2)=(0.3*0.1)/(0.3*0.1 +0.7*0.8)= 5%

11.5 决策树图略。

（1）生产该品种的期望收益值为41.5万元大于不生产的期望值，根据现有信息可生产。（2）自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56，

此时，市场真实欢迎的概率=0.65*0.7/（0.65*0.7+0.35*0.30）=0.8125

期望收益值=(77*0.8125 -33*0.1875)0.56+(-3*0.44) =30.25万元

（3）委托调查得出受欢迎结论的概率=0.65*0.8 +0.35*0.20=0.59

此时，市场真实受欢迎的概率= 0.65*0.8/（0.65*0.8 +0.35*0.20）=0.8814

期望收益值=（75*0.8814 -35*0.1186）0.59+（-5*0.41）=34.50万元

根据以上分析结果。由于进一步调查的可靠性不高，并要花费相应的费用，所以没有必要进一步调查。

第12章国民经济统计基础知识

12.1 生产法GDP=168760亿元；

分配法GDP=168755亿元

使用法GDP=154070亿元

国内生产净值=149755亿元（按生产法计算）

国民总收入=165575亿元（按收入法计算）

国民可支配总收入=167495亿元

国民可支配净收入=148490亿元

消费率=67.95%（按可支配总收入计算）

储蓄率=32.05%（按可支配总收入计算）

投资率=27.31%（按使用法GDP计算）

12.2 国民财富总额为：216765亿元

12.3生产法GDP增长速度为8.69%；紧缩价格指数为102.83%。

使用法GDP增长速度为8.25%。紧缩价格指数为103.25%。

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

统计学(第三版课后习题答案

Hah 和网速是无形的 1：各章练习题答案 2.1 （1）属于顺序数据。（2）频数分布表如下：服务质量等级评价的频数分布服务质量等级家庭数（频率）频率% A1414 B2121 C3232 D1818 E1515 合计100100 （3）条形图（略） 2.2 （1）频数分布表如下： 40个企业按产品销售收入分组表按销售收入分组（万元）企业数（个）频率（%）向上累积向下累积企业数频率企业数频率 100以下100～110 110～120 120～130 130～140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————（2）某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下：某百货公司日商品销售额分组表按销售额分组（万元）频数（天）频率（%） 25～30 30～35 35～40 40～45 45～50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图（略）。 2.4 （1）排序略。（2）频数分布表如下： 100只灯泡使用寿命非频数分布按使用寿命分组（小时）灯泡个数（只）频率（%） 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图（略）。（3）茎叶图如下： 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念（1 ）随机变量答：在统计学上把取值之前，不能准确预料取到什么值的变量，称为随机变量。（2）总体答：总体（population ）又称为母全体或全域，是具有某种特征的一类事物的总体，是研究对象的全体。（3）样本答：样本是从总体中抽取的一部分个体。（4）个体答：构成总体的每个基本单元。（5）次数是指某一事件在某一类别中出现的数目，又称作频数，用f表示。（6）频率答：又称相对次数，即某一事件发生的次数除以总的事件数目，通常用比例或百分数来表示。（7）概率答：概率（probability）, 概率论术语，指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值，称为事件A的概率，记为P（A）。（8）统计量答：样本的特征值叫做统计量，又称作特征值。（9）参数答：又称总体参数，是描述一个总体情况的统计指标。（10）观测值答：随机变量的取值，一个随机变量可以有多个观测值。 2何谓心理与教育统计学？学习它有何意义？答：（1）心理与教育统计学是专门研究如何运用统计学原理和方法，搜集、整理、分析心理与教育科学研究中获得的随机性数据资料，并根据这些数据资料传递的信息，进行科学推论找出心理与教育统计活动规律的一门学科。具体讲，就是在心理与教育研究中，通过调查、实验、测量等手段有意地获取一些数据，并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理，最后得出结论的一种研究方法。（2）学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类，从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力，就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。凡是客观存在事物，都有数量的表现。凡是有数量表现的事物，都可以进行测量。心理与教育现象是一种客观存在的事物，它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多，难以准确测量。但是它毕竟还是可以测量的。因此，在进行心理与教育科学研究时，在一定条件下，是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3．1 为评价家电行业售后服务的质量，随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为：A．好；B．较好；C一般；D．较差；E.差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求： (1)指出上面的数据属于什么类型。顺序数据 (2)用Excel制作一张频数分布表。用数据分析——直方图制作：接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图，反映评价等级的分布。用数据分析——直方图制作： (4)绘制评价等级的帕累托图。逆序排序后，制作累计频数分布表：

(完整版)医学统计学第六版课后答案

第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平（以获得了高中文凭和没有获得高中文凭分类）和就业状况（以全职和非全职分类）所做出如果原假设即在教育水平和工作状态之间没有联系为真，那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值？ A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer ：B Analysis ：本题考查二维表中两个变量的独立性，如果原假设独立成立，那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为： 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中，每一个随机样本中的成人都有他的最喜爱的颜色，下表展示了按年龄分组的试验结果。如果对于颜色的偏好是同年龄组相互独立，下列哪一个选项表明了年龄组30到50岁，喜爱绿色的人数的期望值？ A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer ：A Analysis ：本题考查二维表中两个变量的独立性，如果两个变量独立，那么cell “aged 30 to 50”和“prefer green ”的期望值为： 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

商务统计学(第四版)课后习题答案第八章

288 Chapter 8: Confidence Interval Estimation CHAPTER 8 8.1 X ±Z ?σ n = 85±1.96? 864 83.04 ≤μ≤ 86.96 8.2 X ±Z ? σ n = 125±2.58?24 36 114.68 ≤μ≤ 135.32 8.3 If all possible samples of the same size n are taken, 95% of them include the true population average monthly sales of the product within the interval developed. Thus you are 95 percent confident that this sample is one that does correctly estimate the true average amount. 8.4 Since the results of only one sample are used to indicate whether something has gone wrong in the production process, the manufacturer can never know with 100% certainty that the specific interval obtained from the sample includes the true population mean. In order to have 100% confidence, the entire population (sample size N ) would have to be selected. 8.5 To the extent that the sampling distribution of sample means is approximately normal, it is true that approximately 95% of all possible sample means taken from samples of that same size will fall within 1.96 times the standard error away from the true population mean. But the population mean is not known with certainty. Since the manufacturer estimated the mean would fall between 10.99408 and 11.00192 inches based on a single sample, it is not necessarily true that 95% of all sample means will fall within those same bounds. 8.6 Approximately 5% of the intervals will not include the true population. Since the true population mean is not known, we do not know for certain whether it is contained in the interval (between 10.99408 and 11.00192 inches) that we have developed. 8.7 (a) X ±Z ?σ n =0.995±2.58? 0.02 50 0.9877≤μ≤1.0023 (b) Since the value of 1.0 is included in the interval, there is no reason to believe that the mean is different from 1.0 gallon. (c) No. Since σ is known and n = 50, from the Central Limit Theorem, we may assume that the sampling distribution of X is approximately normal. (d) The reduced confidence level narrows the width of the confidence interval. X ±Z ? σ n =0.995±1.96? 0.02 50 0.9895≤μ≤1.0005 (b) Since the value of 1.0 is still included in the interval, there is no reason to believe that the mean is different from 1.0 gallon.

贾俊平统计学(第六版)思考题答案

1、什么是统计学？统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计：研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。推断统计：研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型，个有什么特点？按照计量尺度不同，分为：分类数据、顺序数据、数值型数据。分类数据：只能归于某一类别的，非数字型数据。顺序数据：只能归于某一有序类别的，非数字型数据。数值型数据：按数字尺度测量的观察值，结果表现为数值。按收集方法不同。分为：观测数据、和实验数据观测数据：通过调查或观测而收集到的数据；不控制条件；社会经济领域实验数据：在试验中收集到的数据；控制条件；自然科学领域。按时间不同，分为：截面数据、时间序列数据截面数据：在相同或近似相同的时间点上收集的数据。时间序列数据：在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。总体：是包含全部研究个体的集合，包括有限总体和无限总体（围、数目判定）样本：从总体中抽取的一部分元素的集合。参数：用来描述总体特征的概括性数字度量。（平均数、标准差、比例等）统计量：用来描述样本特征的概括性数字度量。（平均数、标准差、比例等）变量：是说明样本某种特征的概念，其特点：从一次观察到下一次观察结果会呈现出差别或变化。（商品销售额、受教育程度、产品质量等级等）（对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。） 5、变量可以分为哪几类？分类变量：说明事物类别；取值是分类数据。顺序变量：说明事物有序类别；取值是顺序数据数值型变量：说明事物数字特征；取值是数值型数据。变量也可以分为：随机变量和非随机变量；经验变量和理论变量 6、举例说明离散型变量和连续型变量。离散型变量：只能取有限个、可数值的变量。（企业个数、产品数量）连续型变量：可以在一个或多个区间中取任何值的变量。（年龄、温度、零件尺寸误差）7、请举出统计应用的几个例子。市场调查、人口普查等。 8、请举出应用统计学的几个领域。社会科学中的经济分析、政府政策制定等；自然科学中的物理、生物领域等。

社会统计学习题和答案--相关与回归分析报告

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb 与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析（二次曲线指数曲线）一、填空 1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。 2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。 3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。 4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。 5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。 6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。二、单项选择 1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学课后第一章习题答案.doc

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计，森林公园生长着25000颗成年松树，该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是（） A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是（） A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是（） A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明，85%的高中生愿意接受大学教育。这一叙述是（）的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业，在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中，他应该将此数据报告来源于（） A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到，雇员的午饭要么从家里带来，要么在公司餐厅就餐，要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是（） A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是（） A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费，为此，他观察了200名新生在教科书上的花费，发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费，为此，他观察了200名新生在教科书上的花费，发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是（）A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中，关于推断统计的描述是（） A、一个饼图描述了某医院治疗过的癌症类型，其中2%是肾癌，19%是乳腺癌； B、.从一个果园中采摘36个橘子，利用这36个橘子的平均重量估计

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1．教育统计学的研究对象是．教育问题。 2．一般情况下，大样本是指样本容量．大于30 的样本。 3．标志是说明总体单位的名称，它有．品质标志和数量标志两种。 4．统计工作的三个基本步骤是：、和。 5．集中量数是反映一组数据的趋势的。 6．“65、66、72、83、89”这组数据的算术平均数是。 7．6位学生的身高分别为：145、135、128、145、140、130厘米，他们的众数是。 8．若某班学生数学成绩的标准差是8分，平均分是80分，其标准差系数是。 9．参数估计的方法有和两种。 10．若两个变量之间的相关系数是负数，则它们之间存在。 11．统计工作与统计资料的关系是和的关系。 12．标准差越大，说明总体平均数的代表性越，标准差越小，说明总体平均数的代表性越。 13．总量指标按其反映的内容不同可以分为和。二、判断题 1、教育统计学属于应用统计学。（）

２、标志是说明总体特征的，指标是说明总体单位特征的。（） 3、统计数据的真实性是统计工作的生命（） 4、汉族是一个品质标志。（） 5、描述一组数据波动情况的量数称为差异量数。（） 6、集中量数反映的是一组数据的集中趋势。（） 7、在一个总体中，算术平均数、众数、中位数可能相等。（） 8、同一总体各组的结构相对指标数值之和不一定等于100%。（） 9、不重复抽样误差一定大于重复抽样误差。（） 10. 一致性是用样本统计量估计统计参数时最基本的要求。（）三、选择题 1．某班学生的平均年龄为22岁，这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2．统计调查中，调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3．统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4．下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5．统计抽样调查中，样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中，b表示( )。增加1个单位，y增加a的数量增加1个单位，x增加b的数量增加1个单位，x的平均增加量增加1个单位，y的平均增加量 7．下列统计指标中，属于数量指标的有（） A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下，重复抽样的抽样极限误差增加1倍，则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍四、简答题 1．学习教育统计学有哪些意义？

《统计学》(第四版)学习指导书以及课后习题答案

附录：教材各章习题答案第1章统计与统计数据 1.1（1）数值型数据；（2）分类数据；（3）数值型数据；（4）顺序数据；（5）分类数据。 1.2（1）总体是“该城市所有的职工家庭”，样本是“抽取的2000个职工家庭”；（2）城市所有职工家庭的年人均收入，抽取的“2000个家庭计算出的年人均收入。 1.3（1）所有IT从业者；（2）数值型变量；（3）分类变量；（4）观察数据。1.4（1）总体是“所有的网上购物者”；（2）分类变量；（3）所有的网上购物者的月平均花费；（4）统计量；（5）推断统计方法。 1.5（略）。 1.6（略）。第2章数据的图表展示 2.1（1）属于顺序数据。（2）频数分布表如下（4）帕累托图（略）。 2.2（1）频数分布表如下

2.3 2.5（1）排序略。（2）频数分布表如下（4）茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8（1）属于数值型数据。

2.9 （1）直方图（略）。（2）自学考试人员年龄的分布为右偏。布比A 班分散，且平均成绩较A 班低。 2.11 （略）。 2.12 （略）。 2.13 （略）。 2.14 （略）。 2.15 箱线图如下：（特征请读者自己分析）第3章数据的概括性度量 3.1 （1）100=M ；10=e M ；6.9=x 。

（2）5.5=L Q ；12=U Q 。（3）2.4=s 。（4）左偏分布。 3.2 （1）190=M ；23=e M 。（2）5.5=L Q ；12=U Q 。（3）24=x ；65.6=s 。（4）08.1=SK ；77.0=K 。（5）略。 3.3 （1）略。（2）7=x ；71.0=s 。（3）102.01=v ；274.02=v 。（4）选方法一，因为离散程度小。 3.4 （1）x =274.1（万元）；M e=272.5 。（2）Q L =260.25；Q U =291.25。（3）17.21=s （万元）。 3.5 甲企业平均成本＝19.41（元），乙企业平均成本＝18.29（元）；原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。 3.6 （1）x =426.67（万元）；48.116=s （万元）。（2）203.0=SK ；688.0-=K 。 3.7 （1）（2）两位调查人员所得到的平均身高和标准差应该差不多相同，因为均值和标准差的大小基本上不受样本大小的影响。（3）具有较大样本的调查人员有更大的机会取到最高或最低者，因为样本越大，变化的范围就可能越大。 3.8 （1）女生的体重差异大，因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。（2）男生：x =27.27（磅），27.2=s （磅）；女生：x =22.73（磅），27.2=s （磅）；（3）68%；（4）95%。 3.9 通过计算标准化值来判断，1=A z ，5.0=B z ，说明在Ａ项测试中该应试者比平均分数高出1个标准差，而在B 项测试中只高出平均分数0.5个标准差，由于A 项测试的标准化值高于B 项测试，所以A 项测试比较理想。 3.10 通过标准化值来判断，各天的标准化值如下表日期周一周二周三周四周五周六周日标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

_统计学概论第六版习题集总答案

第一章总论一、填空题 1．威廉·配弟、约翰·格朗特 2．统计工作、统计资料、统计学、统计工作、统计资料、统计学3．数量对比分析 4．大量社会经济现象总体的数量方面 5．大量观察法、统计分组法、综合指标法、统计推断法 6．统计设计、统计调查、统计整理、统计分析 7．信息、咨询、监督 8．同质性 9．大量性、同质性、差异性 10．研究目的、总体单位 11．这些单位必须是同质的 12．属性、特征 13．变量、变量值 14．总体单位、总体 15．是否连续、离散、性质二、是非题 1．非2．非3．是4．非5．是6．非7．是8．是9．是10．非11．非12．非13．非14．是15．非三、单项选择题 1.C 2．B 3．C 4．A 5．C 6．C 7．A 8．A 9．C 10．B 11．A 12．B 13．C 14．A 15．A 四、多项选择题 1.BC 2．ABC 3．ABE 4．ABCD 5．BCDE 6．AC 7．ABCDE 8．BD 9．AB 10．ABCD 11．BD 12．ABCD 13．BD 14．ABD 15．ABC 五、简答题略第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2．直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题略第三章统计整理一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率（或频率） 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

统计学第三章课后题及答案解析

第三章一、单项选择题 1．统计整理的中心工作是（） A．对原始资料进行审核B．编制统计表 C．统计汇总问题D．汇总资料的再审核 2．统计汇总要求资料具有（） A．及时性B．正确性 C．全面性D．系统性 3．某连续变量分为五组：第一组为40—50，第二组为50—60，第三组为60—70，第四组为70—80，第五组为80以上，依习惯上规定（） A．50在第一组，70在第四组B．60在第二组，80在第五组 C．70在第四组，80在第五组D．80在第四组，50在第二组 4．若数量标志的取值有限，且是为数不多的等差数值，宜编制（） A．等距式分布数列B．单项式分布数列 C．开口式数列D．异距式数列 5．组距式分布数列多适用于（） A．随机变量B．确定型变量 C．连续型变量D．离散型变量 6．向上累计次数表示截止到某一组为止（） A．上限以下的累计次数B．下限以上的累计次数 C．各组分布的次数D．各组分布的频率 7．次数分布有朝数量大的一边偏尾，曲线高峰偏向数量小的方向，该分布曲线属于（）A．正态分布曲线B．J型分布曲线 C．右偏分布曲线D．左偏分布曲线 8．划分连续变量的组限时，相临组的组限一般要（） A．交叉B．不等 C．重叠D．间断二、多项选择题 1．统计整理的基本内容主要包括（） A．统计分组B．逻辑检查 C．数据录入D．统计汇总 E．制表打印 2．影响组距数列分布的要素有（） A．组类B．组限 C．组距D．组中值 E．组数据 3．常见的频率分布类型主要有（） A．钟型分布B．χ型分布 C．U型分布D．J型分布 E．F型分布 4．根据分组标志不同，分组数列可以分为（） A．组距数列B．品质数列 C．单项数列D．变量数列 E．开口数列 5．下列变量一般是钟型分布的有（）

教育统计学课后练习参考答案

教育统计学课后练习参考答案第一章 1、教育统计学，就是应用数理统计学的一般原理和方法，对教育调查和教育实验等途径所获得的数据资料进行整理、分析，并以此为依据，进行科学推断，从而揭示蕴含在教育现象中的客观规律的一门科学。教育统计学既是统计科学中的一个分支学科，又是教育科学中的一个分支学科，是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看，教育统计学属于教育科学体系的一个方法论分支；从学科性质来看，教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理，计算出简单明白的统计量数来描述庞大的资料，以显示其分布特征的统计方法。推断统计又叫分析统计，它根据统计学的原理和方法，从我们所研究的全体对象（即总体）中，按照等可能性原则采取随机抽样的方法，抽出总体中具有代表性的部分个体组成样本，在样本所提供的数据的基础上，运用概率理论进行分析、论证，在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中，一种事物常存在几种可能出现的情况或获得几种可能的结果，这类现象称为随机现象。随机现象具的特点：（1）一次条件完全相同的实验有多种可能的结果（这样的实验称为随机实验）；（2）在实验之前不能确切知道哪种结果会发生；（3）在相同的条件下可以重复进行这样的实验。 4、总体，也叫做母体或全域，是指具有某种共同特征的个体的总和。当所研究的总体数量非常大时，可以从总体中抽取其中一部分个体来观测，由此来推断总体的信息，从总体中抽出的这部分个体就称为样本，它是用以表征总体的个体的集合。通常将样本中样本个数大于或等于30个的样本称为大样本，小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后，仍放回原总体，然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数，简称参数。反映样本特征的量数叫做样本统计量，简称统计量。参数是总体的真正数值，是固定的常量，理论上应该通过计算总体中全部个体的数值而获得，但由于总体中个体的数量通常很大，总体参数往往很难获得，在统计分析中一般通过样本的数值来估计。在进行推断统计时，就是根据样本统计量来推断总体相应的参数。第二章 1、按照数据的来源，可分为计数数据和度量数据；按照数据的取值情况，可分为间断性数据和连续性数据；按照数据的测量水平，可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了；表的层次要清晰；主谓分明。 4、连续性数据：（2），（3）；间断性数据：（1），（4）。 5、略 6、（1）50；（2）75；（3）34；（4）5；（5）45

社会统计学复习题有答案

社会统计学复习题有答案集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零；各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度= 平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多；曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6％，实际降低了7％，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度；若某厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度。

9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数r=0，则表明两个变量之间不存在线性相关关系。二、判断题 1、在季节变动分析中，若季节比率大于100%，说明现象处在淡季；若季节比率小于100%，说明现象处在旺季。（×；答案提示：在季节变动分析中，若季节比率大于100%，说明现象处在旺季；若季节比率小于100%，说明现象处在淡季。） 2、工业产值属于离散变量；设备数量属于连续变量。（×；答案提示：工业产值属于连续变量；设备数量属于离散变量） 3、中位数与众数不容易受到原始数据中极值的影响。（√；） 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√）