社会统计学习题和答案--相关与回归分析

社会统计学习题和答案--相关与回归分析
社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析

第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关

双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析

同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb

与τ

c 系数)

·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数

第四节 定距变量的相关分析

相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析

线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归

可线性化的非线性函数·实例分析(二次曲线指数曲线)

一、填空

1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。

2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。

3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。

5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。

6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。

二、单项选择

1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。

A 直线正相关

B 直线负相关

C 曲线正相关

D 曲线负相关

2.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。

A 无相关

B 低度相关

C 中等相关

D 高度相关

3.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。

A在相关分析中,相关的两变量都不是随机的;

B在回归分析中,自变量是随机的,因变量不是随机的;

C在回归分析中,因变量和自变量都是随机的;

D在相关分析中,相关的两变量都是随机的。

4.关于相关系数,下面不正确的描述是( B )。

≤r1时,表示两变量不完全相关;

A当0≤

B当r=0时,表示两变量间无相关;

C两变量之间的相关关系是单相关;

D如果自变量增长引起因变量的相应增长,就形成正相关关系。

5.欲以图形显示两变量X和Y的关系,最好创建( D )。

A 直方图

B 圆形图

C 柱形图

D 散点图

6.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。

A 0.50

B 0.80

C 0.64

D 0.90

7.在完成了构造与评价一个回归模型后,我们可以( D )。

A 估计未来所需样本的容量

B 计算相关系数和判定系数

C 以给定的因变量的值估计自变量的值

D 以给定的自变量的值估计因变量的值

8.两变量的线性相关系数为0,表明两变量之间( D )。

A 完全相关

B 无关系

C 不完全相关

D 不存在线性相关

9.身高和体重之间的关系是( C )。

A 函数关系

B 无关系

C 共变关系

D 严格的依存关系

10.在相关分析中,对两个变量的要求是( A )。

A 都是随机变量

B 都不是随机变量

C 其中一个是随机变量,一个是常数

D 都是常数

11.在回归分析中,两个变量( D )。

A 都是随机变量

B 都不是随机变量

C 自变量是随机变量

D 因变量是随机变量

12.一元线性回归模型和多元线性回归模型的区别在于只有一个( B )。

A 因变量

B 自变量

C 相关系数

D 判定系数

13.以下指标恒为正的是( D )。

A 相关系数r

B 截距a

C 斜率b

D 复相关系数

14.下列关系中,属于正相关关系得是( A )。

A 身高与体重

B 产品与单位成本

C 正常商品的价格和需求量

D 商品的零售额和流通费率

三、多项选择

1.关于积差系数,下面正确的说法是(ABCD )。

A 积差系数是线性相关系数

B 积差系数具有PRE性质

C 在积差系数的计算公式中,变量X和Y是对等关系

D 在积差系数的计算公式中,变量X和Y都是随机的2.关于皮尔逊相关系数,下面正确的说法是()。

A 皮尔逊相关系数是线性相关系数

B 积差系数能够解释两变量间的因果关系

C r公式中的两个变量都是随机的

D r的取值在1和0之间

E 皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3.简单线性回归分析的特点是(ABE )。

A 两个变量之间不是对等关系

B 回归系数有正负号

C 两个变量都是随机的

D 利用一个回归方程,两个变量可以互相推算

E 有可能求出两个回归方程

4.反映某一线性回归方程y=a+bx好坏的指标有(ABD )。

A 相关系数

B 判定系数

C b的大小

D 估计标准误

E a的大小5.模拟回归方程进行分析适用于(ACDE )。

A 变量之间存在一定程度的相关系数

B 不存在任何关系的几个变量之间

C 变量之间存在线性相关

D 变量之间存在曲线相关

E 时间序列变量和时间之间

6.判定系数r2=80%和含义如下(ABC )。

A 自变量和因变量之间的相关关系的密切程度

B 因变量y的总变化中有80%可以由回归直线来解释和说明

C 总偏差中有80%可以由回归偏差来解释

D 相关系数一定为0.64

E 判定系数和相关系数无关

7.回归分析和相关分析的关系是(ABE )。

A 回归分析可用于估计和预测

B 相关分析是研究变量之间的相互依存关系的密切程度

C 回归分析中自变量和因变量可以互相推导并进行预测

D 相关分析需区分自变量和因变量

E 相关分析是回归分析的基础

8.以下指标恒为正的是(BC )。

A 相关系数

B 判定系数

C 复相关系数

D 偏相关系数

E 回归方程的斜率

9.一元线性回归分析中的回归系数b可以表示为(BC)

A 两个变量之间相关关系的密切程度

B 两个变量之间相关关系的方向

C 当自变量增减一个单位时,因变量平均增减的量

D 当因变量增减一个单位时,自变量平均增减的量

E 回归模型的拟合优度

10.关于回归系数b ,下面正确的说法是( )。 A b 也可以反映X 和Y 之间的关系强度。; B 回归系数不解释两变量间的因果关系; C b 公式中的两个变量都是随机的;

D b 的取值在1和-1之间;

E b 也有正负之分。

四、名词解释

1.消减误差比例

变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 2. 确定性关系

当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。 3.非确定性关系

在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。 4.因果关系

变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。 5.单相关和复相关

单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。 6.正相关与负相关

正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。 7.散点图

散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。 8.皮尔逊相关系数r

皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。 9.同序对

在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。

10.异序对

在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。

11.同分对

如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j

Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。

五、判断题

1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。(√)

2.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。(√)3.不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相关。(×)

4.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。(×)5.如果众数频数集中在条件频数分布列联表的同一行中, 系数便会等于0,从而无法显示两变量之间的相关性。(√)6.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。(×)

六、计算题

1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。

3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。

4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。

【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】

5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma 【τc =0.18】

6.以下为两位评判员对10

名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。

【斯皮尔曼相关系数:0.95】

要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;

(4)用积差法求相关系数。 【Y=-11.48+0.27X 】【正相关】【相关系数r=0.95】

(1)求回归方程; (2)求相关系数。 【Y=-0.957X+14.867】【r=0.98】

9.试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。

【r=0.77】 10.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X )和综合素质(Y )进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。 【肯德尔系数:0.56,斯皮尔曼系数:0.76】

11.青年歌手大奖赛,假设五位评委对10

名决赛选手的演唱水平进行排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。

12.某地区失业率与通货膨胀率之间的资料如下表所示,试求:(1)拟合指数回归方程

c Y =x ab ;(2)失业率与通货膨胀率之间的相关系数。

【()

x

e y 1803.0717.1-=】【相关系数0.76】

13.试就下表所示资料,求算员工工作满足感高与归属感之Gamma 系数,并解释Gamma 系数具有削减误差比例PRE 性质。

工作满足感与归属感

【G=0.092】

14.已知相关系数r =0.6,估计标准误差X

Y S =8,样本容量为62。求:

1)剩余变差值;

2)剩余变差占总变差的百分比; 3)求总变差值。

15.在相关和回归分析中,已知下列资料:2

X S =16,2

Y S =25,2

XY S =-19,a =30。 要求:1)计算相关系数r ,说明相关程度;2)求出直线回归方程。

16.在相关和回归分析中,已知下列有关资料:X S =5,Y S =10,n =20,r =0.9,

2

)(∑-Y Y =2000。试计算:

1)回归系数b ;

2)回归变差和剩余变差; 3)估计标准误差X

Y S 。

17.根据下述假设资料求回归方程。

X 1 2 3 4 5 6 7 Y

23.0

23.4

24.1

25.2

26.1

26.9

27.3

要求:1)写出最小平方法计算的回归直线方程;

2)在95.46%把握下,当X=45时,写出Y的预测区间。

19.根据下述假设资料,试用积差法求相关系数。

输出X(亿元)12 10 6 16 8 9 10

输出Y(亿元)12 8 6 11 10 8 11

20.对40个企业的横截面样本数据进行一元回归分析,因变量与其平均数的离差平方和为6000,而回归直线拟合的剩余变差为2000,求:

1)变量间的相关指数R;

2)该方程的估计标准误差。

七、问答题

1.简述积差系数的特性。

2.简述回归分析和相关分析之间的密切联系。

部分计算参考:(见计算题六)

2. 已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。

皮尔逊相关系数与回归方程

编号

身高(cm )x 体重 (kg )y

xy 1 171 53 29241 2809 9063 2 167 56 27889 3136 9352 3 177 64 31329 4096 11328 4 154 49 23716 2401 7546 5 169 55 28561 3025 9295 6 175 66 30625 4356 11550 7 163 52 26569 2704 8476 8 152 47 23104 2209 7144 9 172 58 29584 3364 9976 10 162 50 26244 2500 8100 合计

1662

550

276862

30600

91830

n xy x y r 0.89-=

=

22

n xy x y b 0.659

n x (x)y x a=b 54.479n n

y=a+bx=-54.479+0.659x

-=

=--=-∑∑∑∑∑∑∑

斯皮尔曼相关系数

编号

身高(cm ) 次序

体重(kg )

次序

d

1 171 4 53 6 -2

4 2 167 6 56 4 2 4 3 177 1 64 2 -1 1 4 154 9 49 9 0 0

5 169 5 55 5 0 0

6 175 2 66 1 1 1

7 163 7 52 7 0 0

8 152 10 47 10 0 0

9 172 3 58 3 0 0 10 162

8

50

8

0 合计

10

2s 2

6d r 1-0.94n(n -1)

==∑

4. 某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结 果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。

斯皮尔曼等级相关系数

环境名次

体质名次

d

3 5 -2

4 9 9 0 0 7 6 1 1

5 7 -2 4 12 12 0 0 8 8 0 0 10 11 -1 1 2 1 1 1 11 10 1 1 4 3 1 1 1 2 -1 1

6 4

2

4 合计

18

2s 2

6d r 1-0.94n(n -1)

==∑

肯德尔等级相关系数

1) A : 同序对 AC AB AD AE AF AG AH AI AK 9 异序对 AJ AL 2 2) B : 同序对 BC BD BG BH BI BJ BK BL BE BF 10

3) C : 同序对 CE CF CG CH CI CJ CK CL 8 异序对CD 1 4 D : 同序对 DE DF DG DH DI DJ DK 7 异序对 DL 1 5) E : 同序对 EG EH EI EJ EK EL EF 7 6) F : 同序对 FG FH FI FJ FK FL 6

7) G : 同序对 GH GJ GK GL 4 异序对GI 1 8) H : 同序对 HI HJ HK HL 4 9) I :

同序对 IJ IK IL 3 10)J : 同序对 JK JL 2 11)K : 同序对 KL 1

合计:同序对s n 61= 异序对d n 5=

s d

a n n 0.831

n(n 1)2

τ-=

=-

5. 以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度 Gamma 系数和肯德尔相关系数τc 。

s n =9×(30+18+4+7)+16×(18+7)+8×(4+7)+30×7=1229 d n =5×(30+8+3+4)+18×(3+4)+16×(8+3)+30×3=617

[]s d

c 2

n n 1n (m 1)/m 2

τ-=

=-0.18

6.以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。

参赛人 评审员1

评审员2

d

A 1 1 0 0

B 2 2 0 0

C 4 3 1 1

D 3 4 -1 1

E 5 5 0 0

F 8 6 2 4

G 6 7 -1 1

H 7 8 -1 1

I 9 9 0 0

J 10

10

0 合计

8

2s

26d r 1-

0.95n(n -1)

==∑

要求:(1)求回归方程;

(2)这是正相关还是负相关;【正相关】 (3)求估计标准误差; (4)用积差法求相关系数。

X Y

xy 65 5 4225 25 325 73 7 5329 49 511 91 13 8281 169 1183 88 13.5 7744 182.25 1188 76 7 5776 49 532 53 4.5 2809 20.25 238.5 96 15 9216 225 1440 67 6.7 4489 44.89 448.9 82

10

6724

100 820

85 11 7225 121 935 776

92.7

61818

985.39

7621.4

22

n xy x y r 0.95

n xy x y b 0.267

n x (x)y x a=

b 11.477

n n

y=a+bx=-11.477+0.267x

-==-==--=-∑∑∑∑∑∑∑

17.根据下述假设资料求回归方程。

X 1 2 3 4 5 6 7 Y 23.0 23.4 24.1

25.2

26.1

26.9

27.3

编号 x

y

xy

1 1 23.0 1 529 23

2 2 23.4 4 547.56 46.8

3 3 24.1 9 580.81 72.3

4 4 25.2 16 635.04 100.8

5 5 26.1 25 681.21 130.5

6 6 26.9 36 723.61 161.4

7 7 27.3 49 745.29 191.1 合计

28

176.0

140

4442.52

725.9

7

r a b

0.992832 22.0143

0.782143

22

n xy x y b 0.782

n x (x)y x a=b 22.014n n

y=a+bx=22.014+0.782x

-==--=∑∑∑∑∑∑∑

要求:1)写出最小平方法计算的回归直线方程;

2)在95.46%把握下,当X =45时,写出Y 的预测区间。

收入(X ) 支出(Y )

xy

20 7 400 49 140 30 9 900 81 270 33 8 1089 64 264 40 11 1600 121 440 15 5 225 25 75 13 4 169 16 52 26 8 676 64 208 38 10 1444 100 380 24 9 576 81 216 43 10 1849 100 430

282

81

8928

701

2475

2

2

n xy x y b 0.196

n x (x)

y x a=

b 2.585

n n

y=a+bx=2.585+0.196x

-==--=∑∑∑∑∑∑∑

19.根据下述假设资料,试用积差法求相关系数。

输出X (亿元)

12

10 6 16 8 9 10 输出Y (亿元) 12

8

6

11

10

8

11

输出 x (亿元) 输出 y (亿元

xy

12 12 144 144 144 10 8 100 64 80 6 6 36 36 36 16 11 256 121 176 8 10 64 100 80 9 8 81 64 72 10

11

100

121

110

n xy x y r 0.70-=

=

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

相关与回归分析习题

第六章相关与回归分析习题 一、填空题 1现象之间的相关关系按相关的程度分为 ___________ 、_________ 和 _____ ;按相关的形式分为_ 和________ ;按影响因素的多少分为__________ 和_______ 。 2 ?两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量__________ ,这种相关 称为正相关;当一个现象的数量由小变大,另一个现象的数量__________ ,这种相关称为负相关。 3 ?相关系数的取值范围是___________ 。 4 ?完全相关即是_________ 关系,其相关系数为 _____________ 。 5?相关系数,用于反映__________ 条件下,两变量相关关系的密切程度和方向的统计指标。 6 ?直线相关系数等于零,说明两变量之间_________ ;直线相关系数等1,说明两变量之 间________ ;直线相关系数等于一1,说明两变量之间 ________________ 。 7 ?对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系 的________ ,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用 数学方程式表达,称为 ___________ 。 8. ___________________________________ 回归方程y=a+bx中的参数a是, b是。在统计中估计待定参数的常用方 法是______________ 。 9. _______ 分析要确定哪个是自变量哪个是因变量,在这点上它与___________ 不同。 10. 求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通 过________ 化成________ 来解决。 11. ___________________________________________________ 用来说明回归方程代表性大小的统计分析指标是 __________________________________________________ 。 二、单项选择题 3. 年劳动生产率z (干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工 人工资平均() A增加70元B减少70元C增加80元D减少80元 4?若要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于() A+1 B 0 C 0 ? 5 D [1] 5?回归系数和相关系数的符号是一致的,其符号均可用来判断现象() A线性相关还是非线性相关B正相关还是负相关 C完全相关还是不完全相关D单相关还是复相关 6 ?某校经济管理类的学生学习统计学的时间(X)与考试成绩(y)之间建立线性回归方程y c=a+b x。经计算,方程为y c=200 —0.8x,该方程参数的计算() A a值是明显不对的 B b值是明显不对的 C a值和b值都是不对的 C a值和6值都是正确的 7?在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0. 8时, 则其回归系数为:() A 8 B 0.32 C 2 D 12 . 5 8?进行相关分析,要求相关的两个变量()

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学作业一.

社会统计学作业一 特别提示:1、作业提交截至时间:2005年10月11日中午12点; 2、不接收电子版,答案要求手填。 一、某城市有人口211732人,去年发生了47次银行抢劫案,13次谋杀案,23次汽车偷窃案,分别计算每10万人口中这三类案件的犯罪率。 二、

上面是社会学系某年级学生的总评学分绩点,按照这个原始数据,作出四个完整的分布统计表: (1)不分组的频次统计表; (2)利用计算法确定组距画出分组的频次统计表; (3)利用经验法分组的频次统计表,包括标示组限、频次、相对频次,频率,cf↑,cf↓,c%↑,c%↓; (4)利用经验法分组的频次统计表,包括每组的标示上下组限,真实上下组限,组距,组中值和频次。 三、下面的统计表有哪些问题,指出来。并画一个完整的频次和频率统计表,在 表中把真实组限、组距和组中值都列上。 某厂工人的月收入分布 四、下面的图是一个直方图,表示了在药物研究项目中所有14148位妇女的血压 分布。使用直方图回答下列问题:

a) 血压在130mm 以上的妇女的百分数大约是25%,50%,还是75%? b) 血压在90mm 与160mm 之间的妇女的百分数大约是1%,50%,还是99%? c) 在哪个区间有较多妇女:135-140mm 还是140-150mm ? d) 哪个区间更拥挤一些:是135—140mm 还是140—150mm ? e) 在区间125—130mm 内,直方图的高大约为每mm2.1%。多少百分数的妇女 具有这个小组区间里的血压? f) 哪个区间有较多妇女:是97-98mm ,还是102—103mm ? g) 所有的毫米中,哪里最拥挤? 五、三个人使用密度尺度对一项研究中的实验对象的体重绘制了直方图。只有一 个人是正确的。是哪一个,为什么? (1) 100 150 200 (2) (3) 100 150 200 100 150 200 六、下面给出非全日雇员月工资的直方图。没有人一个月挣1000美元以上。200 至500美元的小组区间上的块形不见了,它必定有多高? 每 mm 的百 分数 0 1 2 3 4 90 100 110 120 130 140 150 160 血压(mm )

第七章 相关分析与回归分析(补充例题)

第七章 相关分析与回归分析 例1、有10个同类企业的固定资产和总产值资料如下: 根据以上资料计算(1)协方差和相关系数;(2)建立以总产值为因变量的一元线性回归方程;(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少? 解:计算表如下: (1)协方差——用以说明两指标之间的相关方向。 2 2) )((n y x xy n n y y x x xy ∑∑∑∑- = - -= σ

35.126400100 9801 6525765915610>=?-?= 计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。 ∑∑∑ ∑∑∑∑--- = ] )(][) ([2 2 2 2 y y n x x n y x xy n r 95 .0) 980110866577 10()6525566853910(9801 65257659156102 2 =-??-??-?= 计算得到的相关系数为0.95,表示两指标为高度正相关。 (3) 2 2 26525 56685391098016525765915610) (-??-?= --= ∑∑∑∑∑x x n y x xy n b 90 .014109765 126400354257562556685390 6395152576591560== --= 85 .39210 65259.010 9801=? -= -=x b y a 回归直线方程为: x y 9.085.392?+= (4)当固定资产改变200万元时,总产值平均改变多少? x y ?=?9.0,180 2009.0|200=?=?=?x y 万元 当固定资产改变200万元时,总产值平均增加180万元。 (5)当固定资产为1300万元时,总产值为多少? 85 .156213009.085.392|1300=?+==x y 万元 当固定资产为1300万元时,总产值为1562.85万元。 例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学原理第九章(相关与回归)习题答案

第九章相关与回归 一.判断题部分 题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。() 答案:× 题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。() 答案:√ 题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。() 答案:× 题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。() 答案:× 题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。() 答案:× 题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。() 答案:√ 题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。() 答案:×

题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。() 答案:× 题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。() 答案:√ 题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。() 答案:× 题目11:完全相关即是函数关系,其相关系数为±1。() 答案:√ 题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。() 答案× 二.单项选择题部分 题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。 A.相关关系 B.函数关系 C.回归关系 D.随机关系 答案:B 题目2:现象之间的相互关系可以归纳为两种类型,即()。 A.相关关系和函数关系 B.相关关系和因果关系

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题 一、单项选择题 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是() A.332.1万户家庭B.3000户家庭 C.332.1户家庭的年均收入D.3000户家庭的年均收入 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有( ) A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19B.28.90C.19.54D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比B.各组频数与下一组频数之比 C.各组频数与总频数之比D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9B.0C.0.5D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数B.离散系数C.回归系数D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

第6章相关与回归分析习题

《统计学》习题6 (第6章相关分析与回归分析) 班级 学号 姓名 一、单项选择题: 1、相关关系是指变量间的( )。 ① 严格的函数关系 ② 简单关系和复杂关系 ③ 严格的依存关系 ④ 不严格的依存关系 2、单相关也叫简单相关,所涉及变量的个数为( )。 ① 一个 ② 两个 ③ 三个 ④ 多个 3、直线相关即( ) ① 线性相关 ② 非线性相关 ③ 曲线相关 ④ 正相关 4、相关系数的取值范围是( )。 ① (0,1) ② [0,1] ③(-1,1) ④ [-1,1] 5、相关系数为零时,表明两个变量间( )。 ① 无相关关系 ② 无直线相关关系 ③ 无曲线相关关系 ④ 中度相关关系 6、相关系数的值越接近-1,表明两个变量间( )。 ① 正线性相关关系越弱 ② 负线性相关关系越强 ③ 线性相关关系越弱 ④ 线性相关关系越强 7、进行简单直线回归分析时,总是假定( )。 ① 自变量是非随机变量、因变量是随机变量 ② 两变量都是随机变量 ③ 自变量是随机变量、因变量是确定性变量 ④ 两变量都不是随机变量 8、回归方程i i x y 5.1123?+=中的回归系数数值表明:当自变量每增加一个单位时,因变量( )。 ① 增加1.5个单位 ② 平均增加1.5个单位 ③ 增加123个单位 ④ 平均增加123个单位 9、下列现象的相关密切程度高的是( ) 。 ① 某商店的职工人数与商品销售额之间的相关系数为0.87 ② 流通费用率与商业利润率之间的相关系数为-0.94 ③ 商品销售额与商业利润率之间的相关系数为0.51 ④ 商品销售额与流通费用率之间的相关系数为-0.81 10、从变量之间相关的表现形式看,可分为( )。 ① 正相关与负相关 ② 线性相关和非线性相关 ③ 简单相关与多元相关 ④ 完全相关和不完全相关 二、多项选择题: 1、下列表述正确的有( )。 ① 具有明显因果关系的两变量一定不是相关关系 ② 只要相关系数较大,两变量就一定存在密切关系 ③ 相关关系的符号可以说明两变量相互关系的方向 ④ 样本相关系数和总体相关系数之间存在抽样误差 ⑤ 相关系数的平方就是判定系数 2、下列各组变量之间属于相关关系的有( )。 ① 家庭收入越多与其消费支出也越多 ② 人口数与消费品的需求量 ③ 人的身高与体重 ④ 一般地说,一个国家文化素质越高,则人口的平均寿命也越长 ⑤ 在一定的施肥量范围内,施肥量增加,农作物收获量也增加 3、判断现象之间有无相关关系的方法有( )。 ① 编制相关表 ② 绘制相关图 ③ 计算估计标准误差 ④ 对客观现象作定性分析 ⑤ 计算相关系数 4、相关分析是( )。 ① 研究两个变量之间是否存在着相关关系 ② 测定相关关系的密切程度 ③ 判断相关关系的形式 ④ 配合相关关系的方程式 ⑤ 进行统计预测或推断 5、应用相关分析与回归分析需注意( )。 ① 在定性分析的基础上进行定量分析 ② 要注意现象质的界限及相关关系作用的范围 ③ 要具体问题具体分析 ④ 要考虑社会经济现象的复杂性 ⑤ 对相关与回归分析结果的有效性应进行假设检验 三、填空题: 1、按变量之间的相关的表现形态可分为( )和( )两种。 2、相关系数r 的符号反映相关关系的( ),其绝对值的大小反映两变量线性相关的( )。 3、样本容量较大时,样本相关系数r 越大,表示总体的相关程度( )。 4、估计回归方程的参数时,常用的方法是( ),其基本要求是( )。 5、回归分析和相关分析的联系表现在:相关分析是回归分析的( ),回归分析是相关分析的( )。

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

最新资源包 7相关与回归分析习题答案

章后习题参考答案 第七章相关与回归分析 1.单项选择题 (1)A,(2)C,(3)D,(4)B,(5)A 2.多项选择题 (1)AB,(2)BE,(3)ABE,(4)BD,(5)ABCDE 3.判析题 (1)×,(2)√,(3)√,(4)√,(5)× 4.简答题 (1)什么是相关分析?相关分析的主要内容是什么? 相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的关系的一种统计方法。 相关分析的内容: ①确定现象之间有无相关关系 ②确定相关关系的表现形式 ③判定相关关系的密切程度和方向 (2)什么是回归分析?回归分析的主要内容是什么? 回归分析就是对具有相关关系的两个或两个以上变量之间的数量变化关系进行测定,建立因变量和自变量之间数量变动关系的数学表达式(回归方程),以便利用自变量的数值去估计或预测因变量数值的统计分析方法。 ①根据研究的目的和现象之间的内在联系,确定自变量和因变量 ②确定回归分析模型的类型及数学表达式 ③对回归分析模型进行评价和诊断 ④根据给定的自变量数值推断因变量的数值 (3)相关分析和回归分析有什么关系? ①回归分析与相关分析的区别 从广义上来说,相关分析包括回归分析,从狭义上说,相关分析与回归分析又有一定的区别。狭义的相关分析和回归分析的区别主要有以下三个方面: 第一,在相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是

对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。因此,在回归分析中,变量之间的关系是不对等的。 第二,在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的。 第三,相关分析主要是通过一个指标即相关系数来反映变量之间相关密切程度的大小,由于变量之间是对等的,因此相关系数是惟一确定的;而在回归分析中,对于互为因果关系的两个变量,则有可能存在两个回归方程。 ②相关分析与回归分析的联系 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。 (4)什么是估计标准误差?估计标准误差的作用是什么? 估计标准误差是说明回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散程度。 估计标准误差的作用包括: 第一,说明以回归直线为中心的所有相关点的离散程度; 第二,说明回归直线的代表性大小; 第三,可以对因变量的值进行区间估计。 (5)什么是相关关系?什么是函数关系?二者之间有什么关系? 函数关系是指现象之间存在着严格的数量依存关系。在这种关系中,某个现象的数值发生变化,都有另一个现象的确定值与它相对应,现象之间的数值是一一对应关系相关关系是指现象间存在的不完全确定的数量依存关系。在这种关系中,对于某一现象的每一数值,可以有另一现象的若干数值与之相对应,现象之间的数值并不是一一对应关系。 相关关系与函数关系即有区别,又有联系。有些函数关系往往因为有观察或测量误差存在,以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;而在研究相关关系时,其数量间的规律性通常也是通过函数关系来近似地表现出来的。 ●实务题 1.(1)B (2)C (3)C (4)B (5)A

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

相关文档
最新文档