统计学第七章 相关与回归分析试题及答案

统计学第七章  相关与回归分析试题及答案
统计学第七章  相关与回归分析试题及答案

第七章 相关与回归分析

(二) 单项选择题

1、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B )

A 、相关关系

B 、函数关系

C 、回归关系

D 、随机关系

2、测定变量之间相关密切程度的代表性指标是(C )

A 、估计标准误

B 、两个变量的协方差

C 、相关系数

D 、两个变量的标准差

3、现象之间的相互关系可以归纳为两种类型,即( A )

A 、相关关系和函数关系

B 、相关关系和因果关系

C 、相关关系和随机关系

D 、函数关系和因果关系

4、相关系数的取值范围是( C )

A 、10≤≤γ

B 、11<<-γ

C 、11≤≤-γ

D 、01≤≤-γ

5、变量之间的相关程度越低,则相关系数的数值(B )

A 、越小

B 、越接近于0

C 、越接近于-1

D 、越接近于1

6、在价格不变的条件下,商品销售额和销售量之间存在着( D )

A 、不完全的依存关系

B 、不完全的随机关系

C 、完全的随机关系

D 、完全的依存关系

7、下列哪两个变量之间的相关程度高( C )

A 、商品销售额和商品销售量的相关系数是0.9;

B 、商品销售额与商业利润率的相关系数是0.84;

C 、平均流通费用率与商业利润率的相关系数是-0.94;

D 、商品销售价格与销售量的相关系数是-0.91

8、回归分析中的两个变量(D )

A 、都是随机变量

B 、关系是对等的

C 、都是给定的量

D 、一个是自变量,一个是因变量

9、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:x y c 856+=,这意味着( C )

A 、 废品率每增加1%,成本每吨增加64元

B 、 废品率每增加1%,成本每吨增加8%

C 、 废品率每增加1%,成本每吨增加8元

D 、 如果废品率增加1%,则每吨成本为56元。

10、某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:x y c 5180-=,该方程明显有错,错误在于( C )

A 、a 值的计算有误,b 值是对的

B 、b 值的计算有误,a 值是对的

C 、a 值和b 值的计算都有误

D 、自变量和因变量的关系搞错了

11、配合回归方程对资料的要求是(B )

A 、因变量是给定的数值,自变量是随机的

B 、自变量是给定的数值,因变量是随机的

C 、自变量和因变量都是随机的

D 、自变量和因变量都不是随机的。

12、估计标准误说明回归直线的代表性,因此( B )

A 、估计标准误数值越大,说明回归直线的代表性越大;

B 、估计标准误数值越大,说明回归直线的代表性越小;

C 、估计标准误数值越小,说明回归直线的代表性越小;

D 、估计标准误数值越小,说明回归直线的实用价值越小。

13、在相关分析中,要求相关的两个变量( A )

A 、都是随机变量

B 、都不是随机变量

C 、其中因变量是随机变量

D 、其中自变量是随机变量

14、在简单回归直线bx a y c +=中,b 表示( C )

A 、当x 增加一个单位时,y 增加a 的数量

B 、当y 增加一个单位时,x 增加b 的数量

C 、当x 增加一个单位时,y 的平均增加值

D 、当y 增加一个单位时,x 的平均增加值

15、相关关系是( C )

A 、现象之间,客观存在的依存关系

B 、现象之间客观存在的,关系数值是固定的依存关系

C 、现象之间客观存在的,关系数值不固定的依存关系

D 、函数关系

16、判断现象之间相关关系密切程度的主要方法是(D )

A 、对客观现象作定性分析

B 、编制相关表

C 、绘制相关图

D 、计算相关系数

17、当变量x 按一定数额变化时,变量y 也随之近似地按固定的数额变化,那么,这时变量x 和y 之间存在着( A )

A 、正相关关系

B 、负相关关系

C 、直线相关关系

D 、曲线相关关系

18、两个变量间的相关关系称为( A )

A 、单相关

B 、无相关

C 、复相关

D 、多相关

19、如果两个变量之间的相关系数8.0||>γ,说明这两个变量之间存在( B )。

A 、低度相关关系

B 、高度相关关系

C 、完全相关关系

D 、显著相关关系

20、已知400)(2=-=∑-x x L xx ,1000)()(-=--=-

-∑y y x x L xy ,3000)(2=-=∑-y y L yy ,则相关系数γ=( B )

A 、0.925

B 、-0.913

C 、0.957

D 、0.913

21、已知2)(∑--x x 是2)(∑--y y 的两倍,并已知)()(----∑

y y x x 是2)(∑--y y 的1.2倍,则相关系数γ为( C )

A 、不能计算

B 、0.6

C 、1.2/2

D 、2.1/2

22、不计算相关系数,是否也能计算判断两个变量之间相关关系的密切程度( D )

A 、能够

B 、不能够

C 、有时能够,有时不能

D 、能判断但不能计算出具体数值

23、每吨铸件的成本(元)与每一个工人劳动生产率(吨)之间的回归方程为x y 5.0270-=,这意味着劳动生产率每提高一个单位(吨)成本就( C )

A 、提高270元

B 、提高269.5元

C 、降低0.5元

D 、提高0.5元

24、已知变量x 的标准差x σ,变量y 的标准差为y σ;并且已知41

=xy σ,

y x σσ2=,则相关系数为( A )

A 、不可知

B 、1/2

C 、

22 D 、42 25、已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是( A )

A 、x y c 246000+=

B 、x y c 24.06+=

C 、x y c 624000+=

D 、x y c 600024+=

26、回归估计的估计标准误差的计算单位与(B )

A 、自变量相同

B 、因变量相同

C 、自变量及因变量相同

D 、相关系数相同

27、计算回归估计标准误的依据是(D )

A 、因变量数列与自变量数列

B 、因变量的总离差

C 、因变量的回归离差

D 、因变量的剩余离差

28、回归估计标准误是反映( D )

A 、平均数代表性的指标

B 、序时平均数代表性的指标

C 、现象之间相关关系的指标

D 、回归直线代表性的指标

29、当两个相关变量之间只能配合一条回归直线时,那么这两个变量之间的关系( A )

A 、存在明显因果关系

B 、不存在明显因果关系而存在相互联系

C 、存在自身相关关系

D 、存在完全相关关系

(三) 多项选择题

1、测定现象之间有无相关关系的方法是( ABC )

A 、编制相关表

B 、绘制相关图

C 、对客观现象做定性分析

D 、计算估计标准误

E 、配合回归方程

2、直线回归分析中( ABDE )

A 、自变量是可控制量,因变量是随机的

B 、两个变量不是对等的关系

C 、利用一个回归方程,两个变量可以互相推算

D 、根据回归系数可判定相关的方向

E 、对于没有明显因果关系的两变量可求得两个回归方程

3、下列属于正相关的现象是( ABE )

A 、家庭收入越多,其消费指出也越多;

B 、某产品产量随工人劳动生产率的提高而增加;

C 、流通费用率随商品销售额的增加而减少;

D 、生产单位产品所耗工时随劳动生产率的提高而减少;

E 、产品产量随生产用固定资产价值的减少而减少。

4、直线回归方程bx a y c +=中的b 称为回归系数,回归系数的作用是(ABE )

A 、可确定两变量之间因果的数量关系

B 、可确定两变量的相关方向

C 、可确定两变量相关的密切程度

D 、可确定因变量的实际值与估计值的变异程度

E 、可确定当自变量增加一个单位时,因变量的平均增加值

5、计算相关系数时(ACE )

A 、相关的两个变量是对等的关系

B 、相关的两个变量一个是随机的,一个是可控制的量

C 、相关系数有正负号,可判断相关的方向

D 、可以计算出自变量和因变量两个相关系数

E 、相关的两个变量都是随机的

6、可用来判断现象之间相关方向的指标有( BCD )

A 、估计标准误

B 、相关系数

C 、回归系数

D 、两个变量的协方差

E 、两个变量的标准差

7、工人的工资(元)依劳动生产率(千元)的回归方程为x y c 7010+=,这意味着( BDE )

A 、如果劳动生产率等于1000元,则工人工资为70元;

B 、如果劳动生产率每增加1000元,则工人工资平均提高70元;

C 、如果劳动生产率每增加1000元,则工人工资增加80元;

D 、如果劳动生产率等于1000元,则工人工资为80元;

E 、如果劳动生产率每下降1000元,则工人工资平均减少70元。

8、在回归分析中,就两个相关变量x 与y 而言,变量y 倚变量x 的回归和变量x 倚变量y 的回归所得的两个回归方程是不同的,这种不同表现在(BCE )

A 、方程中参数估计的方法不同

B 、方程中参数的数值不同

C 、参数表示的实际意义不同

D 、估计标准误的计算方法不同

E 、估计标准误的数值不同

9、回归估计标准误是反映( ABD )

A 、回归方程代表性大小的指标

B 、估计值与实际值平均误差程度的指标

C 、自变量与因变量离差程度的指标

D 、因变量估计值的可靠程度的指标

E 、回归方程实用价值大小的指标

10、现象之间相互联系的类型有( AC )

A 、函数关系

B 、回归关系

C 、相关关系

D 、随机关系

E 、结构关系

11、相关关系种类(ABCD )

A 、从相关方向分为正相关和负相关

B 、从相关形态分为线性相关和非线性相关

C 、从相关程度分为完全相关、不完全相关和零相关

D 、从相关的影响因素多少可分为单相关和复相关

E 、从相关数值形式分为相关系数和相关指数

12、下列现象属于相关关系的是(ACD )

A 、家庭收入越多,则消费也增长

B 、圆的半径越长,则圆的面积越大

C 、产量越高,总成本越多

D 、施肥量增加,粮食产量也增加

E 、体积随温度升高而膨胀,随压力加大而减小

13、据统计资料证实,商品流通费用率的高低与商品销售额的多少有依存关系,即随商品销售额的增加,商品流通费用率有逐渐降低的变动趋势,但这种变动不是均等的。可见这种关系是( BDE )

A 、函数关系

B 、相关关系

C 、正相关

D 、负相关

E 、曲线相关

14、直线回归分析的特点是( ACD )

A 、两个变量不是对等关系

B 、回归系数只能取正值

C 、自变量是给定的,因变量是随机的

D 、可求出两个回归方程

E 、利用一个回归方程,两个变量可以相互换算

15、配合一条直线回归方程是为了( AC )

A 、确定两个变量之间的变动关系

B 、用因变量推算自变量

C 、用自变量推算因变量

D 、两个变量互相推算

E 、确定两个变量之间的函数关系

16、直线相关分析与直线回归分析的区别在于( ADE )

A 、相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的

B 、回归分析中的两个变量都是随机的,而相关中的自变量是给定的数

值,因变量是随机的

C 、相关系数有正负号,而回归系数只能取正值

D 、相关的两个变量是对等关系,而回归分析中的两个变量不是对等关

E 、相关分析中根据两个变量只能计算出一个相关系数,而回归分析中

根据两个变量可以求出两个回归方程

17、相关系数的计算公式有( ABCDE )

A 、∑∑∑--------=

2

2)()())((y y x x y y x x γ B 、yy xx xy

L L L

C 、

∑∑∑∑∑∑∑---2

22

2)(1)(11y n y x n x y x n

xy D 、

y x n y y x x σσ∑----)

)(( E 、y x xy σσσ

18、直线回归方程bx a y c +=的意义是( ABE )

A 、这是一条具有平均意义的直线;

B 、对应一个确定的i x 所计算出来的i c y 是指与i x 对应出现所有i y 的平均

数的估计值

C 、毫无平均的意义

D 、与一个固定的i x 对应出现的i y 应该等于i c y ,如果i y 不等于i c y ,说明

在观测中出现了误差

E 、与一个固定的i x 对应出现的i y 落在以i c y 为中心的一个多大的范围内

取决于概率度和估计标准误差。

(四) 判断题

(五) 计算题

1

(2)编制直线回归方程,指出方程参数的经济意义;

(3)计算估计标准误;

(4)估计生产性固定资产(自变量)为1100万元时,工业增加

值(因变量)的可能值;

2、检查五位同学《会计学》的学习时间与成绩分数如下表所示:

根据资料:(1)建立学习成绩(y )倚学习时间(x )的直线回归方程;

(2)计算估计标准误;

(3)对学习成绩的方差进行分解分析,指出总误差平方和中有多

大比重可由回归方程来解释;

(4)由此计算出学习时数与学习成绩之间的相关系数。

3、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:(x 代表人均收入,y 代表销售额)

9=n ∑=546x ∑=260y 343622=∑x ∑=16918xy

计算:(1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义;

(2)若2003年人均收入为400元,试推算该年商品销售额。

4、某地经回归分析,其每亩地施肥量(x )和每亩粮食产量(y )的回归方程为:x y c 5.10500+=,试解释式中回归系数的经济含义。若每亩最高施肥量为40斤,最低施肥量为20斤,问每亩粮食产量的范围为多少?

5、根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据:

7=n ∑=1890x ∑=1.31y 5355002=∑x 15.1742=∑y 9318=∑xy

要求:(1)确定以利润为因变量的直线回归方程。

(2)解释式中回归系数的经济含义。

(3)当销售额为500万元时,利润率为多少?

6、某地区家计调查资料得到,每户平均年收入为6800元,均方差为800元,每户平均年消费支出为5200元,方差为40000元,支出对于收入的回归系数为0.2,

要求:(1)计算收入与支出的相关系数;

(2)拟合支出对于收入的回归方程;

(3)估计年收入在7300元时的消费支出额;

(4)收入每增加1元,支出平均增加多少元?

7、某部门8

要求:(1)计算产品销售额与利润额的相关系数;

(2)建立以利润额为因变量的直线回归方程,说明斜率的经济意义;

(3)当企业产品销售额为500万元时,销售利润为多少?

三、习题参考答案选答

(五)计算题

1、解:设生产性固定资产为自变量x ,工业总产值为因变量y ,所需合计数如下:

6525=∑x 9801=∑y 56685392=∑x 108665772=∑y

7659156=∑xy

(1)计算相关系数

])(][)([2222∑∑∑∑∑∑∑---=y y n x x n y

x xy n γ

]98011086657710][6525566853910[9801

652576591561022-?-??-?=

95.0=

95.0=γ,说明两变量之间存在高度正相关。

(2)编制直线回归方程:bx a y c +=

求解参数a 、b :

8958.0652556685391098016525765915610)(222=-??-?=

--=∑∑∑∑∑x x n y

x xy n b

59.3951065258958.0109801=?-=-=∑∑n x b n y a

回归方程为:x y c 8958.059.395+=

(3)计算估计标准误

22---=∑∑∑n xy

b y a y S

2107659156

8958.0980159.39510866577-?-?-=

65.126=

(4)当生产性固定资产1100=x 万元时,工业总产值为:

97.138011008958.059.395=?+=c y (万元)

2、解:设学习时间为自变量x ,学习成绩为因变量y ,所需合计数如下:

40=∑x 310=∑y 2740=∑xy 3702=∑x

207002=∑y

(1)编制直线回归方程:bx a y c +=

经计算求得:2.5=b 4.20=a

回归方程为:x y c 2.54.20+=

(2) 计算估计标准误:53.6=S (3)计算总误差平方和中回归误差所占比重。此比重称为决定系数,用符号γ表示。(列表计算各项离差过程略) 根据计算得知:

1480

)(=-∑-y y 1352)(=-∑-y y c 则9135

.014801352)()2==--=

∑∑--y y y y c

γ

即总误差中有91.35%可以由回归方程来解释,说明学习时数与学习成绩之间存在高度相关。

(4)计算相关系数:

956.09135.02===γγ 3、解:(1)配合回归方程:

92.0=b 92.26-=a

回归方程为:x y c 92.092.26+-=

回归系数的含义:当人均收入每增加一元时,商品销售额平均增加0.92万元。

(2)预测2003年商品销售额:

08.34140092.092.26=?+-=c y (万元)

4、解:①解释回归系数的意义:

当施肥量每增加1斤,粮食产量增加10.5斤。

②确定粮食产量的范围:

上限:当40=x 时,920405.10500=?+=c y (斤)

下限:当20=x 时,710205.10500=?+=c y (斤)

所以:每亩粮食产量范围为:710-920

5、解:①配合直线回归方程:bx a y c +=

②计算回归系数b :

公式: ∑∑∑∑∑--

=22)(11x n x y x n xy b 代入数字并计算: 0365.01890715355001.3118907193182

=?-??-=

③计算a 值:

公式: n x b n y a ∑∑-=

代入数字并计算 41.5718900365.071.31-=?-=

回归直线方程为:x y c 0365.041.5+-=

④回归系数b 的经济意义:

当销售额每增加一万元,销售利润率增加0.0365%

⑤计算预测值:

当500=x 万元时

%8.125000365.041.5=?+-=c y

6、解:收入为x ,支出为y ,由已知条件知:

6800=-x 元, 800=x σ元, 5200=-

y 元, 400002=y σ,

2.0=b

①计算相关系数:

公式: y x

b r σσ= 代入数字并计算:8

.040000800

2.0=?=

②配合回归直线方程:bx a y c +=

计算系数-

--=x b y a ,代入数字计算得:

384068002.05200=?-=a

故支出对于收入的回归方程为:x y c 2.03840+=

③估计消费支出额:

当7300=x 元时,530073002.03840=?+=c y (元)

④当收入每增加1元时,支出平均增加0.2元。

7、解:设销售额为x ,销售利润额为y ,

①计算相关系数:

])(][)([2222∑∑∑∑∑∑∑---=

y y n x x n y x xy n γ ]1.26011.121898][429029697008[1

.2604290189127822-?-??-?=

9934.0=

②配合回归直线方程为:bx a y c +=

回归系数 0742.04290296970081.26042901891278)(222=-??-?=

--=∑∑∑∑∑x x n y

x xy n b ; 计算 2773.726.536074.05125.32-=?-=-=∑∑n x b n y a

斜率b 的经济意义:销售额每增加一万元,销售利润增加0.0742万元。 ③估计销售利润值:

当500=x 万元时,8227.295000742.02773.7=?+-=c y (万元)

第七章相关与回归分析

第七章 相关与回归分析 一、本章学习要点 (一)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。函数关系是一种完全确定性的依存关系,相关关系是一种不完全确定的依存关系。相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。 相关按其程度不同,可分为完全相关、不完全相关和不相关。其中不完全相关关系是相关分析的主要对象;相关按方向不同,可分为正相关和负相关;相关按其形式不同,可分为线性相关和非线性相关;相关按影响因素多少不同,可分为单相关和复相关。 (二)判断现象之间是否存在相关关系及其程度,可以根据对客观现象的定性认识作出,也可以通过编制相关表、绘制相关图的方式来作出,而最精确的方式是计算相关系数。 相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“γ”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;计算相关系数的两个变量都是随机变量。 相关系数的取值区间是[-1,+1],不同取值有不同的含义。当1||=γ时,x 与y 的变量为完全相关,即函数关系;当1||0<<γ时,表示x 与y 存在一定的线性相关,||γ的数值越大,越接近于1,表示相关程度越高;反之,越接近于0,相关程度越低,通常判别标准是:3.0||<γ称为微弱相关,5.0||3.0<<γ称为低度相关,8.0||5.0<<γ称为显著相关,1||8.0<<γ称为高度相关;当0||=γ时,表示y 的变化与x 无关,即不相关;当0>γ时,表示x 与y 为线性正相关,当0<γ时,表示x 与y 为线性负相关。 皮尔逊积距相关系数计算的基本公式是: ∑∑∑∑∑∑∑---= =] )(][)([22222y y n x x n y x xy n y x xy σσσγ 斯皮尔曼等级相关系数和肯特尔等级相关系数是测量两个等级变量(定序测度)之间相 关密切程度的常用指标。 (三)回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。回归分析按自变量的个数分,有一元回归和多元回归,按回归线的形状分,有线性回归和非线性回归。与相关分析相比,回归分析的特点是:两个变量是不对等的,必须区分自变量和因变量;因变量是随机的,自变量是可以控制的量;对于一个没有因果关系的两变量,可以求得两个回归方程,一个是y 倚x 的回归方程,一个是x 倚y 的回归方程。 简单线性回归方程式为:bx a y c +=,式中c y 是y 的估计值,a 代表直线在y 轴上的截距,b 表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量x 每增加一个单位时,因变量y 的平均增加值。当b 的符号为正时,表示两个变量是正相关,当b 的符号为负时,表示两个变量是负相关。a 、b 都是待定参数,可以用最小平方法求得。求解a 、b 的公式为: ∑∑∑∑∑--= 2 2)(x x n y x xy n b ; n x b n y a ∑∑-= 回归估计标准误差是衡量因变量的估计值与观测值之间的平均误差大小的指标。利用此 指标可以说明回归方程的代表性。其计算公式为: 2 ) (2 --= ∑n y y S c yx 或2 2 ---= ∑∑∑n xy b y a y S yx 回归估计标准误和相关系数之间具有以下关系:

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学题目第七章相关与回归分析

(一) 填空题 1、 现象之间的相关关系按相关的程度分有________相关、________相关和_______ 相关;按相关的方向分有________相关和________相关;按相关的形式分有-________相关和________相关;按影响因素的多少分有________相关和-________相关。 2、 对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为 _______;研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为_______。 3、 完全相关即是________关系,其相关系数为________。 4、 在相关分析中,要求两个变量都是_______;在回归分析中,要求自变量是 _______,因变量是_______。 5、 person 相关系数是在________相关条件下用来说明两个变量相关________的统 计分析指标。 6、 相关系数的变动范围介于_______与_______之间,其绝对值愈接近于_______, 两个变量之间线性相关程度愈高;愈接近于_______,两个变量之间线性相关程度愈低。当_______时表示两变量正相关;_______时表示两变量负相关。 7、 当变量x 值增加,变量y 值也增加,这是________相关关系;当变量x 值减少, 变量y 值也减少,这是________相关关系。 8、 在判断现象之间的相关关系紧密程度时,主要用_______进行一般性判断,用_______进行数量上的说明。 9、 在回归分析中,两变量不是对等的关系,其中因变量是_______变量,自变量是 _______量。 10、 已知13600))((=----∑y y x x ,14400)(2=--∑x x ,14900)(2=-∑-y y ,那么,x 和y 的相关系数r 是_______。 11、 用来说明回归方程代表性大小的统计分析指标是________指标。 12、 已知1502=xy σ,18=x σ,11=y σ,那么变量x 和y 的相关系数r 是_______。 13、 回归方程bx a y c +=中的参数b 是________,估计特定参数常用的方法是 _________。 14、 若商品销售额和零售价格的相关系数为-0.95,商品销售额和居民人均收入的相关系数为0.85,据此可以认为,销售额对零售价格具有_______相关关系,销售额与人均收入具有_______相关关系,且前者的相关程度_______后者的相关程度。 15、 当变量x 按一定数额变动时,变量y 也按一定数额变动,这时变量x 与y 之间存在着_________关系。 16、 在直线回归分析中,因变量y 的总变差可以分解为_______和_______,用公式表示,即_____________________。 17、 一个回归方程只能作一种推算,即给出_________的数值,估计_________的可能值。 18、 如估计标准误差愈小,则根据回归直线方程计算的估计值就_______ 19、 已知直线回归方程bx a y c +=中,5.17=b ;又知30=n ,∑=13500y ,

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

统计学试题及答案分析-共20页

统计学考试题一 一、 单项选择题(请将正确答案的番号写在括号内,每小题1分,共20分) 1. 统计学名称来源于 A .政治算术学派 B .国势学派 C .数理统计学派 D .社会经济统计学派 2. 统计学是一门关于研究客观事物数量方面和数量关系的 A .社会科学 B .自然科学 C .方法论科学 D .实质性科学 3. 几位学生的统计学考试成绩分别为55,60,70,80,85,60,这几个数字是 A .指标 B .变量 C .标志 D .变量值 4. 重点调查中的重点单位就是 A .有关国际名声的单位 B .在总体中其单位数目占绝大比重的单位 C .特殊的单位 D .其单位数虽少,但被调查的标志值在总体标志值中占绝大比重的单位 5. 调查某大学学生学习情况,则总体是 A .该大学所有学生 B .该大学每一名学生的学习成绩C .该大学每一名学生 D .以上都不正确 6. 某公司员工的工资分为:(1)800元以下;(2)800~1500元;(3)1500~2019元;(4) 2019元以上,则第四组的组中值近似为 A .2019元 B .1750元 C . 2250元 D .2500元 7. 分配数列是 A .按数量标志分组的数列 B .按品质标志分组的数列 C .按指标分组的数列 D . 按数量标志或品质标志分组的数列 8. 统计表的形式构成由总标题、横行标题、纵栏标题 A .数据资料 B .主词 C .宾此 D .以上都不正确 9. 反映同类现象在不同时期发展变化一般水平的指标是 A .算术平均数 B .序时平均数 C .众数 D . 调和平均数 10. 某企业5月份计划要求成本降低3%,实际降低5%,其成本计划完成程度为 A .97.94% B .166.67% C .101.94% D .1.94% 11. 若两总体的计量单位不同,在比较两总体的离散程度时,应采用 A .全距 B .平均差 C .标准差 D .标准差系数 12. 下列指标中,属于强度相对数的是 A .某企业的工人劳动生产率 B .人均国民收入 C .某种商品的平均价格 D .某公司的平均工资 13. 拉氏指数所用的同度量因素是固定在 A .基期 B .报告期 C .固定时期 D .任意时期 14. 某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为 A .113.3% B .13% C .106.8% D .10% 15. 我国消费价格指数的编制方法 A .∑∑= 0q p q p K K p p B . ∑∑= 1 1111 q p K q p K p p C .∑∑= 1q p q p K p D .∑∑= 1 011q p q p K p

统计学相关 典型相关分析

典型相关分析 在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对他进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的安装路径之中,调用方式如下: 文件——新建——语法 INCLUDE 'C:\Program Files\SPSSInc\PASWStatistics18\Samples\English\Canonical correlation.sps'. CANCORR SET1=体重腰围脉搏 /SET2=单杠仰卧起坐跳高. 复制后,点击“运行”——“全部”即可 1.Correlations for Set-1 Correlations for Set-2 首先给出的是两组变量内部各自的相关矩阵,可见生理指标之间具有相关性、训练指标之间也有相关性。 2.Correlations Between Set-1 and Set-2 接着给出的是两组变量间各变量的两两相关矩阵,可见生理指标与训练指标之间确实存在相关性。 3.Canonical Correlations 提取典型相关系数的大小,可见第一典型相关系数为0.796

4.Test that remaining correlations are zero 检验各典型相关系数有无统计学意义,可见第一典型相关系数有统计学意义,第二第三典型相关系数没有统计学意义(<0.1)。 5.Standardized Canonical Coefficients for Set-1 Raw Canonical Coefficients for Set-1 各典型变量与变量组1中各变量间标化与未标化的系数列表,由此我们可以写出典型变量的转换公式(标化的):U1=0.775x1-1.579x2+0.059x3 6.各典型变量与变量组2中各变量间标化与未标化的系数列表,同理可以写出 典型变量的转换公式:V1=0.349y1+1.054y2-0.716y3

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

统计分析考试试题及答案解析

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 统计分析考试试题及答案解析 一、单选题(本大题17小题.每题1.0分,共17.0分。请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。) 第1题 某国国内生产总值2009年为2008年的109.1%,这是( )。 A 比例相对数 B 动态相对数 C 比较相对数 D 计划完成相对数 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 动态相对数是指用指标的当前状态数值除上期水平、历史最好水平和上年同期水平的结果。题中,指标是当前状态数值除上期水平数值所得的结果,属于动态相对数。 第2题 移动平均修匀方法较多地应用于( )。 A 含有季节影响的时间数列 B 无季节影响的时间数列 C 项数较少的时间数列 D 预测未来 【正确答案】:A 【本题分数】:1.0分 【答案解析】 [解析] 移动平均修匀较多地被应用于含有季节影响的时间数列,如果让移动平均的项数等于季节周期的长度,则所得到的移动平均数列中消除了季节影响。 第3题

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 指数平滑平均数的计算公式是( )。 A S t =αx 0+(1-α)S t-1 B S t =αx t+1+(1-α)S t-1 C S t )=αx t-1+(1-α)S t-1 D S t =αx t +(1-α)S t-1 【正确答案】:D 【本题分数】:1.0分 第4题 某产品单位成本计划今年比去年降低10%,实际降低15%,则计划完成相对数为 ( )。 A 150% B 94.4% C 104.5% D 66.7% 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 计划完成相对数是指用指标的当前状态数值除计划水平的结果。计划完成相对数以降低率的形式时,计划完成相对数=(1-实际降低率)/(1-计划降低率)×100%=(1-15%)/(1-10%)×100%=94.4%。 第5题 评价某一指标的当前状态的基本方法是找出一个( )作为“参照物”,将指标的当前状态与之进行比较。 A 标准水平 B 发展水平 C 一般水平 D 相对水平

第七章 相关分析与回归分析(补充例题)

第七章 相关分析与回归分析 例1、有10个同类企业的固定资产和总产值资料如下: 根据以上资料计算(1)协方差和相关系数;(2)建立以总产值为因变量的一元线性回归方程;(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少? 解:计算表如下: (1)协方差——用以说明两指标之间的相关方向。 2 2) )((n y x xy n n y y x x xy ∑∑∑∑- = - -= σ

35.126400100 9801 6525765915610>=?-?= 计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。 ∑∑∑ ∑∑∑∑--- = ] )(][) ([2 2 2 2 y y n x x n y x xy n r 95 .0) 980110866577 10()6525566853910(9801 65257659156102 2 =-??-??-?= 计算得到的相关系数为0.95,表示两指标为高度正相关。 (3) 2 2 26525 56685391098016525765915610) (-??-?= --= ∑∑∑∑∑x x n y x xy n b 90 .014109765 126400354257562556685390 6395152576591560== --= 85 .39210 65259.010 9801=? -= -=x b y a 回归直线方程为: x y 9.085.392?+= (4)当固定资产改变200万元时,总产值平均改变多少? x y ?=?9.0,180 2009.0|200=?=?=?x y 万元 当固定资产改变200万元时,总产值平均增加180万元。 (5)当固定资产为1300万元时,总产值为多少? 85 .156213009.085.392|1300=?+==x y 万元 当固定资产为1300万元时,总产值为1562.85万元。 例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。

生物统计学 第九章 多元统计分析

第九章多元统计分析简介 多元统计分析主要研究多个变量之间的关系以及具有这些变量的个体之间的关系。无论是自然科学还是社会科学,无论是理论研究还是应用决策,多元统计分析都有较广泛的应用。近年来,随着计算机的普及和广泛应用,多元统计分析的应用越来越广泛,越来越深入。生物学研究中,有许多问题要考虑样本与样本之间的关系、性状与性状之间的关系,也要考虑样本与性状之间的关系,为了能够正确处理这些错综复杂的关系,就需要借助于多元统计分析方法来解决这些问题。 从应用的观点看,多元统计分析就是要研究多个变量之间的关系,但哪些问题才是多元统计的内容,并无严格的界限。一般认为,典型的多元统计分析主要可以归结为两类问题:第一类是决定某一样本的归属问题:根据某样品的多个性状(特征)判定其所属的总体。如判别分析、聚类分析即属于此类内容。第二类问题是设法降低变量维数,同时将变量变为独立变量,以便更好地说明多变量之间的关系。主成分分析、因子分析和典型相关分析均属于此类问题。此外,多因素方差分析、多元回归与多元相关分析和时间序列分析,均是研究一个变量和多个变量之间的关系的,也是多元统计分析的内容。 第一节聚类分析(Cluster Analysis) 聚类分析是研究分类问题的一种多元统计方法,聚类分析方法比较粗糙,但由于这种方法能解决许多实际问题,应用比较方便,因此越来越受到人们的重视。近年来聚类分析发展较快,内容也越来越多。常见的有系统聚类、模糊聚类、灰色聚类、信息聚类、图论聚类、动态聚类、最优分割、概率聚类等方法,本节重点介绍系统聚类法。 系统聚类法是目前应用较多的聚类分析方法,这种聚类方法从一批样本的多个观测指标(变量)中,找出能度量样本之间相似程度的统计数,构成一个相似矩阵,在此基础上计算出样本(或变量)之间或样本组合之间的相似程度或距离,按相似程度或距离大小将样本(或变量)逐一归类,关系密切的归类聚集到一个小分类单位,关系疏远的聚集到一个大的分类单位,直到把所有样本(或变量)都聚集完毕,形成一个亲疏关系谱系图,直观地显示分类对象的差异和联系。 第二节判别分析(Discriminant Analysis) 判别分析是多元统计分析中较为成熟的一类分类方法,它是根据两个或多个总体的观测结果,按照一定的判别准则和相应的判别函数,来判断某一样本属于哪一类总体。判别分析的内容很多,常见的有距离判别、贝叶斯判别、费歇判别、逐步判别、序贯判别等方法。 第三节主成分分析(Principal components analysis)

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

统计学多元回归研究分析方法

统计学多元回归分析方法

————————————————————————————————作者:————————————————————————————————日期:

多元线性回归分析 在数量分析中,经常会看到变量与变量之间存在着一定的联系。要了解变量之间如何发生相互影响的,就需要利用相关分析和回归分析。回归分析的主要类型:一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析以及逻辑回归分析等。 1.1 回归分析基本概念 相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用面不同。 在回归分析中,变量y称为因变量,处于被解释的特殊地位;而在相关分析中,变量y与变量x处于平等的地位,研究变量y与变量x的密切程度和研究变量x与变量y的密切程度是一样的。 在回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;而在相关分析中,变量x和变量y都是随机变量。 相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度。 具体地说,回归分析主要解决以下几方面的问题。 (1)通过分析大量的样本数据,确定变量之间的数学关系式。

(2)对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。 (3)利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。 作为处理变量之间关系的一种统计方法和技术,回归分析的基本思想和方法以及“回归(Regression)”名称的由来都要归功于英国统计学F·Galton(1822~1911)。 在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。 1.2 多元线性回归 1.2.1 多元线性回归的定义 一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。 一元线性回归分析讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;影响水果产量的外界因素有平均气温、平均日照

第七章 相关与回归分析s

第七章 相关回归分析 皮尔逊线性相关系数计算的基本公式: (简捷法) ])(][)([(积差法)22222∑∑∑∑∑∑∑--- ==y y n x x n y x xy n s s s y x xy γ 简单线性回归方程式为:bx a y c +=, 式中c y 是y 的估计值,a 代表直线在y 轴上的截距,b 表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量x 每增加一个单位时,因变量y 的平均增加值。 当b 的符号为正时,表示两个变量是正相关,当b 的符号为负时,表示两个变量是负相关。a 、b 都是待定参数,可以用最小平方法求得。 求解a 、b 的公式为: ∑∑∑∑∑--=22) (x x n y x xy n b ; n x b n y a ∑∑-= 相关系数与回归系数之间具有以下的关系: x y s s r b = (一) 填空题 1.在相关关系中,把具有因果关系相互联系的两个变量中起影响作用的变量称为_______,把另一个说明观察结果的变量称为________。 2.现象之间的相关关系按相关的程度分有________相关、________相关、________相关和_______相关;按相关的方向分有________相关和______ _相关;按影响因素的多少分有________相关和________相关。 3.对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为_______;研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为_______。 4.完全相关即是________关系,其相关系数为________。 5.相关系数的变动范围介于_______与_______之间,其绝对值愈接近于_______,两个变量之间线性相关程度愈高;愈接近于_______,两个变量之间线性相关程度愈低。当_______时表示两变量正相关;_______时表示两变量负相关。 6.当变量x 值增加,变量y 值也增加,这是________相关关系;当变量x 值减少,变量y 值也减少,这是________相关关系。 7.已知13600))((=----∑y y x x ,14400)(2=--∑x x ,14900)(2 =-∑-y y ,那么,x 和y 的相关系数r 是_______。 8.已知1502=xy s ,18=x s ,11=y s ,那么变量x 和y 的相关系数r 是_______。 9.已知直线回归方程bx a y c +=中,5.17=b ;又知30=n , ∑=13500y ,12=- x , 则可知_______=a 。

统计学试题库及试题库答案解析

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

相关文档
最新文档