统计学(复习)

统计学(复习)
统计学(复习)

第1章统计和统计数据

1统计学的定义:是收集、处理、分析、解释数据并从数据中得出结论的科学

描述统计与推断统计的含义、内容、目的。

描述统计: 是研究数据收集,处理和描述的统计学方法.其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合,概括与分析,得出所关心的数据特征.

推断统计: 是研究如何利用样本数据来推断总体特征的统计学方法,内容包括两大类:

参数估计: 是利用样本信息推断所关心的总体特征.

假设体验:是利用样本信息判断对总体的某个假设是否成立.

2、变量与数据:不同数据类型的含义,会判断已有数据的类型.

变量:它们的特点是从一次观察到下一次观察会出现不同结果.

Ex: 企业销售额, 上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数

数据: 把观察到的结果记录下来.

总体:包含所研究的全部个体(数据)的集合

样本: 从总体中抽取的一部分元素的集合

样本量: 构成样本的元素的数目

定量变量或数值变量:定量变量的观察结果称为定量数据或数值型数据.可以用阿拉伯数据来记录其观察结果.如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”

定性变量:分类变量和顺序变量统称为定性变量

分类变量:表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院”等. 分

类变量的观察结果就是分类数据

顺序变量或有序分类变量:具有一定顺序的类别变量. 如考试成绩按等级,一个人对事物的态度.顺序变量的观察结果就是顺序数据或有序分类数据

离散型变量: 只能取有限个值得随机变量

连续型变量:可以取一个或多个区间中任何值得随机变量

3、获得数据的概率抽样方法有哪些?

根据一个已知的概率来抽取样本单位,也称随机抽样

-简单随机抽样:从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中. 抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选。不重复抽样抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取n 个个为止。

- 分层抽样或分类抽样:它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。

-系统抽样或等距抽样:它是想将总体个元素按某个顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n 个元素组成一个样本。

-整群抽样:是先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群中包含的所有元素进行观察。

第二章.用图表展示数据

频数: 落在各类别中的数据个数

比例:某一类别数据个数占全部数据个数的比值

百分比:将对比的基数作为100而计算的比值

比率: 不同类别数值个数的比值

频数分布表:频数分布表中落在某一特定类别数据.频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布状况.

什么是条形图:是用宽度相同的条形来表示数据多少的图形用于观察不同类别数据的多少或分布状况.

帕累托图: 是按各类别数据出现的频数多少排序后绘制的条形图

饼图:是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分道德数据占全部数据的比例,对于研究结构性问题十分有用.

环形图: 只能显示一个样本各部分所占的比例

数据分组:是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别.

1. 下限(lower limit) :一个组的最小值

2. 上限(upper limit) :一个组的最大值

3. 组距(class width) :上限与下限之差

4. 组中值(class midpoint) :下限与上限之间的中点值

组中值=下限值+上限值/2

直方图与条形图的区别。

1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距

2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列

3.条形图主要用于展示定性数据,而直方图则主要用于展示定量数据

茎叶图: 是反映原始数据分布的图形.它由茎和叶两部分构成,其图形是由数据组成的.通过茎叶图,可以看出数据的分布形状及数据的离散状况,比如:分布是否对称,数据是否集中,是否有离群点.等等

箱线图:是由一组数据的最大值,最小值,中位数,两个四分位数.这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较.

雷达图: 是显示多个变量的常用图示方法.

1.从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样

本围成多个区域,就是雷达图

2.可用于研究多个样本在多个变量上的相似程度

3.当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。

第三章. 用统计量描述数据

1、水平的度量

描述数据水平的统计两主要有: 平均数,中位数,分位数以及众数等.

平均数。平均数的计算:

1.也称为均值,常用的统计量之一

2.消除了观测值的随机波动

3.易受极端值的影响

4.根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为?x

中位数: 是一组数据排序后处于中间位置上数值,用M e 表示.

四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值

众数、中位数和平均数的关系*

2、差异的度量

极差:

1.一组数据的最大值与最小值之差

2.离散程度的最简单测度值

3.易受极端值影响

4.未考虑数据的分布

5.计算公式为:R = max(x i) - min(x i)

四分位差

1.也称为内距或四分间距

2.上四分位数与下四分位数之差:Q d=Q U–Q L

3.反映了中间50%数据的离散程度

4.不受极端值的影响

5.用于衡量中位数的代表性

样本方差和标准差(会计算)

1.数据离散程度的最常用测度值

2.反映各变量值与均值的平均差异

3.根据总体数据计算的,称为总体方差(标准差),记为σ2(σ);根据样本数据计算的,称为样本方差(标

准差),记为s2(s)

4.样本方差

假设是一个样本,则样本方差的计算公式为:

其中是样本均值。例如,一样本取值为3,4,4,5,4,则样本均值=,样本方差

=。样本方差是常用的统计量之一,是描述一组数据变异程度或分散程度大小的指标。

样本标准差

S称为样本标准差。如在上例中,S=0.7071。称(S/ X)×100%为样本变异系数。由于S与X都是从同一个样本资料中求得,两者的单位相同,故变异系数为一纯数。当两种样本资料所用的单位不同时,只要计算出变异系数,就可以比较它们的变异程度。

标准分数: 可以计算一组数据中每个数值的标准分数,以测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点

离散系数(变异系数)是一组数据的标准差与其相应的平均数据之比,它消除了数据绝对值大小和计量单位对标准差大小的影响.

分布形状的度量

偏态:是指数据分布的不对称性。侧度数据分布不对称性的统计量称为(偏态系数)

峰态:是指数据分布峰值的高低。测度峰态的统计量是(峰态系数)

弄清偏态系数的取值含义,会判断左偏、右偏和对称情形*

弄清峰态系数的取值含义,会判断尖峰、扁平和正常情形*

第四章.概率分布

概率:概率是对事件发生的可能性大小的度量

随机变量:是用数值来描述特定试验一切可能出现的结果,它的取值事先不能确定,具有随机性

连续性随机变量:只能取一个或多个区间中任何值得随机变量

离散型随机变量:只能取有限个值得随机变量

随机变量的概括性度量:期望值和方差的计算:描述随机变量集中程度的统计量称为(期望值)

离散型概率分布:是用表格的形式表现出来,就是离散型随机变量的概率分布

二项分布: 二项分布是建立在伯努利试验基础上的。N重伯努利

1.贝努里试验满足下列条件

?一次试验只有两个可能结果,即“成功”和“失败”

●“成功”是指我们感兴趣的某种特征

?一次试验“成功”的概率为p ,失败的概率为q =1- p,且概率p对每次试验都是相同的

?试验是相互独立的,并可以重复进行n次

?在n次试验中,“成功”的次数对应一个离散型随机变量X

泊松分布:

1.1837年法国数学家泊松(D.Poisson,1781—1840)首次提出

2.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布

3.泊松分布的例子

?一定时间段内,某航空公司接到的订票电话数

?一定时间内,到车站等候公共汽车的人数

?一定路段内,路面出现大损坏的次数

?一定时间段内,放射性物质放射的粒子数

?一匹布上发现的疵点个数

?一定页数的书刊上出现的错别字个数

超几何分布的应用背景

1.采用不重复抽样,各次试验并不独立,成功的概率也互不相等

2.总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何

概率分布

3.概率分布函数为

连续型概率分布:

正态分布:

1.由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出

2.描述连续型随机变量的最重要的分布

3.许多现象都可以由正态分布来描述

4.可用于近似离散型随机变量的分布

?例如:二项分布

5.经典统计推断的基础

标准正态分布

1.随机变量具有均值为0,标准差为1的正态分布

2.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布

3.标准正态分布的概率密度函数

4.标准正态分布的分布函数

数据的正态性评估:Q-Q图和P-P图的应用

1.对数据画出频数分布的直方图或茎叶图

?若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似

3.绘制正态概率图。有时也称为分位数—分位数图或称Q-Q图或称为P-P图

?用于考察观测数据是否符合某一理论分布,如正态分布、指数分布、t分布等等

? P-P 图是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的 ? Q-Q 图则是根据观测值的实际分位数与理论分布(如正态分布)的分位数绘制的

4. 使用非参数检验中的Kolmogorov-Smirnov 检验(K-S 检验)

由正态分布导出的几个重要分布:χ2分布、t 分布、F 分布的特点 χ2分布:

1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875

年和1900年推导出来

2. 设,则

3. 令,则y 服从自由度为1的χ2分布,即

4. 对于n 个正态随机变量y 1,y 2,y n ,则随机变量

5. 称为具有n 个自由度的χ2分布,记为 性质和特点

1. 分布的变量值始终为正

2. 分布的形状取决于其自由度n 的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称

3. 期望为:E (χ2)=n ,方差为:D (χ2)=2n (n 为自由度)

4. 可加性:若U 和V 为两个独立的χ2分布随机变量,U ~χ2(n 1),V ~χ2(n 2),则U +V 这一随机变量服从自

由度为n 1+n 2的χ2分布

t 分布:

1. 提出者是William Gosset ,也被称为学生分布(student’s t)

2. t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之

为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布

F 分布:

1. 为纪念统计学家费希尔(R.A.Fisher) 以其姓氏的第一个字母来命名则

2. 设若U 为服从自由度为n 1的χ2分布,即U ~χ2(n 1),V 为服从自由度为n 2的χ2分布,即V ~χ2(n 2),且

U 和V 相互独立,则

称F 为服从自由度n 1和n 2的F 分布,记为

)

,(~2σμN X )

1,0(~N )1,0(~N X z σ

μ

-=

22

z Y =2

)

1(~2χY =n

i i y 1

2

2

==n i i y 12

2χ2

~χχ2

1

n V n U F =

21n V n U F =2

1),(~21n n F F

统计量:

?用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数

?一个总体参数推断时的统计量:样本均值(?x)、样本标准差(s)、样本比例(p)等两个总体参数

推断时的统计量:(?x1-?x2)、(p1-p2)、(s1/s2)

?样本统计量通常用小写英文字母来表示

参数:

?描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值

?一个总体的参数:总体均值(μ)、标准差(σ)、总体比例(π);两个总体参数:(μ1 -μ2)、(π1-

π2)、(σ1/σ2)

?总体参数通常用希腊字母表示

抽样分布的概念:

1.样本统计量的概率分布,是一种理论分布

?在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布

2.随机变量是样本统计量

?样本均值, 样本比例,样本方差等

3.结果来自容量相同的所有可能样本

4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据

样本均值的抽样分布:

1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布

2.一种理论概率分布

3.推断总体均值μ的理论基础

中心极限定理:从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布

其他统计量的分布:

1.总体(或样本)中具有某种属性的单位与全部单位总数之比

? 不同性别的人与全部人数之比

? 合格品(或不合格品) 与全部产品总数之比

2. 总体比例可表示为

3. 样本比例可表示为

样本比例的分布

1. 在重复选取容量为n 的样本时,由样本比例的所有可能取值形成的相对频数分布

2. 一种理论概率分布

3. 当样本容量很大时,样本比例的抽样分布可用正态分布近似,即 样本方差的分布

1. 在重复选取容量为n 的样本时,由样本方差的所有可能取值形成的相对频数分布

2. 对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n -1) 的χ2分布 统计量的标准误差

1. 样本统计量的抽样分布的标准差,称为统计量的标准误,也称为标准误差

2. 衡量统计量的离散程度,测度了用样本统计量估计总体参数的精确程度

3. 样本均值和样本比例的标准误差分别

第五章.参数估计

1、参数估计的基本原理

参数估计:就是用样本统计量去估计总体的参数 估计量:用于估计总体参数的统计量的名称

? 如样本均值,样本比例,样本方差等

N

N N

N 101=

-=

ππ或n

n p n

n p 101=

-=

?例如: 样本均值就是总体均值m 的一个估计量

估计值:估计参数时计算出来的统计量的具体值

?如果样本均值?x =80,则80就是θ的估计值

点估计

1.用样本的估计量的某个取值直接作为总体参数的估计值

?例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计

2.无法给出估计值接近总体参数程度的信息

?由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值

?一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出

估计的可靠性的度量

区间估计:

1.在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到

2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量

?比如,某班级平均分数在75~85之间,置信水平是95%

置信度:一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值得次数所占的比例称为,也称为置信度或置信系数

置信水平:

1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度

2.表示为(1 - a) %

?a为是总体参数未在区间内的比例

3.常用的置信水平值有99%, 95%, 90%

?相应的a 为0.01,0.05,0.10

置信区间

1.由样本估计量构造出的总体参数在一定置信水平下的估计区间

2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间

3. 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的

真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述

4. 总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会

因样本的不同而变化,而且不是所有的区间都包含总体参数

5. 实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置

信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个

6. 当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所

产生的区间是否包含总体参数的真值,因为它可能是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个

7. 一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”

的问题

8. 置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所

抽取的这个样本所构建的区间而言的

2、一个总体参数的区间估计

1.个总体均值区间估计的计算(两种情形) A .大样本的估计 1. 定条件

? 总体服从正态分布,且方差(σ2) 已知

? 如果不是正态分布,可由正态分布来近似(n 3 30)

2.用正态分布统计量z

3.总体均值μ在1-α置信水平下的置信区间为 B .小样本的估计 1.假定条件

? 总体服从正态分布,但方差(σ2) 未知 ? 小样本(n < 30)

2. 使用t 分布统计量

)

1,0(~N n

x z σμ

-=

α)(22未知或σσαα

n

s

z x n z x ±±)1(~--=

n t n

s x t μ

n

s

2

αn s t x 2α

±

3.总体均值μ在1-α置信水平下的置信区间为

评价估计量好坏的标准: 对于同一个未知参数,不同的方法得到的估计量可能不同,,于是提出问题:

1.应该选用哪一种估计量?

2.用什么标准来评价一个估计量的好坏?

第六章.假设检验

1、假设检验的基本原理

原假设:

1.又称“0假设”,研究者想收集证据予以反对的假设,用H0表示

2.所表达的含义总是指参数没有变化或变量之间没有关系

3.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它

4.总是有符号=, £或 3

?H0 :m = 某一数值

?H0 :m 3某一数值

?H0 :m£某一数值

●例如, H0 :m= 10cm

备择假设:

1.也称“研究假设”,研究者想收集证据予以支持的假设,用H1或H a表示

2.所表达的含义是总体参数发生了变化或变量之间有某种关系

3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持

备择假设

4.总是有符号 1,<或>

?H1 :m1某一数值

?H1 :m>某一数值

?H1 :m <某一数值

单侧检验和双侧检验:

1.备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)

2.备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-

tailed test)

?备择假设的方向为“<”,称为左侧检验

?备择假设的方向为“>”,称为右侧检验

两类错误与显著性水平

1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,

因而就有可能犯错误

2.原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假

设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误

3.第Ⅰ类错误(a错误)

?原假设为正确时拒绝原假设

?第Ⅰ类错误的概率记为a,被称为显著性水平

2. 第Ⅱ类错误(b错误)

?原假设为错误时未拒绝原假设

第Ⅱ类错误的概率记为b (Beta)

利用统计量进行检验时的决策准则

1.根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量

2.对样本估计量的标准化结果

?原假设H0为真

?点估计量的抽样分布

3.标准化的检验统计量

点估计量的抽样标准差标准化检验统计量

点估计量的抽样标准差

假设值

点估计量

标准化检验统计量=

统计量决策规则

1.给定显著性水平a,查表得出相应的临界值z a或z a/2,t a或t a/2

2.将检验统计量的值与a 水平的临界值进行比较

3.作出决策

?双侧检验:I统计量I >临界值,拒绝H0

?左侧检验:统计量< -临界值,拒绝H0

?右侧检验:统计量>临界值,拒绝H0

利用P值进行决策的准则

1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率

?P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设

2.被称为观察到的(或实测的)显著性水平

3.决策规则:若p值

2、一个总体参数的假设检验

一个总体均值双侧检验的计算(两种情形)

1.总体方差_____ 已知或未知.

在____已知的条件下,由抽样分布理论可知,样本统计量服从 z 分布;而在______ 未知的条件下,样本统计服从 t 分布。故当_______已知时,可以使用z体验;当___ 未知时,可以使用 t 体验。

2.n(n1,n2) 较大或n较小。

当样本量 n1,n2 都较大时,如果总体方差 __ 和__位置,可以用样本方差__, __替代,这时,杨本统计量近似服从z分布,采用z作为体验统计量也是可行的,但是当n 或n1,n2部大时,如果__,__未知,就应该采用t作为统计量。

第八章.一元线性回归

1、变量间的关系

相关关系的含义,与函数关系的区别

函数关系

1.是一一对应的确定关系

2.设有两个变量x 和y ,变量y 随变量x 一起变化,并完全依赖于x ,当变量x 取某个数值时, y 依

确定的关系取相应的值,则称y 是x 的函数,记为y = f (x),其中x 称为自变量,y 称为因变量

3.各观测点落在一条线上

相关系数

1.一个变量的取值不能由另一个变量唯一确定

2.当变量x 取某个值时,变量y 的取值对应着一个分布

3.各观测点分布在直线周围

相关关系的分类

相关关系的描述及测度

1.度量变量之间线性关系强度的一个统计量

?若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

?若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为r

也称为Pearson 相关系数 (Pearson’s correlation coefficient)

2. 样本相关系数的计算公式

散点图:散点图可以判断两个变量之间有无相关关系,并对关系形态作出大致描述,但要准确度量变量间的关系强度,则需要计算相关关系。

简单相关系数的取值特点及相关含义: 简单相关系数又称皮尔逊相关系数或“皮尔逊积矩相关系数”,它一般用字母r 表示。它是用来度量定量变量间的线性相关关系。

计算公式为:

2、一元线性回归

因变量: 被预测或被解释的变量,用 y 表示

自变量:用来预测因变量的一个或多个变量,用x 表示 回归模型各个部分的解释

参数:因变量y 的取值是不同的,y 取值的这种波动称为(变差)。 参数最小二乘估计的基本思想*

1. 德国科学家Karl Gauss(1777—1855)提出用最小化图中垂直方向的误差平方和来估计参数

2. 使因变量的观察值与估计值之间的误差平方和达到最小来求得和的方法。即

3. 用最小二乘法拟合的直线来代表x 与y 之间的关系与实际数据的误差比其他任何直线都小

(和的计算公式) 根据最小二乘法,可得求解和的公式如下

2

2

∑∑∑-?---=

22)

()())((y y x x y y x x r =n i i 1

最小=--=-∑∑==n

i i

i n i i x y y y 1

21012

)??()?(ββ00?β1

1?β====1210?1

1

2

10?0

1

10

0n

i i

i i n

i i

i ββββ?????

??=---==---=?∑∑====0)??(20)??(21210?11210?01100n i i i i n i i i x y x Q x y Q

ββ?β?βββ?ββββn i n

i i i n

i i n i i n

i i i 1

0121

21111=====x y x x n y x y x n n i n i i i n i i n i i n i i i 101212

1111???βββ-=??? ??-?

??

????? ??-=∑∑∑∑∑=====00?β1

1?β

判定系数的含义及计算公式的解释:

1.回归平方和占总误差平方和的比例

2.反映回归直线的拟合程度

3.取值范围在[ 0 , 1 ] 之间

4.R2 →1,说明回归方程拟合的越好;R2→0,说明回归方程拟合的越差

5.决定系数平方根等于相关系数

第十章.时间序列预测

1、时间序列组成要素

时间序列:是同一现象在不同时间上的相继观察值排列而成的序列

平稳序列:是基本上不存在趋势的序列

非平稳序列:是包含趋势,季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列又可以分为趋势的序列。

趋势:是时间序列在长时期内呈现出来的持续向下的变动

季节变动:是时间序列在一年内重复出现的周期性波动

循环波变动:是时间序列呈现出的非固定长度的周期性波动

不规则波动:是时间序列中除去趋势,季节变动和周期性波动之后的随机波动

2、时间序列预测的程序

1.确定时间序列所包含的成分

2.找出适合此类时间序列的预测方法,并对可能的预测方法进行评估,以确定最佳预测方案

3.利用最佳预测方案进行预测

3、平滑法预测

1. 适合于只含有随机成分平稳序列

2. 通过对时间序列进行平滑以消除其随机波动,因而也称为平滑法

3. 主要有移动平均法(moving average)和指数平滑法(exponential smoothing)等,这些方法是

4. 平滑法既可用于短期预测,也可以用于对时间序列进行平滑以描述序列的趋势(包括线性趋势和非

线性趋势)

移动平均法和指数平滑法的适用条件

移动平均法:

1. 选择一定长度的移动间隔,对序列逐期移动求得平均数作为下一期的预测值

2. 将最近k 期数据平均作为下一期的预测值

3. 设移动间隔为k (1

4. 预测误差用均方误差(MSE )来衡量

4、了解趋势预测和自回归模型预测 趋势预测:

1. 根据时间序列变化的趋势选择适当的模型进行预测

2. 主要适合于含有趋势的序列

3. 趋势序列的预测方法主要有线性趋势(linear trend)预测、非线性趋势(non-linear trend)预测和自

回归(autoregression)模型预测等

自回归模型预测:

1. 序列包含多种成分自回归是解决自相关序列的有效预测方法之一

2. 它是利用观测值与以前时期的观测值之间的关系来预测值的一种多元回归方法

3. 因变量是观测值Y t ,自变量是因变量的滞后值Y t-1 ,Y t-2 ,Y t-3 ,…。看上去就像自己同自己回

归,故名自回归

5、多成分序列的预测:

1. 序列包含多种成分

2. 预测方法有

t

t k t k t t t -+-+-+1211k

Y Y Y Y Y F t t k t k t t t ++++=

=-+-+-+1211 误差平方和

n

F Y MSE n

i i

i

∑=-=

=

1

2

)

(误差个数

误差平方和

? 季节多元回归模型预测 ? 季节自回归模型模型预测 ? 分解预测等

? 分解预测是先将时间序列的各个成分依次分解出来,尔后再进行预测

虚拟变量和季节指数

1. 用虚拟变量表示季节的多元回归预测方法

2. 若数据是按季度记录的,需要引入3个虚拟变量;按月记录的,则需要引入11个虚拟变量

3. 季度数据的季节性多元回归模型可表示为

1?

??=其他季度第一季度011Q 2

???=其他季度第二季度01Q 23

???=其他季度

第三季度

01Q 3季节成分

季节成分趋势

34231210?Q b Q b Q b t b b Y ++++=

《统计学》复习总结

《统计学》复习总结 第一部分基本概念与原理 1 统计的涵义(统计统计资料统计学) 统计学的性质与特点 统计工作的过程(统计调查统计整理统计分析) 统计分组的概念统计分组的方法(单变量分组与组距分组) 2 统计数据的分类 定类数据定序数据定距数据定比数据 (品质数据)(数量数据) 3 统计指标的分类 总量指标相对指标平均指标(时期指标时点指标) (比例比率)(一般平均数序时平均数)(要求:掌握概念并会区分常用的统计指标的类型或举出各种类型指标的例子) 4 . 统计调查常用的几种方式 (统计报表普查抽样调查典型调查与重点调查五种) 统计调查问卷的设计(要求会进行具体的设计) 5 .统计数据的整理与显示(相应整理方法常用的统计图名称与示意图的画法) 按定类数据定序数据定距数据定比数据分类型总结 6. 数据特征的测度 集中趋势众数、中位数、均值(算术、调和、几何) (要求掌握计算方法、计算公式和适用场合) 离中趋势异众比率四分位差方差与标准差离散系数(适用的数据类型) 偏度和峰度(偏斜程度扁平程度) (要求了解概念及其作用) 7 . 时间序列的对比分析 序时平均数的计算方法及公式 各种动态指标的定义及其相互关系 水平分析发展水平与平均发展水平增长量(逐期累积)和平均增长量 速度分析发展速度(环比定基)增长速度(环比定基) 平均发展速度与平均增长速度(二者关系) 增长1%的绝对值 (要求:重点掌握并能熟练运用) 8 . 用最小二乘法求直线趋势方程的方法 (了解参数估计公式、相关系数r 的计算公式及其意义)

9. 季节变动测定的两种方法 按月(季)平均法趋势剔除法 (了解以上两种方法) 10.指数的概念与分类 概念(广义与狭义) 分类(总指数个体指数数量指标指数质量指标指数综合指数平均数指数) 11 .加权综合指数加权平均指数 (要求:熟练掌握两种形式的数量指数与质量指数公式包括权数的选取及时期的确定原则)12 .指数体系的分析与运用 指数与指数体系 (一)总量变动的因素分析 加权综合指数体系分析(权数的确定原则相应公式) 加权平均指数体系分析(权数的确定原则相应公式) (能熟练运用指数体系进行总量变动的因素分析,包括从相对数和绝对数两个方面进行分析) (二)平均数变动的因素分析 平均数变动指数= 变量影响指数X 结构影响指数 (要求掌握相应的指数名称意义及计算公式) 第二部分复习题选 (一)题型 1 . 简答题 2. 填空题 3 . 计算题 4 . 综合分析题 (二)题选(见附页)

应用统计学期末复习

应用统计学期末复习重点(按题型整理) 一、填空题(10分) 1.统计学的三种含义:统计工作;统计数据或统计信息;统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法 5.标志是说明总体单位特征的,而指标是说明总体特征的, 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志,可变标志称为变量。 7.统计总体具有三个基本特征,即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。 10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。 13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数。 14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。 19.从统计表的内容看:统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类:计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

生物统计学

生物统计学

————————————————————————————————作者: ————————————————————————————————日期:

第七章回归分析 第一节回归和相关的概念 方差分析检验一个或多个因子对某一生物变量是否有影响,只涉及一种变量。两个以上变量之间的定量关系的统计分析需要回归分析来解决。在自然界,两个或多个变量相互制约、相互依存的现象很常见。 变量间的关系一般分为两种:一种是因果关系,即一个变量的变化受另一个变量或几个变量的制约,如微生物的繁殖速度受温度、湿度、光照等因素的影响,子女的身高是受着父母身高的影响;另一种是平行关系,即两个以上变量之间共同受到另外因素的影响,如人的身高与体重之间的关系,兄弟身高之间的关系等都属于平行关系。 设有两个随机变量X和Y,如果变量X的每一个可能的值,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归(Regression)。 X也是随机变量时,X和Y相互存在回归关系,这两个随机变量间就存在相关(Correlation)关系。在实际应用中,并不严格区分相关和回归。 在回归和相关分析中,必然注意下面一些问题,以避免统计方法的误用。 (1)变量间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。回归和相关只能作为一种统计分析手段,帮助认识和解释事物的客观规律,决不能把风马牛不相及的资料凑到一起进行分析; (2)由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其他变量的影响,因此,在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平,否则,回归和相关分析就可能会导致不可靠甚至完全虚假的结果。例如人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围一定较小,当体重在变化时,其结果就会相反; (3)在进行回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的准确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的回归关系; (4)回归与相关分析一般是在变量一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间的关系类型可能会发生改变,所以回归预测必须限制自变量Y的取值区间,外推要谨慎,否则会得出错误的结果。 第二节一元线性回归 研究两个随机变量的关系时首先要收集成对数据。 7.1研究土壤中NaCl的含量对植物单位叶面积物质干重的影响时,收集到如下成对数据。问二者的回归关系如何? NaCl的含量0.00.8 1.6 2.4 3.2 4.0 4.8 单位叶面积干重80 90 95 1 根据数据作散点图,分析:1. X与Y的关系密切否?2.线性还是曲线关系?3. 有无偏

统计学1-3章练习题参考答案

第一章统计总论、单项选择题 1. 属于统计总体的是( A. 某县的粮食总产量 C.某商店的全部商品销售额B D. . 某地区的全部企业 某单位的全部职工人数 )。 D. 总体单位 2. 构成统计总体的个别事物称为( A.调查单位 B.标志值 C.品质标志D 3. 对某城市工业企业未安装设备进行普查,总体单位是( A. 工业企业全部未安装设备B C. 每个工业企业的未安装设备D B 4. 工业企业的设备台数、产品产值是( A. 连续变量B C. 前者是连续变量,后者是离散变量 D 5. 在全国人口普查中() 。 A. 男性是品质标志B C. 人口的平均寿命是数量标志 B )。 . 工业企业每一台未安装设备 . 每一个工业企业 )。 . 离散变量 D . 前者是离散变量,后者是连续变量 . 人的年龄是变量 . 全国人口是统计指标 6. 总体的变异性是指()。 A.总体之间有差异B C.总体随时间变化而变化 B 7. 几位学生的某门课成绩分别是 A. 品质标志 B . 数量标志C B D. . 总体单位之间在某一标志表现上有差异 总体单位之间有差异 67 分、. 标志值 78 分、88 分、89 分、96 分,“学生成绩”是 ( D . 数量指标 ) 。 8. 某年级学生四门功课的最高考分分别是 A. 指标 B. 标志 C. D 变量 98 分、 D. 86分、88 分和95,这四个数字是 (标志值 9. 下列指标中属于质量指标的是( A. 社会总产值 B .产品合格率 B ) 。 C . 产品总成本 D . 人口总数 10. 下列属于质量指标的是( A.产品的产量 B.产品的出口额 D C. 产品的合格品数量 D. 产品的评价 11. 下列属于离散型变量的是( A.职工的工资 B.商品的价格 C.) 粮食的亩产量 D. 汽车的产量

应用统计学期末试卷

南京邮电大学 2010 /2011 学年第 一 学期 《应用统计》期末 试卷(A ) 院(系) 班级 学号 姓名 一、单项选择题(每题2分,共10题,合计20分) (1)一个旅游景点的管理员根据以往的经验,有80%游客照相留念,则接下来的两名游客都照相留念的概率是( )。 A.0.65 B.0.36 C.0.5 D.0.4 (2)从一个装有3个红球2个白球的盒子摸球(不放回),则连续两次摸到红球的概率为( )。 A.0.6 B.0.3 C.0.5 D.0.4 (3)下面属于时期指标的是( )。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 (4)平均发展速度是( )。 A. 定基发展速度的算术平均数 B. 环比发展速度的算术平均数 C. 环比发展速度的几何平均数 D. 增长速度加上100% (5)在回归直线Y =a +bx 中,回归系数b 的意义为( )。 A .x =0时,Y 的期望值 B .X 每变动一个单位引起的Y 的平均变动量 C .Y 每变动一个单位引起的X 的平均变动量 D .X 每变动一个单位时Y 的变动总量 (6)设随机变量2~(3,)X N σ,且(36)0.4P X <<=,则( )0P X <=( )。 A .0.1 B .0.4 C .0.6 D .1 (7)某企业生产某种产品,其产量每年增加5万吨,则该产品的产量环比增长速度( )。 A . 年年下降 B . 年年增长 C . 年年保持不变 D . 无法做结论 (8)设()~X P λ,已知()()12P X P X ===,则()3P X =的数值为( )。 装 订 线 内 不 要 答 题 自 觉 遵 守 考 试 规 则,诚 信 考 试,绝 不 作 弊

统计学总复习(详细)

《统计学原理》总复习 2011年6月制作人:暨南大学统计学系 王艳丽 1

第一章 绪论 第二章 统计调查 第三章 统计整理 第四章 总量指标和相对指标 第五章 数据分布特征的描述 第六章 抽样调查和参数估计 第七章 假设检验 第八章 相关与回归 第九章 时间数列分析与预测 第十章 统计指数 第十一章 统计分析和统计新闻写作(不考) 制作人:暨南大学统计学系 王艳丽 2

第一章 绪论 £统计的含义 £统计学的概念与研究对象 £数据的类型 £统计学的一些基本概念 制作人:暨南大学统计学系 王艳丽 3

制作人:暨南大学统计学系 王艳丽 4 £统计的三种含义 ? 1.统计工作:是指搜集、整理、分析和显示统计数据的活动。 ? 2.统计资料:是指统计活动的结果,即统计数据。 ? 3.统计学:是一门关于搜集、整理、分析、解释统计数据的方法 论科学和艺术。 £统计的特点: ? 数量性 ? 具体性 ? 综合性 £统计的作用 ? 统计是认识世界的有力武器 ? 统计是治国和管理的重要手段 ? 统计是科学研究 的有效工具 £统计的研究对象:客观现象的数量表现、数量关系和数量 变化 第一章 绪论

统计学和统计数据 £统计学的研究对象:统计工作的规律性 £统计学的分类: ?从统计学方法构成方面分类:1、描述统计学;2、推 断统计学。 ?从统计方法研究和统计方法的应用角度来看:1、理论 统计学;2、应用统计学。 £数据的类型 ?分类数据、顺序数据、数值型数据 ?观测数据和实验数据 ?截面数据和时间序列数据 制作人:暨南大学统计学系 王艳丽 5

统计学的一些基本概念 £1、统计总体、总体单位、样本、样本容量 ?二者的关系:没有总体单位,总体就不存在;没有总 体,也就无法确定总体单位。 ?总体的特点:同质性、差异性、大量性 £2、标志与指标、变量、变量值 ?标志;描述总体单位特征的名称 ?统计指标:描述总体数量特征的名称 l数量指标:是指反映事物的规模或总量的指标。 l质量指标:是指反映事物的性质、质量和管理水平的指标。 l两者的关系:指标数值由数量标志汇总而来,两者随总体单位 的相互转化而转化。但两者说明的对象不同,表现形式也不 同。 ?变量:说明现象某种特征的名称,包括可变标志和指 标 ?变量值:变量的取值,称变量值。 制作人:暨南大学统计学系 王艳丽 6

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

统计学原理复习1

统计学原理计算题(考试复习必备) 1 某车间有30个工人看管机器数量的资料如下: 5 4 2 4 3 4 3 4 4 5 4 3 4 2 6 4 4 2 5 3 4 5 3 2 4 3 6 3 5 4 以上资料编制变量分配数列。 答案: 2 某班40名学生统计学考试成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 学校规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。要求: (1)将该班学生分为不及格 及格 中 良 优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。 答案:(1) (2) 分组方法为:变量分组中的组距式分组,而且是开口式分组; 本班学生的考试成绩的分布呈两头小,中间大的“正态分布”的形态。 3 某企业10 4 计算表如下: 元620=∑? ∑=f x x 该工业集团公司工人平均工资620元。 5 某厂三个车间一季度生产情况如下: 第一车间实际产量为190件,完成计划95%;第二车间实际产量250件,完成计划100%;第三车间实际产量609件,完成计划105%,三个车间产品产量的平均计划完成程度为: %1003 % 105%100%95=++ 另外,一车间产品单位成本为18元/件,二车间产品单位成本12元/件,三车间产品单位成本15元/件,则三个车间平均单位成本为: 153 15 1218=++元/件 以上平均指标的计算是否正确?如不正确请说明理由并改正。 解:两种计算均不正确。 平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度 指标的特定涵义。正确的计算方法是:平均计划完成程度 () % 84.1011030 104905.160900.125095.0190609250190/== ++++=∑∑= x m m X 平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接影响。故 正确的计算为: 平均单位成本件元/83.141049 15555 609250190609152501219018==++?+?+?=∑∑= f xf X 6

统计学复习资料分析

《统计学》 第一章 一、填空题 1、统计是、和的统一体,是统计工作的成果,是 统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量; 变量按分,可分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表 现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标 就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。

统计学原理复习1

一、判断题() 1. 标志和指标是两个根本不同的概念,两者没有任何联系。 2. 典型调查的误差可以控制。 ( ) 3. 按数量标志分组所形成的次数分布数列叫做变量分布数列。 4. 直接用物量乘以其相应的不变价格所求得的价值指标仅包括数量因素变动, 映物量的变化。 ( ) 5. 平均数与次数和的乘积等于变量值与次数乘积的总和。 6. 平均差是各标志值对其算术平均数的离差的平均数。 7. 利用指数体系理论,可以反映被研究现象的变动趋势。 8. 使用全面资料条件下,平均指数法可以理解为是综合指数法的一种变形形式。 9. 由于抽样调查中既有登记误差又有抽样误差,所以只有登记误差的全面调查准确性高。 ( ) 10. 定量预测必须以定性预测为基础,定性预测是定量预测的前提。 二、单项选择题() 统计学原理》 1.“统计”一词的基本含义是 ( ) A. 统计调查、统计整理、统计分析 B. 统计方法、统计分组、统计计算 C. 统计方法、统计分析、统计预测 D. 统计科学、统计工作、统计资料 2.数量指标一般表现为 ( ) A. 平均数 B. 相对数 C. 绝对数 D. 指数 3.要了解我国农村经济的具体情况,最适合的调查方式是 A. 普查 B. 典型调查 C. 重点调查 D. 抽样调查 4.下 面属于按品质标志分组的是 ( ) A. 企业按职工人数分组 B. 企业按工业总产值分组 C. 企业按经济类型分组 D. 企业按资金占用额分组 5.按连续型变量分组、其末组为开口组, 下限为 2 000 。 组组中值为 ( ) A. 2 500 B. 2 250 C. 2 100 D. 2 200 ( 已知相邻组的组中值为 1 750,则末 则商品销售额计划完成情况相对指标 可以确切地反

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

生物统计学(第三版)

概论 名词: 生物统计:将概率论和数理统计的原理应用到生物学中以分析和解释其数量资料的科学 试验设计:试验工作未进行之前应用生物统计原理,来制定合理的试验方案,包括选择动物,分组和对比以及相应的资料搜集整理和统计分析的方法。 总体与样本 ?数据具有不齐性。 ?根据研究目的确定的研究对象的全体称为总体(population); ?含有有限个个体的总体称为有限总体; ?包含有无限多个个体的总体叫无限总体; ?总体中的一个研究单位称为个体(individual); ?从总体中随机抽出一部分具有代表性的个体称为样本(sample); ?样本中所包含的个体数目叫样本容量或大小,常记为n。 ?通常把n≤30的样本叫小样本,n >30的样本叫大样本。 随机抽取(random sampling) 的样本是指总体中的每一个个体都有同等的机会被抽取组成 样本。 变数与变异数列、变量: ?变数:研究中对样本个体的观察值。 ?变量:相同性质的事物间表现差异性的某种特征。如:身高、体重。 ?变异数列:将变数按从小到大的顺序排列的一组数列。 参数与统计量 ?由总体计算的特征数叫参数(parameter); ?由样本计算的特征数叫统计量(staistic)。 准确性与精确性 ?准确性(accuracy)也叫准确度,指观测值与其真值接近的程度。若x与μ相差的 绝对值|x-μ|小,则观测值x的准确性高;反之则低。 ?精确性(precision)也叫精确度,指重复观测值彼此接近的程度。若观测值彼此接 近,即任意二个观测值xi、xj相差的绝对值|xi -xj |小,则观测值精确性高;反之 则低。 ?调查或试验的准确性、精确性合称为正确性。由于真值μ常常不知道,所以准确性 不易度量,但利用统计方法可度量精确性。 随机误差与系统误差 随机误差也叫抽样误差(sampling error) ,是由于许多无法控制的内在和外在的偶然因素所造成。带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。 系统误差也叫片面误差(lopsided error),是试验处理之外的其他条件明显不一致所带来的偏差。是由于试验动物的初始条件相差较大,饲料种类、品质、数量、饲养条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。 系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度愈大。随机误差不可避免,但可减少,这主要依赖控制试验过程,尤

统计学复习题1

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间?

要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。 (2)说明成年组和青少年组平均身高的代表性哪个大?为什么? 要求:试比较哪个单位的职工工资差异程度小。 8、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。 与平均分数相比,该位应试者哪一项测试更为理想? KEY: 1、(1)77,80.5,68.5,87.25 (2)83,18.75,0.173 (3)中位数,是数据分布明显左偏又是顺序数据。

统计学复习重点

1、统计学:是收集、汇总和分析统计数据的科学和艺术。 2、统计数据的分析是统计学的核心内容,它是通过统计描述和统 计推断的方法探索数据内在规律的过程。 3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。 4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。 5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。 6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。) 7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数/组距,用频数密度才能准确反映频数分布的实际情况。8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。 9、描述统计的内容也包括频数分布、但主要是关于集中趋势和离中趋势的描述问题。 10、众数:是一组数据中出现次数最多的变量值。从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数,记为M。 11、众数是一组数据中心位置的一个代表值。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数。

12、协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。 13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。 14、用报告期水平减去基期水平,就等于增长量。其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。 15、报告水平与基期水平之比,称为发展速度。其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。 16、序时平均数也称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平。由于指标形式分绝对数、相对数和平均数等,所以对其平均的方法存在差异性。 17、绝对数有时期数和时点数之分,两者的区别主要在于是否具有可加性。 18、几何平均法的应用条件是要求现象呈现均匀变动。如果现象发生大起大落的变化,用几何平均法所计算的平均发展速度将失去代表性。 19、累计法考虑各时期的发展状况,不只是受最初和最末两个极端值的影响。 20、移动平均法是趋势变动分析的一种较简单的常用方法。该方法的基本思想和原理是,通过扩大原时间序列的时间间隔,并按一定的间

《应用统计学》期末考试试题及答案(第一套)

《应用统计学》期末考试试题(第一套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、某城市工业企业未安装设备普查,总体单位是( B)。 A.工业企业全部未安装设备B.工业企业每一台未安装设备 C.每个工业企业的未安装设备D.每一个工业企业 2、属于数量指标的是( A )。 A.粮食总产量 B.粮食平均亩产量 C.人均粮食生产量 D.人均粮食消费量 3、某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日, 则调查期限为( B )。 A.一日B.一个月C.一年D.一年零一个月 4、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出下列哪项 是正确的( C ) A.80-89%B.80%以下C.90%以下D.85%以下 90-99%80.1-90%90-100% 85-95% 100-109% 90.1-100% 100-110% 95-105% 110%以上 100.1-110%110%以上 105-115% 5、某企业2005年职工平均工资为5200元,标准差为110元,2006年职工平均 工资幅长了40%,标准差增大到150元,职工平均工资的相对变异( B )A.增大 B.减小C.不变D.不能比较6、权数对算术平均数的影响作用,实质上取决于( A ) A.作为权数的各组单位数占总体单位数比重的大小 B.各组标志值占总体标志总量比重的大小 C.标志值本身的大小 D.标志值数量的多少 7、已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方 法为( A )

生物统计学名词解释

生物统计学 1、参数与统计量 参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。如:总体平均数、总体标准差。 统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。如:样本平均数、样本标准差。 2、标准差与变异系数 标准差和变异系数都是反映离散性的特征数即变异数中的一种。 标准差有总体标准差和样本标准差之分:б=N x 2) (∑-μ、S=1)(2--∑n x x 。标准差的大小受多个变量影响,若各变量间差异大标准差也大。标准差的值较大时,x 的代表性受到削弱。要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。 变异系数是度量数据资料变异程度的常用指标。变异系数CV=x s ×100%,是样本变量的相对差异量,是为不带单位的纯数。变异系数CV 可比较多个样本的变异系数。 3、精确性与准确性 准确性也称准确度,是指测定值与真值的符合程度大小。 精确性也称精确度,是指多次测定值的变异程度。 4、单侧检验与双侧检验 双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。备择假设为

HA :0μμ≠(或21μμ≠)。单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。备择假设为HA :0μμ> (0μμ<),或:21μμ>(21μμ<) 5、假设检验的两类错误 若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。犯第一类错误(“弃真”)的概率即为显著性水平α。若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。犯第二类错误(“纳伪”)的概率为β。当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。 6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么? 若用t 检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为 1-0.05=0.95。比如对五个样本进行t 检验,需比较1025=C 次,那么10次检验都不 犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为401.0)05.0(11=P 10=--。 故比较多个样本平均数时不适用于t 检验,而用方差分析可有效地控制第一类错误。 用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。方差分析比t 检验运算简便,也比t 检验更为精确。 7、独立事件和概率的乘法原则

统计学复习[1]

一.单项选择题部分 1.1.社会经济统计的研究对象是(C 社会经济现象的数量特征和数量关系)。 1.2.几位学生的某门课程成绩分别为67分、78分、88分、89分、96分,这些分数是(C 标志值)。 1.3.对某城市工业企业未安装设备进行普查,总体单位是(B 工业企业每一台未安装设备)。 1.4.标志是说明总体单位特征的名称(C 数量标志具有标志值)。 1.5.工业企业的设备台数、产品产值是(D 前者是离散变量,后者是连续变量)。 1.6.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,"学生成绩"是(B 数量标志)。 1.7.在全国人口普查中(B 人的年龄是变量)。 1.8.下列指标中属于质量指标的是(B 、产品合格率)。 2.1.连续调查与不连续调查的划分依据是(B 调查登记的时间是否连续 )。 2.2.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于(B 重点调查) 2.3. 为了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于(B 等距抽样 ) 2.4.下列调查中,调查单位与填报单位一致的是(D 工业企业现状调查 )。 2.5.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查研究,是(B 典型调查)。 2.6.下述各项调查中属于全面调查的是(B 某地区对工业企业设备进行普查 )。 2.7.抽样调查和重点调查都是非全面调查,二者的根本区别在于(D 选取单位方式不同)。 3.1.在组距分组时,对于连续型变量,相邻两组的组限(A 必须是重叠的)。 3.2.下列分组中属于按品质标志分组的是(B 产品按品种分组)。 3.3.简单分组和复合分组的区别在于(B 选择的分组标志多少不同)。 3.4、品质分组和变量分组的区别在于(A 选择分组标志的性质不同)。 4.1.反映社会经济现象发展总规模、总水平的综合指标是(B 总量指标)。 4.2.总量指标按反映时间状况的不同,分为(B 时期指标和时点指标 )。 4.3.总量指标是用(A 绝对数形式)表示的。 4.4.某厂1996年完成产值2000万元,1997年计划增长10%,实际完成2310万元,超额完成计划(B5% )。 4. 5.反映不同总体中同类指标对比的相对指标是(B 比较相对指标)。 4.6.在什么条件下,简单算术平均数和加权算术平均数计算结果相同(B 权数相等)。 4.7.加权算术平均数计算公式 ∑∑=- f f x x 的权数是(C ∑f f )。 4.8.权数对算术平均数的影响作用,实质上取决于(A 作为权数的各组单位数占总体单位数比重的大小)。 4.9.某企业的总产值计划比去年提高11%,执行结果提高13%,,则总产值计划完成提高程度为( C (113%÷111%)-100% ) 4.10.比较不同水平的总体的标志变动度,需要计算(C 标准差系数)。 4.11.销售成本利润率指标属于(B 比例相对数)。 4.12.总量指标按反映总体内容的不同,可分为(C.总体单位总量和总体标志总量 )。 5.1.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的(C4倍)。 5.2.对某种连续生产的产品进行质量检验,每隔一小时抽10分钟产品进行检验,这种抽查方式是(D 整群抽样)。 5.3.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A 缩小为原来的81.6% )。 5.4.为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1 人,对其家庭进行调查,这种调查属于(B 等距抽样)。 7.1.相关系数的取值范围是( C -1 ≤ r ≤1 )。 7.2.现象之间线性依存关系的程度越低,则相关系数( C 越接近于0 ) 。 7.3.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( B 负相关)。 7.4.现象之间线性相关关系的程度越高,则相关系数( D 越接近于+1和-1 ) 。 8.1.统计指数按反映的对象范围可分为(C 个体指数和总指数) 8.2.统计指数按指数化指标的性质不同,可分为(B 数量指标指数和质量指标指数)。 8.3.某厂05年的产量比04年增长了13.6%,总成本增长了12.9%,则该厂05年产品单位成本( A 减少0.62% )。 8.4. 编制总指数的两种形式是 ( B 综合指数和平均数指数 )。 8.5平均指数的两种计算形式是 (C 算术平均数指数和调和平均数指数)。 9.1.根据时期数列计算序时平均数应采用(C 简单算术平均法)。 9.2.间隔相等的时点数列计算序时平均数应采用( D.首末折半法)。 9.3.数列中各项数值可以直接相加的时间数列是( B.时期数列 )。 9.4.下列数列中哪一个属于动态数列( D 出口额按时间先后顺序排列形成的数列 )。 9.5.说明现象在较长时期内发展的总速度的指标是(C 定基发展速度)。 9.6.定基增长速度与环比增长速度的关系是(C 各环比增长速度加1后的连乘积再减1 )。 二、多项选择题部分 1.1.要了解某地区的就业情况(ABE A 、全部成年人是研究的总体B 、成年人口总数是统计指标E 、某人职业是教师是标志表现) 1. 2.在全国人口普查中(BCE B 、男性是品质标志表现、C 、人的年龄是变量E 、人口的平均年龄是统计指标 ) 1. 3.在工业普查中(BCE B 、每一个工业企业是总体单位、C 、固定资产总额是统计指标E 、职工人数是离散变量) 1.4.下列各项中,属于统计指标的有(ACD A 、1999年全国人均国内生产总值C 、某市年供水量 D 、某地区原煤生产量 ) 1.5.下列统计指标中,属于质量指标的有(BDE B 、单位产品成本D 、人口密度 E 、合格品率) 1.6.下列各项中,属于连续型变量的有(ACD A 、基本建设投资额 C 、国民生产总值 D 、居民生活费用价格指数) 2.1.普查是一种(ABE A 、专门组织的调查 B 、一次性调查E 、全面调查) 2.2.在工业设备普查中(BDE B 、工业企业的全部设备是调查对象D 、每台设备是调查单位 E、每个工业企业是填报单位 ) 2. 3.抽样调查方式的优越性表现在以下几个方面(BCDE B 、经济性 C 、时效性 D 、准确性 E 、灵活性 ) 2.4..制定统计调查方案,应确定(ABCE A 、调查目的和调查对象 B 、调查单位和填报单位C 、调查项目和调查表E 、调查的时间和时限) 3.1..下列分组哪些是按品质标志分组(BCDE B 、科技人员按职称分组C 、人口按民族分组 D 、企业按经济类型分组 E 、人口按地区分组) 3.2.下面哪些分组是按数量标志分组(ACD A 、企业按销售计划完成程度分组C 、工人按产量分组 D 、职工按工龄分组) 4.1.影响加权算术平均数的因素有(AB A 、各组频率或频数 B 、各组标志值的大小) 4.2.在下列条件下,加权算术平均数等于简单算术平均数(ADE A 、各组次数相等D 、各组次数都为1 E 、各组次数占总次数的比重相等) 4.3.下列统计指标属于总量指标的是(ACE A 、工资总额C 、商品库存量E 、进出口总额) 4.4.下列指标属于相对指标的是(BDE B 、某地区人口出生率14.3% D 、某产品产量计划完成程度为113% E 、某地区人口自然增长率11.5‰) 4. 5.下列指标中强度相对指标是(ABCD A 、人口密度 B 、平均每人占有粮食产量 C 、人口自然增长率D 、人均每国内生产总值 ) 5.1.抽样估计中的抽样误差(ACE A、是不可避免要产生的C 是可以事先计算出来的E其大小是可能控制的) 5.2.总体参数区间估计必须具备的三个要素是(BDE B、样本指标D、抽样误差范围 E、抽样估计的置信度) 5.3.用抽样指标估计总体指标,所谓优良估计的标准有(BCD B 、无偏性 C 、一致性 D 、有效性 )7.1.变量间的相关关系按其程度划分有 ( ABC A 、完全相关 B 、不完全相关 C 、不相关) 7.2.变量间的相关关系按其形式划分有 ( CE C 、线性相关E 、非线性相关) 8.1.下列属于质量指标指数的有 ( CDE C 、商品零售价格指数D 、职工劳动生产率指数 E 、产品单位成本指数) 9.1.下面哪几项是时期数列(BC B 、我国历年新增人口数C 、我国历年图书出版量 ) 9.2..下列哪些指标是序时平均数(ABDE A 、一季度平均每月的职工人数 B 、某产品产量某年各月的平均增长量 D 、某商场职工某年月平均人均销售额 E 、某地区近几年出口商品贸易额平均增长速度) 9.3.下面属于时点数列的有(BDE B 、某工厂每年设备台数D 、历年牲畜存栏数E 、某银行储户存款余额) 三、简答 1.简述统计指标与统计标志的区别与联系。 统计指标与标志的区别表现为:(1)标志是说明总体单位属性的,一般不具有综合的特征;指标是说明总体综合数量特征的,具有综合的性质。(2)统计指标都可以用数量来表示;标志中,数量标志可以用数量来表示,品质标志只能用文字表示。 统计指标与统计标志的联系表现为: (1)统计指标的指标值是由各单位的标志值汇总或计算得来的; (2)随着研究目的不同,指标与标志之间可以相互转化。 2.平均指数和综合指数计算结论相同的条件是什么?当数量指标的算术平均数指数,在采用基期总值为权数的特定情况下,与一般综合指数的计算结论相同; 当质量指标的调和平均数指数,在采用报告期总值为权数的特定情况下,与一 般综合指数的计算结论 相同。 3.什么是数量指标和质量指标?两者有何关系? 数量指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标,用绝对数表示。质量指标是反映社会经济现象发展相对水平或工作质量的统计指标,用相对数或平均数表示。 两者的关系表现为:它们从不同角度反映总体的综合数量特征。数量指标是计算质量指标的基础,而质量指标往往是相应的数量指标进行对比的结果。 4.时期数列和时点数列的基本概念和特点是什么? 在动态数列中,每一指标是反映某现象在一段时间内发展过程的总量,则该动态数列称时期数列。基本特点是:1 数列具有连续统计的特点,2 数列中各个指标的数值可以相加,3 数列中各个指标数值大小与所包括时期长短有直接关系。 在动态数列中,每一指标值是反映某现象在某一时刻内发展状态的总量, 则该动态数列称时点数列。基本特点是:1 数列不具有连续统计的特点, 2 数列中各个指标的数值不可以相加,3 数列中各个指标数值大小与所包括时期长短没有直接关系。 5.如何理解抽样推断的概念和特点 抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应的数量特征的统计分析方法。其特点如下: (1)是由部分推算整体的一种认识方法;(2)建立在随机取样基础上; (3)运用概率估计的方法;(4)抽样推断的误差可以事先计算并加以控制; 6.简述统计分组的概念与种类划分? 根据统计研究任务的要求和现象总体的内存特点,把统计总体按照某一标志划分为若干性质不同而又有联系的几个部分称为统计分组。统计分组的分类: (1)统计分组按其任务和作用的不同,分为类型分组、结构分组和分析分组。

相关文档
最新文档