统计学期末复习重点

统计学期末复习重点
统计学期末复习重点

统计学期末复习重点

一.单项选择(20 X 2=40)

单选题所涉及的知识点,不用死记概念,要理解其内涵,灵活应用!

第一章.绪论

统计的定义:统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。

统计学的定义:统计学是关于数据的科学,研究如何收集(如调查与试验)、分析(回归分析)、表述数据(图与表),并通过数据得出基本结论。

统计的研究对象的特点:①数量性。统计数据是客观事物量的反映。②总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。③变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。

统计的分类:统计可分为描述统计,推断统计、核算统计、理论统计、应用统计描述统计:汇总的表、图和数值。包括搜集数据、整理数据、展示数据

推断统计:用样本数据对总体性质进行估计,检验

核算统计:对国家或地区经济运行过程及各类总量进行描述和分析

总体:根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。

总体单位(简称单位):是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。

样本:由总体的部分单位组成的集合。样本容量:样本所包含的总体单位数

标志(变量):总体各单位普遍具有的属性或特征。

标志的分类:①品质标志:单位属性方面的特征。品质标志的表现只能用文字、语言来描述。②数量标志:单位数量方面的特征。数量标志可以用数值来表现

几种常用的统计软件:SAS SPSS MINITAB STATISTICA Excel

思考题:1、在调查某高校学生的学习状况时,总体是(C )

A该校全部学生B该校每个学生

C该校全部学生的学习情况

D被随机抽取进行数据采集的全部学生

2. 要了解全国的人口情况,总体单位是(A )。

A.每一个人

B.每一户

C.每个省的人口

D.全国总人口

第二章.数据

数据:所收集、分析、汇总表述和解释的事实及数字,数据是进行统计分析研究的基础;是统计学研究对象的特征,是客观事实;不仅仅局限于数字范畴,包括非数字形式的其他信息。

个体——总体单位:收集数据的实体,也就是数据的承载者

变量(标志):个体的特征或者属性变量值:个体在变量上的具体表现(例如,固定资产是一个变量,各企业固定资产的具体数值是变量值)

指标(统计指标):是说明总体的综合数量特征的。

标志:总体各单位普遍具有的属性或特征

指标与标志的区别:①标志是说明总体单位特征的,而指标是说明总体特征的。

②指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的。连续型变量:变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。(例如,气象上的温度、湿度,零件的尺寸等)

离散型变量:变量的取值是整数值,可以一一列举。(例如,企业数,职工人数)数据的分类:

品质数据:不能用数字来表述的特征。如人的性别,民族,宗教信仰等

数量数据:用数字能够表述的特征,数值型特征,如人的身高,体重等

二者的区别:数量数据总是以数字形式表现,品质数据可以是数值型,也可以是非数值型。只有数量数据可以进行数学运算

数据的计量尺度:可分为定类尺度、定序尺度、定距尺度、定比尺度

定类变量:“名义型变量”,值只能用文字表述,说明事物是属于这一类还是属于那一类,不同类别间地位相等,没有高低优劣之分,如性别,民族,党派。定序变量:“顺序型”变量,变量值只能用文字表述。与定类变量不同的是,定序变量的值有高低、大小、多少、优劣、强弱等方面的区分,即变量的值有顺序性。如考试成绩用优秀,良好,及格,不及格来显示,用文盲、半文盲、小学、初中、高中、大学、研究生来标记每个人的文化程度。

定距变量:变量值为数值型,对事物的准确测度,比定序尺度精确,没有绝对零点,变量值只能进行加减计算而不能进行乘除计算,如温度,公元纪年等极少数现象属于定距变量

定比变量:数据表现为“数值”对事物的准确测度,与定距尺度处于同一层次,有绝对零点,具有?或÷的数学特性,可以进行任何形式的计算

截面数据:相同或近似相同的时间点上收集的数据,某个时间点或某瞬间事物或现象的特征情况,静态数据

时间序列数据:在几个时期或时点收集到,反映同一主体同一特征情况的数据, 动态数据

统计调查方式:统计调查方式有普查、抽样调查、典型调查、重点调查

普查:为特定目的专门组织的非经常性全面调查,通常是一次性或周期性的;一般需要规定统一的标准调查时间,应用范围比较狭窄,如人口普查,工业普查

抽样调查:从总体中随机抽取一部分单位(样本)进行调查,分重复抽样和不重复抽样,目的是推断总体的未知数字特征,遵循随机性原则,存在调查误差,并且可以加以控制,具有经济性、时效性强、适应面广、准确性高等特点

典型调查:从调查对象的全部单位中选择少数典型单位进行调查,目的是描述和揭示事物的本质特征和规律,调查结果不能用于推断总体

重点调查:从调查对象的全部单位中选择少数重点单位进行调查,调查结果不能用于推断总体,优点在于调查单位少,可以调查较多的项目和指标,了解较详细的情况。即用较少的人力和时间,取得较好的效果。组织重点调查的关键问题是确定重点单位。

调查误差:收集的数据资料与真实情况之间的差距,可分为登记性误差和代表性误差,登记性误差:由于调查者或被调查者的人为因素所造成的误差,理论上讲可以消除。代表性误差:用样本数据进行推断时所产生的误差,通常无法消除,但事先可以进行控制和计算。

组距分组步骤:①确定组数:组数的确定没有专门的规定,应以能够显示数据的

分布特征和规律为目的。建议组数:5-20组

②组限:变量值区间两端的值,上限和下限,其中上限为一个组的最大值,下限是一个组的最小值 ③确定各组组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定

注意:开口组只有一个组限,无法计算组距,开口组以相邻一组的组距作为其组距

④根据分组整理成频数分布表

组距:上限与下限之差 组距=( 最大值 - 最小值)÷ 组数 组中值:下限与上限之间的中点值 组中值=(下限值+上限值)/2

第三章. 单变量描述统计 频数——次数:对总体经过分组后形成各组单位数在各组间的分布。也就是各类别中的数据个数。

频数分布——次数分布,分布数列:总体中的各个类别及其相应的频数全部展示出来的数据集汇总表

累计频数 (P62 表3-3)

向上累计:将各组次数和比率,由变量值低的组向变量值高的组逐组累计。 向下累计:将各组次数和比率,由变量值高的组向变量值低的组逐组累计。 众数:出现次数最多的变量值。

对单项式分组数列确定众数:出现次数最多的标准值就是众数(书P63例3.2) 对组距数列确定众数:出现次数最多的组作为众数所在组 中位数:排序后处于中间位置上的值。 中位数位置的确定: (看书P65 例3.4)

未分组数据:

组距分组数据: (根据向上/下累计法确定中位数)

未分组数据的中位数的计算公式:

四分位数:把数据分为4部分,处在分位点的数值 四分位数位置的确定:

未分组数据:下四分位数位置=(N+1)/4 上四分位数位置=3*(N+1)/4

组距分组数据:下四分位数位置=N/4

2

1

+=

N 中位数位置21+=N 中位数位置21∑+=f 中位数位置21∑+=f 中位数位置+??? ??+N N N e 12221???????????

??+=+??? ??+为偶数时当为奇数时当N X X N X M N N N

e 1222121

上四分位数位置=3N/4

均值 (P69 例3.10)

简单均值的计算公式为 权均值的计算公式为

第四章. 两变量描述统计

相对指标:两个有联系的指标数值对比得到的综合指标 相对指标的表现形式:无名数和有名数 无名数:抽象掉分子和分母的计量单位。表现为百分数,千分数,倍数,系数 有名数:保留分子和分母的计量单位。表现:密度

相对指标的具体形式(6种):(具体参考第四章的ppt 弄懂)

结构相对数=

(各部分比重和为1)

比例相对数= (三个或三个以上的连比)

比较相对数= (横向比较,静态)

动态相对数= (随时间发展的变化,动态)

强度相对数= (两个性质不同

但有一定联系的总量指标之比,有名数)

计划完成程度相对数=

(计划完成的程度)

协方差:度量两个具有联合概率分布P (X,Y )的随机变量之间线性关系的指标 样本:含有n 个个体,每个个体含有两个数据值(x1,y1),(x2,y2) 样本协方差公式:

总体协方差:变量离差乘积的数学期望

N

i i N =1

21N X N X X X X N i i N ∑=

=+++=121Λ==K

i i K

i i i N N N 1

1212211∑∑===++++++=K i i K i i i N N N F F X F F F F X F X F X X 1121221

1ΛΛ&%100*总体全部数值

总体部分数值

总体中另一部分数值

总体中某部分数值

另一范围的该指标数值某一范围指标数值%100*基期指标数值报告期指标数值总体的指标数值另一有联系而性质不同某一总体的指标数值

%100*计划数

实际完成数

1

)

)((---=∑

n y y x x s i i xy

总体协方差公式:

总体相关系数: (总体相关系数记为ρ)

样本相关系数: (样本相关系数记为r )

r 的取值范围是 [-1,1]

|r |=1,为完全相关 r =1,为完全正相关

r =-1,为完全负正相关 r = 0,不存在线性相关关系

-1≤r<0,为负相关 0

相关程度评价标准:

|r|<0.3称为微弱相关

0.3≤ |r|<0.5称为低度相关 0.5≤ |r|<0.8称为显著相关

0.8≤ |r|<1称为高度相关或强相关。

第五章.概率与概率分布 正态分布的概率密度函数:

f (x ) = 随机变量 X 的频数 σ2 = 总体方差 π =3.14159; e = 2.71828 x = 随机变量的取值 (-∝ < x < ∝) μ = 总体均值 正态分布函数的性质:

①概率密度函数在x 轴的上方,即f (x )>0

②正态曲线的最高点在均值μ,它也是分布的中位数和众数

③正态分布是一个分布族,每一特定正态分布通过均值μ的标准差σ来区分。 σ决定曲线的高度,同时决定曲线的平缓程度,即宽度

④曲线f (x )相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交

⑤正态曲线下的总面积等于1 正态分布的概率:

P (a ≤x ≤b )=∫a b

f(x)dx

标准正态分布函数:

2

2)(∑∑∑-?---=

22)()())((y y x x y y x x r N

Y Y X X i i xy ∑--=

)

)((σy

x xy

σσσρ=N Y Y X X i i xy ∑

--=

))((σ()--x 2221μσ()∞<<∞-=--x x f x ,e 21)(2221μσπσ

任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布

标准正态分布的概率密度函数: 标准正态分布的分布函数:

标准正态分布表的使用:

将一个一般的转换为标准正态分布,计算概率时,查标准正态概率分布表 对于负的 x ,可由Φ (-x )-1=Φ (x )得到 对于标准正态分布,即X ~ N (0,1),有 P (a ≤ X ≤b )= Φ (b ) -Φ (a )

P (|X| ≤a )= 2Φ (a ) -1

对于一般正态分布,即X ~ N (μ , σ),有

例1 : 设X ~ N (0,1),求以下概率: (1) P (X <1.5) ;(2) P (X >2);

(3) P (-1

解:(1) P (X <1.5) = Φ (1.5)=1-0.0668=0.9332 (2) P (X >2)=1- P (X ≤2)=1-0.9973=0.0228 (3) P (-1

= Φ(3)- Φ(-1)= Φ(3)–[1-Φ(1)] = 0.9987-(1-0.8413)=0.8354

(4) P (| X | ≤ 2) = P (-2≤ X |≤ 2)= Φ(2)- Φ(-2)

= Φ(2)- [1-Φ(2)]=2 Φ(2)- 1=0.9544

例2: 设X ~N (5,32

)),求以下概率

(1) P (X ≤10) ; (2) P (2

)1,0(~N X Z σ

μ-=?

?∞

-∞-==Φx t x t

t x f x d e 21

d )()(2-2π-x 2

2∞<<∞-=-x x f x 2

2

e π21)(?

??-a ??? ??--??? ??-=≤≤σμΦσμΦa b b X a P )(9525.0=9525.0)67.1(67.135351035)10(==??? ??≤-=?

??

??-≤-=≤ΦX P X P X P

另外,第五章第二节:大数定律与中心极限定理大家了解即可,不是重点内容,不放心的可自行参考第五章的ppt 内容

第九章.抽样调查

抽样调查的意义:一般所讲的抽样调查,即指狭义的抽样调查(随机抽样), 按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。 总体:由被调查对象的全部单位所构成的集合体,总体单位数用N 表示。 抽样总体:抽取出来调查观察的单位,抽样总体的单位数用n 表示。n ≥ 30 大样本 n < 30 小样本

抽样估计:在抽样调查的基础上,利用样本的数据资料计算样本指标,以样本特征值对总体特征值做出具有一定可靠程度的估计和判断。 总体和样本的方差和标准差:分有偏(n>30)和无偏(n≤30)

总体成数:每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位数的比例称为总体成数,记作P 成数总体方差:P(1-P)

样本成数:从成数总体中抽取样本容量为n 的样本,样本中具有此种特征的单位占全部样本单位数的比例称为样本成数,记作p p=n1/n

成数是一种特殊的平均数,是总体中具有某个属性的单位占全体单位的比重 样本成数p 是总体成数P 的无偏、一致、有效估计量 样本成数的无偏方差是成数总体方差的无偏估计量

第十章和第十一章以计算题考核为主,选择题不再细分知识点! 二、简答题(7+8=15,四题中任选两题,必须牢记!) 1、抽样平均误差受哪些因素影响?

抽样平均误差不仅是测定样本指标对总体指标代表性高低的一个重要尺度,也是根据样本指标对总体指标进行推断的重要依据,他的大小与总体标志变异度(即总体的标准差大小)成正比,与样本容量成反比,而且与抽样调查的组织形式和抽样方法有关。

2、什么是简单随机抽样?具体做法是什么?

简单随机抽样是从总体单位中不加任何分组、排队,完全随机地抽取调查单位。 具体做法:

(1)直接抽选法:总体单位不编号,不编制抽样框

(2)

7938

.0)1()67.1(67.135135103535

2)102(=-Φ-Φ=?

?

?

??<-<-=?

?

? ??-<-<-=<

(2)抽签法:对总体所有单位进行编号,且签需外形一致 (3)随机数表法:总体所有单位编号,使用随机数表抽样 (4)计算机模拟法:将随机数字编程

3、什么是时期指标、时点指标,两者之间有什么区别?

(1)时期指标:指反映某种社会经济现象在一段时间内发展变化结果的总量指标,它所反映的是一段时间连续发生的变化过程。例如,社会生产总值,国内生产总值,利润总额,税收总额等。

(2)时点指标:时点指标是反映社会经济现象总体在某一时刻(瞬间)的数量状况,例如,全国总人口数、商品库存数、乡镇企业个数等。 区别:①时期指标的指标值具有连续性,而时点指标的指标值不具有连续性。 ②时期指标的指标值可以累计相加,而时点指标的指标值不能累计相加。 ③时期指标指标值的大小与所包括的时期长短有直接的关系,而时点指标指标值的大小与时间间隔长短无直接关系。

4、举例说明总体、样本、参数、统计量的概念、区别和联系

区别:总体是具有某种共同性质的多个个体组成的集合;样本是从总体中抽取的一部分个体构成的集合;参数是用来描述总体特征的概括性数字的度量;统计量是用来描述样本特征的概括性数字度量。

联系:样本是从总体中抽取的一部分个体组成的集合;参数是用来描述总体的特征的,统计量是用来描述样本的特征的。

举例:如果研究的对象是100人,这100人就是总体。从中抽取10人做研究,那就是样本。参数是反映总体统计特征的数字,如这100人的平均身高,方差等等。统计量就是反应样本的某些特性的量,如10人的身高。

或者河南省的所有工业企业构成一个总体,从中抽取100个企业就构成一个样本,对这100个企业构成的样本计算的企业平均工资、企业平均产值等就是统计量,而河南省所有工业企业的平均工资、平均产值则是参数。 (这两个例子中任选一个作答即可)

三、计算题(4大题,总共45分)

1、考试范围:第三章:单变量描述统计 知识点:

(1)众数:出现次数最多的变量值

(2)中位数:未分组数据:21+=N 中位数位置

组距分组数据:21∑+=f 中位数位置

(3)未分组数据的中位数:??????

????? ??+=+??

?

??+为偶数时

当为奇数时

当N X X N X M N N N e 122

2121

(4)四分位数:排序后处于25%和75%位置上的值。未分组数据:

下四分位数(Q

L

)位置=

N+1

4

上四分位数(Q

U

)位置=

3(N+1)

4组距分组数

下四分位数(Q

L

)位置=

N

4

上四分位数(Q

L

)位置=

3N

4

(5)P百分位数:p%的数据项的值小于等于P百分位数;(100-p)%的数据项的值大于等P 百分位数

(6)均值:一组数据的均衡点所在

设一组数据为:X1,X2,…,X N。简单均值的计算公式为:

N

X

N

X

X

X

X

N

i

i

N

=

=

+

+

+

=1

2

1

Λ

设分组后的数据为:X1,X2,…,X K,相应的频数为:F1,F2,…,F K

加权均值的计算公式为

=

=

=

+

+

+

+

+

+

=

K

i

i

K

i

i

i

N

N

N

F

F

X

F

F

F

F

X

F

X

F

X

X

1

1

2

1

2

2

1

1

Λ

Λ

&

各变量值与均值的离差之和等于零∑

=

=

-

n

i

i

X

X

1

)

(

各变量值与均值的离差平方和最小∑

=

=

-

n

i

i

X

X

1

2min

)

(

(7)

调和平均数∑

??=

=

i

i

i

i

i

i

i

i

M F

F

X

X

F

X

F

X

H

8

四分位差(定序数据)上四分位数与下四分位数之差:Q D= Q U - Q L

(9)极差:未分组数据:R=m a x(X i)-m i n(X i);

组距分组数据R=最高组上限-最低组下限

(10)平均差:未分组数据N

X

X

M

N

i

i

D

=

-

=1

组距分组数据

=

=

-

=

K

i

i

K

i

i

i

D

f

f

X

X

M

1

1

&

(11)异众比率(定类数据)

-

=

-

=

i

m

i

m

i

r f

f

f

f

f

V1

标准差系数:

%

100

*

=

X

V

σ

σ

(12)

偏态:偏态系数=0为对称分布;偏态系数> 0为右偏分布;偏态系数< 0为左偏分布峰度:()3

1

3

3σαN f X X

K

i i

i

∑=-=

峰度系数=3,扁平程度适中,正态分布;扁平分布,偏态系数<3,变量值的次数在众数周

围分布分散;尖峰分布,偏态系数

>3,变量值的次数在众数周围分布集中

()4

1

4

4σαN f X X

K

i i

i

∑=-=

请仔细复习P98 第5、6题

2、考试范围:第九章:抽样调查,知识点:抽样估计

(1)样本成数的无偏方差(n<=30))1(12p p n n

s p --=

(2)样本成数的有偏方差(n>30)

)

1(2

0p p s p -=

(3)样本成数的性质:x1,x2……xn 的各标志值中有n1个值为1,有n0个值为0,

所以p

n n

x n x n i i ===∑=111

(4)实际抽样推断中采用的公式(*) 重复简单随机抽样:

n x 2

)(σμ=

不重复简单随机

抽样:

)1()1

()(2

2N n

n

N n

N n x -

--=

σσμ

(5)样本成数的抽样平均误差 :重复抽样条件下

n P P p )1()(-=

μ不重复抽样条件下:

)1()1()(N n

n P P p --=

μ

例题:

(6)区间估计:设总体参数为 ,由样本确定的两个统计量,对于给定的,有

αθθθ-=≤≤1)(21P

(7)总体未知参数落在区间内的概率,表示为 (1 - α) %,α 为显著性水平,是总体参数未在

区间内的概率 ,常用的置信水平值有 99%, 95%, 90%,相应的 α 为0.01,0.05,0.10

(8)总体均值的置信区间 (σ2 已知),假定条件:总体服从正态分布,且总体方差(σ2

)已知,如果不是正态分布,可以由正态分布来近似 (n>= 30),使用正态分布统计量Z,

)1,0(~N n x Z σμ

-=

,总体均值 μ 在1-α置信水平下的置信区间为

??? ?

?

+-n Z x n Z x σσαα2, 请查阅PPT ,课后习题P280.5

3、考试范围:第十章:时间序列分析,知识点:序时平均数、时间序列分析指

(1)一、根据绝对数时间数列计算的 <1> 根据时期数列计算的

<2> 根据时点数列计算的①根据连续性时点数列计算的:间隔相等、间隔不等

②根据间断性时点数列计算的:间隔相等、间隔不等 二、根据相对数时间数列计算的 三、根据平均数时间数列计算的

(2)总量指标时期数列——算术平均,连续时点间隔不相等时——加权算术平

间断时点数列的序时平均数;间隔相等时,采用首末折半法计算;间隔不相等时,

采用时间间隔长度加权平均

5、时间序列指标分析法通过时间序列的分析指标来揭示现象的发展变化状况和发展变化

程度。(水平指标,速度指标)

水平指标包括:发展水平,平均发展水平,增长量,平均增长量 速度指标包括:发展速度,平均发展速度,增长速度,平均增长速度 (4)有逐期增长量与累积增长量之分:

逐期增长量,报告期水平与前一期水平之差计算形式为:Δi=Yi-Yi-1 (i =1,2,…,n)

累积增长量,报告期水平与某一固定时期水平之差,计算形式为:Δi=Yi-Y0 (i=1,2,…,n)

55.0)20002001(20081.7)1(2

2=-=-=N n n x σμ

42

200

8400

===

∑f xf x 81

.720012200)(2

==-=∑∑f f x x s

(5)逐期增长量:11201,,,----n n y y y y y y Λ (6)累计增长量:00201,,,y y y y y y n ---Λ

(7)二

()()()0

11201y y y y y y y y n n n -=-++-+--Λ,

()()()n i y y y y y y i i i i ,,2,11010Λ=-=-----

(8)平均增长量:

1-=

=

观察值个数累积增长量

逐期增长量个数逐期增长量之和平均增长量

(9)发展速度:报告期水平与基期水平之比

(10)环比发展速度:报告期水平与前一期水平之比,

)

,,2,1(1n i Y Y R i i i Λ==

-

(11)定基发展速度:报告期水平与某一固定时期水平之比,

)

,,2,1(0

n i Y Y R i i Λ==

(12)环比发展速度与定基发展速度的关系:

1

010--=÷i i

i i Y Y Y Y Y Y

(13)增长速度:

1

-=-==

发展速度基期水平基期水平

报告期水平基期水平增长量增长速度

(14)环比增长速度,报告期水平与前一时期水平之比,

)

,,2,1(11

11n i Y Y Y Y Y G i i

i i i i Λ=-=-=

---

(15)定基增长速度,报告期水平与某一固定时期水平之比,

)

,,2,1(10

00n i Y Y Y Y Y G i

i i Λ=-=-=

(16)平均发展速度,

)

,,2,1(01

112

01n i R Y Y Y

Y Y Y Y Y Y Y R n

n n n i i n

n n ΛΛ====???=∏--

(17)速度的分析与应用,

100100%1前期水平

环比增长速度逐期增长量绝对值=

增长=

?

请看PPT 相关例题,课后练习题P318 第10、11题

4、考试范围:第十一章:统计指数分析,知识点:综合指数

(3)综合指数:反映多个项目变量的综合变动,如多种商品的价格或销售量的综合变动

(4)拉氏综合指数——同度量因素固定在基期;派氏综合指数——同度量因素固定在报告

期;我国:数量指标指数用拉氏形式,质量指标指数用派氏指数形式

(5)拉氏综合指数,质量指数:

∑∑=

0010

1q

p q p p ,数量指数:

∑∑=

01

01q

p q p q

(6)派氏综合指数,质量指数:∑∑=

1

0111q

p q

p p ,数量指数:

∑∑=

11

101q

p q p q

(7)理想指数(费雪公式),

∑∑?∑∑=?=10110001q p q

p q p q p P L F p p p ∑∑?∑∑=?=101

10001p q p q p q p q P L F q q q

以上为计算题知识点的公式,请看PPT 例题,以及相关课后练习题,仅供参考!

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学重点、难点问题总结

1、品质标志和数量标志有什么区别 答:品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。 2、什么是统计指标统计指标和标志有什么区别和联系 答:统计指标是反映社会经济现象总体综合数量特征的科学概念或范畴。统计指标反映现象总体的数量特征;一个完整的统计指标应该由总体范围、时间、地点、指标数量和数值单位等内容构成。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 标志和指标的主要联系表现在:指标值往往由数量标志值汇总而来;在一定条件下,数量标志和指标存在着变换关系。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者的主要区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 3、统计普查有哪些主要特点和应用意义 答:普查是专门组织的、一般用来调查属性一定时点上社会经济现象数量的全面调查。普查的特点:(1)普查是一种不连续调查。因为普查的对象是时点现象,时点现象的数量在短期内往往变动不大,不需做连续登记。 (2)普查是全面调查。它比任何其它调查方法都更能掌握全面、系统的反映国情国力方面的基本统计资料。 (3)普查能解决全面统计报表不能解决的问题。因为普查所包括的单位、分组目录、指标内容比定期统计报表更广泛、更详细,所以能取得更详尽的全面资料。 (4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 4、抽样调查有哪些特点有哪些优越性 答:(1)抽样调查是一种非全面调查,但其目的是要通过对部分单位的调查结果推断总体的数量特征。 (2)抽样调查是按照随机原则从全部总体单位中来抽选调查单位。所谓随机原则就是总体中调查单位的确定完全由随机因素来决定,单位中选与不中选不受主观因素的影响,保证总体中每一个单位都有同等的中选可能性。抽样调查方式的优越性现在经济性、实效性。准确性和灵活性等方面。 抽样调查的作用:能够解决全面调查无法解决或解决困难的问题;可以补充和订正全面调查的结果;可以应用于生产过程中产品质量的检查和控制;可以用于对总体的某种假设进行检验。 5、统计分组可以进行哪些分类 答:根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志化分为若干性质不同而又有联系的几个部分,称为统计分组。 统计分组可以按分组的任务和作用、分组标志的多少以及分组标志的性质等方面来进行分类。 统计分组可以按其任务和作用的不同,分为类型分组、结果分组和分析分组。进行这些分组的目的,分别是化分社会经济类型、研究同类总体的结构和分析被研究现象总体诸标志之间的联系和依存关系。类型分组和结构分组的界限比较难区分,一般认为,现象总体按主要的品质标志分组,多属于类型分组,如社会产品按经济类型、按部门、按轻重工业分组;按数量标志分组多是结构分组。进行结构分组的现象总体相对来说同类较强。如全民所有制企业按产量计划完成程度、劳动生产率水平、职工人数、利税来分组。分析分组是为研究现象总体诸标志依存关系的分组。分析分组的分组标志称为原因标志,与原因标志对应的标志称为结果标志。原因标志多是数量标志,也运用品质标志;结果标志一定是数量标志,而且要求计算为相对数或平均数。 统计分组按分组标志的多少分为简单分组和复和分组。简单分组实际上就是各个组按一个标志形成的。而复制分组则是各个组按两个以上的标志形成的。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

统计学试题库及答案

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变 量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相 同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。

统计学重要考点总结

第一章导论 1.2、 描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计 方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 1.3、统计学据可以分成哪几种类型,各有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同,分为:观测数据、和实验数据。 观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 1.4 分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。 顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,它是由顺序尺度计量形成的。 数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进 行测量的结果,其结果表现为具体的数值。 第二章数据的搜集 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽 样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本

被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 第三章数据的图表搜集 3.4直方图和条形图有何区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积 表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度 与宽度都有意义; 直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。 3.6饼图和环形图的不同? 饼图只能显示一个样本或总体各部分所占比例。环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。 第四章习题答案 4.5简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值; 优点:不受极值的影响。 缺点:具有不唯一性;只有数据量较大时才有效果 中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。 平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。 优点:利用了所有数据信息;数据误差相互抵消,具有无偏性; 缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。 4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。

相关文档
最新文档