统计学原理第五版李洁明著知识点总结

统计学原理第五版李洁明著知识点总结
统计学原理第五版李洁明著知识点总结

统计学知识点

第一章绪论

1、统计包含三种涵义

(1)统计工作:一种调查研究活动。资料搜集、整理和分析。

统计资料:即统计信息,工作成果。包括统计数据和分析报告。

统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。

(2)统计资料:对现象的数量进行搜集、整理和分析的活动过程。

统计资料:通过统计实践活动取得的说明对象某种数量特征的数据

原始资料:直接从各调查单位搜集的用来反映个体特征的数据资料

次级资料:由原始资料加工得到的在一定程度上能反映总体特征的数据资料

(3)统计学:是研究总体一定条件下的数量特征及其规律性的方法论学科

统计学的性质:统计学是通用的方法论科学;统计学使用大量观察和归纳推理的方法,得出对事物总体的综合认识;统计学结合现象的“质”研究现象的“量”

特点:数量性(统计研究过程是从质和量的辩证统一中研究现象的数量特征,从数量上认识事物的性质和规律)、总体性(统计所研究的是由同类事物构成的群体现象的数量特征)、具体性、社会性

2、统计学的分类

理论统计学:研究的内容是统计的一般理论和方法,包括描述统计学、推断统计学

应用统计学:研究的内容是运用于某一特定领域的统计问题,国民经济统计学、社会统计学、人口统计学

3、统计研究方法

(1)方法论——大数定律

(2)统计研究的基本方法

大量观察法:是指对所研究的事物的全部或足够数量进行观察的方法。它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。其数理依据是反映随机现象基本规律的大数定律。诸如,各种基本的、必要的统计报表、普查、重点调查和抽样调查等。

统计描述法:指通过对客观实际的调查了解,并对搜集到的数据进行加工整理、综合分析,从而计算出各种能反映总体数量特征的综合指标,借以反映现象总体的总量规模、结构比例、速度快慢等实际状况。统计描述的内容包括统计分组法、综合指标法和统计模型法。

统计推断法:是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断是现代统计学的基本方法。

(3)统计活动过程

统计设计:统计指标和指标体系的设计、统计分类分组的设计、统计表的设计、统计资料搜集方法的设计、统计工作各个部门和各个阶段的协调与联系、统计力量的组织与安排,

统计调查:就是搜集统计资料的工作阶段。

统计整理:对调查阶段搜集的原始资料,按照一定标志进行科学的分组和汇总,使之条理化、系统化。

统计分析:对经整理后的各项综合指标进行分析计算,揭示被研究现象的比例关系和发展过程,阐明现象的变化趋势和规律性,通过分析研究作出科学的结论。

4:统计总体和总体单位

统计总体:由客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合

具有客观性、大量性、同质性、变异性、相对性等特点。

总体单位:指构成总体的个体即每一个单位。总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。

总体或总体单位的区分不是固定的,在一定条件下可以相互转化。

5、统计总体的种类

有限总体和无限总体,大总体和小总体,可加总体和不可加总体

6、标志:指总体单位所具有的属性和特征,标志的具体表现称为标志值

品质标志:是表明事物“质”的特性的标志。如性别、民族

数量标志:是表明事物“量”的特性的标志。如身高。其中,可变的数量标志又被叫作变量。

统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。

7、总体单位标志:不变标志(标志表现无差别),决定总体的同质性

变异标志(标志表现有差别),决定总体的差异性,包括品质标志和数量标志

8、变量的种类:确定性变量(由确定性因素:明确的、可解释的、人为的或者受人控制的因素影响所形成,使变量按一定方向变动)、随机变量(由随机因素:不确定的、偶然的、非人为控制的、不可解释的因素所形成的变量);离散变量(只能取整数)、连续变量(可取小数)

9、统计指标:反映社会经济现象总体数量特征的概念及其具体数值

构成要素:时间限制、空间限制、计算方法、(指标名称、指标数值)、计量单位

性质:数量性(统计指标是数量范畴,“没有没有数量的指标”)、具体性(总体在具体时间、地点、条件下的数量特征,即统计指标“质的规定性”)、综合性(对总体数量特征的综合说明,是由个体数量综合而来的。

10、标志与指标的联系与区别:

联系:(1)一些数量标志汇总可以得到指标的数值(2)数量标志与指标之间存在变换关系。

区别:(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的;

(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。

11:、统计指标的分类

(1)按表现形式、内容特征分类:总量指标(单一计量单位,绝对数,数量指标,按计量单位分为实物指标、价值指标、劳动指标)相对指标(无计量单位,相对数,质量指标)平均指标(双重计量单位,质量指标)

(2)按时间特征分类:时期指标(一段时期累计总量及据此计算的相对、平均指标)时点指标(瞬间的总量及据此计算的相对、平均指标)

12、统计指标体系:具有某种内在联系的一系列统计指标所构成的整体

如、存在确定的数量关系:产量×价格=产值;存在某种共同性: 产销比率、盈利水平、劳动效率、偿债能力

指标体系的作用:全面、综合地对客观事物进行描述、分析。

第二章统计调查与整理

13、统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程。

14、统计调查的基本要求:准确性、及时性。准确性要求和及时性要求是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求

15、统计调查的设计(即统计调查方案)

(1)确定调查的目的——即为什么调查

(2)确定调查对象和调查单位——即向谁做调查。调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。作为调查单位乃是进行登记的标志表现的直接承担者。

(3)拟订调查提纲和制定调查表——即用什么方法调查。拟订调查项目时要注意几个原则:- 调查项目要少而精;- 调查项目含义要明确;- 尽可能做到各个调查项目之间有一定的联系。

调查表分为:一览表(把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够;)单一表(将一个调查单位的项目登记在一份表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。)

(4)确定调查时间——即在什么时间调查。要区别调查时间和调查期限的不同:- 调查时间是指调查资料所属的时间(时点或时期);- 调查期限是指调查工作的起讫时间。

(5)制定调查的组织实施计划

16、统计调查的方法:直接观察法、报告法、采访法、网上调查法。另外,还有电话调查、座谈会、个别深度访谈等方法。

17、统计调查的组织(即调查的种类)——按调查的范围分,统计调查可以分为:全面调查和非全面调查;按登记事物的连续性分,统计调查可以分为:经常调查和一时调查;按组织形式分,统计调查可以分为:统计报表和专门调查。

18、统计报表分为:基本统计报表,专门统计报表。

按报送周期长短不同统计报表分为:定期报表(日报、旬报、月报、季报、半年报)、年报

专门调查:分为普查、重点调查、抽样调查、典型调查。普查为全面调查,后三者为非全面调查。

普查:专门组织的一次性调查,用来调查属于一定时点的社会现象的总量。例:每5年一次的经济普查

重点调查:对重点单位进行调查。重点单位指的是这些单位数占总体的很少部分,而研究的标志总量占绝大部分(或绝大比重)。

抽样调查:按随机原则从总体中抽取一部分单位进行调查。

典型调查:先对总体进行分析,然后选择有代表性的单位进行调查。例,选取部分企业进行调查,以了解企业股份制改革后的成果及问题。

19、统计分组

概念:把同质总体中的具有不同特点的单位分开,从而正确地认识事物的本质及其规律性。

作用:类型分组——揭露社会经济现象的类型,反映各类型的特点。

结构分组——说明社会经济现象的内部结构。

分析分组——研究经济现象之间的依存关系。

选择分组标志的原则:根据研究问题的目的来选择;要选择最能反映被研究现象本质特征的标志;要结合现象所处的具体历史条件或经济条件来选择。

20、分组标志的种类

(1)按分组标志的特征不同分为:

品质标志分组——反映事物属性差异。

—简单分组,如人口按性别分组;- 复杂分组,亦称分类,如人口按职业分组。

数量标志分组——反映事物数量差异。

- 单项式数量分组——运用于变量变动幅度小、项目少的分组。

- 组距式分组——运用于变量变动幅度大、项目多的分组。

(2)按总体所选择标志的个数分:

简单分组——按一个标志对总体进行分组

复合分组——按两个或两个以上标志对同一总体进行分组

对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。

21、分配数列

概念:统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。

种类:以分组标志特征不同分为——品质数列、变量数列

变量数列:(1)单项变量数列(单项数列)——按每个变量值分别列组编制数列,适用于不连续变量或变量能以整数表示,其变动范围不大时。

组距变量数列(组距数列)——按组距分组编制数列。适用于连续变量或变量可用小数表示,其变动范围较大时。(2)连续变量数列——可有小数,采取组距式。

非连续变量数列——整数,采取单项式或组距式 (例:一个地区的企业按职工人数分组)。

22、组距数列的编制

组限:组距两端的数值。分为上限和下限。

组距:某一组的上限和下限的距离,分等距和异距。组距=上限-下限,等距数列组距=全距R/组数

全距:分组数列中最大值的上限与最小值的下限之差。

组中值:组的上限和下限的中间值。

因数列两端组限形式不同分:开口式组距—最低组与最高组不封口;闭口式组距。

编制步骤:确定组距和组数;确定组限和组中值。

23、关于组限问题

对连续变量,组数也要连续。在登记次数时,习惯上遵守:上组限不在内——适用于越大越好的变量,如产值;下组限不在内——适用于越小越好的变量,如成本。

对不连续变量,组与组间是间断的。

关于组中值问题:

闭口式分组的组中值求法:

开口式分组的组中值求法:24、次数分布的表示方法

2

2

下限

上限

下限

组的下限

组的上限

组中值

-

+

=

+

=

邻组组距

下限

缺上限的开口组的组中

邻组组距

上限

缺下限的开口组的组中

2

1

2

1

+

=

-

=

表示法——即用统计表来表示次数分布。以下累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少;以上累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。

图示法:用统计图来表示次数分布——直方图、折线图(在直方图的基础上连接各条形顶边的中点成折线图)、曲线图(组数趋向于无限多时折线图的极限描绘,是一种理论曲线)

25、次数分布的主要类型

一般次数分布呈正态分布曲线,或称正态曲线:对称型;很多是偏态分布曲线,或称偏态曲线:右偏型(上偏型)、左偏型(下偏型);还有其他形态:U型分配曲线、J型分配曲线、双峰曲线

26、统计表的结构和内容

从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。

从内容上看:统计表由主词(说明总体或总体的分组)和宾词(用哪些指标数值来说明总体或总体的分组)两部分构成。

27、统计表的特点——开口式;上下有基线;编号:

主词一般按A、B、C…,宾词按1、2、3…;有计量单位;表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“……”

28、统计表的分类

简单表:总体未分组

分组表:总体按一个标志进行分组

复合表:总体按二个或二个以上标志进行复合分组

29、统计表的编制原则

. 总标题须简明扼要表达出全表的内容;

. 各标题要确切反映表的内容,且表格安排合理;

. 指标数值要位数对齐,合计或总计一般放在表的尾部;

. 对指标内容作必要说明时,可加注在表的下方;

. 表的上下边线(基线)用粗实线或双线,表的两边是开口式;

. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。

总原则:合理、科学、实用、简练、美观。

第三章综合指标

30、综合指标从它的作用和方法特点的角度可概括为三类:绝对指标、相对指标、平均指标

31、总量指标(绝对指标)

概念:总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。

总量指标表现形式是绝对数,也可表现为绝对差数。

作用:总量指标能反映一个国家的基本国情和国力,反映某部门、单位等人、财、物的基本数据;总量指标是进行决策和科学管理的依据之一;总量指标是计算相对指标和平均指标的基础。

32、总量指标的分类

按其反映的内容不同可分为:总体单位总量——说明总体的单位数数量。

标志总量——说明总体中某个标志值总和的量。

按其反映的时间状况不同可分为:时期指标——反映现象在某一时期发展过程的总数量。(可连续计数,与时间长短有关,

是累计结果)

时点指标——反映现象在某一时刻的状况。 (间断计数,与时间间隔无关,不能累计)

33、总量指标的计算

计算原则:现象的同类性;明确的统计含义;计量单位必须一致。

根据总量指标所反映的社会经济现象性质不同,计量单位分三种形式:

(1) 实物单位:a.自然单位:辆、双、头、根、个……

b. 度量衡单位:吨、米、克、立方米……

c. 双重单位:公里/小时、人/平方公里……

d. 复合单位:吨公里、公斤米、千瓦小时……

对有些性质相同但规格或含量不同的产品总量的计算,要按折合标准实物量的方法计算。

(2) 价值单位(货币单位):货币单位有现行价格和不变价格之分。价值单位使不能直接相加的产品产量过渡到能够加总,用于综合说明具有不同使用价值的产品生产总量或商品销售量等的总规模、总水平。

(3) 劳动单位 :工时 —— 工人数和劳动时数的乘积;台时 —— 设备台数和开动时数的乘积。 由于具体条件不同,不同企业的劳动量指标不具有可比性,因此,劳动量指标只限于企业内部使用。 34、相对指标

概念:是两个有联系的绝对指标之比。

相对指标的数值有两种表现形式:有名数(人口密度:人/平方公里;平均每人分摊的粮食产量:千克/人 )无名数(系数

或倍数、成数、百分数、千分数)

35、相对指标的种类及其计算 (一) 计划完成相对指标

(1)、计算公式:

根据绝对数、平均数、相对数来计算计划完成相对数

(2)长期计划的检查 水平法: 累计法:

(二) 结构相对指标 计算公式为:

(三) 比例相对指标 计算公式为:

常用的比例形式有两种:将作为比较基础的数值抽象化为1、10、100或1000,看被比较的数值是多少;首先将总体全部数值抽象化为100,求得各部分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。 (四) 比较相对指标(类比相对指标)

计算公式为:

计算比较相对数时,作为比较基数的分母可取不同的对象,一般有两种情况: ① 比较标准是一般对象,这时,分子与分母的位置可以互换。 如:

② 比较标准(基数)典型化,如:把企业的各项技术经济指标都和国家规定的质量水平比较,和同类企业的先进水平比较,

和国外先进水平比较等,这时,分子与分母的位置不能互换。 (五) 强度相对指标

计算公式为: 强度相对数的数值表示有两种方法:① 一般用复名数表示;② 也有少数用百分数或千分数表示。 有些强度相对数有正、逆两种计算方法。 (六) 动态相对指标 计算公式为:

基期 —— 作为对比标准的时间;报告期—— 同基期比较的时期,也称计算期

36、正确运用相对指标的原则:注意二个对比指标的可比性;相对指标要和总量指标结合起来运用;多种相对数结合运用;在比较二个相对数时,是否适宜相除再求一个相对数,应视情况而定。若除出来有实际意义,则除;若不宜相除,只宜相减

100%实际完成数计划完成相对数计划数

=?100%

五年计划末年实际达到的水平五年计划完成程度五年计划中规定的末年水平

=

?100%

五年计划期间实际累计完成数五年计划完成程度五年计划规定的累计数

=?100%

总体某部分数值结构相对数总体全部数值

=

?=

总体中某部分数值比例相对数总体中另一部分数值

100%某条件下的某类指标数值

比较相对数另一条件下的同类指标数值

=?%

100)()(?=

同类现象的水平

单位乙地区某一现象的水平

单位甲地区比较相对数=

某一总量指标数值

强度相对数另一性质不同但有一定联系的总量指标数值

100%

报告期水平动态相对数基期水平

=

?

求差数,用百分点表示之。(百分点 —即百分比中相当于百分之一的单位) 37、平均指标的意义和作用

概念:平均指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。 特点:数量抽象性 集中趋势代表性

作用:比较作用(a. 同类现象在不同空间的对比。b. 同一总体在不同时间上的比较); - 利用平均指标可以分析现象之间的依存关系

- 利用平均指标可以进行数量上的推算,还可以作为论断事物的一种数量标准或参考 种类:数值平均数(算术平均数—;调和平均数—

h

X

;几何平均数—

G

X

位置平均数(众数—o M ,中位数—e M )

38、算术平均数

算术平均数的基本公式:

简单算术平均数:

式中: —— 算术平均数

X —— 各单位的标志值

n —— 总体单位数 —— 总和符号

加权算术平均数: 式中: —— 算术平均数 X —— 各组数值

f —— 各组数值出现的次数(即权数)

在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:

加权算术平均数与简单算术平均数不同在于:加权算术平均数受变量值大小、次数多少的影响;而简单算术平均数只反映变量值大小这一因素的影响。 39、算术平均数的数学性质

① 各个变量值与算术平均数离差之和等于零 简单平均数:

∑=-0)(X X 加权平均数:0=-∑f X X )(

③ 各个变量值与算术平均数离差平方之和 等于最小值

40、算术平均数的特点

算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使 的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使 的代表性也不很可靠。 41又称“倒数平均数”)

调和平均数是各个变量值倒数的算术平均数的倒数。

计算方法:

在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:

=

总体标志总量算术平均数总体单位总数

X X n

∑=∑

X f X f

?∑=

∑f Xf X X f

f

∑=

=?

∑∑∑2

2

()()-=∑-=∑X X f X X 简单平均数:最小值

加权平均数:

最小值X 1(1).先计算各个变量值的倒数,即X 1

(2).计算上述各个变量值倒数的算术平均数,即

X

n ∑(3).,1再计算这种算术平均数的的倒数,就是调和平均数即

n

X

∑1h n

X X

=

∑1在加权的情况下:h f

X f

X =

∑∑1式中:,h

Xf Xf m X X m

f Xf X X

m

m Xf f X

=

=====

∑∑∑∑∑∑

m 是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。 42、调和平均数的特点

如果数列中有一标志值等于零,则无法计算 ;较之算术平均数, 受极端值的影响要小。 43、几何平均数(又称“对数平均数”) 简单几何平均数:

计算时要进行对数变换,即:n

X

X G ∑=

lg lg

G G X arc X =

加权几何平均数:

44

、几何平均数的特点

如果数列中有一个标志值等于零或负值,就无法计算 ;受极端值的影响较 和 小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。 45、众数 M 0

概念:众数是在总体中出现次数最多的那个标志值

众数存在的条件:① 只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。若有两个次数相等的众数,则称复众数。② 在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。

46、众数的计算方法:① 根据单项数列确定众数;② 根据组距数列确定众数(由最多次数来确定众数所在组;利用比例插值法推算众数的近似值)

计算众数的近似值:下限公式: 上限公式:

47、众数的特点

众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。

众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则 无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。 48、中位数 M e

概念:将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。 中位数的计算方法:

① 由未分组资料确定中位数:

⑴ n 为奇数时,则居于中间位置的那个标志值就是中位数。 ⑵ n 为偶数时,则中间位置的两个标志值的算术平均数为中位数 ② 由单项数列确定中位数 ③ 由组距数列确定中位数: 下限公式(较小制累计时用):

上限公式(较大制累计时用):

h X h X n n n G X

X X X X ∏=?= 21式中:为各变量值的次数或权数

将公式两边取对数,则为:

12112212lg lg lg lg lg (lg )

L L L G

G G G f f n n

n

X f f X f X f X f X X f f f f

X arc X +++=

+++==

+++=∑∑G

X X h X d

X M L ??+??+

=

d

X M U ??+??-

=

1()

2

中位数的位置为总体单位数n n +=

d

f S f

X M m

m L e ?-+

=-∑

d

f S f

X M m

m U e ?--

=+∑

49、中位数的特点

① 中位数不受极端值及开口组的影响,具有稳健性。 ② 各单位标志值与中位数离差的绝对值之和是个最小值。

④ 对某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。 50、各种平均数之间的相互关系

(一)

h G X X X ≤≤

(二)当总体分布呈对称状态时,三者合而为一, 0即e X M M ==

当总体分布呈非对称状态时,

所以:

0>-)(o M X 则说明分布右偏(或上偏)

0<-)(o M X 则说明分布左偏(或下偏) 0=-)(o M 则说明分布对称

根据卡尔·皮尔逊经验公式,还可以推算出:

51、平均指标的运用原则:平均指标只能适用于同质总体;用组平均数补充说明总平均数;用分配数列补充说明平均数。

52、标志变动度

概念: 标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。

作用:① 标志变动度是评价平均数代表性的依据。② 标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。

种类:即测定标志变动度的方法,主要有:全距、四分位差、平均差、标准差、离散系数等。 全 距R ;四分位差Q.D. ;平 均 差A.D. ;标 准 差S.D.(σ) ;离散系数V σ 53、全距

全距是总体各单位标志值最大值和最小值之差, max min R X -X 即:=

全距的特点:① 优点: 计算方便,易于理解。② 缺点: 全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略

方法,不能全面反映总体各单位标志的变异程度。 54、四分位差

概念: 将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q 1、Q 2、Q 3),这三个分割点称为四分位数,(其中第二个四分位数Q 2就是数列的中位数M e )。四分位差 Q.D.=Q 3-Q 1 计算:① 根据未分组资料求Q.D.

② 根据分组资料求Q.D.

2) 若单项数列,则Q 1与Q 3所在组的标志值就是Q 1与Q 3的数值; 若组距数列,确定了Q 1与Q 3所在组后,还要用以下公式求近似值:

四分位差的特点:① 四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;② 用四分位差可以衡量

min min

即:

e

e

X M

X M

f -=-=∑∑0

(1). 如果分布右偏,则e X M M >>0

(2). 如果分布左偏,则e X M M <

o e M M X -=133(1)1

4

4

()的位置,的位置为变量值的项数n n Q Q n ++=

=

13f 3f

1) Q , Q 44

的位置的位置∑==∑1311111333

1

3

34

4

Q Q f

f

S S Q L d Q L d f f ----=+

?=+

?∑∑

中位数的代表性高低;③ 四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。 55、平均差

概念:平均差是数列中各单位标志值与平均数之间绝对离差的平均数。

平均差的特点:① 平均差是根据全部标志值与平均数离差而计算出的变异指标,能全面反映标志值的差异程度;② 平均差计算有绝对值符号,不适合代数方法的56演算使其应用受到限制。 56、标准差

概念:标准差是离差平方平均数的平方根,故又称“均方差”。其意义与平均差基本相同。

在组距数列中,结合算术平均数的简捷公式,可得标准差的简捷法公式如上:

57、交替标志的标准差

在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。 统计中,用“是”、“否”或“有”、“无”来表示的标志,称为交替标志,也称是非标志。 N: N 1,N

N 1是具有某种标志的单位数N 1=P ;N 2是不具有这种标志的单位数N 2=1-P ;具有某种标志——变量为1;不具有这种标志——变量为

58、标准差与全距、平均差的关系

① σ与R 的关系:经验表明,当分布数列接近于正态分布时,R 和σ之间存在以下经验公式——R 为4至6个σ:;当标志值项数较少时,R ≈4;当标志值项数较多时,R ≈6σ

② σ与A.D.的关系:对同一资料,所求的平均差一般比标准差要小,即A.D.≤ σ 59、离散系数 V σ

离散系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。

第四章 动态数列 60、动态数列

X-X

(1) A.D.n

X-X (2) A.D.其计算公式为:未分组资料:分组资料:f

f

==∑∑

∑=

=

σ

σ式中:为数列中间组的组中值,为该组组距

d A d σ=100%

=?V X

σ

标准差系数计算公式为:

概念:动态数列又称时间数列。它是将某种统计指标,或在不同时间上的不同数值,按时间先后顺序排列起来,以便于研究其发展变化的水平和速度,并以此来预测未来的一种统计方法。

动态数列由两个基本要素构成:① 时间,即现象所属的时间;② 不同时间上的统计指标数值,即不同时间上该现象的发展水平。

动态数列按照所列入指标数值的不同可分为: 绝对数动态数列(时期数列、时点数列)、相对数动态数列、平均数动态数列 61:时期数列:在绝对动态数列中,如果各项指标都是反映某种现象在一段时期内发展过程的总量,这种绝对动态数列就称为时期数列。

时期数列特点:数列中各个指标值是可加的;数列中每个指标值的大小随着时期的长短而变动;数列中每个指标值通常是通过连续不断的登记而取得。

62、时点数列:在绝对动态数列中,如果各项指标都是反映现象在某一时间点(瞬间)上所处的数量水平,这种绝对动态数列就称为时点数列。

时点数列特点:数列中各个指标值是不能相加的;数列中每个指标值的大小与时间间隔的长短没有直接关系;数列中每个指标值通常是按期登记一次取得的。 63、动态数列的编制原则 基本原则:是遵守其可比性。

具体说有以下几点:注意时间的长短应统一;总体范围应该一致;指标的经济内容应该相同;指标的计算方法和计量单位应该一致。

64、动态数列的水平分析指标

属于现象发展的水平分析指标有:发展水平、平均发展水平、增长量、平均增长量。

发展水平:在动态数列中,每个绝对数指标数值叫做发展水平或动态数列水平。如果用a 0,a 1,a 2,a 3,……a n ,代表数列中各个发展水平,则其中a 0即最初水平,a n 即最末水平。

平均发展水平:平均发展水平是对不同时期的发展水平求平均数,统计上又叫序时平均数。 65、序时平均数与一般平均数的异同点:

相同点:二者都是将现象的个别数量差异抽象化,概括地反映现象的一般水平。 不同点:计算方法不同;差异抽象化不同;序时平均数还可解决某些可比性问题。 66、序时平均数的计算方法 ㈠ 绝对数动态数列的序时平均数 时期数列的序时平均数

时点数列的序时平均数

(1) 如果资料是连续时点资料,可分为二种情况:

对连续变动的连续时点数列(即未分组资料):a

a n

=

∑ 对非连续变动的连续时点数列(即分组资料):

af a f

=

∑∑

⑵ 如果资料是间断时点资料,也可分为二种情况:

对间隔相等的间断时点资料: 对间隔不等的间断时点资料:

㈡ 相对数动态数列的序时平均数 由两个时期数列对比组成的相对数动态数列的序时平均数:

123123n

,,, n

n a

a a a a a n n

a

a a a a ++++=

=

∑L L 式中:序时平均数

各时期发展水平

时期项数

"

" 1

22

1

222

13213

2211

首末折半法这种计算方法称为般公式:上面计算过程概括为一-+++++=-++++++=--n a a a a a

n a a a a a a a n

n n

n 23112121

1

1

2

2

2

n n n n i

i a a a a a a f f f a f

---=++++

++

=

∑L ∑∑∑∑=

==b

a n

b

n a

b

a c

一般公式为:

由两个时点数列对比组成的相对数动态数列的序时平均数:

若为间隔不等的二个间断时点数列对比组成的相对数动态数列的序时平均数为:

若由二个连续时点数列对比组成的相对数动态数列的序时平均数:

a a

c b b ==∑∑连续变动时点:用简单平均,即af a c bf b ==

∑∑非连续变动时点:用加权平均,即

由一个时期数列和一个时点数列对比组成的相对数动态数列的序时平均数:

㈢ 平均数动态数列的序时平均数 由一般平均数组成的平均数动态数列的序时平均: b

a

c ∑∑=

由序时平均数组成的平均数动态数列的序时平均数:

可见,当时期相等时,可直接用简单算术平均法计算。 若时期或间隔不等时,应使用加权算术平均法计算。

67、增长量

概念:说明某种现象在一定时期内所增长的绝对数量。 增长量=报告期水平—基期水平

基期有两种:前一时期、某一固定时期。 增长量:累计增长量——

0a a i -逐期增长量——1--i i a a

1

1a a a a n n

i i i -=-∑=-)(

68、平均增长量

概念:说明社会现象在一段时期内平均每期增加的绝对数量。

69、动态数列的速度指标有:发展速度、增长速度、平均发展速度、平均增长速度 发展速度:反映社会经济现象发展程度的动态相对指标。

L L L L

n

n

n n b b b b a

a a a n

b b b b n a a a a b a

c ++++++++=-++++-++++==23112

12

123112121

222n n n n n n a a a a a a f f f a c b b b b b b b f f f

----++++++==

++++++L L 1

2

2

b a

c 321-+

+++∑=

=

n b b b b n

a n 一般公式为:)

(25.2012

243

33333

92312317314 万元全年平均每月产值以时间为权数:

==+++?+?+?+?=

1

=

=

-逐期增长量之和累计增长量

平均增长量逐期增长量个数动态数列项数报告期水平发展速度基期水平定基发展速度:可分为:环比发展速度:01100%i i i a a a -?

???

???

=?11

0i i

n i n a a a a =-?=∏推理:1i 001

i i

i a a a a a a --÷=

增长速度:反映社会经济现象增长程度的动态相对指标。

70、平均发展速度和平均增长速度

平均发展速度是各个环比发展速度的动态平均数(序时平均数),说明某种现象在一个较长时期中逐年平均发展变化的程度; 平均增长速度是各个环比增长速度的动态平均数,说明某种现象在一个较长时期中逐年平均增长变化的程度。 ㈠ 平均发展速度

几何平均法,又称水平法:

方程法,又称累计法:

在实践中,如果长期计划按累计法制定,则要求用方程法计算平均发展速度。

解这样的高次方程,用查表法。

㈡ 平均增长速度

平均增长速度=平均发展速度-1 (100%)

平均发展速度大于“1”,平均增长速度就为正值,则称“平均递增速度”或“平均递增率”。 平均发展速度小于“1”,平均增长速度就为负值,则称“平均递减速度”或“平均递减率”。 71、长期趋势的测定与预测

长期趋势就是指某一现象在一个相当长的时期内持续发展变化的趋势。(向上或向下变化)

测定长期趋势的目的主要有三个:把握现象的趋势变化;从数量方面研究现象发展的规律性,探求合适趋势线;为测定季节变动的需要。

长期趋势的类型基本有二种:直线趋势;非直线趋势,即趋势曲线。

测定长期趋势常用的主要方法有:间隔扩大法(通过扩大时间间隔,编制成新的动态数列);移动平均法(趋势值项数=原数列项数-移动平均项数+1);最小平方法。 73、移动平均法

注1:若采用奇数项移动平均(如上例“三项”),则平均值是对准在奇项的居中时间处。一次可得趋势值;若采用偶数项移动平均,则平均值也居中,因未对准原来的时间,还要再计算一次平均数,故一般都用奇数项移动平均。 注2:修匀后的数列,较原数列项数少。(在进行统计分析时,若需要两端数据,则此法不宜使用) 注3:取几项进行移动平均为好,一般若现象有周期变动,则以周期为长度。例,季度资料

可四项移动平均;各年月资料,可十二项移动平均;五年一周期,可五项移动平均。移动平均法可消除周期变动。 74、最小平方法

即对原有动态数列配合一条适当的趋势线来进行修匀。这条趋势线可以是直线,也可以是曲线;这条趋势线必须满足最基本的要求。即:

增长速度发展速度 - 定基增长速度无关系

环比增长速度

增长量前一时期水平

增长的绝对值增长百分比基期水平或 1 (100%)

1%100

100=??

?==

n

X

X ∏=

n

n

a a 0

=

n

R

=

n n

X X X X 321??=n

n n a a a a a a a a 1

23

1201-??= ∑==++++n

i i

n a a a a a 1

321 ∑==++++∴n

i i

n

a X a X a X a X a 1

030200 n

a X X X

X n

i i

n n ∑=-=

++++∴1

2

1

2c

()min y y c y y -→∑实际值,即原数列值趋势值或理论值

㈠ 直线方程

当现象的发展,其逐期增长量大体上相等时。该方程的一般形式为: 方程组可简化为:

(二)抛物线方程 当现象的发展, 其二级增长量大体 上相同时。

㈢ 指数曲线方程

当现象的发展,环比增长速度大体上相等时。

该方程的一般形式为:t

c ab y =

75、季节变动分析的意义

测定季节变动的资料时间至少要有三 个周期以上,如季节资料,至少要有 12季,月度资料至少要有36个月等, 以避免资料太少而产生偶然性。 测定季节变动的方法有二种:

按月平均法,不考虑长期趋势的影响(假定不存在长期趋势),直接利用原始动态数列来计算; 移动平均趋势剔除法,即考虑长期趋势的存在,剔除其影响后再进行计算,故常用此法。 76、按月平均法测定季节变动

也称按季平均法。若为月度资料就按月平均;若为季度资料则按季平均。

其步骤如下:列表,将各年同月(季)的数值列在同一栏内;将各年同月(季)数值加总,并求出月(季)平均数;将所有同月(季)数值加总,求出总的月(季)平均数;求季节比率(或季节指数)。

77、时间序列预测法是将历史资料和数据,按照时间顺序排列成一系列,根据时间序列所反映的经济现象的发展过程、方向

和趋势,将时间序列外推或延伸,以预测经济现象未来可能达到的水平。

78、时间序列又称动态序列,它是将某个经济变量的观测值,按时间先后顺序排列所形成的数列。时间可以是周、月、季度或年等。如商场计算销售额是按月排列数据,国家计算国民生产总值是按年度来排列数据的 时间序列预测法是世界各国普遍采用的经济预测的基本方法。

79、在时间序列中,数据的大小受到各种因素的影响,数据的变化趋势也就表现出各种性状,通常根据这些影响因素将数据的变化趋势分为四大类:长期趋势、季节变动、循环变动和不规则变动。对于前三种数据趋势预测问题,由于数据均呈现出某种规律性,因此我们能够将数据进行简化、分析,从而使预测成为可能;而不规则变动是指由某种偶然因素引起的突然变动,如战争的发生、政权的更迭、重大自然灾害的发生等,不规则变动没有周期性。 第五章 指数 80、统计指数

概念:广义指数是指同类事物变动程度的相对数,包括动态相对数、比较相对数、计划完成相对数,即所有的动态比较指标。

c y a bt

=+Na y =∑∑∑=

t

b ty 0)(

222=??

?

?

???

=?-=-==--=∑∑∑∑∑∑∑∑∑∑∑t n y n t b n y t b y a t ty t t n y t ty n b )(导出:

由联立方程也可直接推2c 223322

4y a bt ct (a b c ) y Na b t c t ty a t b t c t t y a t b t c t =++?=++??=++??=++??∑∑∑∑∑∑∑∑

∑∑∑该方程的一般形式为:

、、均为未定参数同样用求偏导数的方法,导出以下联立方程组:2lg lg lg lg , lg , lg

(,0)

c c y a t b

Y y A a B b Y A Bt

Y NA B t tY A t B t t t =+====+?=+??=+??=∑∑∑∑∑∑先对上述方程两边各取对数:设则:应用最小平方法求得的联立方程组为:同样设使

狭义指数是综合反映多种不同事物在不同时间上的总变动的特殊的相对数。即专门用来综合说明那些不能直接相加和对比的复杂社会经济现象的变动情况。

作用:综合反映多种不同事物的总的变动程度;测定复杂经济现象的总变动中,各个因素变化的影响;测定平均指标中各因素变动对平均指标变动的影响程度。 81、受多种因素影响的现象叫做复杂现象。

(1) 现象的总量是各因素的总和; (2) 现象的总量是若干因素的乘积。

82、在分组条件下,加权算术平均数的大小受到两因素的影响:一是现象水平的影响,二是现象内部结构的影响。我们可运用指数来分析这两个因素的变动对平均指标总变动的影响情况。 83、统计指数的种类

(1)个体指数和总指数——按其所反映现象的范围不同。 个体指数是反映个别社会经济现象变动的相对数。

两者联系:总指数是个体指数的平均数,是总体中各个个体指数的代表值。

在个体指数和总指数之间,还存在一种类指数(或称组指数),其实质与总指数相同,只是范围小些。 (2)环比指数和定基指数——按其所采用的基期不同 指数往往随着时间的推移而连续编制,从而形成指数数列。

(3)数量指标指数和质量指标指数——按其所反映的现象性质的不同

反映某一现象规模大小、数量多少,称数量指标,而表明这些指标变动程度的相对数是数量指数(简称),如,产品产量指数、商品销售量指数、职工人数指数等。

说明工作质量的好坏或事物质的属性,称质量指标,而表明这些指标变动程度的相对数,称质量指数(简称),如,产品成本指数、商品价格指数、劳动生产率指数等。 84、综合指数

“同度量因素”的概念:同度量因素有二个作用——① 同度量作用 ② 权数作用。

85、拉氏指数和派氏指数

(1)拉氏指数公式:拉斯贝尔提出,在综合指数公式中,同度量因素宜固定于基期。

(2)派氏指数:派许提出,在综合指数公式中,同度量因素宜固定在报告期。

86、如何编制综合指数?

数量指标综合指数的编制——其同度量因素往往取基期的质量指标 质量指标综合指数的编制——其同度量因素往往取

报告期的数量指标 87、平均数指数——综合指数的变形 (1)加权调和平均数指数——通常用于编制质量

指标综合指数。 (右边把综合价格指数公式变形为加权调和平均数指数的原则适用于

一切综合指数)

例:

100%

K =?报告期水平基期水平

总指数是说明社会经济现象总体变动的相对数。3120121 n n P P P P P P P P -L 在指数数列中,若各个指数都以报告期的前一期作为基期,例:,,,,称为环比指数。3120000 n P P P P P P P P L 在指数数列中,若各个指数都以某一个固定时期作为基期,例:,,,,称为定基指数。

K 利用同度量因素计算的总指数称为综合指数。综合指数是编制总指数的基本形式,用表示。

100

q

q p K q p

∑=

∑称为拉氏数量指数公式1

00

p p q

K p q ∑

=∑

称为拉氏质量指数公式110

1

q

q p K q p

∑=

∑称为派氏数量指数公式11

1

p

p q K p q

∑=

∑称为派氏质量指数公式

11

01

101

011

11

1, p 1

p p p p q

K p q p

K p p K p q

p q K ∑=∑=∴=∑∴=∑??Q 权数为原综合指数基本公式的分子

我国现行农产品收购价格指数和集市贸易价格

指数就采用此公式10

00

101

010

10

1 , q 1q q q q p

K q

K q q p

K q p K ∑=∑=∴=∑∴=∑Q

(2)加权算术平均数指数——通常用于编制数量指标综合指数

(右边把综合产量指数公式变形为加权算术平均数指数的原则适用于一切综合指数) 例:

88、社会经济现象是错综复杂的,它往往受制于多个相互联系的因素影响,这种联系往往表现为一种连乘的关系。分析各构成因素变动对总体变动的影响方向和影响程度,这种方法,也称连乘因素分析法。 89、统计上把互相联系的指数所构成的体系,叫做指数体系——因素分析法的基础。 例:商品销售额指数=商品价格指数 × 商品销售量指数

生产费用支出额指数=单位成本指数 × 产品产量指数 利用指数体系,可进行指数因素之间的互相换算。 90、两因素现象的变动分析

91、多因素现象的变动分析

多因素则包含二个以上的因素。实际中,采用“连锁替代法”。

例:总产值=工人人数 × 工人劳动生产率

A D C B

=工人人数 × 时劳动生产率 × 平均工作日长度× 平均工作月长度

10001100111011111111

00000000100011001110

A B C D A B C D A B C D A B C D A B C D A B C D A B C D A B C D A B C D A B C D =???

92、平均指标指数的因素分析

93、两种指数体系:

1000

1q 10

0000

K

q q q p K q p q

q Kq q Kq p

K q p ∑=∑=∴=∑∴=∑Q 以综合产量指数为例:

11

01

110

01

01

, p p p p p q

K p q p

K Kp p Kp q

K p q ∑=∑=∴=∑∴=∑Q 111110000100110011011000()()p q p q q p p q p q q p p q p q p q p q q p q p ∑∑∑=?∑∑∑-=-+-∑∑∑∑∑∑若建立指数体系为:

()

1

1

1

1

1

1100

1

129.02110.19117.1199.98p q p q q p p q p q p q p q q p p q

p q

∑∑∑∑∑=??∑∑??若引入“共变影响指数”,则:仍以上例数据为例,经计算后得相对数变动的关系式为:

%=%%%

01

111111110000100

010X X f X f X f f f f

X K X f X f X f X f f ∑∑∑∑∑∑===?∑∑∑∑∑∑""X f f

∑从公式可看出,总平均数动态指标同时受各组平均水平和各组构成变动的影响。这个平均数动态指标,称可变构成指数。

1

11111011

011

1

01

01100000

f X f X f f X f f X f

f X f X f f X f f X f f ????∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑?即

称“固定构成指数”

即称“结构影响指数”

故:可变构成指数=固定构成指数结构影响指数1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

()()

X f X f

f

f X X f X f

X f f

X f X f X f X f

X X f f f f

∑∑∑∑=?∑∑∑∑∑∑∑∑-=-+-∑∑∑∑若建立指数体系:

() ( () 总量指标指数的因素分析

旨在解决社会现象总变动中

即综合指数体系受数量指标变动和质量指标变动的影响大小;平均指标指数的因素分析则是指质量指标平均指标)即平均指标指数体系在分组的条件下受各?

??

?

?????

??

?组水平

以工资总额变动为例:

94、常用的统计指数

(1)商品零售价格指数的编制方法如下: 1.选择恰当的调查地区和调查点 2.选择代表商品和代表规格品 3.搜集价格资料 4.确定权数5、计算平均价格6、编制价格指数

(2)居民消费价格指数简称CPI (consumer price index ),用于反映居民家庭购买的消费品及服务价格水平的变动情况。 我国CPI 的调查内容包括食品、烟酒及用品、衣着等八大类。

(3)股票价格指数一般采用与基期比较法,即将选样股票计算期的价格总和与基期的价格总和进行比较,反映各个时期价格水平的变动情况,简称股价指数。

选择权数的方法:一般方法是以采样股股票发行量为权数,以求得市价总值,报告期市价总值与基期市价总值之比即求得指数。 另一种方法是以采样股股票成交量为权数。

(4)道·琼斯股票价格指数又称道·琼斯股票价格平均指数,是世界上最有影响、使用最广的股价指数。香港恒生指数是香港股票市场上历史最悠久、影响最大的股票价格指数。上证综合指数是由上海证券交易所编制的综合指数类股票指数,简称上证综指,它是以1990年12月19日为基准日, 基准日指数定为100点,1991年7月15日正式开始发布。深证成指深证成份股指数是反映深圳证券交易所成份股价指数,简称深证成指,它是深圳证券交易所的主要股指之一。

第六章 抽样调查

95、抽样调查的意义:一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。

抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,具有准确度高、成本低、速度快、应用面广等优点。 96、抽样调查的适用范围

实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;虽可进行全面调查观察,但比较困难或并不必要;对普查或全面调查统计资料的质量进行检查和修正;抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。 97、全及总体和抽样总体(总体和样本)

全及总体:所要调查观察的全部事物。总体单位数用N 表示。

抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n 表示。n ≥ 30 大样本 n < 30 小样本 98、全及指标:全及总体的那些指标。 抽样指标:抽样总体的那些指标。

99、样本数——指从总体中可能抽取的样本的数量。 样本容量——指一个样本所包括的单位数。 100、抽样调查的组织形式

(1)简单随机抽样(纯随机抽样):即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。 随机抽选可有各种不同的具体做法,如:直接抽选法;抽签法;随机数码表法;

(2)类型抽样(分类抽样):先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例; 三是分类型的数目不宜太多。

类型抽样的好处是:样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。 两种类型:等比例类型抽样(类型比例抽样);不等比例类型抽样(类型适宜抽样)。

(3)机械抽样(等距抽样):先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。

排列次序用的标志有两种:选择标志与抽样调查所研究内容无关, 称无关标志排队(研究工人的平均收入水平时,按工号

1

10

1

1

1

1

1

1

1. ()

2. ()X f

X f f X f f f X f X X X f

∑∑∑∑∑∑∑∑首先,工资总额变动

分解为:

数量指标工人数变动影响或

质量指标平均工资变动影响或

010001

010*******

1101() 1. 2. X f X f X f f f X f X f X f X f f f X f ∑∑∑÷=

∑∑∑∑∑∑÷=∑∑∑其次,将质量指标平均工资进一步分解为:结构影响指数:固定构成指数:

排队);选择标志与抽样调查所研究的内容有关, 称有关标志排队(研究工人的生活水平,按工人月工资额高低排队)。 机械抽样按样本单位抽选的方法不同,可分为三种:

A 、随机起点等距抽样:

B 、半距起点等距抽样

C 、对称等距抽样

机械抽样的好处:可以使抽样过程大大简化,减轻抽样的工作量;如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。

机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。 (4)整群抽样

即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。

整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。 (5)多阶段抽样

即把抽样本单位的过程分为两个或几个阶段来进行。

(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲: ①先抽大单位(可以用类型抽样或机械抽样), ②再在大单位中抽小单位(可用整群抽样或简单随机抽样),③小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。 (6)重复抽样和不重复抽样

以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样): 重复抽样:又称有放回抽样。不重复抽样:又称不放回抽样。 101、抽样误差

在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。

抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。

抽样误差的影响因素:1.全及总体标志变异程度。——正比关系 2. 抽样单位数目的多少。——反比关系 3. 不同的抽样方式。4. 不同的抽样组织形式。

抽样误差的作用:1. 在于说明样本指标的代表性大小。误差大,则样本指标代表性低;

误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。2. 说明样本指标和总体指标相差的一般范围。 102、抽样平均误差

抽样平均误差实际上是样本指标的标准差。通常用μ表示。在N 中抽出n 样本,从排列组合中可以有各种各样的样本组: 如果是重复抽样:

⑴ 考虑顺序的不重复抽样:

⑵ 不考虑顺序的不重复抽样:

??

??

??

?????????登记误差系统性误差统计误差代表性误差实际误差随机误差抽样平均误差

x X p P --抽样误差就是指样本指标和总体指标之间数

量上的差别,即、

。虑顺序的重复抽样:样本种数种

考5

(1)()

50312,500,000n n

N

B N ==1

(2)n n

N

N n D C

+-=考虑顺序的重复抽样:不)!

(!)())((n N N n N N N N A n N -=

+---=121

n N n N C n N -=

抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。 103、纯随机抽样的抽样平均误差 (一) 平均数的抽样平均误差 重复抽样:

取得σ的途径有:1.用过去全面调查或抽样调查的资料,若同时有n 个σ的资料,应选用数值较大的那个;2. 用样本标准差S 代替全及标准差σ;3. 在大规模调查前,先搞个小规模的试验性的调查来确定S ,代替σ;4. 用估计的方法

不重复抽样:

(二) 成数的抽样平均误差 已证明得:成数的方差为p(1-p)

104、类型抽样的抽样平均误差 在重复抽样情况下:

105、机械抽样(等距抽样)的抽样平均误差 若按无关标志排队

公式用以上纯随机抽样的公式,一般采用 不重复抽样公式: 若按有关标志排队

公式用类型抽样的公式:

106、整群抽样的抽样平均误差

整群抽样的抽样平均误差受三个因素影响:

(1)抽出的群数(r)多少 (反比关系) (2)群间方差(2

δ) (正比关系)

计算方法如下:

)

()

(1025

2500

)

()(2

为样本配合总数元抽样平均误差n n

X x ±==

∑-=

μσ μ

=

∴或x

μ=

x

μ=

x N n μ=

但实际中,往往很大,很小,故改用下列公式:

p

p

∴μ=

μ=

在重复抽样情况下:在不重复抽样情况下:n

i x

σμ=

N

N i

i i ∑=

σσx μ=在不重复抽样情况下:重复抽样在成数情况下::

p μ=不重复抽样:p μ=

p μ=μ=

为简便起见,也可采用重复抽样公式。

x

p

μ=

μ=

为全及总体各群的平均数为全及平均数或:为抽样各群的平均数为抽样各群的总平均数为全及总体各群的成数

2

22

2

x

2

2

r

i i

i 1

r

i i i 1

r

i i i 1

(x x)x r x

(x x)r

x r

x (p p)

p =δ=δ=-∑=-∑??=

?

?∑??

-∑

(3)抽样方法

107

以两阶段抽样为例

设总体分R 组,每组包含M i 个单位,若各组M 相等,则N=RM

在抽样第一阶段,从R 组中抽出r 组;在抽样第二阶段,在中选的r 组中随机抽选M i 个单位,若各组m 相等,则n=rm 则:在重复抽样下 在不重复抽样下

108、抽样平均误差的公式归纳如下:

109、点估计和区间估计 (一)点估计:

只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足无偏性、一致性、有效性三个准则,就会得到合理的估计。

(二)区间估计:是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。 *置信区间:根据中心极限定理,得知当n 足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的

x p R r r R (1)R 1R

-

--∴μ=

μ=

整群抽样都采用不重复抽样。所以在计算抽样误差时要使用修正系数,当的数目较大时,可用来代替。

整群抽样的抽样平均误差计算公式为:rm

r

x 2

2

σ

δ

μ+

=

)

1( ) 1 (

2 2--+--=

M m M rm R r R r x σδμ()()

()p

x

2

2

2

2

x

2p

n (1)1N (2)p 1-p p 1-p (3)p 1-p μ=

μ=

σσσ

δδ??

??

???→??→??→??→,最基本的是:若为:乘以-若不重复抽样类型抽样整为:若为群抽样: n

N R

r

?

?→??→x X p

P 是由样本指标直接代替全及指标,不考虑

任何抽样误差因素。即用直接代表,用直接代表。

概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下: 抽样极限误差△=t μ,(t 为概率度)

可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。

抽样误差范围的实际意义是要求被估计的全及指标 或P 落在抽样指标一定范围内,即 落在 或 的范围内。

110、全及平均数和全及成数的推断 111、全及总体总量指标的推断

(一) 直接推断法: 抽样平均数(成数)×总体单位数=总体标志总量

(二) 修正系数法:就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。 112、影响必要抽样数目的因素

113、必要抽样数目的计算公式 (一) 简单随机抽样

(二) 类型抽样 重复抽样: 不重

复抽样:

(三) 机械抽样 在有总体差异程

度和比重的全面资料时,可采用类型抽样的公式;

没有总体的全面资料时,可采用简单随机抽样的公式。 (四) 整群抽样

114、假设检验的意义

所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。

115、假设检验的程序

(一)提出原假设和替代假

原假设(又称虚无假设)是接受检验的假设,记作H 0;替代假设(又称备选假设)是当原假设被否定时的另一种可成立的假设,记作H 1;H 0与H 1两者是对立的,如H 0真实,则H 1不真实;如H 0不真实,则H 1为真实。 H 0和H 1在统计学中称为统计假设。 例:关于总体平均数的假设有三种情况: (1) H 0: μ=μ0; H 1: μ≠μ0 (2) H 0: μ≥μ0; H 1: μ<μ0 (3) H 0: μ≤μ0; H 1: μ>μ0

以上三种类型,对第一种类型的检验,称双边检验,因为μ≠μ0,包含μ>μ0和μ<μ0。而对第二、三种类型的检验,称单边检验。

X x

x ?±p

p ?±x x

p p

F(t)x X x p P p ()()t -?≤≤+?

-?≤≤+?=±μ在概率的保证下:即:全及平均数成数抽样平均数成数21. σP(1P)()

-体各单位的标志变异程度,即或的大小正比总

2. ()

?许误差的大小反比允 3. t ()率度的数值正比概4. 样方式和组织形式

抽22t P(1P)n -=?不重复抽样:

222

22N t n N t σ=?+σ: 重复抽样222

t n σ=?

2

22

N P(1P)

t n N t P(1P)-=?+-22 ;σ→σ2

2

2

x

t n ?=σ

221p

p p t n ?-=

)(2

222

2

σσt N N

t n +?=

)

()(p p t N N p p t n p -+?-=1122

22222

p p x x

n r ; N R ; ; →→σ→δσ→δ2

2x 222x x

22

p

22

2p

p

R

t r R t R t r R t δ=?+δδ=

?+δ

不:重复抽样

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

统计学原理知识点公式

统计学原理知识点及公式 第一章统计总论 ?1.统计一词的三种含义 ?2.统计学的研究对象及特点 ?3.统计学的研究方法 ?4.统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。 ?5.国家统计兼有的职能 第二章统计调查 ?1.统计调查的概念和基本要求 ?2.统计调查的种类 ?3.统计调查方案的构成内容 ?4.统计调查方法:普查、抽样调查、重点调查、典型调查 ?5.调查误差的种类 第三章统计整理 ?1.统计整理的概念和方法 ?2.统计分组的概念、种类 ?3.统计分组的关键 ?4.统计分组的方法:品质分组方法、变量分组的方法 ?5.分配数列的概念、构成及编制方法 变量数列的编制基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,组距可计算得到:组距= 全距÷组数全距= 最大变量值-最小变量值。 第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。) 第五步:汇总出各组的单位数(注意:不同方法确定的组限在汇总单位数时的区别),计算频率,并编制统计表。 间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。

重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。 因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。 ?6.统计表的结构和种类 第四章综合指标 ?1.总量指标的概念、种类和计量单位 ?2.相对指标的概念、指标数值的表现形式、相对指标的种类。相对指标包括: 结构相对指标、比例相对指标 比较相对指标、强度相对指标 动态相对指标、计划完成程度相对指标 ●3.平均指标的概念、作用和种类。 算术平均数、调和平均数、众数、中位数

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

统计学习题集5

第五章统计指数 一、填空题 1.编制综合指数的一般原则是:编制数量指数时,把作为同度量因素的质量指标固定在期。编制质量指数时,把作为同度量因素的数量指标指标固定在期。 2.由加权算术平均式形式计算数量指数时,其权数是。 3.由加权调和平均式形式计算质量指数时,其权数是。 4.拉氏物量指数公式为。 5.派氏价格指数公式为。 6.平均指标指数由可变构成指数、指数、指数构成。 7.某企业今年比去年产品产量增长12%,出厂价格平均下降了12%,则产品产值指数为。 8.某地区两年中,每年都用100元购买某商品,而第二年购回的该商品数量却比第一年少了10%,该商品的价格第二年比第一年。 二、判断题 1.某商店今年比去年销售量增长12%,价格下降了12%,则销售额指数为100%。() 2.某居民两年中,每年都用100元购买某商品,而第二年购回的该商品数量却比第一年少了20%,该商品的价格第二年比第一年上涨了20%。() 3.编制价格指数时,一般用报告期销售量作同度量因素。() 4.编制销售量指数时,一般用报告期价格作同度量因素。() 5.职工平均工资下降了15%,固定构成指数为115%,则职工人数指数为100%。() 6.某居民两年中,每年都用100元购买某商品,而第二年购回的该商品数量却比第一年多了20%,该商品的价格第二年比第一年下降了20%。() 7.拉氏指数的同度量因素都固定在基期。() 8.派氏指数的同度量因素都固定在报告期。() 9.把构成固定下来,单纯反映各组水平变动的指数是结构影响指数。() 10.个体指数是反映个别现象数量变动的相对数。()

三、单项选择题 1.按照个体单位成本指数和报告期总成本资料计算的单位成本总指数是 ( )。 A.综合指数 B.平均指标指数 C.加权算术平均指数 D.加权调和平均指数 2.下列指数中的质量指标指数是( )。 A.劳动生产率指数 B.总产值指数 C.总成本指数 D.产量指数 3.某企业生产多种产品,实际与计划相比,其产品单位成本总指数为98%,则说明平均来说该企业( )。 A.未完成成本降低的计划 B.超额完成成本降低的计划 C.产品单位成本上升2% D.总成本下降2% 4.设q 为产品产量,m 为单位产品原材料消耗量,p 为单位产品原材料价格,则公式110100q m p q m p -∑∑的意义是( )。 A.反映费用总额变动的绝对额 B.反映由于单耗的变动使费用总额变动的绝对额 C.反映由于产品产量的变动使费用总额变动的绝对额 D.反映由于单位产品原材料价格的变动使费用总额变动的绝对额 5.设q 为产品产量,m 为单位产品原材料消耗量,p 为单位产品原材料价格,则 公式 11 1 1 10 q m p q m p ∑∑的意义是( )。 A.反映费用总额变动的程度 B.反映产品产量变动的程度 C.反映单耗变动的程度 D.反映单位产品原材料价格变动的程度 6.设q 为产品产量,z 为单位产品成本,则公式1111 1 z q z q z k ∑∑的意义是( )。 A.反映总成本变动的程度 B.反映产品产量变动的程度 C.反映单位成本变动的绝对额 D.反映单位产品成本变动的程度 7. 设q 为产品产量,p 为单位产品价格,则公式00 00 q k q p q p -∑∑的意义是 ( )。

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

统计学原理第七版李洁明-课后选择判断题习题及答案

统计学原理第七版李洁明-课后选择判断题习题及答案 一、单项选择题 1.统计有三种含义,其基础是()。 (1)统计学(2)统计活动(3)统计方法(4)统计资料 2.一个统计总体()。 (1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标3.下列变量中,()属于离散变量。 (1)一包谷物的重量(2)一个轴承的直径(3)在过去一个月中平均每个销售代表接触的期望客户数(4)一个地区接受失业补助的人数 4.某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。(1)指标(2)标志(3)变量(4)标志值 5.下列属于品质标志的是()。 (1)员工年龄(2)员工性别(3)员工体重(4)员工工资 6.现要了解某机床企业的生产经营情况,该企业的产量和利润是() (1)连续变量(2)离散变量(3)前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量 7.劳动生产率是() (1)动态指标(2)质量指标(3)流量指标(4)强度指标 8.统计规律性主要是通过运用()方法经整理、分析后得出的结论 (1)统计分组法(2)大量观察法(3)综合指标法(4)统计推断法 9.()是统计的基础功能。 (1)管理功能(2)咨询功能(3)信息功能(4)监督功能 10.()是统计的根本准则,是统计的生命线。 (1)真实性(2)及时性(3)总体性(4)连续性 11.构成统计总体的必要条件是()

(1)差异性(2)综合性(3)社会性(4)同质性 12.数理统计学的奠基人是()。 (1)威廉·配第(2)阿亨瓦尔(3)凯特勒(4)恩格尔 13.统计研究的数量必须是()。 (1)抽象的量(2)具体的量(3)连续不断的量(4)可直接相加的量 14.最早使用统计学这一学术用语的是() (1)政治算术学派(2)社会统计学派(3)国势学派(4)数理统计学派 15.指标是说明总体特征的,标志则是说明总体单位特征的,所以,() (1)指标和标志之间在一定条件下可以相互变换 (2)指标和标志都是可以用数值表示的 (3)指标和标志之间不存在关系 (4)指标和标志之间的关系是固定不变的 二、判断题 1.统计学是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。(×) 2.三个学生的成绩不同,因此存在三个变量。(×) 3.统计数字的具体性是统计学区别于数学的根本标志。(×) 4.统计指标体系是许多指标集合的总称。(√) 5.一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。(×) 6.变量是指可变的数量标志。(√) 7.社会经济统计是在质与量的联系中,观察和研究社会经济现象的数量方面。(√) 8.运用大量观察法,必须对研究对象的所有单位进行观察调查的(×) 9.综合为统计指标的前提是总体的同质性。(√) 10.数量指标的表现形式是绝对数,质量指标的表现形式是相对数或平均数。(√) 11.个人的工资水平和全部员工的工资水平,都可以称为统计指标。(×)

统计学原理复习题

统计学原理复习题 一.单项选择题 1.“统计”一词的基本含义是(D ) A.统计调查,统计整理,统计分析B.统计设计,统计分组,统计计算C.统计方法,统计分析,统计预测D.统计科学,统计工作,统计资料2.就一次统计活动来讲,一个完整的过程包括的阶段有(D ) A.统计调查,统计整理,统计分析,统计决策 B. 统计调查,统计整理,统计分析,统计预测 C.统计设计,统计调查,统计审核,统计分析 D.统计设计,统计调查,统计整理,统计分析 3.统计总体的基本特征是(A ) A.同质性,大量性,差异性 B.数量性,大量性,差异性 C.数量性,综合性,具体性 D.同质性,大量性,可比性 4.标志是说明(A ) A.总体单位的特征的名称 B.总体单位量的特征的名称 C.总体质的特征的名称 D.总体量的特征的名称 5.统计指标的特点是(A ) A.大量性,综合性,具体性 B.准确性,及时性,全面性 C.大量性,同质性,差异性 D.科学性,客观性,社会性 6.对某市占成交额比重大的7个大型集市贸易市场的成交额进行调查,这种调查的组织方式是(C ) A.普查 B.抽样调查 C.重点调查 D.典型调查 7.对无限总体进行调查的最有效,最可行的方式通常采用(A ) A. 抽样调查 B.全面调查 C. 重点调查 D. 典型调查 8、统计分组的结果表现为( A ) A、组内同质性,组间差异性 B、组内差异性,组间同质性 C、组内同质性,组间同质性 D、组内差异性,组间差异性 9、下面属于按品质标志分组的有(C ) A、企业按职工人数分组 B、企业按工业总产值分组 C、企业按经济类型分组 D、企业按资金占用额分组 10、下面属于按数量标志分组的有(B ) A、工人按政治面貌分组 B、工人按年龄分组 C、工人按性质分组 D、工人按民族分组 11、变量数列中各组频率(以百分数表示)的总和应该(D ) A、大于100% B、小于100% C、不等于100% D、等于100% 12、对于越高越好的现象按连续型变量分组,如第一组为75以下,第二组为75-85,第三组为85-95,第四组为95以上,则数据(A ) A、85在第三组 B、75在第一组 C、95在第三组 D、85在第二组 13、按连续型变量分组,其末组为开口组,下限为2000。一直相邻组的组中值为1750,则末组组中值为(B ) A、2500 B、2250 C、2100 D、2200 14.下列指标属于时期指标的是(A ) A.商品销售额 B.商品库存额 C.商品库存量 D.职工人数

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

统计学重点学习的知识点重点学习的全归纳全面准确.doc

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 ( 1)政治算术学派 最早的统计学源于17 世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学 的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 ( 2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对 国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名, 无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的 社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和 相互关系。 ( 4)数理统计学派 创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计 方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19 世纪中叶到 20 世纪中叶,数理统计学得到迅速发展。到 20 世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之

间的数量关系和质量互变的数量界限。 ( 2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的 数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总 体数量方面等等。 ( 3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学 的区别。 ( 4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会 经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 ( 1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出 各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有 用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或 检验总体的数量特征。 ( 4)统计资料的积累、开发与应用

统计学原理第七版李洁明-课后选择判断题习题及答案

) 统计学原理第七版李洁明-课后选择判断题习题及答案 一、单项选择题 1.统计有三种含义,其基础是()。 (1)统计学(2)统计活动(3)统计方法(4)统计资料 2.一个统计总体()。 (1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标3.下列变量中,()属于离散变量。 (1)一包谷物的重量(2)一个轴承的直径(3)在过去一个月中平均每个销售代表接触的期望客户数(4)一个地区接受失业补助的人数 < 4.某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。(1)指标(2)标志(3)变量(4)标志值 5.下列属于品质标志的是()。 (1)员工年龄(2)员工性别(3)员工体重(4)员工工资 6.现要了解某机床企业的生产经营情况,该企业的产量和利润是() (1)连续变量(2)离散变量(3)前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量

7.劳动生产率是() | (1)动态指标(2)质量指标(3)流量指标(4)强度指标 8.统计规律性主要是通过运用()方法经整理、分析后得出的结论(1)统计分组法(2)大量观察法(3)综合指标法(4)统计推断法 9.()是统计的基础功能。 (1)管理功能(2)咨询功能(3)信息功能(4)监督功能 10.()是统计的根本准则,是统计的生命线。 (1)真实性(2)及时性(3)总体性(4)连续性 11.构成统计总体的必要条件是() 《 (1)差异性(2)综合性(3)社会性(4)同质性 12.数理统计学的奠基人是()。 (1)威廉·配第(2)阿亨瓦尔(3)凯特勒(4)恩格尔 13.统计研究的数量必须是()。 (1)抽象的量(2)具体的量(3)连续不断的量(4)可直接相加的量14.最早使用统计学这一学术用语的是() (1)政治算术学派(2)社会统计学派(3)国势学派(4)数理统计学派

统计学原理复习题

统计学练习题 一、判断题 1、在其他条件不变的情况下,相关系数越大,估计标准误差就越大;反之,估计标准误差就越小。可见估计标准误差的大小与相关系数的大小是一致的。 F 2、以最低限度为任务提出的计划指标,计划完成程度以不超过100%为好。F 3、全国人均国民生产总值,属于强度相对数。T 4、标志总量是指总体单位某一数量标志值的总和。T 5、在计算相对指标时,分子、分母可以互换的相对指标唯一只有强度相对数。F 6、某企业工人劳动生产率,计划提高5%,实际提高10%,则劳动生产率的计划完成程度为104.76%。T 7、相关系数的数值越大,说明相关程度越高;同理,相关系数的数值越小,说明相关程度越低。F 8、不具有因果关系的两个变量之间,一定不存在相关关系。F 9、离散变量的数值包括整数和小数。F 10、总体和总体单位的概念不是固定不变的,任何一对总体和总体单位都可以互相变换。F 11、某市社会商品零售额1995年至2000年的环比增长速度分别为10.10%,9.50%,10.23%,11.28%,12.03%,则其平均增长速度为10.63%。T 12、增长百分之一的绝对值是前期水平与100之比。T 13、两个相邻的定基发展速度之商等于相应的环比发展速度。T 14、正相关是指两个变量之间的变化方向都是止升的趋势,而负相关是指两个变量之间的变化方向都是下降的趋势。F 15、人口普查可以经常进行,所以它属于经常性调查。F 16、某厂劳动生产率计划在去年的基础上提高10%,计划执行结果仅提高5%,则该厂劳动生产率计划仅完成一半. 17、累计增长量与逐期增长量之间的关系是:累计增长量等于相应各个逐期增长量之乘积。 18、加权算术平均数的大小不但受变量值的影响,而且还受权数的影响。 19、已知一组数列的方差为9,离散系数为30%,则其平均数等于30。F 20、抽样调查的目的在于用抽样指标去推断总体指标。 21、当原假设用单侧检验被拒绝时,用同样的显著性水平双侧检验,可能会拒绝也可能不会拒绝。 22、相关系数的数值越大,说明相关程度越高;同理,相关系数的数值越小,说明相关程度越低。F 23、定基发展速度等于相应的各个环比发展速度的连乘积。 24、若单位成本降低10%,产量增长10%,则生产费用总额不变。 25、专门调查是为了研究某些专门问题而组织的调查,所以它可以采用定期统计报表的方式来调查。 26、某地人均粮食产量为800公斤,人均粮食消费量为400公斤,这两个指标都是强度相对指标。 27、权数的实质是各组单位数占总体单位数的比重。T 28、变异度指标综合反映总体各单位标志值之间的差异性。 29、对于重复简单随机抽样,若其他条件不变,样本单位数目增加3倍,则样本平均数抽样平均误差将减少30%。 30、在假设检验中,显著性水平是表示原假设为真时被拒绝的概率。 31、已知两变量直线回归方程为:y=-50.20+1.80x ,则可断定这两个变量之间一定不存在正相关关系。 32、累计增长量等于相应各逐期增长量之和。 33、一般来说,对于含有周期变动的时间数列,采用的序时项数应与周期长度相一致,以便消除周期变动和不规则变动的影响,准确反映现象发展变化的长期趋势。 34、本年与上年相比,若物价上涨15%,则本年的100元人民币,是上年的85元。 35、统计的根本职能是提供决策依据。 36、普查是专门组织的经常性全面调查。

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

相关文档
最新文档