统计学计量资料的统计描述方法

计量资料的统计描述方法

怎样表达一组数据？

描述计量资料的常用指标—

A、描述平均水平（中心位置）:

均数X、中位数和百分位数、几何均数G、众数（mode）

B、描述数据的分散程度:

标准差、四分位数间距、变异系数、方差、全距

(一)均数mean和标准差standard deviation

1. (算术)均数X

均数是描述一组计量资料平均水平或集中趋势的指标。

*直接计算公式：

应用条件：适用于对称分布，特别是正态分布资料。

2. 中位数（median）M和百分位数（percentile）

A.中位数M

是将一组观察值从小到大排序后，居于中间位置的那个值或两个中间值的平均值。

应用条件：

用于任何分布类型，包括偏态资料、两端数据无界限的资料。

计算：

n为奇数时--

n为偶数时--

9人数据：12，13，14， 14， 15， 15， 15， 17, 19天

B.百分位数

是将N 个观察值从小到大依次排列，再分成100等份，对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。

四分位数间距（quartile range ）

= 第25百分位数(P25)～第75百分位数(P75)。

四分位数间距用于描述偏态资料的分散程度（代替标准差S ），包含了全部观察值的一半。

百分位数计算(频数表法)：

X L ：第X 百分位数所在组段下限 L Σf ：小于X L 各组段的累计频数

X i ：第X 百分位数所在组段组距 n ：总例数 f x :所在组段频数

注：有的教材X= r ; L f =C

例：求频数表的第25、第75百分位数(四分位数间距)

组段

频数f 累积频数∑f 56～

2 2 59～

5 7 62～

12 19 ∑f 25 L 25 65～

15 34 P 25在此 68～

25 59 71～

26 85 ∑f 75 L 75 74～

19 104 P 75在此 77～

15 119 80～

10 129 83～85

1 130 合计 130

① 确定Px 所在组段：

P 25所在的组段：n X %=130×25%=32.5,

65～组最终的累积频数=34，32.5落在65～组段内；

P 75所在的组段：n X %=130×75%=97.5, 此值落在74～组段

② 确定Px 所在组段的X L 、X i 、f x 、L Σf

③ P 25＝65+3x[(130x25%－19)/15]＝65.90

P75＝74+3x[(130x75%－85)/19]＝74.66

四分位数间距=65.90～74.66 (次/分)

3.几何均数G（geometric mean）

应用：

适用于成等比数列的资料，特别是服从对数正态分布资料。

原始数据分布不对称，经对数转换后呈对称分布的资料。

可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。例如抗体滴度。

计算：N个数值的乘积开N次方, 即为这N 个数的几何均数。

有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。使用分母计算！

平均抗体效价为： 1：57

加权法：

众数

是一组观察值中出现频率最高的那个观察值；若为分组资料，众数则是出现频率最高的那个组段的组中值。适用于大样本但较粗糙。

例：有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62，试求众数。

正态分布时：均数＝中位数＝众数

正（右）偏态分布时：均数 > 中位数 >众数

负（左）偏态分布时：均数 < 中位数 <众数

3. 标准差S

S描述数据的分散程度.描述一组数据在其平均数周围的分布情况，若每个数据集中在其平均数周围，此平均数对这组数据的代表照就大；反之，代表性较差。

标准差S

甲

75 80 85 90 95 100 105 n1=7 X1=90 s1=10.8

组

乙

45 60 75 90 105 120 135 n2=7 X2=90 s2=32.4

组

()数据越分散 1

2-∑-=n X X S ，分子越大。或者标准差的5应用：

描述变异程度、计算标准误、计算变异系数、

描述正态分布、估计正常值范围

S 用于正态分布资料

怎样使用均数和标准差？

论文中常用X ±S 描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25～P75(代替标准差S ）。方差:

方差=S 2

全距R :

R= 最大值–最小值。简单，但仅利用了两端点值，稳定性差。

变异系数(coefficient of variation ，CV):

计算：CV=（S/X ）?100%，无单位

应用：1.单位不同的多组数据比较；

2.均数相差悬殊的多组资料

什么是正态分布？

(二)正态分布(Normal distribution )

正态分布是描述连续型变量值分布的曲线. 当例数比较多时，医学上许多资料近似服从正态分布。正态分布在统计推断上有重要的作用。

正态分布曲线理论上的特征

（1）以X= μ均数为中心, X值呈钟型分布，中央高、两端对称性减少、与X 轴永不相交。

（2 ）在 X= μ处，f（x）取最大值（例数最多）。

（3 ）正态分布由均数μ、标准差σ决定曲线的左右位置和高低形状：

正态分布有两个参数，即位置参数--均数μ和形态参数--标准差σ。

若固定标准差σ，改变均数μ值，曲线沿着X轴平行移动，其形状不变。

若固定μ，σ越小，曲线形状越陡峭；反之，σ越大，曲线越平坦。

正态分布均数（位置参数）、标准差（变异度）变化示意图

正态曲线面积分布规律：

①X轴与正态曲线所夹面积恒等于1或100%；

②区间μσ

±的面积为68.27%；

③区间 1.96

μσ

±的面积为95.00%；

④区间 2.58

μσ

±的面积为99.00%。

正态分布u值表(标准正态分布概率单位值)

尾部面积为α的u值，记为uα，称为u界值：

尾部面积各为2.5%时（黑色处），其对应的u值为u=±1.96；

u=（-2.58，2.58）区间的面积为0.99（空白处）

正态分布的应用：

1.估计正态分布X值在特定值范围内的分布比例(概率）。

2.制定某临床指标的参考值范围

3.利用估计变量值的范围或对极端值做取舍。

4.许多统计方法的统计推断建立在正态分布基础上。

怎样确定资料是否属正态分布？

1.做正态性检验；

2.粗略估计：正态一般X S 3

1<； X S >者必为偏态！

正态分布可用于求参考值范围！ (三)医学参考值范围的制定

概念医学参考值是指包括绝大多数“正常人”的各种生理及生化指标常数，也称正常值(背景值)。

正常值是指在一定范围内波动的值，医学上常用95%的范围作为判定正常或异常的参考标准。

制定参考值的基本原则

1. 选定正常人：

即排除了影响研究指标的有关因素的同质人群。

有足够的样本例数（一般不低于100例）

2. 确定参考值范围的百分界限（常用95%）

3. 考虑制定单侧或双侧诊断界值：

新药肯定比旧药好（旧药肯定比新药差）——单侧

新药可能好，也可能差------------------------------双侧

双侧标准较高，结论较可靠（常用）

4. 依分布(正态或偏态) 确定计算方法：

（1）正态分布法

X ±μ ?S ，其中

双侧95%参考值范围公式：X ±1.96S

单侧95%参考值范围公式： X +1.64S

例11.3：已知111人的血铅X =0.010 μg/100ml, S=0.012 μg/100ml

因为血铅可以低而不可以高，故用单侧95%参考值范围

X +1.64S=0.010+1.64×0.012=0.030(μg/100ml);

血铅95%参考值范围≤0.030 μg/100ml

注意：如果资料非正态分布而使用正态分布法，会得出错误结论！！（2）百分位数法

适用于偏态分布资料

计算公式：

双侧界值：P2.5～ P97.5

单侧用上界： P95

单侧用下界： P5

描述统计学思考题

1、调查问卷的结构？ 2、多项选择题的编码？（多重响应） 3、多项选择排序题的编码？ 4、缺失值有哪些处理方法？ 5、离群值如何判断和筛选出来？ 6、什么是问卷的信度和效度？怎样检验问卷的信度和效度？ 7、问卷调查中的信度分析，有几种信度系数？写出三种信度的测量方法。 8、问卷调查中的效度分析，有几种关于效度的测定方法？ 9、信度与效度之间有什么关系？ 10、条形图、直方图、茎叶图的区别。 11、箱线图中的离群点是哪些点？离群程度？ 12、数据特征从哪几个方面进行描述？描述统计量分别是？ 13、众数、中位数、均值的异同？ 14、根据下表数据， (1)用描述统计的方法概括表中数据，并讨论你的结论。 (2)对变量数据的最大值、最小值、平均数以及适当的分位数进行评价和解释；通过这些描述统计量，你对亚太地区的商学院有何看法或发现？ (3)对本国学生学费和外国学生学费进行比较。 (4)对要求或不要求工作经验的学校学生的起薪进行比较。 (5)对要求或不要求英语测试的学校学生的起薪进行比较。

(6)分析报告中如果有必要的图表，将更便于反映你希望反映的问题。（见下页）

表亚太地区25所知名商学院商学院名称录取名额每系人数本国学生学费（$）外国学生学费（$）年龄国外学生比例（%）是否要求 GMAT 是否要求英语测试是否要求工作经验起薪（$）麦夸里商学院（悉尼） 12 5 24420 29600 28 47 是否是71400 阿德莱德大学20 4 19993 32582 29 28 是否是65200 梅西大学（新西兰，北帕默斯顿） 30 5 4300 4300 22 0 否否否7100 墨尔本皇家工商学院 30 5 11140 11140 29 10 是否否31000 马来西亚 Sains大学（槟城） 30 4 33060 33060 28 60 是是否87000 澳大利亚国立大学（堪培拉） 42 5 7562 9000 25 50 是否是22800 De La Salle大学（马尼拉） 44 5 3935 16000 23 1 是否否7500 南洋理工大学（新加坡） 50 6 6146 7170 29 51 是是是43300 香港理工大学60 8 2880 16000 23 0 否否否7400 拉合尔管理科学院 70 2 20300 20300 30 80 是是是46600 香港大学90 5 8500 8500 32 20 是否是49300 柯廷理工学院（珀思） 98 17 16000 22800 32 26 否否是49600 日本国际大学126 2 11513 11513 26 37 是否是34000 昆士兰大学（布里斯本） 138 8 17172 19778 34 27 否否是60100 新加坡国立大学 147 7 17355 17355 25 6 是否是17600 墨尔本商学院200 13 16200 22500 30 30 是是是52500 Chulalongkorn 大学（曼谷） 200 10 18200 18200 29 90 否是是25000 新南威尔士大学（悉尼） 228 19 16426 23100 30 10 否否是66000 Jamnalal Bajaj 管理学院（孟买） 240 15 13106 21625 37 35 否是是41400 亚洲管理学院300 7 13880 17765 32 30 否是是48900

习题-计量资料统计描述

计量资料统计描述----习题 1、中位数是表示变量值（）的指标。 A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.变异程度 2、血清学滴度资料最常计算（）来表示平均水平。 A.算术均数 B.中位数 C.几何均数 D.全距 E.百分位数 3、最小组段无下限或最大组段无上限的频数分布资料宜用（） A.算术均数 B.中位数 C.几何均数 D.全距 E.标准差 4、原始数据同减去一个不等于零的常数后，（）。 A. x 不变，S 变 B. x 变，S 不变 C. x 和S 都不变 D. x 和S 都变 E.以上均不对 5、变异系数CV（）。 A.表示X 的绝对离散度 B.表示X 的相对离散度 C.表示x的绝对离散度 D.表示x的相对离散度 E.以上均不对 6、描述一组偏态分布资料的变异度，以（）指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.均数 7、用均数和标准差可以全面描述（）资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.分布不知 E.对数正态分布 8、比较身高和体重两组数据变异度大小宜采用（） A.变异系数 B.标准差 C.四分位数间距 D.全距 E.方差 9、偏态分布宜用（）描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数 D.众数 E.百分位数 10、各观察值同乘以一个不等于0 的常数后，（）不变。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.变异系数 11、（）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 E.以上均不对 12、随机抽查某地成年女子身高，算得均数x =160cm，标准差S=5cm，则可计算变异系数CV=------- 5 160 C.（160/5）cm D.(5/160)cm ×160 13、变异系数CV 的数值（）。 A.一定大于1 B.一定小于1 C.可大于1，也可小于1 D.一定比标准差小 E.不能判定 14、列数8、-3、5、0、4、-1 的中位数是（）。、关于标准差，哪项是错误的（）。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E.适用于对称分布资料 16、5 人的血清滴度为＜1：20、1：40、1：80、1：160、1：320 描述平均滴度，用哪种指标较好（）。 A.平均数 B.几何均数 C.算术均数 D.中位数 E.众数

@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法怎样表达一组数据？描述计量资料的常用指标— A 、描述平均水平（中心位置）: 均数X 、中位数和百分位数、几何均数G 、众数（mode ） B 、描述数据的分散程度: 标准差、四分位数间距、变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式：应用条件：适用于对称分布，特别是正态分布资料。 2. 中位数（median ）M 和百分位数（percentile ） A.中位数M 是将一组观察值从小到大排序后，居于中间位置的那个值或两个中间值的平均值。应用条件： 12n X X X X X n n +++== ∑L

用于任何分布类型，包括偏态资料、两端数据无界限的资料。计算： n 为奇数时-- n 为偶数时-- 9人数据：12，13，14， 14， 15， 15， 15， 17, 19天 B.百分位数是将N 个观察值从小到大依次排列，再分成100等份，对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。四分位数间距（quartile range ） =第25百分位数(P25)～第75百分位数(P75)。四分位数间距用于描述偏态资料的分散程度（代替标准差S ），包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???＋如果只调查了前八位中学生，则：＋（＋）（＋）天

百分位数计算(频数表法)： X L ：第X 百分位数所在组段下限 L Σf ：小于X L 各组段的累计频数 X i ：第X 百分位数所在组段组距 n ：总例数f x :所在组段频数注：有的教材X= r ; L f ∑=C 例：求频数表的第25、第75百分位数(四分位数间距) 组段频数f 累积频数∑f 56～ 2 2 59～ 5 7 62～ 12 19 ∑f 25 L 2565～ 15 34 P 25在此 68～ 25 59 71～ 26 85∑f 75 L 7574～ 19 104 P 75在此 77～ 15 119 80～ 10 129 83～85 1 130 合计 130 ① 确定Px 所在组段： P 25所在的组段：n X %=130×25%=32.5, 65～组最终的累积频数=34，32.5落在65～组段内；

统计分析的八种方法

统计分析的八种方法统计分析的八种方法一、指标对比分析法指标对比分析法，又称比较分析法，是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标，只能说明总体的某些数量特征，得不出什么结论性的认识；一经过比较，如与国外、外单位比，与历史数据比，与计划相比，就可以对规模大小、水平高低、速度快慢作出判断和评价。指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较，如不同部门、不同地区、不同国家的比较，也叫横向比较；动态比较是同一总体条件不同时期指标数值的比较，也叫纵向比较。这两种方法既可单独使用，也可结合使用。进行对比分析时，可以单独使用总量指标或相对指标或平均指标，也可将它们结合起来进行对比。比较的结果可用相对数，如百分数、倍数、系数等，也可用相差的绝对数和相关的百分点（每1％为一个百分点）来表示，即将对比的指标相减。二、分组分析法指标对比分析法是总体上的对比，但组成统计总体的各单位具有多种特征，这就使得在同一总体范围内的各单位之间产生了许多差别，统计分析不仅要对总体数量特征和数量关系进行分析，还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求，把所研究的总体按照一个或者几个标志划分为若干个部分，加以整理，进行观察、分析，以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。三、时间数列及动态分析法时间数列。是将同一指标在时间上变化和发展的一系列数值，按时间先后顺序排列，就形成时间数列，又称动态数列。它能反映社会经济现象的发展变动情况，通过时间数列的编制和分析，可以找出动态变化规律，为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。时间数列速度指标。根据绝对数时间数列可以计算的速度指标：有发展速度、增长速度、平均发展速度、平均增长速度。动态分析法。在统计分析中，如果只有孤立的一个时期指标值，是很难作出判断的。如果编制了时间数列，就可以进行动态分析，反映其发展水平和速度的变化规律。进行动态分析，要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位，都应该前后一致。时间间隔一般也要一致，但也可以根据研究目的，采取不同的间隔期，如按历史时期分。为了消除时间间隔期不同而产生的指标数值不可比，可采用年平均数和年平均发展速度来编制动态数列。此外在统计上，许多综合指标是采用价值形态来反映实物总量，如国内生产总值、工业总产值、社会商品零售总额等计算不同年份的发展速度时，必须消除价格变动因素的影响，才能正确的反映实物量的变化。

描述性统计分析报告--Descriptive Statistics菜单详解

第六章：描述性统计分析－－ Descriptive Statistics菜单详解描述性统计分析是统计分析的第一步，做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析，但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中，最常用的是列在最前面的四个过程：Frequencies过程的特色是产生频数表；Descriptives过程则进行一般性的统计描述；Explore过程用于对数据概况不清时的探索性分析；Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验，我们常用的X2检验也在其中完成。本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一，Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表，还可以按要求给出某百分位点的数值，以及常用的条图，圆图等统计图。和国内常用的频数表不同，几乎所有统计软件给出的均是详细频数表，即并不按某种要求确定组段数和组距，而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表，请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示：

该界面在SPSS中实在太普通了，无须多言，重点介绍一下各部分的功能如下：【Display frequency tables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框如下，用于定义需要计算的其他描述统计量。现将各部分解释如下：

1统计学的基本方法包括有(

试卷2 一、单选题 1．统计学的基本方法包括有( ) ①调查方法、整理方法、分析方法、预测方法 ②调查方法、汇总方法、预测方法、实验设计 ③相对数法、平均数法、指数法、汇总法 ④实验设计、大量观察、统计描述、统计推断 2．要了解某市国有工业企业生产设备情况，则统计总体是( ) ①该市国有的全部工业企业 ②该市国有的每一个工业企业 ③该市国有的某一台设备 ④该市国有制工业企业的全部生产设备 3．有意识地选择三个农村点调查农民收入情况，这种调查方式属于（） ①典型调查②重点调查③抽样调查④普查 4．2000年11月1日零点的第五次全国人口普查是（） ①典型调查②重点调查③一次性调查④经常性调查 5．将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为（） ①动态相对指标②结构相对指标 ③比例相对指标④比较相对指标 6．一个企业产品销售收入计划增长8％，实际增长20％，则计划超额完成程度为（） ①12％②150％③111.11％④11.11％ 7．众数是总体中下列哪项的标志值（） ①位置居中②数值最大 ③出现次数较多④出现次数最多 8．某工厂新工人月工资400元，工资总额为200000元，老工人月工资800元，工资总额80000元，则平均工资为（） ①600元②533.33元③466.67元④500元 9．抽样调查和重点调查的主要区别是（） ①选取调查单位的方式不同②调查的目的不同 ③调查的单位不同④两种调查没有本质区别 10．若销售量增加，销售额持平，则物价指数( ) ①降低②增长③不变④趋势无法确定二、多选题 1．某企业是总体单位，数量标志有( ) ①所有制②职工人数③月平均工资 ④年工资总额⑤产品合格率 2．相对指标数值的表现形式有（） ①比例数②无名数③结构数④抽样数⑤复名数 3．在直线相关和回归分析中（） ①据同一资料，相关系数只能计算一个 ②据同一资料，相关系数可以计算两个 ③据同一资料，回归方程只能配合一个 ④据同一资料，回归方程随自变量与因变量的确定不同，可能配合两个

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支，主要通过利用概率论建立数学模型，收集所观察系统的数据，进行量化的分析、总结，并进而进行推断和预测，为相关决策提供依据和参考。它被广泛的应用在各门学科之上，从物理和社会科学到人文科学，甚至被用来工商业及政府的情报决策之上。统计学主要又分为描述统计学和推断统计学。给定一组数据，统计学可以摘要并且描述这份数据，这个用法称作为描述统计学。另外，观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型，以之来推论研究中的步骤及母体，这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik，最早是由Gottfried Achenwall(1749)所使用，代表对国家的资料进行分析的学问，也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义，并且由John Sinclair引进到英语世界。统计学是一门很古老的科学，一般认为其学理研究始于古希腊的亚里斯多德时代，迄今已有两千三百多年的历史。它起源于研究社会经济问题，在两千多年的发展过程中，统计学至少经历了“城邦政情”，“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科，确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础，但是它不属于统计学的范畴，而属于数学的范畴。统计学的发展过程的三个阶段第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要，其内容包括各城邦的历史，行政，科学，艺术，人口，资源和财富等社会和经济情况的比较，分析，具有社会科学特点。“城邦政情”式的统计研究延续了一两千年，直至十七世纪中叶才逐渐被“政治算数”这个名词所替代，并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。第二阶段称之为“政治算数”(Politcal arthmetic)阶段与“城邦政情”阶段没有很明显的分界点，本质的差别也不大。

统计学常用检验方法

统计中经常会用到各种检验，如何知道何时用什么检验呢，根据结合自己的工作来说一说： t检验有单样本t检验，配对t检验和两样本t检验。单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。配对t检验：是采用配对设计方法观察以下几种情形，1，两个同质受试对象分别接受两种不同的处理；2,同一受试对象接受两种不同的处理；3，同一受试对象处理前后。 u检验：t检验和就是统计量为t,u的假设检验，两者均是常见的假设检验方法。当样本含量n较大时，样本均数符合正态分布，故可用u检验进行分析。当样本含量n小时，若观察值x符合正态分布，则用t检验（因此时样本均数符合t 分布），当x为未知分布时应采用秩和检验。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等，就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验（等方差双样本检验，异方差双样本检验）的前提条件。在t检验中，如果是比较大于小于之类的就用单侧检验，等于之类的问题就用双侧检验。卡方检验是对两个或两个以上率（构成比）进行比较的统计方法，在临床和医学实验中应用十分广泛，特别是临床科研中许多资料是记数资料，就需要用到卡方检验。方差分析用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家，以F命名其统计量，故方差分析又称F检验。其目的是推断两组或多组资料的总体均数是否相同，检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析（one-way ANOVA）：用途：用于完全随机设计的多个样本均数间的比较，其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计（completely random design）不考虑个体差异的影响，仅涉及一个处理因素，但可以有两个或多个水平，所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去，然后观察各组的试验效应；在观察研究（调查）中按某个研究因素的不同水平分组，比较该因素的效应。两因素方差分析即配伍组设计的方差分析（two-way ANOVA）：用途：用于随机区组设计的多个样本均数比较，其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响，可分析处理因素和个体差异对实验效应的影响，所以又称两因素实验设计，比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组（如动物实验时，可按同窝别、同性别、体重相近进行配伍），每个配伍组有三个或三个以上受试对象，再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是，同一受试对象不同时间（或部位）重复多次测量所得到的资料称为重复测量数据

描述统计学

2. 数据汇总Summarizing Data 频数分布与图形展示本章和下一章讨论有关统计描述的问题。关于收集、组织、展示数值数据的方法。其中包括描述各种数据分布，各种统计图形的使用，描述数据的各种指标，如平均值、期望值、方差等等。 2.1 频数分布Frequency distribution 为了进行决策或推断，我们需要信息。例如，为了进行制定有关销售方面的决策需要了解员工的实际销售情况，或者说要获得有关销售的信息。获得了数据以后，就需要对数据进行组织，也就是将数据组织成容易观察的形式。然后就是展示数据，通常都是以图形的方式。最后就可以得出关于这一组数据的结论，并将这些结论用于决策。一种常用的方式是首先获得一组原始数据。将这组数据组织成数组，即将数据从大到小或从小到大进行排序。然后将其总结成一组频数分布。也就是将这一数组按一定的间隔进行计数，清点出位于每一间隔中的数据出现的次数。这样就获得了频数表或频数分布。频数分布就是一张显示一组数据位于每一独立区间间隔内的次数的数据表格。频数分布也称为频数表。频数分布又可以划分为定性数据的频数分布和定量数据的频数分布。一般我们主要对定量数据进行频数分布研究。为了建立一频数分布，我们需要确定： ? 间隔的数量， ? 间隔的长度（或宽度）， ? 间隔的边界，或者说是划分间隔的位置然后我们就可以清点落在每一间隔中的数值。例： PP28表2-2显示了一个频数分布。确定间隔长度（或宽度）的公式为：间隔数量最小值最大值估计的间隔长度-= 在此，如果间隔数量选为8，则间隔的长度应该为： 813.88 26000 96500=-= 估计的间隔长度当然，这个数值看起来不太好，所以可以取整为9000或10000。如果我们不能确定应该用多少个间隔数量，则可以通过下列估计间隔长度的公式进行计算：

问卷调查的常用统计分析方法

问卷调查的常用统计分析方法问卷调查的方法用得很广泛，对于没有接触过spss的人第一步面临的就是问卷编码问题，有很多外专业的同学都在问这个问题，现在通过举例的方法详细讲解如下，以方便第一次接触SPSS 的同学也能做简单的分析。后面还有分析时的操作步骤，以及比较适用的深入统计分析方法的简单介绍。调查分析问卷回收，在经过核实和清理后就要用SPSS做数据分析，首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案，首先要根据问卷问题的不同定义变量。定义变量值得注意的两点：一区分变量的度量，Measure的值，其中Scale是定量、Ordinal是定序、Nominal 是指定类；二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型，他们的变量的定义和处理的方法各有不同，我们详细举例介绍如下：问卷调查的方法用得很广泛，对于没有接触过spss的人第一步面临的就是问卷编码问题，有很多外专业的同学都在问这个问题，现在通过举例的方法详细讲解如下，以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤，

以及比较适用的深入统计分析方法的简单介绍。自己写的，错误之处请指正，调查分析问卷回收，在经过核实和清理后就要用SPSS做数据分析，首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案，首先要根据问卷问题的不同定义变量。定义变量值得注意的两点：一区分变量的度量，Measure的值，其中Scale是定量、Ordinal是定序、Nominal 是指定类；二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型，他们的变量的定义和处理的方法各有不同，我们详细举例介绍如下： 1 、单选题：答案只能有一个选项例一当前贵组织机构是否设有面向组织的职业生涯规划系统？ A有 B 正在开创C没有D曾经有过但已中断编码：只定义一个变量，Value值1、2、3、4分别代表A、B、C、D 四个选项。

统计学基础课后全部详细答案与讲解

统计学第一至四章答案第一章一、思考题 1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。统计方法可分为描述统计和推断统计。 2.统计数据的分类：按计量尺度：分类数据、顺序数据和数值型数据按获取数据的方式：观测数据和实验数据按数据与时间的关系：截面数据和时间序列数据特点：分类数据各类别之间是平等的并列关系，各类别之间的顺序可以任意改变；顺序数据的分类是有序的；数值型数据说明的是现象的数量特征，是定量数据；观测数据是通过调查或观测而收集到的数据，是在没有对事物进行人为控制的条件下得到的；实验数据是在实验中控制实验对象而收集到的数据；截面数据也称静态数据，描述的是现象在某一时刻的变化情况；时间序列数据也称动态数据，描述的是现象随时间的变化情况。 3.对武昌分校的全体教师进行工资调查，那么全体教师就是总体，从中抽取五十名教师进行调查，这五十名教师的集合就是样本，全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数，五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说教师的工资。 4.有限总体：指总体的围能够明确确定，而且元素的数目是有限可数的。例如：武昌分校10 级金融专业学生无限总体：指总体所包含的元素是无限的、不可数的。例如：整个宇宙的星

球 5.变量可分为分类变量、顺序变量、数值型变量。同时数值型变量可分为离散型变量和连续型变量。 6.离散型变量只能取有限个值，而且其取值都以整位数断开，可以一一列举，例如“产品数量” 、“企业数”。连续型变量的取值指连续不断的，不能一一列举。例如“温度” 、“年龄”。二、练习题 1.（1）数值型变量（2）分类变量（3）数值型变量（4）顺序变量（5）分类变量 2.（1）这一研究的总体是IT 从业者，样本是从IT 从业者中抽取的1000 人，样本量是1000 （2）“月收入”是数值型变量（3）“消费支付方式”是分类变量 3.（1）这一研究的总体是所有的网上购物者（2）“消费者在网上购物的原因”是分类变量第二章一、思考题 1:答：1:普查的特点：①：普查通常是一次性的或周期性的； ②：普查一般需要规定统一的调查时间；③：普查的数据一般比较准确；4：普查的使用围比较狭窄，只能调查一些最基本的、特定的现象。2 :抽样调查的特点：①：经济性；②：时效性强; ③：适应面广；④：准确性高。

常用医学科研中的统计学方法(1)

正确答案错误答案 1.从同一总体抽样,则样本标准差（） A随着样本含量增大而增大 B样本含量增大而标准差不变 C随着样本含量减少而减少 D随着样本含量增大而减小 2.用图表示某地区近30年三种疾病的发病率，在各年度的动态发展速度情况,宜绘制（） A普通线性图 B.直方图 C.百分条图 D.半对数线图。 3.均数与标准误的关系（） A.均数越大,标准误越大 B.均数越大,标准误越小 C标准误越小，用均数推测总体均数的可靠性越大。 E标准误越大，用均数推测总体均数的可靠性越大。 4.多重线性回归分析中，度量一组自变量与应变量线性相关程度的统计量是() A.负相关系数 B.决定系数 C.偏相关系数 D.偏回归系数 5.变异系数cv的数值() A.一定大于1 B.一定小于1 C.可以大于1，也可以小于1 D.一定小于标准差。 6.在样本量为n，自变量个数为3的线性回归方程的假设检验中，回归变异和剩余变异的

自由度分别为（） A. 3和n-3 B. 3和n-4 C. 2和n-2 D. 2和n-3 7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制（） A.半对数线图 B.圆图 C.直方图 D.普通线图 8.在同一总体中随机抽取多个样本，用样本均数估计总体均数95%的可信区间，则估计精密度高的是（） A.均数小的样本 B.标准差小的样本 C.标准误大的样本 D.标准误小的样本 9.均数的标准误反映了（） A.个体的变异程度 B.集中趋势的位置 C.指标的分布规律 D.样本均数与总体均数的差异 10.由样本均数估计总体均数可靠性大小的指标是（） A.标准差 B.标准误 C.方差 D.变异系数 11.表示血清抗体滴度资料平均水平最常用的指标是（）

《统计学》名词解释及公式

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术，它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域，然后介绍统计数据的类型及其来源，最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。概念：统计学，描述统计，推断统计。统计在工商管理中的应用。统计的其他应用领域。概念：分类数据，顺序数据，数值型数据。不同数据的特点。概念：观测数据，实验数据。概念：截面数据，时间序列数据。统计数据的间接来源。二手数据的特点。概念：抽样调查，普查。数据的间接来源。数据的收集方法。调查方案的内容。概念。抽样误差，非抽样误差。统计数据的质量。概念：总体，样本。概念：参数，统计量。

概念：变量，分类变量，顺序变量，数值型变量，连续型变量，离散型变量。二、主要术语 1.统计学：收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计：研究数据收集、处理和描述的统计学分支。 3.推断统计：研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据：只能归于某一类别的非数字型数据。 5.顺序数据：只能归于某一有序类别的非数字型数据。 6.数值型数据：按数字尺度测量的观察值。 7.观测数据：通过调查或观测而收集到的数据。 8.实验数据：在实验中控制实验对象而收集到的数据。 9.截面数据：在相同或近似相同的时间点上收集的数据。 10.时间序列数据：在不同时间上收集到的数据。 11.抽样调查：从总体中随机抽取一部分单位作为样本进行调查，并根据样本调查结果来推断总体特征的数据收集方法。 12.普查：为特定目的而专门组织的全面调查。 13.总体：包含所研究的全部个体（数据）的集合。 14.样本：从总体中抽取的一部分元素的集合。 15.样本容量：也称样本量，是构成样本的元素数目。 16.参数：用来描述总体特征的概括性数字度量。 17.统计量：用来描述样本特征的概括性数字度量。 18.变量：说明现象某种特征的概念。 19.分类变量：说明事物类别的一个名称。 20.顺序变量：说明事物有序类别的一个名称。 21.数值型变量：说明事物数字特征的一个名称。

统计学概述

统计学概述统计学是一门通过搜索、整理、分析数据等手段，以达到推断所测对象的本质，甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识，它的使用范围几乎覆盖了社会科学和自然科学的各个领域。统计学主要分为描述统计学和推断统计学。给定一组数据，统计学可以摘要并且描述这份数据，这个用法称作为描述统计学。另外，观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型，以之来推论研究中的步骤及母体，这种用法被称作推断统计学。这两种用法都可以被称为应用统计学。另外还有数理统计学专门讨论这门科目背后的理论基础。统计学，英文Statistics，最早源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik，代表对国家的资料进行分析的学问，也就是“研究国家的科学”。统计学是一门很古老的科学，一般认为其学理研究始于古希腊的亚里斯多德时代，迄今已有两千三百多年的历史。它起源于研究社会经济问题，在两千多年的发展过程中，统计学至少经历了“城邦政情”，“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科，确切地说：它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础，但是它不属于统计学的范畴，而属于数学的范畴。统计学的发展过程的三个阶段： 1).城邦政情（Matters of state）

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十余种纪要，其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析，具有社会科学特点。“城邦政情”式的统计研究延续了一两千年，直至十七世纪中叶才逐渐被“政治算数”这个名词所替代，并且很快被演化为“统计学”(Statistics)。 2).政治算术 “政治算术”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。威廉·配弟用数字，重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此，威廉·配弟的《政治算术》被后来的学者评价为近代统计学的来源，威廉·配弟本人也被评价为近代统计学之父。从配弟使用数据的方法看，“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点，统计实证方法和理论分析方法浑然一体，这种方法即使是现代统计学也依然继承。 3).统计分析科学(Science of statistical analysis) 在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。 “统计分析科学”课程的出现是现代统计发展阶段的开端。1908年，“学生”氏(William Sleey Gosset，笔名Student)发表了关于t分布的论文，这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法，开创了统计学的新纪元。

计量资料汇总统计描述

第二章计量资料的统计描述一、教学大纲要求（一）掌握容 1. 频数分布表与频数分布图（1）频数表的编制。（2）频数分布的类型。（3）频数分布表的用途。 2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。（二）熟悉容连续型变量的频数分布图：等距分组、不等距分组。二、教学容精要计量资料又称为测量资料，它是测量每个观察单位某项指标值的大小所得的资料，一般均有计量单位。常用描述定量资料分布规律的统计方法有两种：一类是用统计图表，主要是频数分布表（图）；另一类是选用适当的统计指标。（一）频数分布表的编制频数表（frequency table ）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日死亡0，1，2，…20个病人的天数。如描述某学校学生性别分布情况，男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。制作连续型数据频数表一般步骤如下： 1.求数据的极差（range ）。 min max X X R -= （2-1） 2.根据极差选定适当“组段”数（通常8—10个）。确定组段和组距。每个组段都有下限L 和上限U ，数据χ归组统一定为L ≤χ

数学建模中统计学常用方法.

1.1多元回归 1、方法概述: 在研究变量之间的相互影响关系模型时候, 用到这类方法, 具体地说:其可以定量地描述某一现象和某些因素之间的函数关系,将各变量的已知值带入回归方程可以求出因变量的估计值,从而可以进行预测等相关研究。 2、分类分为两类:多元线性回归和非线性线性回归; 其中非线性回归可以通过一定的变化转化为线性回归, 比如:y=lnx 可以转化为 y=u u=lnx来解决;所以这里主要说明多元线性回归应该注意的问题。 3、注意事项在做回归的时候,一定要注意两件事: (1 回归方程的显著性检验(可以通过 sas 和 spss 来解决 (2 回归系数的显著性检验(可以通过 sas 和 spss 来解决检验是很多学生在建模中不注意的地方, 好的检验结果可以体现出你模型的优劣, 是完整论文的体现, 所以这点大家一定要注意。 4、使用步骤: (1根据已知条件的数据,通过预处理得出图像的大致趋势或者数据之间的大致关系; (2选取适当的回归方程; (3拟合回归参数; (4回归方程显著性检验及回归系数显著性检验 (5进行后继研究(如:预测等

这种模型的的特点是直观,容易理解。这体现在:动态聚类图可以很直观地体现出来! 当然,这只是直观的一个方面! 2、分类聚类有两种类型: (1 Q 型聚类:即对样本聚类; (2 R 型聚类:即对变量聚类; 聚类方法: (1 最短距离法 (2 最长距离法 (3 中间距离法 (4 重心法 (5 类平均法 (6 可变类平均法 (7 可变法 (8 利差平均和法在具体做题中,适当选取方法; 3、注意事项

在样本量比较大时,要得到聚类结果就显得不是很容易,这时需要根据背景知识和相关的其他方法辅助处理。还需要注意的是:如果总体样本的显著性差异不是特别大的时候,使用的时候也要注意! 4、方法步骤 (1首先把每个样本自成一类; 2选取适当的衡量标准,得到衡量矩阵,比如说:距离矩阵或相似性矩阵,找到矩阵中最小的元素,将该元素对应的两个类归为一类, (4重复第 2步,直到只剩下一个类; (4重复第 2步,直到只剩下一个类; 补充:聚类分析是一种无监督的分类,下面将介绍有监督的“分类” 。我简单说明下,无监督学习和有监督学习是什么无监督学习:发现的知识是未知的而有监督学习:发现的知识是已知的有监督学习是对一个已知模型做优化,而无监督学习是从数据中挖掘模型他们在分类中应用比较广泛 (非数值分类如果是数值分类就是预测了,这点要注意 1.3数据分类 1、方法概述

统计学简答题及答案说课讲解

统计学简答题及参考答案 1.简述描述统计学的概念、研究内容与目的。概念：它是研究数据收集、整理和描述的统计学分支。研究内容：搜集数据、整理数据、展示数据和描述性分析的理论与方法。研究目的：描述数据的特征；找出数据的基本数量规律。 2.简述推断统计学的概念、研究内容与目的。概念：它是研究如何利用样本数据来推断总体特征的统计学分支。研究内容：参数估计和假设检验的理论与方法。研究目的：对总体特征作出统计推断。 3.什么是总体和样本？总体是指所研究的全部个体(数据)的集合，其中的每一个元素称为个体（也称为总体单位）。可分为有限总体和无限总体： ?有限总体的范围能够明确确定，且元素的数目是有限的，可数的。 ?无限总体所包括的元素数目是无限的，不可数的。总体单位数可用N表示。样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量，记为n。 4.什么是普查？它有哪些特点？普查就是为了特定的研究目的，而专门组织的、非经常性的全面调查。它有以下的特点： 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规范化程度较高 4)应用范围比较狭窄。 5.什么是抽样调查？它有哪些特点？抽样调查是指从总体中随机抽取一部分单位作为样本进行调查，并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本内容。答：统计调查方案就是统计调查前所制订的实施计划，它是指导整个调查过程的纲领性文件，是保证调查工作有计划、有组织、有系统地进行的计划书。它应包括的基本内容有：〈1〉明确调查目的；〈2〉确定调查对象和调查单位；〈3〉设计调查项目；〈4〉设计调查表格和问卷；〈5〉确定调查时间；〈6〉组织实施调查计划；〈7〉调查报告的撰写，等等。 7.简述统计分组的概念、原则和具体方法。答：（1）概念

统计分析的四种方法

统计分析的四种方法一、指标对比分析法，又称比较分析法，是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标，只能说明总体的某些数量特征，得不出什么结论性的认识；指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较，也叫横向比较；动态比较是同一总体条件不同时期指标数值的比较，也叫纵向比较。这两种方法既可单独使用，也可结合使用。进行对比分析时，可以单独使用总量指标或相对指标或平均指标，也可将它们结合起来进行对比。比较的结果可用相对数，如百分数、倍数、系数等，也可用相差的绝对数和相关的百分点（每1％为一个百分点）来表示，即将对比的指标相减。二、分组分析法指标对比分析法是总体上的对比，但组成统计总体的各单位具有多种特征，这就使得在同一总体范围内的各单位之间产生了许多差别，统计分析不仅要对总体数量特征和数量关系进行分析，还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求，把所研究的总体按照一个或者几个标志划分为若干个部分，加以整理，进行观察、分析，以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。三、时间数列及动态分析法, 时间数列是将同一指标在时间上变化和发展的一系列数值，按时间先后顺序排列，就形成时间数列，又称动态数列。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。时间数列速度指标。根据绝对数时间数列可以计算的速度指标：有发展速度、增长速度、平均发展速度、平均增长速度。动态分析法。在统计分析中，如果只有孤立的一个时期指标值，是很难作出判断的。如果编制了时间数列，就可以进行动态分析，反映其发展水平和速度的变化规律。进行动态分析，要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位，都应该前后一致。时间间隔一般也要一致，但也可以根据研究目的，采取不同的间隔期，如按历史时期分。四、指数分析法指数是指反映社会经济现象变动情况的相对数。有广义和狭义之分。根据指数所研究的范围不同可以有个体指数、类指数与总指数之分。用指数进行因素分析。因素分析就是将研究对象分解为各个因素，把研究对象的总体看成是各因素变动共同的结果，通过对各个因素的分析，对研究对象总变动中各项因素的影响程度进行测定。因素分析按其所研究的对象的统计指标不同可分为对总量指标的变动的因素分析，对平均指标变动的因素分析。