《统计学》名词解释及公式

合集下载

统计学名词解释(超全)

统计学名词解释(超全)统计学：是一门搜集、整理、显示和分析统计数据的方法论科学。

总体：就是统计所要研究的事物或现象的全体，即由客观存在的，具有某种共同特征的许多个别事物构成的整体。

参数：是描述总体数量特征的指标，又称总体指标。

样本：是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。

变量：指给所要研究的事物起的名字，包括可变的标志和所有的统计指标。

总体参数：描述总体数量特征的指标，又称总体指标。

样本统计量：是根据样本数据计算出来的样本指标，用来描述样本的数量特征。

普查：为某一特定目的而专门组织的一次性全面调查。

抽样调查：是按随机原则，从总体中抽选部分单位进行观察，并根据部分单位（样本）的调查数据，从数量方面推断总体参数的一种非全面调查。

统计分组：根据被研究现象总体的内在特点以及统计研究的目的，将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。

统计表：指显示统计整理结果的表格，就是把通过整理的调查数据，使其成为得以说明现象总体数量特征的分组数据，并按一定顺序排列而形成的表格。

时期数据：反映现象总体在一段时期内发展变化总结果的总量指标。

时点指标：反应现象整体在某一的点（瞬间）上所处状况的总量指标。

众数：是一组数据中出现次数最多的变量值。

时间序列：将反映某种现象的统计指标在不同时间上的数值，按时间顺序排列而成的序列。

发展水平：时间序列中的每一项指标数值，都称为发展水平，它反映了某种现象在一定时期或时点所达到的规模和水平。

均匀发展水平：将不同时间的发展水平加以均匀而得到的均匀数。

发展速度：是反映现象发展变化快慢程度的动态相对指标，是根据两个不同时期的发展水平对比求得的。

环比发展速度：是时间序列中敷陈期发展水平与前期发展水平之比，表明现象逐期发展变化的方向和程度。

定基发展速度：是报告期发展水平与某一固定时期发展水平（最初发展水平）之比，说明现象在较长时期内总的发展变动方向与程度。

统计学名词解释

1、统计包括三方面的涵义：统计活动、统计资料、统计学；2、统计活动：是在一定的理论指导下，采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。

3、统计资料：即统计信息，它集中、全面、综合地反应国民经济和社会发展的现象和过程4、统计学：即统计理论，是一门独立的方法论科学，它根据自己的研究对象，系统的阐述统计理论的方法5、统计总体：是根据一定的目的和要求所确定的研究事物的全体，它是由客观存在的，具有某种共同性质的许多个别单位构成的整体。

6、总体单位：是指构成总体的个体单位，它是总体的基本单位。

（又称个体）7、同质性：指总体各单位在某一标志上的共同性8、变异性：指总体所有单位至少有一个以上的可变品质标志或数量标志9、大量性：指统计总体中的单位应有足够的数量，如果总体单位应有足够的数量，如果总体单位数量很少，就难以揭示总体的规律性10、标志：是指统计总体中各单位所具同具有的属性和特征11、品质标志：表明总体单位属性方面的特征，用文字表示12、数量标志：数量方面的特征13、指标：是反映社会经济现象总体数量特征的概念和数值。

14、变异：统计中的标志和指标都是可变的15、变量：可以取不同值得量，在社会经济统计学中，各种数量标志和全部统计指标都是变量16、连续变量：数值是连续不断的，相邻两值之间可作无限分割，即可去无限数值17、离散变量：数值都是以整数位断开的，其数值要用计算的方法取得18、确定性变量：变量值的变动受制于某种决定性因素，致使其沿着一定的方向变动19、随机变量：影响变量值变动的因素有很多，作用不同，因而变量值变动无确定方向20、统计法：国家制定和认可的调整参与统计活动的各方面——统计主体、客体、宿体在统计活动中形成的社会关系的法律规范的总称21、统计设计：对一个完整的统计工作涉及各个方面和各个环节的通盘考虑和适当安排22、统计指标体系：将反映社会经济现象数量特征的一系列相互依存、相互联系的统计指标有机结合所组成的整体；23、指标名称：指标质的规定，它反映一定的社会经济范畴24、指标数值：根据指标的内容所计算出来的具体数值25、数量指标：反映总体总规模、总水平或总工作量的统计指标，又称总量指标26、质量指标：反映总体内部数量关系、单位一般水平、工作质量的统计指标27、描述指标：对总体及其组成部分的规模水平和数量关系进行客观描述的统计指标28、评价指标：反映社会经济总体的结构、比例、速度以及利用状况和效益、效果的统计指标29、监测指标：对社会经济总体运行进行跟踪监测，看其是否偏离既定目标，是否保持平衡的统计指标30、预警指标：可以对总体运行中出现的偏离进行及时的调控31、统计调查：是按照统计的任务和调查的目的要求，运用科学的方法搜集或者收集被研究对象的各个标志值的过程。

(完整)统计学名词解释

名词解释：医学统计学：用统计学的原理和方法研究生物医学问题的一门学科.变量（variable ）：观察单位的某项特征变量值（value of variable ）：变量的观察结果（测量值）总体(population ）：是根据研究目的确定的同质的观察单位的全体，确切的说是同质的所有的观察单位某种变量值的集合。

样本（sample)从总体中随机抽取部分由代表性的观察单位，其测量值的集合称为样本。

随机抽样(random sample ）：按随机化原则从总体中抽取部分观察单位的过程。

同质（homogeneity ）:是针对被研究指标来讲，其影响因素相同.简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。

变异（variation)：指在自然地状态下,个体测量结果在同质基础上的差异。

等级资料（ordinal data ）：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位称为等级资料，如患者的治疗结果可分为治愈,好转，有效，无效,死亡.有序变量(定性变量的一种）。

概率（probability)：是度量某一随机事件A 发生可能性大小的一个数值，记为P （A ），P （A ）越大，说明A 事件发生的可能性越大,0〈P(A)<1,小概率事件.频率（frequency ）：在相同的条件下，独立重复做n 次实验，事件A 出现了m 次,比值m/n 称为随机事件A 在n 次实验中出现的频率。

随机误差（random error):排除了系统误差后的尚存的误差，受多种因素影响，使观察值不按照方向性和系统性而随机的变化，误差变量一般服从正态分布,可以通过统计处理来估计.系统误差（system error ）:由于受试对象,研究者，仪器设备，研究方法等非实验因素影响等确定性原因造成，有一定倾向性或规律性的误差，可以避免.随机变量（random variable ）:是指取值不能事先确定的观察结果，不能用一个正常数来表示，每个变量的取值服从特定的概率分布。

统计学名词解释

名词解释1.备择假设（alternative hypothesis）：与原假设逻辑上反面的假设。

2.标准分数（standard score）：也称标准化值或分数，它是变量值与其平均数的离差除以标准差后的值。

3.残值（residual）：因变量的观测值y i与根据估计的回归方程求出的预测值y i之差，用e表示。

对于第i个观测值，残差为e i=y i-y i。

4.α错误（αerror）：原假设为真却在检验中将原假设被拒绝，又称弃真错误或者第一类错误（type I error），用α表示其概率。

5.β错误（βerror）原假设为伪却在检验中未拒绝的原假设，又称取伪错误或者第二类错误（type II error），用β表示其概率。

6.对照组（control group）：随记选取的实验对象的子集。

在这个子集中，每个单元不接受实验组成员所接受的某种特别的处理。

7.多重共线性（multicollinearity）回归模型中两个或两个以上的自变量彼此相关。

8.多重判定系数（multiple coefficient of determination）回归平方和占总平方和的比例，反映因变量y取值的变差中，能被估计的多元回归方程所解释的比例。

9.峰态（kurtosis）对数据分布平峰或尖峰的程度的测度。

10.假设检验（hypothesis testing）根据样本信息，对提出的命题进行检验的一套程序和方法。

11.离散系数（coefficient variation）也称变异系数，一组数据的标准差与其相对应的平均数之比，是测度数据离散程度的相对值。

12.拟合优度实验（goodness of fit test）对多个总体比例是否等于其期望概率的检验。

当期望概率相同时，表现为对多个总体的比例是否相等的检验。

13.偏态（skewness）对数据分布对称性的测度。

14.异众比率（variation ratio）非众数组的频数占总频数的比例。

统计学名词解释

统计学名词解释
统计学试验置信区间统计量残差置信水平第一错误第二错误抽样误差非抽样误差帕式价格指数拉氏回归方程模型价格指数参数拟合优度统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。

误差:是指通过搜查到的数据与研究对象真实结果之间的差异。

抽样误差:是由于抽样的随机性引起的样本结果与总体真值之间的误差。

非抽样误差:是相对于抽样误差而言，是指除抽样误差之外的，由于其他原因引起的样本观察结果与总体真值之间的差异。

弃真错误:是原假设H。

为真却被我们拒绝了，犯这种错误的概率用a表示，所以也称a错误。

取伪错误:是原假设为伪我们却没有拒绝，犯这种错误的概率用β表示，所以也称β错误。

统计量:是用来描述样本特征的概括性数字度量。

参数:是用来描述总体特征的概括性数字度量，它是研究者想要了解的总体的某种特征值。

置信水平:一般地，如果将构造置信区间的步骤重复多次，置信区间中包含总体参数真值的次数所占的比例称为置信水平。

拟合优度:回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。

试验:在同一组条件下，对某事物或现象缩进型的观察或实验。

事件:观察或试验的结果。

极差:一组数据的最大值与最小值之差。

残差:是指实际观察值与回归估计值的差。

统计学名词解释

名词解释：1、分类数据：是只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，是用文字来表示的。

(P5)2、四分位数：也称四分位点，它是一组数据排序后处于25%和75%位置上的值。

(P89)3、方差分析：是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

(P264)4、相关系数：是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

(P304)5、居民消费价格指数：是度量居民消费品和服务项目价格随时间变动的相对数，反映居民家庭购买的消费品和服务价格水平的变动情况。

(420)6、顺序数据：是只能归于某一有序类别的非数字型数据。

(P6)7、抽样误差：是由于抽样的随机性引起的样本结果与总体真值之间的误差。

(P33)8、离散系数：也称变异系数，它是一组数据的标准差与其相应的平均数之比。

计算公式为：(P103)1.v s= s／⎺x9、置信区间：在区间估计中，由样本统计量所构成的总体参数的估计区间。

(P177)10、点估计：用样本统计量＾θ的某个取值直接作为总体参数θ的估计值。

(P176)11、系统抽样：将总体中的所有单位（抽样单位）按一定的顺序排列，在规定的范围内随机地抽取一个单位作为初始单位，然后按后按事先规定好的规则确定其他样本单位。

(P19)12、中心极限定理：设从均值为μ、方差为σ2（有限）的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值⎺X的抽样分布近似服从均值为μ、方差为σ2／n的正态分布。

(P165)13、回归模型：描述因变量ｙ如何依赖于自变量ｘ和误差项的方程。

对于只涉及一个自变量的一元线性回归模型可表示为ｙ=β0+β1ｘ+ε。

(P308)14、指数平滑法：是通过对过去的观察值加权平均进行预测的一种方法，该方法是t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。

(P378)15、非概率抽样：是相对于概率抽样而言的，指抽取样本时不是依据随机原则，而是根据研究目的对数据的要求，采用某种方式从总体中抽出部分单位对其实施调查。

统计学名词解释

抽样平均误差:是指所有可能出现的样本的样本指标的标准差，也可以说是所有可能出现的样本指标和总体指标的平均离差。

总量指标：是反映社会经济现象在一段时间、地点、条件下的总规模或总水平的统计指标。

也称绝对指标或绝对数。

平均指标：平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。

不变价格：是在综合不同的产品产量并反映他们的总动态时，为了消除不同时期价格变动的影响所用的固定价格。

指数：广义：指一切说明社会经济现象数量变动或差异程度的相对数。

狭义：指一种特殊相对数，也即专指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。

置信区间：统计上把这个给定的抽样误差范围叫做抽样极限误差，也称置信区间（抽样误差范围：变动的的抽样指标与确定的全及指标之间离差的可能范围）发展水平：在动态数列中，各项具体的指标数值叫发展水平或动态数列水平。

它反映社会经济现象在不同时期所达到的水平，是计算其他动态分析指标的基础。

长期趋势：就是研究某种现象在一个相当长的时期内持续向上或向下发展变动的趋势。

抽样推断：按已经抽定的样本指标（样本平均数或样本成数）来估计总体指标（总体平均数或总体成数），或其所在的区间范围。

抽样调查：按照随机原则从总体中抽取一部分单位进行观察，并运用数理统计的原理，以被抽取的那部分单位的数量特征为代表，对总体作出数量上的推断分析。

质量指标：指反映现象总体的社会经济效益和工作质量的各种相对指标和平均指标。

标准差系数：根据标准差与算术平均数对比的离散系数。

数量指标:指说明总体规模和水平的各种总量指标。

相对指标：又称相对数，它是两个有联系的指标数值对比的结果。

用来对比的两个数，既可以是绝对数，也可以是平均数和相对数。

估计标准误差:就是用来说明回归方程推算结果的准确程度的统计分析指标，或者说是反映回归直线代表性大小的统计分析指标。

指数体系：是由三个或三个以上有联系的指数所组成的数学关系式。

(完整版)统计学名词解释

统计学名词解释第一章绪论1.随机变量：在统计学上，把取值之间不能预料到什么值的变量。

2.总体：又称母全体、全域，指具有某种特征的一类事物的全体。

3.个体：构成总体的每个基本单元称为个体。

4.样本：从总体中抽取的一部分个体，称为总体的一个样本。

5.次数：指某一事件在某一类别中出现的数目，又称为频数。

6.频率：又称相对次数，即某一事件发生的次数被总的事件数目除，亦即某一数据出现的次数被这一组数据总个数去除。

7.概率：某一事物或某一情在某一总体中出现的比率。

8.观测值：一旦确定了某个值。

就称这个值为某一变量的观测值。

9.参数：又称为总体参数，是描述一个总体情况的统计指标。

10.统计量：样本的那些特征值叫做统计量，又称特征值。

第二章统计图表1.统计表：是由纵横交叉的线条绘制，并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。

一般由表号、名称、标目、数字、表注组成。

2.统计图：一般采用直角坐标系，通常横轴表示事物的组别或自变量x，称为分类轴。

纵轴表示事物出现的次数或因变量，称为数值轴。

一般由图号及图题、图目、图尺、图形、图例、图组成。

3.简单次数分布表：依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表，适合数据个数和分布范围比较小的时候用。

4.分组次数分布表：数据量很大时，应该把所有的数据先划分在若干区间，然后将数据按其数值大小划归到相应区域的组别内，分别统计各个组别中包括的数据个数，再用列表的形式呈现出来，适合数据个数和分布范围比较大的时候用。

5.分组次数分布表的编制步骤：（1）求全距（2）定组距和组数（3）列出分组组距（4）登记次数（5）计算次数6.分组次数分布的意义：（1）优点：A．可将杂乱无章数据排列成序，以发现各数据的出现次数及分布状况。

B．可显示一组数据的集中情况和差异情况等。

（2）缺点：原始数据不见了，从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入，出现误差，即归组效应。

统计学名词解释

加权算数平均数指数：加权算术平均指数是以基期总量为权数对个体数量指标指数进行加权算术平均，以此计算的加权平均数指数等于数量指标综合指数，其公式为：K q=(∑k q p o q o)/(∑p o q o)加权调和平均数指数：加权调和平均数指数是以报告期总量为权数对个体质量指标指数进行加权调和平均，据此计算的加权平均数指数等于质量指标综合指数。

其公式为：K p=(∑p1q1)/[∑(1/k p)p o q o]统计量：也称为样本统计量，它是反映抽样总体数量特征的指标，即样本指标。

样本：从总体中抽取的部分单位组成的的集合成为样本参数：参数也称为总体参数，它是反映全及总体数量特征的指标推断统计学：是研究如何根据样本数据去判断总体数量特征的方法，它是在对样本数据进行描述的基础上，对统计总量的未知数量特征作出概念形式表述的判断。

调查方式：1、统计报表制度2、专门调查：（1）普查（2）重点调查（3）典型调查（4）抽样调查抽样调查原则：1、按随机性原则抽取样本2、根据部分调查的实际资料对调对象总体数量的数量特征作出估计3、抽样误差可以计算并可以控制标准差：是方差的平方根，它表示一组数据关于平均数的平均离散程度。

拒绝域：当检验统计量取某个区域C中的值时,我们拒绝原假设,则称区域C为拒绝域四分位差：也称中点分布，是一组75%位置上的四分位数与25%位置上的四分位数之差，也就是上四分位数（Q u）和下四分位数（Q I）的差，记为Q d，其计算公式为：Q d=Q u-Q t离散系数：也称为变异系数或标准差系数，通常表示为Vσ=σ/ x置信区间：置信区间是指由样本统计量所构造的总体参数的估计区间。

在统计学中，一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。

置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。

描述统计学：研究如何如何取得反映客观现象的数据，并通过图表形式对所收集的数据进行加工处理和显示，进而通过综合、概括与分析客观现象的规律性数量特征。

统计学名词解释

1.总体:根据研究的目的确定的同质观察单位的全体，更确切的说，它是同质的所有观察单位某种观察值的集合2.参数:描述总体数量特征的统计指标3.样本:从总体中随帆抽取部分观察单位，其测量结果的集合称为样本。

样本应具有代表性。

所谓有代表性的样本，是指用随机抽样方法获得的样本，该样本中所包含的观察单位数称该样样本的样本含量。

4.误差:泛指实测值与真值之差。

按其产生的原因的性质可粗分为随机误处和非随机误差，后者又可分为系统误差和非系统误差。

5.标准误:将样本统计量的标准差称为标准误，样本均数的标准差也称为均数的标准误(反应样本均数间的离散程度，也反应样本均数与相应总体均数间的差异，从而说明均数抽样误差的大小)6.医学参考值:指包括绝大多数的正常人的人体形态、功能和代谢产物等各种生理级生化指标常数，也叫正常值。

由于存在个体差异，生物医学数据并非常数，而是在一定的范围内波动，故又采用医学参考值范围作为判定正常或者异常的标准。

7.医学参考值范围：7：I类错误:指拒绝了实际上成立的HO，这类“弃真”的错误称为I型错误，其架率大小用a表示。

8.II类错误:指接受了实际上不成立的HO,这类“存伪”的误称为II 型错误，其频率大小用β。

9.系统误差:在实验过程中产生的误差，它的值或恒定不变，或遵循一定的变化规律，其产生的原因往往是克制的或可以掌握地。

10.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种的生理及生化指标常数，也成正常值。

11.随机误差:是一类不恒定、陆机变化的误差，由多种尚无法控制的因素引起。

在抽样过程中由于抽样的偶然性而出现的抽样误差。

脸机误差是不可避免的，在大量的重复测量中，或在抽样过程中，它可出现或大或小或正或负，呈一定规律的变化。

12.抽样误差:这种由个体变异产生，随机抽样造成的样本统计量与总体参数的差异。

13.P 值:概率又叫几率，是度量某一随机事件A发生可能性的大小的一个数值，(Λ)，P(A)越大，说明此时入事件发生的概率越大。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术，它几乎被应用到所有的学科检验领域。

本章首先介绍统计学的含义和应用领域，然后介绍统计数据的类型及其来源，最后介绍统计中常用的一些基本概念。

本章各节的主要内容和学习要点如下表所示。

概念：统计学，描述统计，推断统计。

统计在工商管理中的应用。

统计的其他应用领域。

概念：分类数据，顺序数据，数值型数据。

不同数据的特点。

概念：观测数据，实验数据。

概念：截面数据，时间序列数据。

统计数据的间接来源。

二手数据的特点。

概念：抽样调查，普查。

数据的间接来源。

数据的收集方法。

调查方案的内容。

概念。

抽样误差，非抽样误差。

统计数据的质量。

概念：总体，样本。

概念：参数，统计量。

概念：变量，分类变量，顺序变量，数值型变量，连续型变量，离散型变量。

二、主要术语1.统计学：收集、处理、分析、解释数据并从数据中得出结论的科学。

2.描述统计：研究数据收集、处理和描述的统计学分支。

3.推断统计：研究如何利用样本数据来推断总体特征的统计学分支。

4.分类数据：只能归于某一类别的非数字型数据。

5.顺序数据：只能归于某一有序类别的非数字型数据。

6.数值型数据：按数字尺度测量的观察值。

7.观测数据：通过调查或观测而收集到的数据。

8.实验数据：在实验中控制实验对象而收集到的数据。

9.截面数据：在相同或近似相同的时间点上收集的数据。

10.时间序列数据：在不同时间上收集到的数据。

11.抽样调查：从总体中随机抽取一部分单位作为样本进行调查，并根据样本调查结果来推断总体特征的数据收集方法。

12.普查：为特定目的而专门组织的全面调查。

13.总体：包含所研究的全部个体（数据）的集合。

14.样本：从总体中抽取的一部分元素的集合。

15.样本容量：也称样本量，是构成样本的元素数目。

16.参数：用来描述总体特征的概括性数字度量。

17.统计量：用来描述样本特征的概括性数字度量。

18.变量：说明现象某种特征的概念。

19.分类变量：说明事物类别的一个名称。

20.顺序变量：说明事物有序类别的一个名称。

21.数值型变量：说明事物数字特征的一个名称。

22.离散型变量：只能取可数值的变量。

23.连续型变量：可以在一个或多个区间中取任何值的变量。

四、习题答案1.D2.D3.A4.B5.A6.D7.C8.B9.A10.A11.C、12.C13.B14.A15.C16.D17.C18.A19.C20.D21.A22.C23.C24.B25.D26.C27.B28.D29.A30.D31.A32.B33.C34.A35.A36.A37.D38.B39.B40.C41.C42.D43.C44.D45.A46.B47.C48.A49.C50.D51.A52.C53.D54.A55.B第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。

本章首先介绍数据的预处理方法，然后介绍不同类型数据的整理与图示方法，最后介绍图表的合理使用问题。

本章各节的主要内容和学习要点如下表所示。

数据审核的目的。

原始数据和二手数据的审核内容。

数据排序的目的。

分类数据和数值型数据的排序方法。

数据筛选的目的。

用Excel进行数据筛选。

数据透视表的用途。

用Excel进行数据透视。

概念：频数，频数分布，比例，百分比，比率。

用Excel制作分类数据的频数分布表。

分类数据的图示：条形图，帕累托图，对比条形图，饼图。

概念：累积频数，累积频率。

累积频数分布图。

概念：数据分组，单变量值分组，组距分组，等距分组，不等距分组，组距，组中值。

频数分布表的制作步骤。

用Excel制作频数分布表。

直方图的绘制。

茎叶图的绘制。

箱线图的绘制。

直方图与条形图的区别。

茎叶图与直方图的区别。

线图的绘制。

散点图的绘制。

气泡图的绘制。

雷达图的绘制。

图形应包括的基本特征。

鉴别图形优劣的准则。

统计表的结构。

统计表的设计。

二、主要术语24.频数：落在某一特定类别（或组）中的数据个数。

25.频数分布：数据在各类别（或组）中的分配。

26.比例：一个样本（或总体）中各个部分的数据与全部数据之比。

27.比率：样本（或总体）中各不同类别数值之间的比值。

28.累积频数：将各有序类别或组的频数逐级累加起来得到的频数。

29.数据分组：根据统计研究的需要，将原始数据按照某种标准划分成不同的组别。

30.组距分组：将全部变量值依次划分为若干个区间，并将这一区间的变量值作为一组。

31.组距：一个组的上限与下限的差。

32.组中值：每一组的下限和上限之间的中点值，即组中值＝(下限值+上限值)/2。

33.直方图：用矩形的宽度和高度（即面积）来表示频数分布的图形。

34.茎叶图：由“茎”和“叶”两部分组成的、反应原始数据分布的图形。

35.箱线图：由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。

四、习题答案1.C2.A3.B4.C5.D6.B7.C 8.B9.B10.C11.A12.B13.B14.C15.C16.B17.D18.D19.C20.B21.C22.D23.D24.B25.D26.B27.B28.D29.D30.C31.B32.C33.C34.A35.B第3章数据的概括性度量一、学习指导数据分布的特征可以从三个方面进行描述：一是分布的集中趋势，反映各数据向其中心值靠拢或聚集的程度；二是分布的离散程度，反映各数据远离其中心值的趋势；三是分布的形状，反映数据分布偏斜程度和峰度。

本章将从数据的不同类型出发，分别介绍集中趋势测度值的计算方法、特点及其应用场合。

本章各节的主要内容和学习要点如下表所示。

概念：众数。

众数的特点。

概念：中位数，四分位数。

中位数和四分位数的特点。

中位数和四分位数的计算。

概念：平均数，简单平均数，加权平均数，几何平均数。

简单平均数和加权平均数的计算。

平均数的性质。

几何平均数的计算和应用场合。

众数、中位数和平均数在分布上的关系。

众数、中位数和平均数的特点及应用场合。

概念：异众比率。

异众比率的计算和应用场合。

概念：四分位差。

四分位差的计算和应用场合。

概念：极差，平均差，方差，标准差。

极差的计算和特点。

平均差的计算和特点。

样本方差和标准差的计算。

总体方差和标准差的计算。

概念：标准分数。

标准分数的计算和应用。

经验法则。

切比雪夫不等式。

概念：离散系数。

离散系数的计算。

离散系数的用途。

概念：偏态，偏态系数。

偏态系数的计算。

偏态系数数值的意义。

概念：峰态，峰态系数。

峰态系数的计算。

峰态系数数值的意义。

用Excel计算描述统计量。

Excel统计函数的应用。

二、主要术语和公式（一）主要术语M表示。

1.众数：一组数据中出现频数最多的变量值，用oM表示。

2.中位数：一组数据排序后处于中间位置上的变量值，用e3.四分位数：一组数据排序后处于25%和75%位置上的值。

4.平均数：一组数据相加后除以数据的个数而得到的结果。

G表示。

5.几何平均数：n个变量值乘积的n次方根，用m6.异众比率：非众数组的频数占总频数的比率。

7.四分位差：也称为内距或四分间距，上四分位数与下四分位数之差。

8.极差：也称全距，一组数据的最大值与最小值之差。

9.平均差：也称平均绝对离差，各变量值与其平均数离差绝对值的平均数。

10.方差：各变量值与其平均数离差平方的平均数。

11.标准差：方差的平方根。

12.标准分数：变量值与其平均数的离差除以标准差后的值。

13.离散系数：也称为变异系数，一组数据的标准差与其相应的平均数之比。

14.偏态：数据分布的不对称性。

15.偏态系数：对数据分布不对称性的度量值。

16.峰态：数据分布的平峰或尖峰程度。

17.峰态系数：对数据分布峰态的度量值。

（二）主要公式四、习题答案1.A2.C3.B4.C5.D6.B7.D8.A9.A10.C11.B12.C13.A14.B15.A16.B17.A18.B 19.C20.A21.B22.C23.C24.C25.C26.D27.A28.A29.B30.B31.A32.A33.B34.B35.A36.B37.A38.C39.B40.A41.A42.B43.B44.A45.B46.A47.C48.D49.B50.A51.C52.D53.B54.D55.B56.A57.B58.D59.A60.B61.C62.D63.A64.C65.D66.D67.C68.B69.D70.D71.A72.B73.D74.C75.A76.D77.D78.A79.A80.C81.D82.D83.A84.A85.A86.D第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一，它是在抽样及抽样分布的基础上，根据样本统计量来推断我们所关心的总体参数。

本章首先介绍抽样分布的有关知识，然后讨论参数估计的一般问题，最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。

本章各节的主要内容和学习要点如下表所示。

概念：简单随机抽样，简单随机样本，重复抽样，不重复抽样，分层抽样，系统抽样，整群抽样。

用Excel抽取简单随机样本。

概念：抽样分布，样本均值的抽样分布，样本比例的抽样分布，样本方差的抽样分布。

中心极限定理。

样本均值抽样分布的特征。

样本均值的抽样分布与总体分布的关系。

样本比例抽样分布的形式和特征。

样本方差抽样分布的形式。

概念：估计量，估计值。

概念：点估计，区间估计，置信区间，置信水平。

置信区间构建的原理。

置信区间的解释。

概念：无偏性，有效性，一致性。

正态总体、方差已知时的置信区间。

非正态总体、大样本时的置信区间。

用Excel计算给定α的正态分布的临界值。

正态总体、方差已知时的小样本置信区间。

正态总体、方差未知时的小样本置信区间。

用Excel计算给定α的t分布的临界值。

总体比例的置信区间。

总体方差的置信区间。

用Excel计算给定α的2χ分布的临界值。

样本容量的计算方法。

二、主要术语和公式（一）主要术语36.简单随机抽样：也称纯随机抽样，它是从含有N个元素的总体中，抽取n个元素作为样本，使得总体中的每一个元素都有相同的机会（概率）被抽中。

37.简单随机样本：从含有N个元素的总体中，抽取n个元素作为样本，使得总体中每一个样本量为n的样本都有相同的机会（概率）被抽中。

38.重复抽样：从总体中抽取一个元素后，把这个元素放回到总体中再抽取第二个元素，直至抽取n个元素为止。

39.不重复抽样：一个元素被抽中后不再放回总体，而是从所剩元素中抽取第二个元素，直到抽取n个元素为止。

40.分层抽样：也称分类抽样，它是在抽样之前先将总体的元素划分为若干层（类），然后从各个层中抽取一定数量的元素组成一个样本。

41.系统抽样：也称等距抽样或机械抽样，它是先将总体中的各元素按某种顺序排列，并按某种规则确定一个随机起点；然后，每隔一定的间隔抽取一个元素，直至抽取n个元素形成一个样本。