统计学基础知识考试重点

合集下载

统计学基础知识要点

统计学基础知识要点

第一章:导论1、什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。

统计方法可分为描述统计方法和推断统计方法。

2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。

按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。

按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。

按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。

3、举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含研究的全部个体的集合。

比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。

样本是从总体中抽取的一部分元素的集合。

比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

参数是用来描述总体特征的概括性数字度量。

比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。

统计量是用来描述样本特征的概括性数字度量。

比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。

变量是说明现象某种特征的概念。

比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集1、调查方案包括哪几个方面的内容?调查目的,是调查所要达到的具体目标。

调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。

调查项目和调查表,要解决的是调查的内容。

2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。

3、统计调查方式:抽样调查、普查、统计报表等。

统计学基础考试重点_保你不挂科

统计学基础考试重点_保你不挂科

基础知识第一章:导论1、什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。

统计方法可分为描述统计方法和推断统计方法。

2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。

按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。

按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。

按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。

3、举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含研究的全部个体的集合。

比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。

样本是从总体中抽取的一部分元素的集合。

比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

参数是用来描述总体特征的概括性数字度量。

比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。

统计量是用来描述样本特征的概括性数字度量。

比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。

变量是说明现象某种特征的概念。

比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集1、调查方案包括哪几个方面的内容?调查目的,是调查所要达到的具体目标。

调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。

调查项目和调查表,要解决的是调查的内容。

2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。

3、统计调查方式:抽样调查、普查、统计报表等。

统计学基础知识要点

统计学基础知识要点

统计学基础知识要点统计学是一门研究数据收集、分析和解释的学科,是许多学科和领域中必不可少的工具。

在本文中,将介绍统计学的基础知识要点,帮助读者理解统计学的基本概念和应用。

一、数据类型在统计学中,数据可以分为两种类型:定量数据和定性数据。

定量数据是以数值表示的,可进行数值计算和比较的数据,如身高、体重等;定性数据则是描述个体特征的非数值数据,如性别、颜色等。

了解数据类型对于选择合适的统计方法非常重要。

二、测量尺度测量尺度指的是衡量数据的方式,常见的测量尺度包括名义尺度、序数尺度、区间尺度和比率尺度。

名义尺度仅用于分类,如性别;序数尺度可以排序,但没有固定的数值差异,如教育程度;区间尺度具有固定的数值差异,但没有绝对零点,如温度;比率尺度具有固定的数值差异和绝对零点,如年龄。

三、描述统计学描述统计学是对数据进行整理、总结和描述的方法。

其中常见的统计量包括平均数、中位数、众数和标准差等。

平均数是一组数据的算术平均值,中位数是将一组数据按大小顺序排列后的中间值,众数是数据中出现频率最高的值,标准差衡量数据的离散程度。

四、概率与概率分布概率是用来描述随机事件发生可能性的数值,常用的表示方法是百分比或小数。

概率分布是描述随机变量可能取得各个值的概率的函数或表格。

常见的概率分布包括正态分布、均匀分布和泊松分布等。

五、参数估计与假设检验参数估计是根据样本数据来估计总体特征的方法,常见的参数估计方法包括点估计和区间估计。

假设检验是通过对样本数据进行统计推断来对总体假设进行验证的方法,常用的假设检验方法包括t检验和卡方检验等。

六、相关分析与回归分析相关分析用于研究两个变量之间的关系,可以通过计算相关系数来描述变量之间的相关程度。

回归分析是一种用于预测和解释因果关系的统计方法,可以建立变量之间的数学模型。

七、抽样与调查抽样是从总体中选择出样本的过程,通过对样本进行研究得出对总体的结论。

调查是一种常用的数据收集方法,可以通过问卷调查、访谈等方式获取数据。

自考00974统计学基础学习知识原理练习情况总结复习资料重要资料

自考00974统计学基础学习知识原理练习情况总结复习资料重要资料

00974统计学原理 章节基础知识 第一章:总论 1、统计的三基本方法:大量观察法,综合分析法,归纳推断法((可扩展未简答) 2、凯特乐将统计学的三个主要源泉:英国的政治学派,德国的国势学,法国的概率统计 3、“统计”一词的含义:统计包括三个含义:统计工作、统计资料和统计科学。

统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。

(简答) 4、统计信息的两大特征:数量性和总体性(多选、简答) 5、统计的三大职能:信息,咨询,监督 (多选) 6、四大计量尺度:定类尺度,定序尺度,定距尺度,定比尺度(重点前两个) 7、按度量层次低到高:定类尺度>定序尺度>定距尺度>定比尺度 8、区别总体和总体单位(选择,判断) 9、统计指标的的三大特性:总体性,数量性,综合性(多选) 10、区分变异和变量,变量又可以分为:连续变量和离散变量(多选) 第二章:统计资料的收集和整理 1.统计资料的三大特性:数量性,总体性,客观性(选择,填空) 2.总体性的定义是指统计是从整体上反映和分析事物数量特征,而不是着眼于个别事物,因为事物的本质和发展规律只有从整体上观察,才能作出正确的判断。

(判断) 3.原始资料的搜集方法 访问方法 观察方法 实验方法(多选) 4.统计调查的方式: 1)普查:专门组织进行一次性的全面调查(填空、多选) 2)抽样调查:最常用的方法 3)统计报表 4)重点调查:了解定义(选择)(多年都有考到) 5)典型调查 6.结论:统计方式是以普查为基础,抽样调查为主体(选择、判断) 7.统计调查方案的内容:(1) 调查目的:调查目的要符合客观实际,是任何一套方案首先要明确的问题,是行动的指南。

(2) 调查对象和调查单位:调查对象即总体,调查单位即总体中的个体。

(3) 调查项目:即指对调查单位所要登记的内容。

统计基础知识试题及答案

统计基础知识试题及答案

统计基础知识试题及答案一、单项选择题(每题2分,共10分)1. 统计学中,用于描述一组数据的集中趋势的统计量是:A. 方差B. 标准差C. 平均数D. 众数答案:C2. 在统计分析中,下列哪个指标不是描述数据离散程度的?A. 极差B. 标准差C. 变异系数D. 平均数答案:D3. 以下哪个选项不是统计图的类型?A. 条形图B. 折线图C. 饼图D. 流程图答案:D4. 总体参数和样本统计量的主要区别在于:A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 总体参数和样本统计量都是固定的D. 总体参数和样本统计量都是变化的答案:A5. 相关系数的取值范围是:A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A二、多项选择题(每题3分,共15分)1. 以下哪些是统计学中常用的平均数类型?A. 算术平均数B. 加权平均数C. 中位数D. 众数答案:A, B, C2. 统计学中,哪些因素会影响数据的离散程度?A. 数据的极值B. 数据的分布范围C. 数据的个数D. 数据的平均值答案:A, B3. 以下哪些是统计学中常用的数据整理方法?A. 频数分布表B. 箱线图C. 散点图D. 直方图答案:A, B, D4. 统计学中,哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 标准差D. 方差答案:A, B5. 在统计分析中,以下哪些是假设检验的步骤?A. 建立假设B. 选择显著性水平C. 计算检验统计量D. 做出决策答案:A, B, C, D三、判断题(每题2分,共10分)1. 统计学中的样本容量是指样本中包含的个体数目。

(对)2. 标准差越大,说明数据的集中程度越高。

(错)3. 相关系数的绝对值越接近1,表示变量之间的相关性越强。

(对)4. 统计图中的条形图可以清晰地展示数据随时间的变化趋势。

(错)5. 统计学中的中位数是将数据从小到大排序后位于中间位置的数值。

统计基础知识试题及答案

统计基础知识试题及答案

统计基础知识试题及答案统计学是一门重要的学科,它研究数据的收集、整理、分析和解释。

在实际应用中,统计学扮演着至关重要的角色。

本文将提供一些统计基础知识的试题及答案,帮助读者巩固对统计学的理解。

一、选择题1. 下列哪个不是概率论的基本概念?A. 样本空间B. 频数C. 随机事件D. 概率答案:B. 频数2. 关于统计量的说法,以下正确的是:A. 统计量是样本的函数B. 统计量是参数的函数C. 统计量是总体的函数D. 统计量是随机变量答案:A. 统计量是样本的函数3. 下列哪个图形可以用于展示分类数据的分布情况?A. 饼图B. 折线图C. 散点图D. 直方图答案:A. 饼图4. 两个随机事件A和B独立,则以下哪个等式成立?A. P(A ∪ B) = P(A) + P(B)B. P(A ∩ B) = P(A) + P(B)C. P(A ∪ B) = P(A) × P(B)D. P(A ∩ B) = P(A) × P(B)答案:C. P(A ∪ B) = P(A) × P(B)5. 某种产品的质量检测结果符合正态分布,标准差为2。

如果要求保证95%的产品质量在合格范围内,该合格范围应为均值的多少倍标准差之内?A. 1B. 1.96C. 2D. 2.58答案:D. 2.58二、填空题1. 抽样误差是指样本统计量与总体参数之间的差异。

抽样误差通常会随着样本量的增加而(减小)。

2. 点估计是使用一个统计量来估计总体参数,区间估计是使用一个(区间)来估计总体参数。

3. 在正态分布的情况下,68%的数据落在(均值±1个标准差)范围内。

4. 样本比例的抽样分布是以(二项分布)为基础的。

5. 在两个统计量中进行对比时,一般会比较它们的(标准误差),而不是它们的原始值。

三、解答题1. 请解释什么是中心极限定理?中心极限定理的意义是什么?答案:中心极限定理指的是,对于任意总体,无论它的分布是什么样的,当样本量足够大时,样本均值的抽样分布将近似服从正态分布。

事业单位招聘考试统计学基础知识试题及答案解析

事业单位招聘考试统计学基础知识试题及答案解析

事业单位招聘考试统计学基础知识试题及答案解析一、选择题1. 统计学的主要任务是什么?- A. 收集数据- B. 分析数据- C. 描述数据- D. 解释数据正确答案:D. 解释数据2. 下列哪个不是统计学的基本概念?- A. 样本- B. 平均值- C. 方差- D. 误差正确答案:D. 误差3. 抽样误差是指什么?- A. 样本数量太小- B. 样本选择方式不正确- C. 样本数据收集错误- D. 样本数据与总体数据不一致正确答案:D. 样本数据与总体数据不一致4. 统计推断的基本方法是什么?- A. 假设检验- B. 相关分析- C. 回归分析- D. 面板数据分析正确答案:A. 假设检验二、填空题1. 统计学中的"频率"是指某一事件发生的________。

正确答案:次数或概率2. 二项分布的概率质量函数是________。

正确答案:P(X=k) = C<sub>n</sub><sup>k</sup> *p<sup>k</sup> * (1-p)<sup>n-k</sup>三、解答题1. 请简要说明抽样方法中的随机抽样是什么,并列举一个随机抽样的具体步骤。

随机抽样是指从总体中按照一定的概率分布,完全随机地抽取样本的方法。

具体步骤如下:- 步骤1:确定总体和抽样框架。

- 步骤2:确定抽样单位和抽样量。

- 步骤3:使用随机数表、随机数生成器等方法,随机选取样本。

- 步骤4:对抽样结果进行统计分析。

2. 解释相关系数的含义,并说明其取值范围。

相关系数是用来衡量两个变量之间关系强度及方向的统计量。

取值范围在-1到1之间,表示以下含义:- 当相关系数为正值时,说明两个变量之间存在正相关关系,即随着一个变量的增加,另一个变量也会增加;- 当相关系数为负值时,说明两个变量之间存在负相关关系,即随着一个变量的增加,另一个变量会减少;- 当相关系数为0时,说明两个变量之间不存在线性关系。

中级统计师考试重点概括-统计学基础知识

中级统计师考试重点概括-统计学基础知识

中继续参与随后的抽样过程;无放回抽样(不重复抽样)在一个单位被选入样本后,不再放
回总体参与随后的抽样过程。
5
简单随机抽样(最基本的抽样方法):数学性质简单,理论最为成熟,其他抽样方法都 是在它的基础上发展起来的。
【特点】简单、直观,用样本统计量对目标量进行估计及计算估计量误差均比较方便。 【适用】在规模较大的调查中很少直接采用简单随机抽样,一般是把这种方法和其他抽 样方法结合起来使用。 分层抽样(类型抽样),是首先将抽样单位按某种特征或某种规则划分为不同的层(组), 然后按照等比例或最优比例的方式从每一层(组)中独立、随机地抽取样本,最后将各层的 样本结合起来对总体的目标量进行估计。 整群抽样是先将总体分为 R 个群(即次级单位或子总体),每个群包含若干总体单位; 然后按某种方式从中随机抽取 r 个群,再对抽中的群中所有单位都进行调查的一种抽样方 式。 系统抽样(等距抽样),它是将总体 N 个单位按某种顺序排列,按规则确定一个随机 起点,再每隔一定间隔逐个抽取样本单位的抽样方法。典型的系统抽样是先从数字 1-k 之间 随机抽取一个数字 r 作为初始单位,以后依次取 r+k,r+2k,……。 ⑵非概率抽样 不满足概率抽样要求的抽样都被归为非概率抽样。 没有完全按照随机原则选取样本单位,其中单个单位被选中的概率是不可知的,样本统 计量的分布不确定,无法计算抽样误差,也无法使用样本的结果对总体相应的参数进行推断。 【特点】非概率抽样不能保证抽出来的部分单位(样本单位)对总体单位的代表性,不 能够由样本的特征准确地推断总体的特征,但该种方法简单、经济,所以也是人们常用的方 法。 常用的非概率抽样方式:4 种 ①方便抽样 方便抽样(便利抽样、偶遇抽样)是纯粹以方便着眼点的抽样方法,事先并不预定样本, 调查过程中由调查员依据方便的原则自行确定人抽样本的单位,碰到即问或被调查者主动回 答问题。 ②判断抽样 判断抽样是调查者根据主观经验和判断从总体中选取有代表性的单位构成样本的一种 非概率抽样方法,它不能获得估计值的精度,其精度取决于抽样者的经验.适用于总体单位 极不相同而样本容量又很小的情况。 ③配额抽样 配额抽样类似于概率抽样中的分层抽样,是非概率抽样方法中最常用的一种抽样方法, 其操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本中,使得样本 的结构和总体的结构类似。 ④雪球抽样 雪球抽样(滚雪球抽样)是先找到最初的样本单位,然后根据他们提供的信息去获得新 的样本单位;这种过程不断继续,直到完成规定的样本容量为止。 滚雪球抽样往往用于对稀少的特定群体的调查。 ⑶统计报表 统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等),自 上而下地统一布置、自下而上地逐级提供基本统计资料的一种调查方式。 国家利用它定期地取得全社会的国民经济与社会发展情况的基本统计资料,是国家取得 调查资料的方法之一。这种调查方法是在过去中央计划管理体制下形成的,至今在官方统计 的经常调查中依然发挥着一定的作用。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学基础知识考试重点第一章统计和数据第二章●统计是用来处理数据的,是关于数据的一门学问。

1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。

2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。

4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。

5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。

●定性变量包括分类变量和顺序变量。

●只反映现象分类特征的变量称分类变量。

分类变量没有数值特征,所以不能对其数据进行数学运算。

●如果类别具有一定的顺序,这样的变量称为顺序变量。

顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。

7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。

●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。

其计量精度远远高于定性数据。

在统计学研究中,数值型数据有着最广泛的用途。

8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。

10、实验数据:一般是在科学实验环境下取得的数据。

11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。

12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。

●运用实验法时,实验组和对照组的产生应当是随机的。

13、数据的间接来源:(1)公开出版的统计数据(2)尚未公开发表的统计数据14、搜集数据的方法:(1)普查(2)抽样调查(3)统计报表(4)重点调查(5)典型调查15、普查:是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会现象总量。

●普查适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。

16、普查的特点:(1)是一种全面调查,具有资料包括范围全面、详尽、系统的优点。

(2)是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一般不宜经常举行。

17、抽样调查的特点:(1)样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。

(2)能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。

(3)在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。

18、在实际调查中抽样的方法:(1)概率抽样(2)非概率抽样(方便抽样、判断抽样、配额抽样、雪球抽样)19、常用的概率抽样形式有:(1)简单随机抽样(2)分层抽样(3)整群抽样(4)系统抽样20、分层抽样:是先将总体各单位按主要标志加以分层,然后在每一层内进行抽样。

21、系统抽样:又称等距抽样,是在总体的名录框中每隔一定距离抽选一个被调查者。

22、统计报表:是按照国家统一规定的调查要求与文件自下而上的提供统计资料的一种调查方式。

23、统计报表按照报送范围分为:(1)全面报表(2)非全面报表24、统计报表的内容包括:(1)表式(2)填表说明25、重点调查:是在调查对象中选择一部分对全局具有决定性作用的重点单位进行的一种非全面调查。

●当调查的任务只要求掌握事物的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。

26、典型调查:是一种非全面的调查,是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。

27、典型调查的作用:(1)补充全面调查的不足(2)在一定条件下可以验证全面调查数据的真实性●典型调查具有灵活机动、通过少数典型即可取得深入详实的统计资料的优点,但是易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。

第二章数据描述1、定性数据的图形表示有:(1)饼图(2)条形图(3)环形图●饼图是利用圆形及圆内扇形面积来表示数值大小的图形。

●条形图是用宽度相同的条形的高度或长度来表述数据多少的图形。

●如果想比较不同变量之间的结构差异,可以通过环形图来实现。

●定性数据的图示表示方法,也都适用于定量数据。

但定量数据还有一些特定的图示方法,它们并不适用于定性数据。

2、频数:是指频数分布表中落在某一特定类别的数据个数。

3、生成定量数据的频数分布表的步骤:(1)对数据进行分组(2)确定组距(3)统计出各组的频数及频数分布表●组距是每个组变量值中的最大值与最小值之差,也就是上限与下限之差。

4、在确定组距时应掌握的原则:(1)要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。

(2)要能准确地清晰地反映总体单位的分布特征。

●在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,一般采用不等距分组。

●在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内。

5、定量数据的图形表示有:(1)直方图(2)折线图(3)散点图(4)茎叶图(数据的分布形状及数据的离散状况)(5)箱线图(6)气泡图(3个变量的关系)(7)雷达图(多个变量)●直方图的横坐标代表变量分组,纵坐标代表各变量值出现的频数。

6、统计表的五个组成部分:(1)表头(2)行标题(3)列标题(4)数字资料(5)表外附加7、数据的分布特征:(1)集中趋势,即一组组数据的数值向其中心值的靠拢程度(2)离散程度,即一组数据的各个数值远离其中心的趋势和程度8、定性数据的集中趋势常用的计算方法:(1)百分比(2)中位数(3)众数9、中位数:是数据按照大小排列之后位于中间的那个数。

如果样本量为偶数,则是中间两个数的平均。

10、众数:就是数据中出现次数或出现频率最多的数值。

11、反映定量数据特征的统计量有:反映数据集中趋势的水平度量:(1)平均数(2)中位数(3)众数(4)分位数反映数据离散程度的差异度量:(1)极差(2)四分位差(3)标准差(4)方差●平均数易为多数人理解和接受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响。

中位数和众数提供的信息不像平均数那样多,但具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,中位数和众数的代表性要比平均数好。

12、极差:又称全距,是一组数据中的最大值和最小值之差。

●极差非常容易受数据中极端值的影响。

●方差用2σ表示,总体标准差用σ表示,样本标准差用s 表示,离散系数用υ表示,标准分数用Z 表示。

●标准差是方差的平方根,它与方差相比更具量纲性。

●在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。

反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。

●标准差的大小会受到数据本身数值大小的影响。

两个数列的标准差相同,但是两数列的差异程度却不同。

为了更准确地反映差异程度,要计算离散系数。

13、离散系数:是将一组数据的标准差除以其均值,用来测度数据离散程度的相对数。

s ==xσυμ标准差或(均值★14、标准分数:是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置。

z i i x x s-==变量值-平均数标准差★15、偏度系数:SK 越大,表示数据分布的偏斜程度越大。

当SK=0即为正态分布,SK>0,右偏或正偏;SK<0左偏或负偏。

16、峰度系数K:K=0,为正态分布;K>0越尖,K<0越平。

第三章参数估计1、总体分布:是总体中所有观测值所形成的分布。

2、总体参数:是对总体特征的某个概括性的度量。

3、总体参数指标有:(1)总体平均数(μ)(2)总体方差(2σ)(3)总体比例(π)等。

●统计量是样本的函数。

构成统计量的函数中不能包含未知因素。

4、样本统计量指标有:(1)样本均值(x )(2)样本方差(2s )(3)样本比例(p )●统计量的概率分布构成了推断总体参数的理论基础。

5、关于样本均值的抽样分布:★(1)设总体共有N 个元素,从中随机抽取一个容量为n 的样本,在重置抽样时,共有n N 种抽法;在不重复抽样时,共有)!(!!n N n N C n N -=个样本。

(2)样本均值的抽样分布就是指所有可能抽出来的样本x 的分布。

(3)样本均值的均值就是总体均值,即μ=)(x E 。

★(4)重置抽样时,样本均值的标准差为总体标准差σ的n 1,即nx σσ=;不重置抽样时,样本均值的方差为122--=N n N n xσσ。

(5)当总体服从正态分布时,样本均值一定服从正态分布,即有:X ~),(2σμN 时,x ~),(2n N σμ。

(6)若总体为未知的非正态分布时,只要样本容量n 足够大(通常要求n ≥30),样本均值x 仍会接近正态分布,其分布的期望值为总体均值,样本方差为总体方差的n1。

(7)如果总体不是正态分布,当n 为小样本时(通常n <30),样本均值的分布则不服从正态分布。

★6、关于样本比例的抽样分布:(1)当样本容量比较大时,样本比率p 近似服从正态分布,且有p 的数学期望就是总体比率,即μ=)(p E 。

(2)在重置抽样时,p 的方差为n p )1(2ππσ-=。

(3)在不重置抽样时,p 的方差为1)1(2---=N n N n p ππσ。

(4)在重置抽样时,p 的分布为p ~)1(,(n N πππ-(5)在不重置抽样时,p 的分布为p ~1)1(,(---N n N n N πππ★7、关于统计量的标准误差:(1)统计量的标准误差用于衡量样本统计量的离散程度。

在参数估计中,用于衡量样本统计量与总体参数之间差距。

(2)样本均值的标准误计算公式为:nx σσ=(3)当总体标准差σ未知时,可用样本标准差s 代替计算,这时计算的标准误差称为估计标准误差。

(4)样本比例的标准误计算公式为:np )1(ππσ-=(5)当总体比例的方差)1(ππ-未知时,可用样本比例的方差)1(p p -代替。

8、参数估计:就是用样本统计量去估计未知的总体参数。

9、用样本统计量估计总体参数的两种方法:(1)点估计(2)区间估计10、常用的点估计有:(1)用样本均值x 估计总体均值μ(2)用样本比例p 估计总体比例π(3)用样本方差2s 估计总体方差2σ11、区间估计:是包括样本统计量在内的一个区间,该区间通常是由样本统计量加减估计标准误差得到的。

相关文档
最新文档