应用统计学期末总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.什么是样本?它的特点有哪些?
答:样本是从全及总体中随机抽取出来,作为代表这一总体的部分个体组成的子集成为样本。
样本有以下特点:1.样本中的每个个体都必须取自于全及总体的内部;
2.从一个全及总体中可以抽取许多个不同的样本。
3.样本是全及总体的代表
4.样本的客观性
6.什么是变量?它的特点有哪些?它的主要分类有几种?
答:广义上的变量是指对客观现象进行计量的概念,包括数字变量和属性变量两种。狭义上的变量仅指可用具体数字表示取值的数字变量。
变量具有以下特点:1、变量是可变化的量,是用于研究总体和个体具有属性变异与数值变异的量化概念;2、变量是一个具有量化性质的概念或名称,他不是具体的数字。3、变量的取值有两个方面,一是在时间上的取值,二是在空间上的取值。
变量的分类有以下几种:1.变量按其取值是否可用数字表示分为属性变量和数字变量;2.变量按其取值是否连续,可分为离散变量和连续变量;3.变量按其变动是否具有确定性,可分为确定性变量和随机变量。4.变量按其在因果关系中所处的位置,可分为自变量和因变量。5.变量按其是否由研究对象体系范围内决定的,可分为内生变量和外生变量。6.变量按其取值是否具有客观性,可分为实在变量和虚拟变量。
9.什么是统计指标?他的测度尺度有哪些?
答:用来测度统计活动研究对象某种特征数量的概念称为统计指标,统计指标的测度尺度有定类尺度、定序尺度、定距尺度和定比尺度四种。其中四种测度计量尺度的测量层次是依次递进的,定类尺度是最粗略的测度计量尺度,而定比尺度却是最精确的测度计量尺度。
2.简述数据调查的一般程序。
答:数据调查是一项非常复杂而细致的工作。其工作程序主要由制定数据调查的方案,现场观察登记取得数据以及数据的整理与显示三个环节组成。其中数据调查方案的制定又包括:1.确定调查数据的目的2.确定调查对象和调查单位3.确定调查项目和调查表4.确定调查时间和调查期限5.调查的组织实施
3.抽样调查的样本抽取方式主要有哪几种?各有什么特点?各适用于什么场合?
答:(1) 简单随机抽样(也叫纯随机抽样)。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
(2) 等距抽样(也叫系统抽样)。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随
机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无
关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。
(3) 类型抽样(也叫分层抽样)。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
(4) 整群抽样。就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或
者不适宜单个地抽选调查样本的情况下,可采用这种方式。
10.什么是单值分类?什么是组距分类?他们各在什么场合下应用?
答:如果作为分类依据的个体项目只能取很少的几个数值,那么就可以将每个不同的取值作为一类,分类项目有几个不同的取值就可以分成多少类,这种分类叫单值分类。如果作为分类依据的个体项目的不同取值个数很多,那么就可以将该个体项目范围划分成若干个不同数值的区间,在同一区间内取值的个体为一类,一共划分了多少区间就有多少类。这种分类称为组距分类。对于个体项目的取值个数多的采用组距分组,对于个体项目的取值个数少的采用单值分组。
1.什么是次数分布?构成次数分布的要素有哪些?显示次数分布的方法有几种?
答:观测变量的各个不同数值及每个不同数值的出现次数的顺序排列,称为变量的次数分布。各组变量值和各组次数或各组频率是次数分布表的两个必不可少的要素。显示次数分布的方法有:表示法,图示法,图示法又分为直方图,折线图和曲线图。
2.总体次数分布和样本次数分布有什么不同?二者有何联系?
答:总体次数分布是观测变量在总体中全部不同取值及其出现次数的顺序列示,而样本次数分布则是样本中各个不同数值及其出现次数的顺序列示。总体次数分布通常都是未知的,而样本次数分布则可以通过队抽样观测数据的整理而得出。样本次数分布式总体次数分布的一个代表,可以用来估计未知的总体次数分布。
1.在平均指标中哪些是数值平均数?哪些是位置平均数?
答:数值平均数有:算术平均数、几何平均数、调和平均数。
位置平均数有:中位数、众数。
2.测量变量分布中心有何意义?测度标准都有哪些?各有什么特点?均值,中位
数和众数之间有什么关系?
答:1、随机变量的分布中心是随机变量一切取值的一个代表,可以用来反映其数值的一般水平。
2、随机变量的分布中心可以揭示随机变量一切取值的次数分布在直角坐标系内的集中位置,可以用来反映随机变量分布密度曲线的中心位置,即对称中心或尖峰位置。
用来测度随机变量次数分布中心的指标可以有多种,其中在统计分析推断中常用的主要有算术平均数、中位数和众数等几种。
1、算术平均数
算术平均数又称算术均值,是随机变量的所有观测值总和与观测值个数的比值。
2、中位数
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。
从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。
3、众数
众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。
若资料是对称分布,则众数、中位数、均值相等。若数据足够多,而且次数分布适度偏斜情况下,均值,中位数和众数三者间有较固定的关系。不论是在右偏还是左偏。中位数始终居于均值和众数之间,左偏情况则是:平均数<中位数<众数。右偏则是:众数<中位数<平均数
4.测度变量取值的散布程度有何意义?测度指标都有哪些?各有什么特
点?有了极差、平均差和标准差,为什么还要计算离散系数?
答:随机变量各取值之间的离散程度是随机变量次数分布的另一个重要特征,对其进行测定也有十分重要的意义。首先,通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小,从而也就可以反映分布中心指标对各个观测变量值代表性的高低。其次,通过对随机变量取值之间离散程度的测定,可以反映随机变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要有极差、平均差、标准差等几种。极差、平均差、标准差的特点:
极差是指一组数据内的最大值和最小值之间的差异。
平均差是说明集中趋势的,标准差是说明一组数据的离中趋势的。
极差越大,平均差的代表性越小,反之亦然;标准差越大,平均差的代表性越小,反之亦然。
由于二变量的极差,平均数和标准差各自有不同的数量级和不同的量纲,难以直接对比,所以就要计算各自的变异系数进行比较。
3.什么是重复抽样?什么是不重复抽样?二者区别是什么?
答:重复抽样是:每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。不重复抽样:每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。总体每经一次抽样,其样品单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。二者的