统计学第六版课后思考题整理大全

统计学第六版课后思考题整理大全
统计学第六版课后思考题整理大全

第一章

1.2解释描述统计和推断统计

描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

第二章

1.3+1.4统计学的类型和不同类型的特点

统计数据;按所采用的计量尺度不同分;

(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;

(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;

观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

2.1什么是二手资料?使用二手资料应注意什么问题

与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。

2.2比较概率抽样和非概率抽样的特点,指出各自适用情况

概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。

2.3+2.4 除了自填式,面访式和电话式还有什么搜集数据的办法?自填式,面访式和电话式各自的长处和弱点

还有试验式和观察式等

自填式;

优点:1调查组织者管理容易2成本低,可进行大规模调查3对被调查者,可选择方便时间答卷,减少回答敏感问题压力。

缺点:1返回率低2不适合结构复杂的问卷,调查内容有限3调查周期长4在数据搜集过程中遇见问题不能及时调整。

面访式;

优点:1回答率高2数据质量高3在调查过程中遇见问题可以及时调整。

缺点:1成本比较高2搜集数据的方式对调查过程的质量控制有一定难度3对于敏感问题,被访者会有压力。

电话式;

优点:1速度快2对调查员比较安全3对访问过程的控制比较容易。

缺点:1实施地区有限2调查时间不能过长3使用的问卷要简单4被访者不愿回答时,不易劝服。

第三章

3.1数据预处理内容(不太重要)

数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。

3.2分类数据和顺序数据的整理和图示方法各有哪些

分类数据:制作频数分布表,用比例,百分比,比率等进行描述性分析。可用条形图,帕累托图和饼图进行图示分析。

顺序数据:制作频数分布表,用比例,百分比,比率。累计频数和累计频率等进行描述性分析。可用条形图,帕累托图和饼图,累计频数分布图和环形图进行图示分析。

3.3数据型数据的分组方法和步骤

分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。

分组步骤:1确定组数2确定各组组距3根据分组整理成频数分布表

3.4直方图和条形图的区别(可画图展示)

1条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,2直方图各矩形连续排列,条形图分开排列,3条形图主要展示分类数据,直方图主要展示数值型数据。

第四章

4.1一组数据的分布特征可以从哪几个方面进行测度?

数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。

4.2怎样理解平均数在统计学中的地位?

平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据。

4.3简述四分位数的计算方法。(应该不会单独出题,放在画箱线图里)

四分位数是一组数据排序后处于25%和75%位置上的值。根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。

4.4对于比率数据的平均为什么采用几何平均?

在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。从公式

∏+=+=n

1i i n G G 11)()(中也可看出,G 就是平均增长率。

第七章

7.1 解释估计量和估计值

估计量:用于估计总体参数的随机变量

估计值:估计参数时计算出来的统计量的具体值

7.2 简述评价估计的标准

评价估计量的标准:

无偏性:估计量抽样分布的数学期望等于被估计的总体参数

有效性:对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数

7.3 怎样理解置信区间

置信区间:由样本统计量所构造的总体参数的估计区间

7.4 解释95%的置信区间

95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 (95%的置信水平:构造的可能样本中包含总体真值的次数占到95%)

(18、阐述点估计和区间估计的内容。

点估计:概念:以样本指标直接估计总体参数。

优点:简单、具体明确

缺点:无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况。 区间估计:概念:根据样本指标和抽样误差来推断总体指标可能范围。在点估计的基础上,给出存一定的置信程度下确定总体参数取值区间的方法和过程。 )

第八章(看笔记可能会超出)

8.1假设检验和参数估计有什么相同点和不同点?

答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

8.2什么是假设检验中的显著性水平?统计显著是什么意思?

答:显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝H 0,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。

8.3什么是假设检验中的两类错误?

答:假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H 0为真却

被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。

8.4两类错误之间存在什么样的数量关系?

答:在假设检验中,α与β是此消彼长的关系。如果减小α错误,就会增大犯β错误的机会,若减小β错误,也会增大犯α错误的机会。

8.5解释假设检验中的P值

答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。)

8.6显著性水平与P值有何区别

答:显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平

8.7假设检验依据的基本原理是什么?

答:假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以作出是否拒绝原假设的决定。

8.8你认为单侧检验中原假设与备择假设的方向如何确定?

答:将研究者想收集证据予以支持的假设作为备择假设H1,将研究者想收集证据证明其不正确的假设作为原假设H0,先确立备择假设H1,备择假设的方向与想要证明其正确性的方向一致,原假设与备择假设是互斥的,等号总在原假设上。(举例说明,如下:“一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立”,则备择假设的方向为“>”(寿命延长),建立的原假设与备择假设应为H0:μ≤1500,H1:μ>1500.又例,“一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立”,则备择假设的方向为“<”(废品率降低),建立的原假设与备择假设应为H0: μ≥2% ,H1: μ< 2%.)

第十章

10.1什么是方差分析?它研究的是什么?

答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。

10.2要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?

答:作两两比较十分繁琐,进行检验的次数较多,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加。而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

10.3方差分析包括哪些类型?它们有何区别?

答:方差分析可分为单因素方差分析和双因素方差分析。区别:单因素方差分析研究的是

一个分类型自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量。

10.4方差分析中有哪些基本假定?

答:方差分析中有三个基本假定:

(1) 每个总体都应服从正态分布

(2) 各个总体的方差σ2必须相同(偏离的平均距每个总体偏离均值的程度相同) (3) 观测值是独立的 第十一章

(人没来看书β2个系数的计算 点预测)

11.1 解释相关关系的含义,说明相关关系的特点

变量之间存在的不确定的数量关系为相关关系

相关关系特点:一个变量的取值不能由另外一个变量确定,但变量x 取某个值时,变量y 的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。

(相关关系的特点:⑴变量之间确实存在着数量上的依存关系;⑵变量之间数量上的关系是不确定、不严格的依存关系)

11.2+11.3 相关分析主要解决哪些问题?相关分析中有哪些基本假定?

相关分析就是对两个变量之间线性关系的描述与变量,它要解决的问题包括:

1.变量之间是否有存在关系?

2.如果存在关系,它们之间是什么样的关系?

3.变量之间的关系强度如何?

4.样本所反映的变量之间的关系能否代表总体变量之间的关系

为解决这些问题,在进行相关分析时,对总体主要有以下两个假定:

1.两个变量之间都是线性关系

2.两个变量都是随机变量

11.4 简述相关系数的性质

(1)r 的取值范围在-1到1之间,即-1《r 《1

(2)r 具有对称性;

(3)r 数值大小与x 和y 的原点及尺度无关

(4)r 仅仅是x 和y 之间线性关系的一个度量,它不能用于描述非线性关系;

(5)r 虽然是两个变量之间线性关系的一个度量,却不一定意味着x 与y 一定有因果关系

(6)若X 与Y 统计上独立,则它们之间的相关系数为零;但r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性。

第十二章

(没讲 选做)

12.1 解释多元回归模型、多元回归方程、估计的多元回归方程的含义(可以写方程) 回归模型是对统计关系进行定量描述的一种数学模型.

回归方程是对变量之间统计关系进行定量描述的一种数学表达式.指具有相关的随机变量和固定变量之间关系的方程.主要有回归直线方程.

当几个变量有多重共线性时,多元回归分析得出的回归方程,靠手算精确值计算量太大,所_

x

以只能得出估计值(不确定答案)

12.2多元线性回归模型中有哪些基本假定

一元线性回归模型通常有以下几条基本的假定:⑴变量之间存在线性关系;⑵在重复抽样中,自变量x的取值是固定的;⑶误差项ε是一个期望为零的随机变量;⑷)对于所有的x 值,误差项?的方差?都相同;⑸误差项?是一个服从正态分布的随机变量,且相互独立。

12.3解释多重判定系数和调整的多重判定系数的含义和作用

(1)多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反应了在因变量y的变差中被估计的回归方程所解释的比例。

(2)调整的多重判定系数:用样本容量n和自变量的个数k去调整R2得到,这使得Ra2的值永远小于R2且Ra2的值不会由于模型中自变量个数的增加而越来越接近1,避免增加自变量而高估多重判定系数

12.4 解释多重共线性的含义

解释变量之间存在完全或接近的线性关系就称之为多重共线性。如果存在的是接近的线性关系就叫不完全的多重共线性。

第十三章

13.1简述时间序列的构成要素。

时间序列的构成要素:趋势,季节性,周期性,随机性

13.2利用增长率分析时间序列时应注意哪些问题。

(1)当时间序列中的观察值出现0或负数时,不宜计算增长率;

(2)不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大。

13.3简述平稳序列和非平稳序列的含义。

1.平稳序列(stationary series)

基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的

2.非平稳序列 (non-stationary series)

是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

13.4简述时间序列的预测程序。

第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。

第二步:找出适合此类时间序列的预测方法。

第三步:对可能的预测方法进行评估,以确定最佳预测方案。

第四步:利用最佳预测方案进行预测。

13.5简述指数平滑法的含义。

1.是加权平均的一种特殊形式

2.对过去的观察值加权平均进行预测的一种方法

3.观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑

4.有一次指数平滑、二次指数平滑、三次指数平滑等

5.该方法使用第T+1期的预测值等于T期的实际观测值与第T期预测值的加权平均值

6.一次指数平滑法也可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势

第十四章

(简答看笔记选)

14.1什么是指数?它有哪些性质?

广义:两个数值对比形成的相对数。

狭义:用于反映复杂总体在不同场合下综合变动的一种特殊相对数。

特点:相对性、综合性、平均性

14.2什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?

同度量因素是指若干度量单位不同,不能直接相加的指标,过度到可以加总和比较而使用的媒介因素。在编制总指数时,把不能相加的因素过度到能够相加的总体的媒介因素。同度量因素在计算总指数的过程中,对各因素起着权衡轻重的作用,所以也叫权数(不确定)

14.3拉氏指数与帕氏指数各有什么特点?

拉氏指数中的同度量因素是基期(拉氏指数中同度量因素固定在基期);派氏指数中的同度量因素是报告期期

拉氏指数:由于拉氏指数是以基期变量值为权数,可以消除权数变动对指数的影响,从而使不同时期的指数具有可比性;物价指数是在假定销售量不变的情况下,报告期价格的变动水平,不能反映出消费量的变化;拉式价格指数实际中应用得很少,拉式质量指数实际中应用得较多。

帕氏指数:它是用报告期物量加权来计算物价指数,不能消除权数变动对指数的影响,不同时期的指数缺乏可比性,但可以同时反映出价格和消费结构的变化,具有比较明确的经济意义;由于包含了价格的变动,说明是按调整后的价格来测定物量的综合变动,这本身不符合物量指数的目的;帕氏数量指数实际中应用得较少,帕氏质量指数实际中应用得较多。

(同度量因素固定时期的方法是:(1)、编制质量指标综合指数时,作为同度量因素的数量指标固定在报告期.(2)、编制数量指标综合指数时,作为同度量因素的质量指标固定在基期.)

14.4加权平均指数与加权综合指数有何区别与联系?

平均数指数必须在特定权数的条件下才能成为综合指数的变形。加权算术平均数指数要成为综合指数的变形,必须在基期总值(p0q0)为权数的特定条件下;加权调和平均数指数要成为综合指数的变形,必须在报告期总值(p1q1)为权数的特定条件下。

14.5什么是指数体系?它有什么作用?

指数体系是指经济上有一定联系、数量上保持一定对等关系的若干指数构成的有机整体。作用:

1利用指数体系,可进行指数之间的相互推算。

2利用指数体系进行因素分析。

14.6试述平均指数体系。

统计学课后练习题。部分题目有附标准答案。

第三章统计数据的整理和显示习题 二、单项选择题 1.统计分组的关键问题是( A ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(C ) 每个组上限与下限的中点值称为组中值,对于开口组的组限是按相邻组的组距来计算的,所以末组开口组的组中值=末组下限+邻组组限/2=200+(200-170)=230 A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( B ) 品质标志是说明事物的性质或属性特征的,它反映的是总体单位在性质上的差异,它不能用数值来表现。 A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( C ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( D ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( A )

A变量分组B属性分组C分组体系D复合分组10.在频数分布中,频率是指( C ) A各组频数之比B各组频率之比C各组频数与总频数之比D各组频数与各组次数之比 11.频数分布用来表明( A ) A总体单位在各组的分布状况B各组变量值构成情况 C各组标志值分布情况D各组变量值的变动程度 12.在分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B ) A上限所在组B下限所在组 C任意一组均可D另设新组 13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( B ) A正例关系B反比例关系C乘积关系D毫无关系14.统计表的宾词是用来说明总体特征的( C ) A标志B总体单位C统计指标D统计对象 15.统计表的主词是统计表所要说明的对象,一般排在统计表的( A ) A左方B上端中部C右方D下方 三、多项选择题 1.统计分组的作用在于( BCD ) A区分现象的类型B反映现象总体的内部结构变化C比较现象间的一般水平D分析现象的变化关系E研

统计学基础课后思考题答案(仅供参考)前六章

第一章概论 1、“统计”一词有统计工作、统计资料、统计学三种涵义。统计资料是统计工作的成果,统计工作和统计资料是过程与成果的关系。 2、统计学的研究对象是客观现象(包括社会现象和自然现象)总体的数量方面。它具有数量性、总体性、变异性、具体性、社会性的特点。 3、统计学的性质是属于方法论学科,统计学是一门研究客观现象总体数量方面的独立的方法论科学。 4、统计学的基本研究方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。 5、统计学的基本职能有:信息职能、咨询职能、监督职能。 6、统计的基本任务:一方面是以国民经济和社会发展为统计调查的对象,在对其数量方面进行科学的统计分析的基础上,为党和国家制定政策、各部门编制计划,指导经济和社会发展及进行科学管理提供信息和咨询服务;另一方面则是对国民经济和社会的运行状态、国家政策,计划的执行情况等进行统计监督。 7、统计工作的过程包括:统计设计、统计调查、统计整理和统计分析。 8、统计总体是指客观存在的,在同一性质的基础上结合起来的许多个别事物构成的整体,简称总体。总体单位是指构成总体的个别事物,简称个体。总体和总体单位是整体与部分、集合与元素的关系,它们互为存在条件。总体是界定总体单位的前提条件,总体单位是构成总体的基本元素。 9、标志按性质不同可分为品质标志和数量标志,按变异情况可分为不变标志和可变标志。 10、统计指标的特点:数量性、综合性、具体性。统计指标按其说明总体特征的性质不同,可分为数量指标和质量指标;按表现形式不同,可分为总量指标、相对指标,平均指标;按计量单位的不同,可分为实物量指标、价值指标和劳动量指标;按指标功能的不同,可分为描述指标、评价指标和预警指标。 11、(简)指标与标志的联系,具有对应关系、汇总关系、转换关系;指标与标志的区别,说明对象范围的不同,具体表现形式不同。(详)指标与标志有哪些区别及联系? 区别: ①指标和标志的概念明显不同,标志是说明个体特征的,一般不具有综合的特征:指标是说明总体特征的,具有综合的性质。 ②统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。 联系: ③统计指标是建立在标志值的基础之上的,它是各个总体单位的数量标志值的汇总,没有总体单位的标志值 也就不可能有总体的指标值。 ④随研究目的不同,指标与标志之间可以互相转化。两者体现这样的关系,指标在标志的基础上形成,指标又是确定标志的依据。 12、变量的分类:按变量值是否连续,可分为连续型变量和离散型变量;按照其性质不同,可分为确定性变量和随机变量。13、统计指标体系分为基本统计指标体系和 专题统计指标体系两大类。 第二章统计调查 1、统计调查是根据统计研究的目的、要求和 任务,采用科学的调查方法,有计划、有组 织地搜集统计资料的工作过程。统计调查在 统计工作的整个过程中,担负着提供基础资 料的任务,所有的统计计算和统计研究都是 在原始资料搜集的基础上建立起来的。 2、统计调查的基本要求: (1)准确性。即统计调查得到的资料应 该是真实可靠的、符合客观实际,不受人的 主观偏见和错误意识的影响。 (2)及时性。即统计调查要按时完成资 料的搜集和上报任务,以及充分发挥统计资 料的时间价值。 (3)完整性。统计调查搜集的资料,一 是要调查单位的完整、做到调查单位不重复、 不遗漏,以保证反映被研究对象整体的面貌; 二是要做到搜集的项目齐全,调查项目不仅 具有层次性,而且是紧密链接、赋予逻辑联 系,齐全的调查项目才能实现调查研究的目 的和任务。 3、一份完整的统计调查方案,应包括: (1)确定调查目的; (2)确定调查对象、调查单位和报告单位; (3)拟定调查项目、制定调查表; (4)规定调查时间和调查期限、调查地点 和方法; (5)制定调查工作的组织实施计划。 4、调查表的内容有:表头、表体和表脚。 调查表分无记名调查反馈表和记名调查 反馈表。 5、统计调查的组织形式有统计报表、普查、 重点调查、典型调查和抽样调查。 6、重点调查与典型调查有何异同? 相同点: 都是非全面调查;调查单位少,可节省 人力、物力、时间;灵活性强;属于有部分 到全面的调查方式。 区别: (1)定义不同 重点调查是一门专门组织的非全面调 查,它是在调查对象的全部单位中只选择一 小部分重点单位进行调查,以了解总体的基 本情况。 典型调查是一种十分重要的,行之有效 的非全面调查方法。它是根据调查目的和要 求,在对被研究对象做全面分析的基础上, 有意识地从中选择少数具有代表性的典型单 位进行深入细致地调查研究,以便认识事物 的本质及其规律性的一种非全面调查。 (2)特点不同 重点调查的主要特点是:投入少、调查 速度快、所反映的主要情况或基本趋势比较 准确。 典型调查的主要特点是:调查单位少、 机动灵活、典型单位的选择带有一定的主观 性、典型单位可以注重于现象数量方面的分 析。 (3)组织形式不同 重点调查既可以是一次性调查性调查, 也可以用于经常性调查。其组织形式可以是 组织专门调查,也可以颁发统计报表,由选 中重点单位填报。 典型调查一般有两种方式:“解剖麻雀” 式和“化类选典”式。 (4)调查方式的优缺点不同 重点调查:优点:调查单位少,可调查 较多的项目和指标,了解较详细的效果,能 使党政领导尽快的掌握基本情况,发现问题, 采取措施,以指导工作。 缺点:因为重点调查单位与一般单位的 差别较大,通常不能用重点调查结果来推算 调查总体的指标 典型调查:优点:是补充全面调查资料 的缺口,利用典型调查资料,可以分析全面 调查不能认识清楚地一些具体问题,还可以 深入研究新生事物,找出事物变化发展的规 律,用来推断总体的指标数值。 缺点:主要是针对问题的普遍性研究, 不够深入 根本区别在于选取调查单位的方法不同。 典型调查单位的选择取决于调查者的主 观判断,因此具有主观性。重点调查单位的 选择取决于某一标志总量在总体所占比重, 因此具有客观性。 典型调查虽然在一定条件下,能根据典 型单位估计推断总体。但由于无法合理估计 其误差,因此不能根据典型单位的数量特征, 推断总体单位的数量特征。不过,可以利用 典型调查得到的具体、详细事例,补充分析 抽样调查无法获得具体、详细事例的不足。 7、统计调查的方法有:观察法、询问法、报 告法、网络调查法和问卷调查法。 观察法:优点是取得的资料比较准确; 缺点是花费的人力、物力、财力和时间都较 多,而且具有局限性。 询问法:优点是调查者能按统计口径逐 项询问,对统计项目有统一的理解,可保证 调查资料的准确性;缺点是花费大量的人力 和时间。 报告法:优点是准确性不亚于观察法; 缺点是花费较多的人力和物力。 网络调查法:优点是速度快、费用低、 易获得联系性数据、调研内容设置灵活、调 研群体大和可视性强;缺点是代表性问题、 安全性问题和无限制样本问题。 问卷调查法:优点是节省时间、经费和 人力;调查结果容易量化、便于统计处理与 分析;现在的电子问卷克服了纸质问卷的一 些缺点,方便实施与调整;可以进行大规模 的调查。 缺点是面向设计的问题问卷调查比较 难;调查结果广而不深;问卷调查经常采用 由用户自己填答问卷的方式,所以其调查结 果的质量常常得不到保证。;问卷调查的回 收率难以保证。 8、调查问卷的结构由卷首语(开场白)、正 文和结尾组成。 问卷的设计形式有开放式和封闭式。 第三章统计数据的整理与显示 1、统计数据整理的主要内容(步骤)是:(1) 统计资料整理方案的设计;(2)对调查资料 的审核;(3)对调查资料进行科学的分组、 汇总;(4)数据资料的显示——编制和绘制 统计表(图);(5)统计资料的保管与积累。 2、统计分组就是根据统计研究的目的和被研 究现象总体的内在特征,将统计整体按照一 定的标志划分为若干性质不同的部分或组的 一种统计方法。统计分组的关键在于确定分 组标志和组距。

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学课后习题

第二章统计数据调查与整理 9.对50只灯泡的耐用时数进行测试,所得数据如下: (单位:小时) 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求: (1)根据上述资料编制次数分布数列,并计算向上累计与向下累计频数与频率。 (2)根据所编制的次数分布数列,绘制直方图、折线图。 (3)根据图形说明灯泡耐用时数的分布属于何种类型。 最大值=651 最下限=650 最小值=1120 最上限=1150 全距=1120-651=469 组数=5,组距=100 组限人数频率%向上累计 频数 向上累计 频率% 向下累计 频数 向下累计 频率% 650-75010、02 1 0、0250 1 750-850 40、08 5 0、149 0、98 850-950300、635 0、745 0、9 950-1050120、2447 0、9415 0、3 1050-115030、0650 1 3 0、06 10.某服装厂某月每日的服装产量如下表所示。 某服装厂X月X日服装产量表 将表中资料编制成组距式分配数列,用两种方式分组,各分为五组,.比较哪一种分组较为合理。等距式分组(不考虑异常数据) 组限频次 0-505 50-1003 100-15012 150-2007

统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度? 数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2. 4.5简述众数、中位数和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。 平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。 4.7标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 7.3怎样理解置信区间? 置信区间:由样本统计量所构造的总体参数的估计区间 7.4解释95%的置信区间。 95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 7.5 Za/2的含义是什么 含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。 7.6 解释独立样本和匹配样本的含义。 独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 匹配样本:一个样本中的数据与另一个样本中的数据相对应。 7.8简述样本量与置信水平、总体方差、边际误差的关系。 样本量越大置信水平越高,总体方差和边际误差越小 10.1什么是方差分析?它研究的是什么? 答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.4方差分析中有哪些基本假定? 答:方差分析中有三个基本假定: (1)每个总体都应服从正态分布 (2)各个总体的方差σ2必须相同 (3)观测值是独立的

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学(第三版)李金昌课后简答题个人整理版

《统计学》简答题 第一章 1.统计的含义与本质是什么? 含义:1、统计工作:调查研究。资料收集、整理和分析。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。 本质:就是关于为何统计,统计什么和如何统计的思想。 2.什么是统计学?有哪些性质? 统计学是关于如何收集、整理和分析统计数据的科学。统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科范畴而言,具有方法型、层次性和通用性的特点;就其研究方式而言,具有描述性和推断性的特点。 3.统计学数据可分为哪几种类型,不同类型数据各有什么特点? 1)按照所采用的计量尺度,可分为定性数据和定量数据 定性数据是只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体分为定序数据和定类数据。定量数据是只能用数值来表现事物数量特征的数据,具体分为定距数据和定比数据。 2)按照表现形式不同,可以分为绝对数、相对数和平均数 绝对数是用以反映现象或事物绝对数量特征的数据。以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位,是表示直接数量标志或总量标志的形式。 相对数是用以反映现象或事物相对数量特征的数据。通过另外两个相关统计数据的对比来体现现象或事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数。 平均数是用以反映现象或事物平均数量特征的数据。体现现象或事物某一方面的一般数量水平。 3)按收集方法,可分为观测的数据和实验的数据 观测数据:数据是在没有对事物进行人为控制的条件下得到的。 实验数据:数据是在实验中控制实验对象而收集到的。 4)按照被描述的对象和时间的关系,可分为截面数据和时间序列数据 截面数据:描述的是现象在某一时刻的变化情况。 时间序列数据:描述的是现象随时间而变化的情况。 5)按照加工程度不同,可以分为原始数据和次级数据 原始数据是指直接向调查对象收集的、尚待加工整理、只反映个体特征的数据,或通过实验采集的原始记录数据。 次级数据是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 4.如何正确理解描述统计与推断统计的关系? 描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。描述统计对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。推断统计是和假设检验联系在一起的,这只是简单的描述现象,并没有进行假设,再利用数据检验,得出推断的结果。 5.统计研究的基本过程如何?常用的统计方法有哪些? 统计设计,数据搜集,数据整理,数据分析与解释(核心、最终目的) 常用的统计方法:大量观察发、统计分组法、综合指标法、统计推断法、统计模型法

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题答案

第四章 统计描述 【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成12.5%。 成本的计划完成程=84%.96100%5% -18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成3.16%。 劳动生产率计划完= 85%.101100%8% 110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成1.85%。 【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨) 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成26.75%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【4.3】我国1991年和1994年工业总产值资料如下表: 要求:

(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1) (2)是比例相对数; 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04 .296826 .21670≈ (3) %37.251%) 451(28248 51353 ≈-+ 即,94年实际比计划增长25.37%。 【4.4】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。 【解】(1)

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核 B.编制统计表 C.统计汇总问题 D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性 B.正确性 C.全面性 D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组 B.60在第二组,80在第五组 C.70在第四组,80在第五组 D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列 B.单项式分布数列 C.开口式数列 D.异距式数列 5.组距式分布数列多适用于() A.随机变量 B.确定型变量 C.连续型变量 D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数 B.下限以上的累计次数 C.各组分布的次数 D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线 B.J型分布曲线 C.右偏分布曲线 D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉 B.不等 C.重叠 D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组 B.逻辑检查 C.数据录入 D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类 B.组限 C.组距 D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布 B.χ型分布 C.U型分布 D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列 B.品质数列 C.单项数列 D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有() A.粮食平均产量的分布 B.零件公差的分布

相关文档
最新文档