统计学思考题培训资料

统计学思考题

思考题：

1、什么是统计学？怎样理解统计学与统计数据的关系？

答：⑴统计学是一门收集、整理、显示和分析统计数据的科学，其目的是探索数据的内在的数量规律性；⑵统计学是由收集、整理、显示和分析统计数据的方法组成的，这些方法来源于对统计数据的研究，目的也在于对统计数据的研究；

⑶离开了统计数据，统计方法乃至统计学就失去其存在的意义。

2、简要说明统计数据的来源。

答：(1)统计数据来源于直接获取的数据和间接获取的数据；(2)直接获取的数据来自于直接组织的调查、观察和科学试验；(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。

3、简要说明抽样误差和非抽样误差。

答：(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误，不完整的抽样框导致的误差，调查中由于被调查者不回答产生的误差等。从理论上看，这类误差是可以避免的；(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的，可以计量，可以控制。

4、怎样理解均值在统计学中的地位？

答：（1）反映了一组数据的中心点或代表值，是数据误差互相抵消后的客观事物必然性数量特征的一种反映；（2）是统计分布的均衡点；（3）任何统计推断和分析都离不开均值。

5、解释洛伦茨曲线及其用途。

答：(1)洛伦茨曲线是累积次数分配曲线，由（美）洛伦茨（M.E.Lorentz）提出，依据（意）帕累托（V.Pareto）的“二八原理”和收入分配公式绘制；（2）用于描述收入和财富分配性质。

6、简述基尼系数的使用。

答：基尼系数用于反应收入分配的变化情况，取值在0～1之间

①基尼系数小于0.2，表明分配平均；②在0.2～0.4之间，分配比较适当；③

0.4 是收入分配不公平的警戒线，超过0.4，收入分配不公平。

7、一组数据的分布特征可以从哪几个方面进行测度？

答：可以从三个方面测度：⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值；⑵分布的离散程度反映的是分布离散和差异程度；

⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。

8、简述频率与概率的关系。

答：①频率反映的是某一事物出现的频繁程度；②概率是指事件在一次试验中发生的可能性；③当观察次数ｎ很大时，频率与概率非常接近。

9、概率的三种定义各有什么应用场合。

答：⑴古典概率实验的基本事件总数有限，每个基本事件出现的可能性相同；

⑵统计概率实验的基本事件总数有限，每个基本事件出现的可能性不完全相同；⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算，也不能根据大量重复试验的频率来估计。

10、概率密度函数和分布函数的联系与区别表现在哪些方面？

答：（1）联系:概率密度函数的积分是分布函数，分布函数的导数是概率密度函数；（2）区别：概率密度函数的函数值是某点的概率密度，分布函数的函数值表示某个区间的概率。

11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同？

答：⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布，此外还有伯松分布、超几何分布；

⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见的连续型随机变量的概率分布有正态分布、均匀分布等。

12、正态分布所描述的随机现象有什么特点？为什么许多随机现象服从或近似服从正态分布？

答：⑴正态分布所描述的随机现象的特点：①对称的分布；②中间多两端少； ⑵许多随机现象的分布都会有集中趋势和离散趋势，即现象的分布表现为中间多两端少的特点，这种分布与正态分布十分贴近。

13、解释总体分布、样本分布和抽样分布的含义。

答：①总体分布是指总体的全部观察值形成的分布；②样本分布是指一个样本的所有观察值形成的分布；③抽样分布就是由样本观察值计算的统计量的概率分布。

14、解释中心极限定理的含义。

答：⑴样本来自于任意总体,样本容量充分大；⑵当样本容量充分大时，样本均值的抽样分布近似于一个均值x μμ=和方差22x

σσ= 的正态分布。

15、简述评价估计量好坏的标准

答：①无偏性估计量抽样分布的数学期望等于被估计的总体参数；②有效性无偏估计量与总体参数的离散程度；③相合性随着样本容量的增大，估计量与总体参数的接近程度。

16、解释置信水平的含义。

答：⑴对总体参数进行区间估计时给定的一个概率值；⑵反应总体参数包括在置信区间的概率。

17、简述样本容量与置信水平、总体方差、允许误差的关系。

答：①样本容量与置信水平成正比；②样本容量与总体方差成正比；③样本容量与允许误差成反比。

18、第Ⅰ类错误和第Ⅱ类错误分别是指什么？它们发生的概率大小之间存在怎样的关系？

答：⑴第Ⅰ类错误是指当原假设为真时拒绝原假设所犯的错误；⑵第Ⅱ类错误是指当原假设为假时没有拒绝原假设所犯的错误；⑶两类错误的概率之间的关系：α增大时，β减小；β增大时，α减小。

19、什么是显著性水平？它对于假设检验决策的意义是什么？

答：（1）显著性水平是指假设检验中犯的第Ⅰ类错误的概率，记为α；（2）显著性水平α所围成的区域成为拒绝域；（3）检验统计量落在拒绝域则拒绝原假设的概率，是人们事先指定的犯第Ⅰ类错误概率α的最大允许值。

20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。

答：（1）方差已知左侧检验为(-∞,-zα),右侧检验为(zα,+∞),双侧检验为(-∞,-zα/2)?(zα/2,+∞)；（2）方差未知左侧检验为(-∞,-tα),右侧检验为(tα,+∞),双侧检验为(-∞,-tα/2)?(tα/2,+∞)。

21、什么是统计上的显著性？

答：（1）由于随机因素的作用，点估计量与假设的总体参数出现差异是可以理解的；（2）点估计量与假设的总体参数出现较小差异是大概率事件，出现过大差异是小概率事件；（3）在一次试验中，点估计量与假设的总体参数出现差异过大是不正常的，这就是统计上的显著性。

22、方差分析中有哪些基本假定？

答：①每个总体都应服从正态分布；②各个总体的方差σ2必须相同；③观测值是独立的。

23、简述方差分析的基本思想。

答：①将观测值之间的差异分为两类：组内误差和组间误差；②组内误差只包含随机误差，组间误差既包括随机误差，也包括系统误差；③衡量组内误差与组间误差的大小，推断观测值之间差异产生的原因。

24、方差分析包括哪些类型？它们有何区别？

答：⑴主要是两种类型：单因素反差分析和双因素方差分析，双因素方差分析又分为无交互作用和有交互作用的方差分析两类；⑵区别之一是考虑因素的数目不同；⑶区别之二是两个因素是否有交互作用。

25、解释方差分析中的水平项平方和、误差项平方和的含义。

答：⑴水平项误差平方和是各组平均值与总平均值的误差平方和，反映各总体的样本均值之间的差异程度；⑵误差项平方和是每个水平或组的各个样本数据与其组平均值误差的平方和，反映了每个样本各观测值的离散状况即反映随机误差的大小

26、解释试验、试验设计、试验单元的含义？

答：（1）试验是指收集样本数据的过程；（2）试验设计是研究如何科学地安排试验，使人们能用尽可能少的试验获得尽可能多的信息；（3）试验单元是指接受“处理”的对象或实体。

27、简述相关分析与回归分析的联系。

答：（1）具有共同的研究对象，都是对变量间相关关系的分析，两者可以相互补充；（2）只有当变量间存在相当程度的相关关系时，进行回归分析去寻找变量间相关的具体数学形式才有实际的意义；（3）相关分析中相关系数的确定建立在回归分析的基础上。

28、简述相关分析与回归分析的区别。

答：（1）相关分析是用一定的数量指标度量变量间相互联系的方向和程度，回归分析是寻找变量间联系的具体数学形式，是要根据自变量的固定值去估计和预测因变量的平均值；（2）相关分析对称的对待相互联系的变量，不考虑二者的因果关系；回归分析对变量的处理是不对称的，必须明确划分自变量和因变量；（3）相关分析的两个变量均视为随机变量；回归分析中通常假定自变量为取固定值的非随机变量，因变量为随机变量。

29、什么是随机误差项和残差？它们之间的区别是什么？

答：⑴随机误差项是指因变量的观测值i Y 与其相应的条件期望值(|)i E Y X 的偏

差；⑵残差是指因变量的实际样本观测值i y 与样本条件期望?i y

的偏差。⑶随机误差不能直接观测，残差可以直接计算。

30、什么是总体回归函数和样本回归函数？它们之间的主要区别是什么？答：⑴总体回归函数是指总体因变量的条件期望表示为自变量的某种函数； ⑵样本回归函数是指把因变量的样本条件期望表示为自变量的某种函数

⑶它们的主要区别是总体回归函数是确定的，样本回归函数随样本波动而变化。

31、为什么在对参数进行最小二乘估计时，要对模型提出一些基本的假定？答：①基本假定有：零期望值、同方差、无自相关、随机扰动与自变量不相

关、正态性等假定； ②在基本假定满足的条件下，回归系数的最小二乘估计是最佳线性无偏估计；③如果多次进行估计值计算，或者是扩大样本容量进行估计值计算，按最佳估计方式计算的估计值接近真实值的可能性最大。

32、为什么对计算的样本相关系数还要进行检验？

答：（1）样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的，它只是对总体相关系数的估计；（2）样本相关系数是随抽样而变动的随机变量，必需对估计的样本相关系数是否为抽样的偶然结果做出判断。

33、为什么用可决系数能够度量回归方程对样本数据的拟合程度？

答：（1）回归方程是通过对样本数据拟合而得到，在散点图上，样本回归线与样本观测值总是一定程度上存在或正或负的偏离，即拟合的优劣程度；（3）可决系数表示回归平方和占总离差平方和的比重；（4）如果样本回归线对样本观测值拟合程度越好，各样本观测点与回归线靠得越近，由样本回归作出解释的

离差平方和在总离差平方和中占的比重也将越大，反之拟合程度越差，这部分占的比重越小；

34、利用回归方程作经济预测的基本条件和前提是什么？

答：（1）变量分为因变量和解释变量两类，它们之间存在因果关系；（2）建立的回归方程通过各项统计检验，并且在经济上有实际意义；（3）影响经济现象的因素及条件始终保持不变。

35、为什么对用回归方程计算的预测值要作区间估计？

答：（1）由样本回归函数计算的?f y

只是对y f 的平均值做的点估计；（2）回归方程中?α

和?β是随机变量，因而?f y 也是随机变量；（3）对平均值的点估计?f y 不一定等于因变量预测值的真实个别值y f ，需要对y f 可能的置信区间作出预测。

36、对回归系数显著性作t 检验的基本思想是什么？

答：（1）回归分析中，最基本的是简单线性回归，人们最关心的是自变量x 对因变量y 是否有显著线性影响；（2）回归系数显著性检验的原假设是H 0:β＝0，若不拒绝原假设，表明x 对y 没有显著的线性影响，若拒绝原假设，表明x 对y 存在显著的线性影响；（3）随机扰动项u i 的方差σ2未知，且样本量较小，统计量??()Se β

β服从t 分布，只能采用t 检验法进行双侧检验。

37、总指数的基本编制方式。

答：①先综合、后对比的方式就是先将各种商品的价格或销售量资料加总起来，然后通过对比得到相应的总指数；②先对比、后平均的方式就是先将各种商品的价格或销售量资料进行对比，然后通过个体指数的平均得到相应的总指数。

38、简述统计指数与数学上的指数函数有何不同？。

答：①统计学中的指数是一种对比性的分析指标；②可以反映不同时间、不同空间现象水平的数量对比关系；③再经济分析的各个领域得到广泛应用，又称为“经济指数”。

39、与一般相对数比较，总指数所研究现象总体有何特点？

答：⑴一般反映的是多种现象的综合变动；⑵在经济领域应用广泛，被称为“经济指数”；⑶通常是指不同时间的现象水平的对比。

40、相对于简单形式的总指数，加权指数有何优点？

答：（1）总指数是考察复杂现象总体数量对比关系的指数；（2）简单形式的总指数是指在处理复杂现象总体时，对各个现象不加区分，同等对待，进行简单的综合；（3）加权指数是指在计算总指数时依据各个现象重要性的差别，对各个现象加以综合。加权指数能真实的反映研究现象总体的数量对比关系。

2014统计学课后复习题答案

《应用统计学》习题解答第一章绪论【1.1】指出下列变量的类型：（1）汽车销售量；（2）产品等级；（3）到某地出差乘坐的交通工具（汽车、轮船、飞机）；（4）年龄；（5）性别；（6）对某种社会现象的看法（赞成、中立、反对）。【解】（1）数值型变量（2）顺序变量（3）分类变量（4）数值型变量（5）分类变量（6）顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。要求：（1）描述总体和样本。（2）指出参数和统计量。（3）这里涉及到的统计指标是什么？【解】（1）总体：某大学所有的大学生样本：从某大学抽取的200名大学生（2）参数：某大学大学生的月平均消费水平统计量：从某大学抽取的200名大学生的月平均消费水平（3）200名大学生的总消费，平均消费水平【1.3】下面是社会经济生活中常用的统计指标： ①轿车生产总量，②旅游收入，③经济发展速度，④人口出生率，⑤安置再就业人数，⑥全国第三产业发展速度，⑦城镇居民人均可支配收入，⑧恩格尔系数。在这些指标中，哪些是数量指标，哪些是质量指标？如何区分质量指标与数量指标？【解】数量指标有：①、②、⑤ 质量指标有：③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标，表现为绝对数的形式，并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标，通常是两个有联系的统计指标对比的结果。【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查，其中60%的居民对自己的居住环境表示满意，70%的居民回答他们的月收入在6000元以下，生活压力大。回答以下问题：（1）这一研究的总体是什么？（2）月收入是分类变量、顺序变量还是数值型变量？（3）对居住环境的满意程度是什么变量？【解】（1）这一研究的总体是某小区的所有居民。

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章统计描述【】某企业生产铝合金钢，计划年产量40万吨，实际年产量45万吨；计划降低成本5%，实际降低成本8%；计划劳动生产率提高8%，实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量即产量超额完成%。成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比即成本超额完成%。劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比即劳动生产率超额完成%。【】某煤矿可采储量为200亿吨，计划在1991~1995年五年中开采全部储量的%，试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。【解】本题采用累计法：（1）该煤矿原煤开采量五年计划完成=100% ?数计划期间计划规定累计数计划期间实际完成累计 = 75%.1261021025357 4 =?? 即：该煤矿原煤开采量的五年计划超额完成%。（2）将1991年的实际开采量一直加到1995年上半年的实际开采量，结果为2000万吨，此时恰好等于五年的计划开采量，所以可知，提前半年完成计划。【】我国1991年和1994年工业总产值资料如下表：

要求：（1）计算我国1991年和1994年轻工业总产值占工业总产值的比重，填入表中；（2）1991年、1994年轻工业与重工业之间是什么比例（用系数表示）（3）假如工业总产值1994年计划比1991年增长45%，实际比计划多增长百分之几？ 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈； 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ （3） %37.25 1%) 451(2824851353 ≈-+ 即，94年实际比计划增长%。【】某乡三个村2000年小麦播种面积与亩产量资料如下表：要求：（1）填上表中所缺数字；（2）用播种面积作权数，计算三个村小麦平均亩产量；（3）用比重作权数，计算三个村小麦平均亩产量。

贾平俊统计学第五版课后思考题答案(完整版)

统计学(第五版)贾俊平课后思考题答案(完整版) 第一章思考题 1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。统计数据;按统计数据都收集方法分;

观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。1.4解释分类数据,顺序数据和数值型数据答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如"企业数"

统计学调查分析报告

一、调查研究方案的设计与组织实施（一）调查目的 (1)描述和反映本校经济管理学院10级会计系，经济系和人力资源系学生对于毕业去向的意向，分析并研究各意向的分布情况； (2)在系别，性别，家庭因素，个人因素等方面对毕业意向的分布进行研究，探究这些因素对于毕业意向分布的影响。 (3)分析和解释形成毕业意向分布差异的因素和原因； (二) 调查对象和调查单位本次调查的基本调查对象是本校经济管理学院会计系、经济系和人力资源系的全体同学。调查单位为此范围内的每一个同学。在此基础上，在每个系内随机抽取样本进行抽样调查，进而对整体进行推断。（三）调查的组织和实施方法获取资料的方法：问卷法、文献法本小组采用的基本方法为问卷法，发放问卷60份，收回问卷54份。辅助方法为文献法，通过图书馆和网络获取相关背景资料，对研究素材进行丰富和补充。调查方法：抽样调查抽样方法：分层抽样将调查对象按系别分为会计系、经济系和人力资源系三个类别，然后从各个类别中随机抽取组成样本，用于对整体进行推断。数据资料整理结果如下：在全部被调查对象中，男生23 人，占43%，女生31 人，占57%，经济系18人，占总体1/3,人力资源系18人，占总体1/3,会计系18人，占总体1/3.。选择考研的有14人，占总体的26% 。选择出国深造的有1人，占总体的2%。选择自主创业的有3人，占总体6%。选择直接就业的有29人，占总体54%。选择考公务员的有7人，占总体12% 。（四）调查时间和调查期限调查时间：2012年6月27日调查期限：2012年6月27日―20012年6月29日（五）调查项目和调查表调查项目：性别年级院系毕业意向家庭收入情况性格特点就业优势调查表如下：二、统计数据的整理和分析

统计学课后习题答案(Chap1.2)

第1章绪论 1．什么是统计学怎样理解统计学与统计数据的关系 2．试举出日常生活或工作中统计数据及其规律性的例子。 3．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)描述推断。答：(1)总体：最近的一个集装箱内的全部油漆； (2)研究变量：装满的油漆罐的质量； (3)样本：最近的一个集装箱内的50罐油漆； (4)推断：50罐油漆的质量应为×50＝226.8 kg。 4．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)一描述推断。答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型； (2)用Excel制作一张频数分布表；

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下（单位：万元）： 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组，编制频数分布表，并计算出累积频数和累积频率； (2)如果按规定：销售收入在125万元以上为先进企业，115万～125万元为良好企业，105万～115万元为一般企业，105万元以下为落后企业，按先进企业、良好企业、一般企业、落后企业进行分组。解：（1）要求对销售收入的数据进行分组，全部数据中，最大的为152，最小的为87，知数据全距为152－87=65；为便于计算和分析，确定将数据分为6组，各组组距为10，组限以整10划分；为使数据的分布满足穷尽和互斥的要求，注意到，按上面的分组方式，最小值87可能落在最小组之下，最大值152可能落在最大组之上，将最小组和最大组设计成开口形式；按照“上限不在组内”的原则，用划记法统计各组内数据的个数——企业数，也可以用Excel 进行排序统计(见Excel练习题2.2)，将结果填入表内，得到频数分布表如下表中的左两列；将各组企业数除以企业总数40，得到各组频率，填入表中第三列；在向上的数轴中标出频数的分布，由下至上逐组计算企业数的向上累积及频率的向上累积，由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下： 40个企业按产品销售收入分组表（2）按题目要求分组并进行统计，得到分组表如下：某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度？数据分布特征可以从三个方面进行测度和描述：一是分布的集中趋势，反映各数据向其中心值靠拢或集中的程度；二是分布的离散程度，反映各数据远离其中心值的趋势；三是分布的形状，反映数据分布的偏态和峰态。 2. 4.5简述众数、中位数和平均数的特点和应用场合。众数是一组数据分布的峰值，不受极端值的影响，缺点是具有不唯一性。众数只有在数据量较多时才有意义，数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值，不受极端值的影响。当数据的分布偏斜较大时，使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。平均数对数值型数据计算的，而且利用了全部数据信息，在实际应用中最广泛。当数据呈对称分布或近似对称分布时，三个代表值相等或相近，此时应选择平均数。但平均数易受极端值的影响，对于偏态分布的数据，平均数的代表性较差，此时应考虑中位数或众数。 4.7标准分数有哪些用途？标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时，常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 7.3怎样理解置信区间？置信区间：由样本统计量所构造的总体参数的估计区间 7.4解释95%的置信区间。 95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 7.5 Za/2的含义是什么含义：Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。 7.6 解释独立样本和匹配样本的含义。独立样本：如果两个样本是从两个总体中独立抽取的，即一个样本中的元素与另一个样本中的元素相互独立。匹配样本：一个样本中的数据与另一个样本中的数据相对应。 7.8简述样本量与置信水平、总体方差、边际误差的关系。样本量越大置信水平越高，总体方差和边际误差越小 10.1什么是方差分析？它研究的是什么？答：方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.4方差分析中有哪些基本假定？答:方差分析中有三个基本假定：（1）每个总体都应服从正态分布（2）各个总体的方差σ2必须相同（3）观测值是独立的

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案第一章思考题 1.1什么是统计学统计学是关于数据的一门学科，它收集，处理，分析，解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计描述统计；它研究的是数据收集，处理，汇总，图表描述，概括与分析等统计方法。推断统计；它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据；按所采用的计量尺度不同分；（定性数据）分类数据：只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，用文字来表述；（定性数据）顺序数据：只能归于某一有序类别的非数字型数据。它也是有类别的，但这些类别是有序的。（定量数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。统计数据；按统计数据都收集方法分；观测数据：是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据：在实验中控制实验对象而收集到的数据。统计数据；按被描述的现象与实践的关系分；截面数据：在相同或相似的时间点收集到的数据，也叫静态数据。时间序列数据：按时间顺序收集到的，用于描述现象随时间变化的情况，也叫动态数据。 1.4解释分类数据，顺序数据和数值型数据答案同1.3 1.5举例说明总体，样本，参数，统计量，变量这几个概念对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。 1.6变量的分类

(完整版)医学统计学第六版课后答案

第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学分析报告模版

统计学调查报告（08级）上海商学院学生消费状况调查报告（奉浦校区）徐伟杰，景宝龙，苏淳，张玮，贾金诚小组成员指导教师姓名崔峰物流管理系系名称论文提交日期2010.12.23

目录一，调查目的： (3) 二，调查对象： (3) 三，调查项目： (3) 四，调查时间和时限 (3) 五，调查的组织工作 (4) 六，调查结果： (4) 七，调查问卷 (4) 市大学生消费状况调查问卷 (4) 八，调查分析： (6) （一）基本信息 (6) （二）消费结构状况分析： (7) （三）具体消费情况： (8) 九，预测分析 (13) 十，调查分析 (15) 十一，附录：调查统计汇总表 (17)

一，调查目的：随着社会的发展，大学生的消费方式及消费状况引起了社会各界的极大关注，社会消费观念的转变和周围环境影响他们的消费观念和行为。大学生有着较为前卫的消费观念，消费来源主要有家庭父母供给，构成了一个比较特殊的消费群体，随着大学生数量的不断攀升，他们的消费行为在一定程度上形象着整个社会的消费观念和消费行为。而有拥有30所本科院校，大学生的数量比较庞大，并且有着更加前卫的消费观念。就此我们针对商学院学生的消费情况展开调查，了解我校学生的消费特征，进而探求更为科学的消费方式和行为，提高大学生的消费效益。二，调查对象：统计调查对象：商学院奉浦校区在读学生统计调查单位：每一位在商学院奉浦校区就读的学生统计填报单位：物流管理082班景宝龙、徐伟杰三，调查项目：统计标志：户籍所在地、就读年级、家庭月收入、个人月生活费、生活费来源、各方面的消费金额分配、是否满意目前的消费金额、期望月消费金额、消费计划、期望消费项目、超前消费的情况四，调查时间和时限调查时间：2010年10月调查时限：两个月五，调查分工：问卷设计：徐伟杰问卷校验：淳，玮，景宝龙问卷调查：景宝龙，玮，淳，徐伟杰，贾金诚

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下：单位：万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求：（1）根据上面的数据进行适当分组，编制频数分布表，绘制直方图。（2）制作茎叶图，并与直方图进行比较。解：（1）频数分布表

或：（2）茎叶图

第三章 1. 已知下表资料：试根据频数和频率资料，分别计算工人平均日产量。解：计算表

根据频数计算工人平均日产量：6870 34.35200 xf x f = = =∑∑（件）根据频率计算工人平均日产量：34.35f x x f = = ∑∑ g （件）结论：对同一资料，采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表：试计算这9个企业的平均单位成本。解：

这9个企业的平均单位成本=f x x f = ∑∑ =13.74（元） 3.某专业统计学考试成绩资料如下：试计算众数、中位数。解：众数的计算：根据资料知众数在80～90这一组，故L=80，d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

贾俊平统计学(第六版)思考题答案

1、什么是统计学？统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计：研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。推断统计：研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型，个有什么特点？按照计量尺度不同，分为：分类数据、顺序数据、数值型数据。分类数据：只能归于某一类别的，非数字型数据。顺序数据：只能归于某一有序类别的，非数字型数据。数值型数据：按数字尺度测量的观察值，结果表现为数值。按收集方法不同。分为：观测数据、和实验数据观测数据：通过调查或观测而收集到的数据；不控制条件；社会经济领域实验数据：在试验中收集到的数据；控制条件；自然科学领域。按时间不同，分为：截面数据、时间序列数据截面数据：在相同或近似相同的时间点上收集的数据。时间序列数据：在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。总体：是包含全部研究个体的集合，包括有限总体和无限总体（围、数目判定）样本：从总体中抽取的一部分元素的集合。参数：用来描述总体特征的概括性数字度量。（平均数、标准差、比例等）统计量：用来描述样本特征的概括性数字度量。（平均数、标准差、比例等）变量：是说明样本某种特征的概念，其特点：从一次观察到下一次观察结果会呈现出差别或变化。（商品销售额、受教育程度、产品质量等级等）（对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。） 5、变量可以分为哪几类？分类变量：说明事物类别；取值是分类数据。顺序变量：说明事物有序类别；取值是顺序数据数值型变量：说明事物数字特征；取值是数值型数据。变量也可以分为：随机变量和非随机变量；经验变量和理论变量 6、举例说明离散型变量和连续型变量。离散型变量：只能取有限个、可数值的变量。（企业个数、产品数量）连续型变量：可以在一个或多个区间中取任何值的变量。（年龄、温度、零件尺寸误差）7、请举出统计应用的几个例子。市场调查、人口普查等。 8、请举出应用统计学的几个领域。社会科学中的经济分析、政府政策制定等；自然科学中的物理、生物领域等。

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告一、数据介绍：本次分析的数据为某地区361个人旅游情况状况统计表，其中共包含七变量，分别是：年龄，为三类变量；性别，为二类变量（0代表女，1代表男）；收入，为一类变量；旅游花费，为一类变量；通道，为二类变量（0代表没走通道，1代表走通道）；旅游的积极性，为三类变量（0代表积极性差，1代表积极性一般，2代表积极性比较好，3代表积极性好 4代表积极性非常好）；额外收入,一类变量。通过运用spss统计软件，对变量进行频数分析、描述性统计、方差分析、相关分析，以了解该地区上述方面的综合状况，并分析个变量的分布特点及相互间的关系。二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状况的统计数据表，在性别、旅游的积极性不同的状况下的频数分析，从而了解该地区的男女职工数量、不同积极性情况的基本分布。统计量积极性性别 N 有效359 359 缺失0 0 首先，对该地区的男女性别分布进行频数分析，结果如下

性别频率百分比有效百分比累积百分比有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明，在该地区被调查的359个人中，有198名女性，161名男性，男女比例分别为44.8%和55.2%，该公司职工男女数量差距不大，女性略多于男性。其次对原有数据中的旅游的积极性进行频数分析，结果如下表：积极性频率百分比有效百分比累积百分比有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析，结果如下表：其次对原有数据中的是否进通道进行频数分析，结果如下表：

免费《统计学》课后答案

统计学费宇石磊（主编）第2章练习题参考答案 2.1解：(1)首先将顾客态度分别用代码1、2、3表示，然后在数据文件的Varible View窗口Values栏定义变量值标签：1代表“喜欢并愿意购买”；2代表“不喜欢”，3代表“喜欢并愿意购买”。操作步骤：依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示：（2）根据表2.1频数分布表资料建立的数据文件为绘制条形图操作步骤：依次点击File→点击open→点击Data→打开数据文件，选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable（纵轴），将“态度分类”选入Category Axis （横轴）→点击OK。输出结果如图2.1所示：

图2.1 30名顾客满意程度分布条形图绘制饼图操作步骤：依次点击File→点击open→点击Data→打开数据文件 of individual cases→点击Define→将“人数”选入Slices Represent栏，将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示： 2.2解:首先列计算表如表2.2所示：表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表

（1）均值151 872072.67120 i i i i i x f x f === = =∑∑（分）表2.2中，分布次数最多的组是“40～50”组，这就是众数所在组；2 N =60，中位数大约在第60位，可确定中位数也在“40～50”组。众数10124230 701073.333018M L i ?-=+ ?=+?=?+?-+-（分）（42）（42）中位数11204922701072.6242 m e m N S M L i f ---=+?=+?=（分）（2）首先计算标准差：11.65s = =（分） 3 1 1 3 3 () /38389.64/120 0.202311.65k k i i i i x x f f SK s ==-= = =∑∑ 由计算结果可看出，偏态系数为正值，但与零的差距不大，说明120名大学生英语成绩为轻微右偏分布，成绩较低的同学占有一定的比例，但偏斜程度不大。 4 1 1 4 4 () /5108282.61/120 330.689111.65k k i i i i x x f f K s ==-= -= -=-∑∑ 由计算结果可看出，峰度系数为负值，说明120名大学生英语成绩为平峰分布，成绩较低的同学占一定比例，但低成绩区域的集中程度并不很高。 2.3解(1)整理的组距数列如表表2.3.1 连续60天计算机销售量频数分布表

统计学分析报告

统计学方案设计 ————问卷调查分析报告目录正文 (2) 1、确定研究问题 (2) 1.1背景分析 (2) 1.2确定研究问题 (3) 2、选择统计分析方法 (4) 2.1问卷设计 (4) 2.2问卷内容 (4) 2.3选择处理软件 (4) 3、收集样本数据 (4) 4、数据分析 (5) 4.1初步分析 (5) 4.2每周运动次数和设施紧缺度的参数估计 (9) 4.3体育项目与紧缺度假设检验 (11) 4.4、运动时间与场地紧缺度的列联分析 (15) 5、总结与建议 (16) 6、调查方案优缺点分析 (16)

附1：问卷 (18) 正文通过一个学期对统计学原理的学习，我们学会了如何用利用数学分析来解决实际问题。在这次调查中，我们确定了以“校内体育设施利用状况”为主题的问卷调查。以下是我们小组这次调查分析的研究流程： 1、确定研究问题 1.1背景分析众所周知，适当的体育锻炼对每个人的身体健康至关重要。对于我们大学生而言，适量的体育锻炼不仅有助于我们的身体健康，更有助于我们的心理健康。具体来说，一方面，体育锻炼有利于人体骨骼、肌肉的生长，增强心肺功能,改善血液循环系统、呼吸系统、消化系统的机能状况，有利于人体的生长发育，提高抗病能力，增强有机体的适应能力。另一方面，体育锻炼还可以调节人体紧张情绪，改善生理和心理状态，恢复体力和精力，培养人的团结、协作及集体主义精神。而在学业压力巨大的今天，大学生的身心健康越来越受到大众的关注。

在我校内部，师生积极参与各类体育活动。在一天的各个时间段，都会有师生在运动场锻炼。而学校方面也十分重视师生的身体健康：每年，校方都会开展“院级杯”篮球赛、“院级杯”羽毛球赛，校运动会等一系列的体育比赛，意在让师生了解体育锻炼的重要性，并提高师生对于体育锻炼的喜爱度。各类比赛也都得到了师生的积极参与。学校也在各项体育比赛中取得了相当不错的成绩。可以说，现阶段我校体育锻炼的氛围还是相当不错的。但随着体育锻炼参与者的增加，校内的体育设施并没有得到同水平的增长。这就导致了在某些时间段，学校个别体育项目的设施供应出现了紧缺状况。有相当一部分的师生群体因为没有锻炼场地而不得不放弃了体育锻炼的机会，这也极大地降低了我校师生体育锻炼的热情。 1.2确定研究问题基于上述问题之上，我们确定了以“校内体育设施利用状况”为主题的问卷调查。首先，主观因素方面，我们会对师生体育锻炼的现状进行调查，（比如经常参加的体育项目，参加锻炼的时间段等因素），以研究师生体育锻炼的基本情况。接着，客观因素方面，我们对师生在锻炼过程中感到的体育设施的供应情况进行调查。通过此次调查，我们希望能了解存在设施紧缺状况的体育项目和具体紧缺的时间段。针对设施严重紧缺的体育项目，我们会向校方提出设施供应方面的建议（比如增加羽毛球场、篮球场的场地或者对篮球场地的照明情况进行改善等）；而针对少数紧缺的体育项目，我们会建议师生在设施利用度较低的时间段进行锻炼。最终通过我们的调查问卷，我们希望可以给广大师生提供更多更好的锻炼机会。

统计学第六版部分课后题答案

第四章数据分布特征的测度 4.6 解：先计算出各组组中值如下： 4.8 解： ⑴ ⑵体重的平均数体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则：大约有68％的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以，女生的体重差异＝＝＝离散系数＝＝＝离散系数女男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅＝磅＝女男=?μ=?μ) (112.25磅＝=?σ

根据经验法则：大约有95％的人体重在此范围内。 4.9 解：在A 项测试中得115分，其标准分数为：在B 项测试中得425分，其标准分数为：所以，在A 项中的成绩理想。 4.11 解：成年组的标准差为：幼儿组的标准差为：所以，幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章参数估计 7.7 根据题意：N=7500，n=36（大样本）总体标准差σ未知，可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差：边际误差为：22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平％时，＝平均上网时间的置信区间为：，同理，置信水平％时，＝；置信水平％时，＝平均上网时间的置信区间分别为：，；，

SPSS统计分析报告分析报告案例

SPSS统计分析案例一、我国城镇居民现状近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。二、我国居民消费结构的横向分析第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医

疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动需,促进我国的经济发展方面有着重大的现实意义。三、我国居民消费结构的纵向分析进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费质量和消费结构都发生了明显的变化。城镇居民在食品、衣着、家庭设备用品三项支出在消费支出中的比重呈现明显的下降趋势,其中食品类支出比重降幅最大;衣着类有所下降;家庭设备用品类下降幅度不是很大。与此同时,医疗保健、交通通讯、文化娱乐教育服务、居住及杂项商品支出在消费支出中的比例均有上升,富裕阶段的消费特征开始显现。四、我国城镇居民消费结构及趋势的统计分析

《卫生统计学》课后思考题答案

《卫生统计学》思考题参考答案第一章绪论 1、统计资料可以分为那几种类型？举例说明不同类型资料之间是如何转换的？答：（1）1定量资料（离散型变量、连续型变量）、2无序分类资料（二项分类资料、无序多项分类资料）、3有序分类资料（即等级资料）；（2）例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级，应归为等级资料，若将该五个等级赋值为5、4、3、2、1，就可按定量资料处理。 2、统计工作可分为那几个步骤？答：设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。答：某人打靶100次，中靶次数少于等于5，那么该人一次打中靶的概率≤0.05，即可称该人一次打中靶的事件为小概率事件，可以视为很可能不发生。第二章调查研究设计 1、调查研究有何特点？答：（1）不能人为施加干预措施（2）不能随机分组（3）很难控制干扰因素（4）一般不能下因果结论 2、四种常用的抽样方法各有什么特点？答：（1）单纯随机抽样：优点是操作简单，统计量的计算较简便；缺点是当总体观察单位数量庞大时，逐一编号繁复，有时难以做到。

（2）系统抽样：优点是易于理解、操作简便，被抽到的观察单位在总体中分布均匀，抽样误差较单纯随机抽样小；缺点是在某些情况下会出现偏性或周期性变化。（3）分层抽样：优点是抽样误差小，各层可以独立进行统计分析，适合大规模统计；缺点是事先要进行分层，操作麻烦。（4）整群抽样：优点是易于组织和操作大规模抽样调查；缺点是抽样误差大。 3、调查设计包括那些基本内容？答：（1）明确调查目的和指标（2）确定调查对象和观察单位（3）选择调查方法和技术（4）估计样本大小（5）编制调查表（6）评价问卷的信度和效度（7）制定资料的收集计划（8）指定资料的整理与分析计划（9）制定调查的组织措施 4、调查表中包含那几种项目？答：（1）分析项目直接整理计算的必须的内容；（2）备查项目保证分析项目填写得完整和准确的内容；（3）其他项目大型调查表的前言和表底附注。第三章实验设计 1、简述实验设计的特点。

统计学(第六版)贾俊平课后习题集规范标准答案

第一章导论 1.1．1 （1）数值型变量。（2）分类变量。（3）离散型变量。（4）顺序变量。（5）分类变量。 1.2 （1）总体是该市所有职工家庭的集合；样本是抽中的2000个职工家庭的集合。（2）参数是该市所有职工家庭的年人均收入；统计量是抽中的2000个职工家庭的年人均收入。 1.3 （1）总体是所有IT从业者的集合。（2）数值型变量。（3）分类变量。（4）截面数据。 1.4 （1）总体是所有在网上购物的消费者的集合。（2）分类变量。（3）参数是所有在网上购物者的月平均花费。（4）参数（5）推断统计方法。

第二章数据的搜集 1.什么是二手资料？使用二手资料需要注意些什么？与研究内容有关的原始信息已经存在，是由别人调查和实验得来的，并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意：资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间，要注意数据的定义、含义、计算口径和计算方法，避免错用、误用、滥用。在引用二手资料时，要注明数据来源。 2.比较概率抽样和非概率抽样的特点，举例说明什么情况下适合采用概率抽样，什么情况下适合采用非概率抽样。概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算，当用样本对总体目标量进行估计时，要考虑到每个单位样本被抽中的概率，概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征，得到总体参数的置信区间，就使用概率抽样。非概率抽样是指抽取样本时不是依据随机原则，而是根据研究目的对数据的要求，采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低，而且对于抽样中的专业技术要求不是很高。它适合探索性的研究，调查结果用于发现问题，为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式，除此之外，还有那些搜集数据的方法？实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊？自填式优点：调查组织者管理容易，成本低，可以进行较大规模调查，对被调查者可以刻选择方便时间答卷，减少回答敏感问题的压力。缺点：返回率低，调查时间长，在数据搜

医学统计学案例分析报告.doc

医学统计学案例分析评述医学期刊论著：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确