卫生统计学课后思考题答案

合集下载

医学统计学课后习题答案解析

医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。

2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。

统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。

统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。

4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。

5答系统误差、随机测量误差、抽样误差。

系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。

6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。

第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。

医学统计学复习思考题及参考答案

医学统计学复习思考题及参考答案

预防医学第三篇复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。

例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。

从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。

抽取样本的目的是用样本的信息推论总体特征。

2.简述3种变量类型的特征。

(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。

第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

2.全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

《卫生统计学》 案例版丁元林课后思考题问题详解

《卫生统计学》 案例版丁元林课后思考题问题详解

第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。

2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。

3、举例说明小概率事件的含义。

答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。

第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。

(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。

(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

《医学统计学》资料整理:医学统计学课程思考题及答案

《医学统计学》资料整理:医学统计学课程思考题及答案

医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。

样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。

2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。

3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。

4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。

A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。

A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。

因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。

u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。

校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。

医学统计学复习思考题及参考答案

医学统计学复习思考题及参考答案

医学统计学复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。

例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。

从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。

抽取样本的目的是用样本的信息推论总体特征。

2.简述3种变量类型的特征。

(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。

第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?2.全距、四分位数间距、方差、标准差、变异系数各有何特点?3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的“正常人”。

一般认为样本含量应在100例以上,并以取得一个比较稳定的样本分布为原则。

(2)对抽取的正常人进行准确而统一的测定,控制测量误差。

(3)判断是否需要分组制定参考值范围。

第十五章数值变量的统计推断2.参考值范围与可信区间有何区别(1)意义不同:参考值范围是指同质总体中包括一定数量(如95%或99%)个体值的估计范围。

可信区间是指按一定的可信度来估计总体参数所在范围。

(2)计算方法不同:参考值范围用uS计算。

可信区间用t,S或uS计算,前者用标准差,后者用标准误。

3.何谓假设检验其一般步骤是什么所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。

医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案
逐年
定基比
环比
定基比
环比
1998~
a0
160.5






1999~
a1
144.2
-16.3
-16.3
0.90
0.90
-0.10
-0.10
2000~
a2
130.0
-30.5
-14.2
0.81
0.90
-0.19
-0.10
2001~
a3
120.2
-40.3
-9.8
0.75
0.92
-0.25
-0.08
2002~
4.正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数 和形态参数 ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间 内的面积为95.00%;区间 内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量

医学统计学课后答案

医学统计学课后答案

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。

故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。

故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。

适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1. 举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007 年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007 年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000 人,分别测的其红细胞数,组成样本,其样本含量为2000 人。

2. 简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差得的实际观测随机误差是使重复观测获值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3. 举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。

2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。

3、举例说明小概率事件的含义。

答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。

第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。

(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。

(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。

3、调查设计包括那些基本容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的容;(2)备查项目保证分析项目填写得完整和准确的容;(3)其他项目大型调查表的前言和表底附注。

第三章实验设计1、简述实验设计的特点。

答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随机分配而定的。

2、简述一般选择受试对象的原则。

答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以是志愿者。

3、什么是混杂因素?设计时怎样控制混杂因素?答:混杂因素是指影响实验效应并与处理因素同时存在的非处理因素。

可以通过采取排除、平衡、或标准化的办法来控制混杂因素的影响。

4、什么是随机化?怎样实现随机抽样和随机分组?答:随机化就是使样本具有较好的代表性,使各组受试对象在重要的非处理因素方面具有较好的均衡性,提高实验结果的可比性。

一般用随机数字表、随机排列表或统计软件包来实现随机抽样和随机分组。

第四章定量资料的统计描述1、常用的平均数指标有哪些?各适用于何种类型资料?答:(1)有算术均数、几何均数和中位数、众数、调和数等。

(2)算术均数:适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势几何均数:等比资料、对数正态分布资料中位数:偏态分布资料、分布类型不明确的资料、“开口资料”(即一端或两端无确切数值的资料)2、如何描述定量资料的离散趋势?答:(1)极差:极差越大,单峰对称分布小样本资料的变异程度越大,只局限于初步描述;(2)四分位数间距:四分位数间距越大,偏态分布及分布的一端或两端无确切数值资料的离散程度越大,但不能全面概括所有观察值的变异情况;(3)方差和标准差:方差和标准差越大,对称分布特别是正态分布或近似正态分布资料的变异程度越大;(4)变异系数:变异系数越大,不同度量衡单位或者均数相差悬殊的资料的变异度越大。

3、正态分布有哪些基本特征?答:(1)概率密度函数曲线在均数处最高;(2)以均数为中心左右对称,且逐渐减少;(3)正态分布有两个参数,即m 和s;(4)曲线下的面积分布有一定规律。

第五章定性资料的统计描述1、相对数适用于何种类型的资料进行统计描述?答:相对数适用于定性资料的统计描述。

2、率和构成比在应用上主要区别是什么?答:率反映事物发生的强度与频率;构成比表示事物部各组成部分的频数所占的比重和分布。

3、什么情况下需要对率进行标准化?直接标准化法与间接标准化法在应用上有何区别?答:若要对比的两组对象部构成的差别足以影响结论时,需要对率进行标准化。

直接法:已知被观察人群中各年龄组的患病率等资料,适用于两组资料中某事物发生率的互相对比间接法:适用于仅已知各年龄组的观察单位数和总患病率的资料4、什么是动态数列?分析动态数列有哪些基本指标?答:动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标,用以说明事物在时间上的变化和发展趋势。

常用动态数列分析指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

第六章总体均数和总体率的估计1、样本均数的标准误的意义是什么?答:反映抽样误差的大小。

越大,样本均数的分布越分散,样本均数与总体均数差别越大,由样本均数估计总体均数的可靠性就越小;反之,样本均数分布就越集中,样本均数与总体均数差别就越小,由样本均数估计总体均数可靠性就越大。

2、标准误与标准差有何区别?答:①意义不同:标准差:表示观测值的变异程度标准误:反映抽样误差的大小②用途不同:标准差:确定医学参考值围标准误:用于统计推断(参数估计、假设检验)③公式不同:标准差:标准误:3、正常值围与总体均数的可信区间有何区别?答:(1)意义不同:总体均数的可信区间是按预先给定的概率,确定的未知参数的可能围;正常值围是描述“正常人”的解剖、生理、生化、某项指标的波动围(2)公式不同可信区间:σ已知:或σ未知但 n ≥50:或σ未知:正常值围:正态分布:或偏态分布:PX ~ P100-X(3)用途不同:总体均数的可信区间是用于估计总体均数;正常值围是用于判断观察对象的某项指标正常与否。

4、二项分布、Poisson分布与正态分布之间有何区别与联系?答:区别:二项分布和Poisson分布是离散型概率分布,用概率函数描述其分布状况;而正态分布是连续性概率分布,用密度函数描述其分布状况。

联系:Poisson分布可以看作是发生概率π很小而观察例数n很大的二项分布;在λ>20时,Poisson分布的平均计数近似正态分布;在n较大,且nπ与n(1-π)均大于5时,二项分布接近于正态分布。

第七章假设检验1、假设检验的意义何在?应用假设检验时要注意哪些问题?答:意义:用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。

通过假设检验来分析样本指标和总体指标之间是否存在显著差异,从而作出判断是否接受原假设。

应用假设检验时注意的问题:1应有严密的研究设计,即总体应有同质性,样本应有代表性及组间具有可比性; 2正确理解a水准和P值的意义,P值越小,越有理由拒绝H0,而a是说明P值小到何种程度才拒绝H0; 3正确理解结论的统计学意义,有统计学意义并不一定有实际意义; 4假设检验的结论不能绝对化。

2、答:(1)由抽样误差所致(2)由于两样本均数来自不同的总体,这两不同的总体参数之间存在显著性差异。

3、假设检验与区间估计有何区别及联系?答:区别:(1)可信区间用于说明量的大小,即推断总体均数的围;假设检验用于推断质的不同,即判断两总体均数是否不同;(2)可信区间比假设检验可提供更多的信息:可信区间不但能回答差别有无统计学意义,而且还能提示差别有无实际的专业意义。

联系:可信区间亦可回答假设检验的问题:可信区间包含H0,按a水准,不拒绝H0;若不包含H0,则按a水准,拒绝H0,接受H1。

4、I型错误与II型错误的区别及联系何在?检验效能的含义是什么?答:(1)区别:I型错误是H0实际上是成立的,但由于抽样的原因,拒绝了H0,称“弃真”,概率用a表示;II型错误是实际上是不成立的,但假设检验没有拒绝它,称“取伪”,概率用b表示。

联系:当样本含量固定时,a增大,b减小;反之亦然;若同时减小a和b,则只能增大样本含量。

(2)检验效能的含义:当两总体参数确实有差别时,按a水准能够发现这种差别的能力。

5、怎样正确运用单侧检验和双侧检验?答:首先应考虑所要解决问题的目的,根据专业知识来确定。

若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。

第八章 t检验1、两样本均数比较时为什么要做统计检验?答:两样本均数分别代表的总体均数m1与m2相等时,也可能会因抽样误差而导致两样本均数不相等,因此需要做统计检验。

2、两样本均数检验比较的t检验中,什么情况下做单侧检验?什么情况下做双侧检验?答:若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。

3、t检验要求满足哪些基本条件?答:(1)资料服从正态分布(2)方差齐性(3)未知且 n 较小(n<50)4、在两样本t检验,如果方差不齐,但两组样本量相同并且很大,能否忽略t检验对方差不齐的要求?答:能。

n1和n2均大于50时,可不必做方差齐性检验;若两总体方差不具有齐性,可采用t’或者进行变量转换或者用秩和检验来处理。

5、对样本均数与某已知的总体均数或两样本均数的差别做统计检验,可信区间与t检验有什么关系?答:可信区间包含H0,按a水准,不拒绝H0;若不包含H0,则按a水准,拒绝H0,接受H1。

第九章方差分析1、为什么不能用两两比较的t检验进行多个样本均数的比较?答:用两两比较的t检验进行多个样本均数的比较时,需要进行多次检验,根据概率乘法法则,全部判断正确的概率大大降低,犯I类错误的概率也就增大,甚至远远大于检验水准。

因此,多组均数之间的两两比较不能直接用t检验。

取而代之的是,必须在方差分析结果为拒绝H0接受H1的基础上,进行多个样本的两两比较。

2、方差分析为何是单侧检验?答:F统计量(F=组间均方/组均方)若原假设成立,即各处理组的样本来自于同一总体,则组间均方应与组均方差不多,即F统计量在1附近波动;否则,若原假设不成立,即不同处理的作用不同时,组间均方(处理因素的作用)一般大于组均方(随机误差),因此,F统计量一般往大于1的方向趋化,从而在作结论时,若F统计量大到一定程度,就拒绝原假设。

因此,F统计量在0侧是不可能的,因此只会在另一侧,从而认为方差分析是单侧检验。

3、为什么说随机区组设计方差分析的效率高于完全随机分组设计的方差分析?答:由于随机区组设计利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组变异种分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理组间的F值更容易出现显著性,从而提高了实验效率。

相关文档
最新文档