《卫生统计学》课后思考题答案
医学统计学(高等教育出版社第二版)思考与练习答案

第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
医学统计学(第二版)思考与练习答案

第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
卫生统计学习题及答案(精华版)

统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
《卫生统计学》 案例版丁元林课后思考题问题详解

第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
《医学统计学》资料整理:医学统计学课程思考题及答案

医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。
医学统计学第七版课后答案及解析

医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
卫生统计学 第八版(李晓松)习题解答03
阳性率的比较: 2 5.10 。请讨论:该医生的统计处理是否正确?若否,请分析
原因并加以修正。
答:不正确,在对 P53 阳性率差异性就行检验的时候,表格理论频数出现 1<T<5 的情况,故应该采用连续用校正公式计算卡方值( 2=0.012,p>0.05)。
7. 什么是非参数检验?与参数检验相比,非参数检验有哪些优点? 答:不依赖于总体分布类型,也不对参数进行推断,而是对总体分布进行分析 的假设检验方法。与参数检验相比,非参数检验对资料要求低,适用范围广,计算 过程相对简单。
18. 生存数据分析的基本内容是什么?分析方法有哪些? 答:基本内容: (1)描述生存时间的分布特点。通过生存时间和生存结局的数据估计平均存 活时间及生存率,绘制生存曲线,根据生存曲线分析其生存特点等。例如上例中肾 上腺皮质癌研究所绘制的生存率曲线可提供预期治疗价值评估信息。 (2)比较生存曲线。通过相应的假设检验方法对不同样本的生存曲线进行比 较,以推断各总体的生存状况是否存在差别,比较不同治疗方法预后效果的差异。 例如本研究比较手术治疗和药物治疗肾上腺皮质癌患者的生存曲线,以推断两种疗 法的效果优劣。 (3)分析影响生存状况的因素。通过生存分析模型来探讨影响生存状况的因 素,通常以生存时间和结局作为因变量,而将可能的影响因素作为自变量,比如年 龄、性别、病理分型、临床分期、治疗方式等。通过拟合生存分析模型,筛选具有 统计学意义的生存状况的影响因素。 分析方法: (1)生存曲线的估计常用的方法有 Kaplan-Meier 法和寿命表法。 (2)生存曲线的比较常用的方法有 log-rank 检验。 (3)分析影响生存状况的因素的方法有 Cox 回归模型。
5. 某职业病防治院希望了解矽肺不同分期患者的胸部平片密度是否存在差异,
人卫第七版医学统计学课后答案及解析-李康、贺佳主编
人卫第七版医学统计学课后答案及解析-李康、贺佳主编本文介绍了医学统计学的基本概念和内容。
统计描述和推断是从样本数据中获得结论的重要方法,可以探测医学规律并提高研究结论的科学性。
医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计描述可以通过统计指标、统计表和统计图来表达结果,统计推断可以通过参数估计和假设检验来推断总体特征。
本文还介绍了定量数据的统计描述、正态分布与医学参考值范围以及定性数据的统计描述。
在计算和分析方面,本文提供了一些实例和参考答案。
一、单项选择题答案1.B2.A3.C4.D5.E6.D7.A8.C9.B10.A11、C12、B13、D14、A15、C1.[参考答案]t检验是用来检验两个样本均值是否有显著差异的方法,适用于样本数量较小、总体方差未知的情况。
2.[参考答案]t检验的原假设是两个样本均值相等,备择假设是两个样本均值不相等。
3.[参考答案]当样本数量较小、总体方差未知时,使用t 检验;当样本数量较大、总体方差已知或近似已知时,使用z 检验。
4.[参考答案]在t检验中,自由度是指样本数量减去估计的参数数量,其中估计的参数数量为1(即样本均值)。
5.[参考答案]在进行t检验时,需要先计算出样本均值、样本标准差和自由度,然后查找t分布表得到临界值,最后比较计算出的t值和临界值,判断是否拒绝原假设。
6.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用双侧检验,即备择假设为两个样本均值不相等。
7.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用配对样本t检验来比较两个相关样本的均值是否有显著差异。
8.[参考答案]在进行t检验时,如果样本数量较大、总体方差已知或近似已知,应该使用z检验来比较两个独立样本的均值是否有显著差异。
9.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用t分布表来查找临界值,以判断是否拒绝原假设。
医学统计学(第二版)思考与练习答案
定基比
环比
定基比
环比
1998~
a0
160.5
—
—
—
—
—
—
1999~
a1
144.2
-16.3
-16.3
0.90
0.90
-0.10
-0.10
2000~
a2
130.0
-30.5
-14.2
0.81
0.90
-0.19
-0.10
2001~
a3
120.2
-40.3
-9.8
0.75
0.92
-0.25
-0.08
2002~
4.正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数 和形态参数 ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间 内的面积为95.00%;区间 内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量
《卫生统计学》课后思考题答案
《卫生统计学》课后思考题答案《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
第三章实验设计1、简述实验设计的特点。
答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随机分配而定的。
2、简述一般选择受试对象的原则。
答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以是志愿者。
3、什么是混杂因素?设计时怎样控制混杂因素?答:混杂因素是指影响实验效应并与处理因素同时存在的非处理因素。
可以通过采取排除、平衡、或标准化的办法来控制混杂因素的影响。
4、什么是随机化?怎样实现随机抽样和随机分组?答:随机化就是使样本具有较好的代表性,使各组受试对象在重要的非处理因素方面具有较好的均衡性,提高实验结果的可比性。
一般用随机数字表、随机排列表或统计软件包来实现随机抽样和随机分组。
第四章定量资料的统计描述1、常用的平均数指标有哪些?各适用于何种类型资料?答:(1)有算术均数、几何均数和中位数、众数、调和数等。
(2)算术均数:适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势几何均数:等比资料、对数正态分布资料中位数:偏态分布资料、分布类型不明确的资料、“开口资料”(即一端或两端无确切数值的资料)2、如何描述定量资料的离散趋势?答:(1)极差:极差越大,单峰对称分布小样本资料的变异程度越大,只局限于初步描述;(2)四分位数间距:四分位数间距越大,偏态分布及分布的一端或两端无确切数值资料的离散程度越大,但不能全面概括所有观察值的变异情况;(3)方差和标准差:方差和标准差越大,对称分布特别是正态分布或近似正态分布资料的变异程度越大;(4)变异系数:变异系数越大,不同度量衡单位或者均数相差悬殊的资料的变异度越大。
3、正态分布有哪些基本特征?答:(1)概率密度函数曲线在均数处最高;(2)以均数为中心左右对称,且逐渐减少;(3)正态分布有两个参数,即μ和σ;(4)曲线下的面积分布有一定规律。
第五章定性资料的统计描述1、相对数适用于何种类型的资料进行统计描述?答:相对数适用于定性资料的统计描述。
2、率和构成比在应用上主要区别是什么?答:率反映事物发生的强度与频率;构成比表示事物内部各组成部分的频数所占的比重和分布。
3、什么情况下需要对率进行标准化?直接标准化法与间接标准化法在应用上有何区别?答:若要对比的两组对象内部构成的差别足以影响结论时,需要对率进行标准化。
直接法:已知被观察人群中各年龄组的患病率等资料,适用于两组资料中某事物发生率的互相对比间接法:适用于仅已知各年龄组的观察单位数和总患病率的资料4、什么是动态数列?分析动态数列有哪些基本指标?答:动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标,用以说明事物在时间上的变化和发展趋势。
常用动态数列分析指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
第六章总体均数和总体率的估计1、样本均数的标准误的意义是什么?答:反映抽样误差的大小。
越大,样本均数的分布越分散,样本均数与总体均数差别越大,由样本均数估计总体均数的可靠性就越小;反之,样本均数分布就越集中,样本均数与总体均数差别就越小,由样本均数估计总体均数可靠性就越大。
2、标准误与标准差有何区别?答:①意义不同:标准差:表示观测值的变异程度标准误:反映抽样误差的大小②用途不同:标准差:确定医学参考值范围标准误:用于统计推断(参数估计、假设检验)③公式不同:标准差:标准误:3、正常值范围与总体均数的可信区间有何区别?答:(1)意义不同:总体均数的可信区间是按预先给定的概率,确定的未知参数的可能范围;正常值范围是描述“正常人”的解剖、生理、生化、某项指标的波动范围(2)公式不同可信区间:σ已知:或σ未知但n ≥50:或σ未知:正常值范围:正态分布:或偏态分布:PX ~ P100-X(3)用途不同:总体均数的可信区间是用于估计总体均数;正常值范围是用于判断观察对象的某项指标正常与否。
4、二项分布、Poisson分布与正态分布之间有何区别与联系?答:区别:二项分布和Poisson分布是离散型概率分布,用概率函数描述其分布状况;而正态分布是连续性概率分布,用密度函数描述其分布状况。
联系:Poisson分布可以看作是发生概率π很小而观察例数n很大的二项分布;在λ>20时,Poisson分布的平均计数近似正态分布;在n较大,且nπ与n(1-π)均大于5时,二项分布接近于正态分布。
第七章假设检验1、假设检验的意义何在?应用假设检验时要注意哪些问题?答:意义:用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。
通过假设检验来分析样本指标和总体指标之间是否存在显著差异,从而作出判断是否接受原假设。
应用假设检验时注意的问题:1应有严密的研究设计,即总体应有同质性,样本应有代表性及组间具有可比性;2正确理解a水准和P值的意义,P值越小,越有理由拒绝H0,而a是说明P值小到何种程度才拒绝H0;3正确理解结论的统计学意义,有统计学意义并不一定有实际意义;4假设检验的结论不能绝对化。
2、答:(1)由抽样误差所致(2)由于两样本均数来自不同的总体,这两不同的总体参数之间存在显著性差异。
3、假设检验与区间估计有何区别及联系?答:区别:(1)可信区间用于说明量的大小,即推断总体均数的范围;假设检验用于推断质的不同,即判断两总体均数是否不同;(2)可信区间比假设检验可提供更多的信息:可信区间不但能回答差别有无统计学意义,而且还能提示差别有无实际的专业意义。
联系:可信区间亦可回答假设检验的问题:可信区间包含H0,按α水准,不拒绝H0;若不包含H0,则按α水准,拒绝H0,接受H1。
4、I型错误与II型错误的区别及联系何在?检验效能的含义是什么?答:(1)区别:I型错误是H0实际上是成立的,但由于抽样的原因,拒绝了H0,称“弃真”,概率用a表示;II型错误是实际上是不成立的,但假设检验没有拒绝它,称“取伪”,概率用β表示。
联系:当样本含量固定时,a增大,β减小;反之亦然;若同时减小a和β,则只能增大样本含量。
(2)检验效能的含义:当两总体参数确实有差别时,按a水准能够发现这种差别的能力。
5、怎样正确运用单侧检验和双侧检验?答:首先应考虑所要解决问题的目的,根据专业知识来确定。
若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。
第八章t检验1、两样本均数比较时为什么要做统计检验?答:两样本均数分别代表的总体均数μ1与μ2相等时,也可能会因抽样误差而导致两样本均数不相等,因此需要做统计检验。
2、两样本均数检验比较的t检验中,什么情况下做单侧检验?什么情况下做双侧检验?答:若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。
3、t检验要求满足哪些基本条件?答:(1)资料服从正态分布(2)方差齐性(3)未知且n 较小(n<50)4、在两样本t检验,如果方差不齐,但两组样本量相同并且很大,能否忽略t检验对方差不齐的要求?答:能。
n1和n2均大于50时,可不必做方差齐性检验;若两总体方差不具有齐性,可采用t’或者进行变量转换或者用秩和检验来处理。
5、对样本均数与某已知的总体均数或两样本均数的差别做统计检验,可信区间与t检验有什么关系?答:可信区间包含H0,按α水准,不拒绝H0;若不包含H0,则按α水准,拒绝H0,接受H1。
第九章方差分析1、为什么不能用两两比较的t检验进行多个样本均数的比较?答:用两两比较的t检验进行多个样本均数的比较时,需要进行多次检验,根据概率乘法法则,全部判断正确的概率大大降低,犯I类错误的概率也就增大,甚至远远大于检验水准。
因此,多组均数之间的两两比较不能直接用t检验。
取而代之的是,必须在方差分析结果为拒绝H0接受H1的基础上,进行多个样本的两两比较。
2、方差分析为何是单侧检验?答:F统计量(F=组间均方/组内均方)若原假设成立,即各处理组的样本来自于同一总体,则组间均方应与组内均方差不多,即F 统计量在1附近波动;否则,若原假设不成立,即不同处理的作用不同时,组间均方(处理因素的作用)一般大于组内均方(随机误差),因此,F统计量一般往大于1的方向趋化,从而在作结论时,若F统计量大到一定程度,就拒绝原假设。
因此,F统计量在0侧是不可能的,因此只会在另一侧,从而认为方差分析是单侧检验。
3、为什么说随机区组设计方差分析的效率高于完全随机分组设计的方差分析?答:由于随机区组设计利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异种分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理组间的F值更容易出现显著性,从而提高了实验效率。