医学统计学课后答案.

合集下载

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社)第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能够根据样本估计。

显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

医学统计学课后答案

医学统计学课后答案

第二章1.答:在统计学顶用来描绘集中趋势的指标系统是均匀数,包含算术均数,几何均数,中位数。

均数反应了一组察看值的均匀水平,合用于单峰对称或近似单峰对称散布资料的均匀水平的描绘。

几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数散布呈明显偏态,各察看值之间呈倍数变化 (等比关系 ),此时不宜用算术均数描绘其集中地点,而应当使用几何均数( geometric mean)。

几何均数一般用 G 表示,合用于各变量值之间成倍数关系,散布呈偏态,但经过对数变换后成单峰对称散布的资料。

中位数和百分位数:中位数( median)就是将一组察看值按升序或降序摆列,位次居中的数,常用M表示。

理论上数据集中有一多半比中位数小,另一半比中位数大。

中位数既合用于资料呈偏态散布或不规则散布时集中地点的描绘,也合用于张口资料的描绘。

所谓“张口”资料,是指数据的一端或许两头有不确立值。

百分位数( percentile)是一种地点指标,以P X表示,一个百分位数P X将所有察看值分为两个部分,理论上有X%的察看值比P X小,有( 100-X)%察看值比P X大。

故百分位数是一个界值,也是散布数列的一百等份切割值。

明显,中位数即是P50分位数。

即中位数是一特定的百分位数。

常用于拟订偏态散布资料的正常值范围。

2.答:常用来描绘数据失散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。

极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。

极差大,说明资料的失散程度大。

用极差反应失散程度的大小,简单了然,故获取宽泛采纳,如用以说明传得病、食品中毒等的最短、最长潜藏期等。

其弊端是: 1.不敏捷; 2.不稳固。

四分位数间距( inter-quartile range)就是上四分位数与下四分位数之差,即: Q= Q U- Q L ,此间包含了所有察看值的一半。

所以四分位数间距又可当作中间一半察看值的极差。

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。

医学统计学课后答案

医学统计学课后答案

第二章1•答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。

均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。

几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。

中位数和百分位数:中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。

理论上数据集中有一半数比中位数小,另一半比中位数大。

中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。

所谓开口”资料,是指数据的一端或者两端有不确定值。

百分位数(percentile)是一种位置指标,以 P X表示,一个百分位数 P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。

故百分位数是一个界值,也是分布数列的一百等份分割值。

显然,中位数即是P50分位数。

即中位数是一特定的百分位数。

常用于制定偏态分布资料的正常值范围。

2•答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。

极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。

极差大,说明资料的离散程度大。

用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。

其缺点是:1•不灵敏;2•不稳定。

四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Q u — Q L ,其间包含了全部观察值的一半。

所以四分位数间距又可看成中间一半观察值的极差。

医学统计学课后习题答案解析

医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。

医学统计学 课后答案

医学统计学 课后答案

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。

故参数检验依赖于特定的分布类型,比较的就是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。

故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的就是分布或分布位置。

适用范围广,可适用于任何类型资料参数检验➢优点:资料信息利用充分;检验效能较高➢缺点:对资料的要求高;适用范围有限2.非参数检验➢优点:适用范围广,可适用于任何类型的资料➢缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1、举例说明总体与样本的概念。

研究人员通常需要了解与研究某一类个体,这个类就就是总体。

总体就是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体与有限总体之分,前者指总体中的个体就是无限的,如研究药物疗效,某病患者就就是无限总体,后者指总体中的个体就是有限的,它就是指特定时间、空间中有限个研究个体。

但就是,研究整个总体一般并不实际,通常能研究的只就是它的一部分,这个部分就就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2、简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差与非随机误差。

随机误差就是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,就是使实际观测值系统的偏离真实值的误差。

3、举例说明参数与统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

医学统计学课后习题答案

医学统计学课后习题答案

(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。

(2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本 是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。

(4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。

(5)概率:是描述随机事件发生的可能性大小的数值,用 p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。

(8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。

是非题:1. X2. X3. X4. X5. V6. V7. X单选题:7. 全距、方差、标准差、变异系数 8. 1.96 2.58名词解释:医学统计学第一章绪论 答案1. C2. E3. D4. C5. D6. B第二章计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标3.标准正态分布以卩服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。

4.参考值范围 参考值范围也称正常值范围,医学上常把把绝 大多数的某指 标范围称为指标的正常值范围填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料3. u -------- (变量变换)标准正态分布、 0、14.1.96 5. 47.5%6. 均数、标准差2.5868.27% 95% 99%9.全距R10.检验水准、显着性水准、0.05、0.01 (0.1 )11.80% 90% 95% 99% 95%12.95% 99%13.集中趋势、离散趋势14.中位数15.同质基础,合理分组16.均数,均数,卩,c,规律性17.标准差18.单位不同,均数相差较大是非题:1. X2. V3. X4. X5. X6. V7. V8. V9. V 10. V11. V 12. V 13. X 14. V 15. V 16. X 17. X 18 .X 19. ,V 20. V21. V单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. .C 15.A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. .C 25.A 26. C 27.B 28. D 29. D 30. D31. A 32. E 33. D 34. .A 35.D 36. D 37. C 38.E 39. D 40. B41. C 42. B 43. D 44.C 45 B问答题:1.均数、几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。

均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。

几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。

中位数和百分位数:中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。

理论上数据集中有一半数比中位数小,另一半比中位数大。

中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。

所谓“开口”资料,是指数据的一端或者两端有不确定值。

百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。

故百分位数是一个界值,也是分布数列的一百等份分割值。

显然,中位数即是P 50分位数。

即中位数是一特定的百分位数。

常用于制定偏态分布资料的正常值范围。

2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。

极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。

极差大,说明资料的离散程度大。

用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。

其缺点是:1.不灵敏; 2.不稳定。

四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。

所以四分位数间距又可看成中间一半观察值的极差。

其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。

常用于描述偏态分布资料的离散程度。

极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。

方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。

变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。

变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。

3.答:常用的相对数指标有:比,构成比和率。

比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。

其计算公式为比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。

常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。

计算公式为:)比例基数(单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ⨯=构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:100%=⨯某一组成部分的观察单位数构成比同一事物内各组成部分的观察单位总数4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。

在这种情况下,直接进行两个总率的比较,会产生错误的结论。

此时,必须首先设法消除这种内部构成上的差别,才能进行比较。

统计学上将这种方法称为率的标准化(standardization method of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。

5(1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;组段 频数 频率(%) ;累计频数(%) 组中值 108 3 2.5 2.5 109.5 111~ 10 8.33 10.83 112.5 114~ 22 18.33 29.17 115.5 117~ 38 31.67 60.83 118.5 120~ 20 16.67 77.5 121.5 123` 18 15 92.5 124.5 126~ 7 5.83 98.33 126.5 129~132 2 1.67 100 129.5 合计120100F r e q u e n c y''height (cm)''108.00111.00114.00117.00120.00123.00126.00129.00132.00135.000.005.0010.0015.0020.0025.0030.0035.00(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好? 答:()3109.510112.522115.538118.520121.518124.57126.52139.5/120X ≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=119.4135 ()1lg lg3109.5lg10112.5lg 22115.5lg38118.5lg 20121.5lg18124.5lg7126.5lg 2139.5/120g X -≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⎡⎤⎣⎦ =119.25125116.63d M =用均数较好.(3) 计算极差、标准差,用何者表示这组数据的离散趋势好? 答:极差:22.62四分位数间距:5.915 标准差:4.380736用标准差表示较好.6.答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。

适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。

7.40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。

试计算平均滴度。

抗体滴度 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512人数1 5 62 7 10 4 5几何均数:exp((ln(4)+5×ln(8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512))/40) =1288.答:此医生的分析是不正确的,原因在于:首先明确率的定义:)比例基数(单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ⨯=发病率的分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病人数是人次数;分母为“同时期平均人口数”,而按率的定义应为“同时期暴露总人数该单位抽样检查2839名职工,其中高血压患者中,男性是178例,女性是49例,共227例,可以计算高血压患者占接受检查所有职工的构成比为7.995773%至于40岁以上的患者占接受检查总人数的90.3%,也是构成比;60岁以上者占接受检查总人数的10.2%也是构成比,不能与发病率混为一谈。

关于高血压与性别有关的结论也不妥。

因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消除内部构成比的差异,即就是率的标准化,然后比较。

第三章1 正态分布与标准正态分布的区别:正态分布是一簇单峰分布的曲线,μ和σ可以有任意取值;标准正态分布是一条单峰曲线,μ和σ有固定的值,μ=0,σ=1。

2 u = (x-μ)/σ= (μ-σ-μ)/σ= -1查标准正态分布表,得Φ(-1)=0.1587,所以小于μ-σ者所占的比例为15.87%。

3 医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范围。

选定同质的正常人作为研究对象。

所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。

确定原则:①选定同质的正常人群作为研究对象 ②控制检测误差③判断是否分组④单、双侧问题⑤选择百分界值⑥确定可疑范围方法:①正态分布法:适用于服从正态分布或近似正态分布的资料②百分位数法:适用于不服从正态分布的资料③对数正态分布法:适用于对数正态分布的资料4 如果资料服从正态分布,那么双侧95%正常值范围为μ±1.96σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。

5 1人以下的概率:P(x≤1)=P(0)+P(1)=C1000.200.810+C1010.210.89 =0.3758人以上的概率:P(X≥8)=P(8)+P(9)+P(10)=C1080.280.82+C1090.290.81+C10100.2100.80 =7.79×1056 二项分布的应用条件:①观察单位只能有互相对立的两种结果之一。

②已知发生某一结果的概率π不变,其对立结果的概率则为1-π③n次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。

7 二项分布和正态分布之间的关系:随着n的增大,二项分布逐渐逼近正态分布。

当nπ较大时,二项分布B(n,π)近似正态分布。

举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。

第四章1标准差标准误不同:意义上:描述一组变量值的离散程度描述样本均数的离散称度应用上:1、标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好。

1、标准误越小,说明样本均数和总体均数的差异越小,用样本均数估计总体均数的可靠性越大。

2、x u sα±估计变量值的分布范围。

2、用xx t sα±估计总体均数的可信区间。

与n的关系:n越大,标准差越稳定n越大,标准误越小相同:1、都是描述变异度的统计指标2、xx nσσ=x σ与x σ成正比,与n 成反比;3、n 一定时,同一组资料,标准差越大,标准误也越大。

2 α水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯Ⅰ型错误的最大风险,是事前概率;P 值是指由H 0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。

标明以多大的误差拒绝H 0,是事后概率。

3 ①配对设计的差值的总体均数的可信区间表达公式:,1n d d t s α-±两均数差值的总体均数的可信区间表达公式:②可以用可信区间回答假设检验的问题。

可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。

相关文档
最新文档