医学统计学课后答案解析
医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学第七版课后答案及解析

医学统计学第七版课后答案及解析练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学课后答案解析

第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。
几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。
所谓“开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。
故百分位数是一个界值,也是分布数列的一百等份分割值。
显然,中位数即是P 50分位数。
即中位数是一特定的百分位数。
常用于制定偏态分布资料的正常值范围。
2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的离散程度大。
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。
其缺点是:1.不灵敏; 2.不稳定。
四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。
所以四分位数间距又可看成中间一半观察值的极差。
人卫第七版医学统计学课后答案及解析-李康、贺佳主编

人卫第七版医学统计学课后答案及解析-李康、贺佳主编本文介绍了医学统计学的基本概念和内容。
统计描述和推断是从样本数据中获得结论的重要方法,可以探测医学规律并提高研究结论的科学性。
医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计描述可以通过统计指标、统计表和统计图来表达结果,统计推断可以通过参数估计和假设检验来推断总体特征。
本文还介绍了定量数据的统计描述、正态分布与医学参考值范围以及定性数据的统计描述。
在计算和分析方面,本文提供了一些实例和参考答案。
一、单项选择题答案1.B2.A3.C4.D5.E6.D7.A8.C9.B10.A11、C12、B13、D14、A15、C1.[参考答案]t检验是用来检验两个样本均值是否有显著差异的方法,适用于样本数量较小、总体方差未知的情况。
2.[参考答案]t检验的原假设是两个样本均值相等,备择假设是两个样本均值不相等。
3.[参考答案]当样本数量较小、总体方差未知时,使用t 检验;当样本数量较大、总体方差已知或近似已知时,使用z 检验。
4.[参考答案]在t检验中,自由度是指样本数量减去估计的参数数量,其中估计的参数数量为1(即样本均值)。
5.[参考答案]在进行t检验时,需要先计算出样本均值、样本标准差和自由度,然后查找t分布表得到临界值,最后比较计算出的t值和临界值,判断是否拒绝原假设。
6.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用双侧检验,即备择假设为两个样本均值不相等。
7.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用配对样本t检验来比较两个相关样本的均值是否有显著差异。
8.[参考答案]在进行t检验时,如果样本数量较大、总体方差已知或近似已知,应该使用z检验来比较两个独立样本的均值是否有显著差异。
9.[参考答案]在进行t检验时,如果样本数量较小、总体方差未知,应该使用t分布表来查找临界值,以判断是否拒绝原假设。
医学统计学-课后答案

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
医学统计学第七版课后答案及解析

医学统计学第七版课后答案及解析目录第一章医学统计中的基本概念 (1)第二章集中趋势的统计描述 (2)第三章离散程度的统计描述 (5)第四章抽样误差与假设检验 (8)第五章 t检验 (10)第六章方差分析 (14)第七章相对数及其应用 (19)第八章2检验 (22)第九章非参数检验 (26)第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
医学统计学第五版孙振球课后答案及解析

医学统计学第五版孙振球课后答案及解析
1. 什么是统计学?
答:统计学是一门研究如何收集、组织、分析、概括和解释
数据的科学。
它是一种研究方法,用于收集、组织、分析、概括
和解释数据,以便更好地理解和控制现实世界中的现象。
统计学
的应用范围很广,可以用于研究社会、经济、医学、教育、科学、工程等各个领域。
2. 什么是抽样?
答:抽样是指从总体中抽取一定数量的样本,以便对总体进
行研究和分析的过程。
抽样是统计学中最重要的方法之一,它可
以帮助我们更好地了解总体的特征,从而更好地控制和管理现实
世界中的现象。
抽样的方法有很多,如简单随机抽样、分层抽样、系统抽样等。
医学统计学课后答案

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1. 举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007 年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007 年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000 人,分别测的其红细胞数,组成样本,其样本含量为2000 人。
2. 简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差得的实际观测随机误差是使重复观测获值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3. 举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章1、答:在统计学中用来描述集中趋势得指标体系就是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值得平均水平,适用于单峰对称或近似单峰对称分布资料得平均水平得描述。
几何均数:有些医学资料,如抗体得滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。
几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布得资料。
中位数与百分位数:中位数(median)就就是将一组观察值按升序或降序排列,位次居中得数,常用M 表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置得描述,也适用于开口资料得描述。
所谓“开口”资料,就是指数据得一端或者两端有不确定值。
百分位数(percentile)就是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %得观察值比P X 小,有(100-X )%观察值比P X 大。
故百分位数就是一个界值,也就是分布数列得一百等份分割值。
显然,中位数即就是P 50分位数。
即中位数就是一特定得百分位数。
常用于制定偏态分布资料得正常值范围。
2、答:常用来描述数据离散程度得指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差与标准差最为常用。
极差(range,记为R ),又称全距,就是指一组数据中最大值与最小值之差。
极差大,说明资料得离散程度大。
用极差反映离散程度得大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等得最短、最长潜伏期等。
其缺点就是:1、不灵敏; 2、不稳定。
四分位数间距(inter-quartile range)就就是上四分位数与下四分位数之差,即:Q =Q U-Q L ,其间包含了全部观察值得一半。
所以四分位数间距又可瞧成中间一半观察值得极差。
其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。
常用于描述偏态分布资料得离散程度。
极差与四分位数间距均没有利用所研究资料得全部信息,因此仍然不足以完整地反映资料得离散程度。
方差(variance)与标准差(standard deviation)由于利用了所有得信息,而得到了广泛应用,常用于描述正态分布资料得离散程度。
变异系数(coefficient of variance,CV )亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。
变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊得两组或多组资料得离散程度。
3、答:常用得相对数指标有:比,构成比与率。
比(ratio),又称相对比,就是A 、B 两个有关指标之比,说明A 为B 得若干倍或百分之几,它就是对比得最简单形式。
其计算公式为比=A /B 率(rate)又称频率指标,用以说明某现象发生得频率或强度。
常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。
计算公式为:)比例基数(单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ⨯=构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占得比重或分布,常以百分数表示,其计算公式为:100%=⨯某一组成部分的观察单位数构成比同一事物内各组成部分的观察单位总数4、答:当比较两类事物得总率时,如果此两同类事物得内部构成,特别就是某项能影响指标水平得重要特征在构成上不同,往往会高估或低估总率。
在这种情况下,直接进行两个总率得比较,会产生错误得结论。
此时,必须首先设法消除这种内部构成上得差别,才能进行比较。
统计学上将这种方法称为率得标准化(standardization method of rate),即采用统一得标准对内部构成不同得各组频率进行调整与对比得方法,调整后得率为标准化率,简称为标化率。
5(1) 编制频数分布表并绘制频数分布图,简述这组数据得分布特征;组段 频数 频率(%) ;累计频数(%)组中值 108 3 2、5 2、5 109、5 111~ 10 8、33 10、83 112、5 114~ 22 18、33 29、17 115、5 117~ 38 31、67 60、83 118、5 120~ 20 16、67 77、5 121、5 123` 18 15 92、5 124、5 126~ 7 5、83 98、33 126、5 129~132 2 1、67 100 129、5 合计 120 100(2) 计算中位数、均数、几何均数,用何者表示这组数据得集中位置好? 答:()3109.510112.522115.538118.520121.518124.57126.52139.5/120X ≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=119、4135 ()1lg lg3109.5lg10112.5lg 22115.5lg38118.5lg 20121.5lg18124.5lg7126.5lg 2139.5/120g X -≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⎡⎤⎣⎦ =119、25125 116.63d M =用均数较好、(3) 计算极差、标准差,用何者表示这组数据得离散趋势好? 答:极差:22、62四分位数间距:5、915 标准差:4、380736 用标准差表示较好、6.答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。
适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。
7、40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。
试计算平均滴度。
抗体滴度 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 人数 1 5 6 2 7 10 4 5几何均数:exp((ln(4)+5×ln(8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512))/40)=1288、答:此医生得分析就是不正确得,原因在于:首先明确率得定义:)比例基数(单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ⨯=发病率得分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病人数就是人次数;分母为“同时期平均人口数”,而按率得定义应为“同时期暴露总人数该单位抽样检查2839名职工,其中高血压患者中,男性就是178例,女性就是49例,共227例,可以计算高血压患者占接受检查所有职工得构成比为7、995773%至于40岁以上得患者占接受检查总人数得90、3%,也就是构成比;60岁以上者占接受检查总人数得10、2%也就是构成比,不能与发病率混为一谈。
关于高血压与性别有关得结论也不妥。
因为在接受检查人群中得男女内部构成比就是不同得,要进行比较首先要设法消除内部构成比得差异,即就就是率得标准化,然后比较。
第三章1 正态分布与标准正态分布得区别:正态分布就是一簇单峰分布得曲线,μ与σ可以有任意取值;标准正态分布就是一条单峰曲线,μ与σ有固定得值,μ=0,σ=1。
2 u = (x-μ)/σ= (μ-σ-μ)/σ= -1查标准正态分布表,得Φ(-1)=0、1587,所以小于μ-σ者所占得比例为15、87%。
3 医学参考值范围得含义:就是根据正常人得数据估计绝大多数正常人某项指标所在得范围。
选定同质得正常人作为研究对象。
所谓正常人就是指不具有影响所测指标得因素或疾病得那类同质人群。
确定原则:①选定同质得正常人群作为研究对象 ②控制检测误差 ③判断就是否分组 ④单、双侧问题 ⑤选择百分界值 ⑥确定可疑范围方法:①正态分布法:适用于服从正态分布或近似正态分布得资料 ②百分位数法:适用于不服从正态分布得资料 ③对数正态分布法:适用于对数正态分布得资料 4 如果资料服从正态分布,那么双侧95%正常值范围为μ±1、96σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。
5 1人以下得概率:P(x≤1)=P(0)+P(1)=C 1000、200、810+C 1010、210、89 =0、3758人以上得概率:P(X≥8)=P(8)+P(9)+P(10)=C 1080、280、82+C 1090、290、81+C 10100、2100、80 =7、79×1056 二项分布得应用条件:①观察单位只能有互相对立得两种结果之一。
②已知发生某一结果得概率π不变,其对立结果得概率则为1-π③n 次试验在相同得条件下进行,且各观察单位得结果互相独立,即每个观察单位得观察结果不会影响到其她观察单位得结果。
7 二项分布与正态分布之间得关系:随着n 得增大,二项分布逐渐逼近正态分布。
当nπ较大时,二项分布B(n,π)近似正态分布。
举例:病人得治愈与不治愈,理化检验结果得阴性与阳性,个体得发病与不发病等属于二项分布资料;某地区12岁男孩得身高,某学校同年级女生得体重等属于正态分布。
第四章型错误得最大风险,就是事前概率;P 值就是指由H 0所规定得总体作随机抽样,获得等于大于现有样本获得得检验统计量值得概率。
标明以多大得误差拒绝H 0,就是事后概率。
3 ①配对设计得差值得总体均数得可信区间表达公式:,1n d d t s α-±两均数差值得总体均数得可信区间表达公式: ②可以用可信区间回答假设检验得问题。
可信区间估计与假设检验时统计学中两种重要得、独特得思维方式,它们在原理上相通,均基于抽样误差理论,只就是考虑问题得角度不同。
例如:样本均数与总体均数得比较,用可信区间得估计方法,观察由样本信息估计得总体均数得可信区间就是否包含已知得总体均数,即可推断该样本就是否来自已知均数得总体;用假设检验得方法,先假设样本均数代表得总体均数等于某已知得总体均数,再()()⎪⎪⎭⎫ ⎝⎛+-+-+-±-nn nn sn s n t x x 2121222211,2111211να判断样本提供得信息就是否支持这种假设。
4 拒绝实际上成立得H 0,这类“弃真”得错误称为Ⅰ型错误或第一类错误;不拒绝实际上就是不成立得H 0,这类“存伪”得错误称为Ⅱ型错误或第二类错误。
第一类错误得概率用α表示,第二类错误得概率用β表示。
α越大,β越小;反之,α越小,β越大。
拒绝H 0,只可能犯第一类错误,不可能犯第二类错误;不拒绝H 0,只可能犯第二类错误,不可能犯第一类错误。
由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。