11-1.计数资料的统计推断

合集下载

统计描述与统计推断

统计描述与统计推断

统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。

统计描述是统计分析的最基本内容,是指应用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。

(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。

(1)集中趋势。

指频数表中频数分布表现为频数向某一位置集中的趋势。

集中趋势的描述指标:1)算术平均数。

直接法:x为观察值,n为个数加权法又称频数表法,适用于频数表资料,当观察例数较多时用。

f为各组段的频数。

2)几何平均数(geometric mean)。

几何平均数用符号G表示。

用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。

直接法:加权法又称频数表法,当观察例数n较大时,可先编制频数分布表,用此法算几何平均数:3)百分位数(percentile )与中位数(median )。

百分位数是一种位置坐标,用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等,其中25P 、50P 、75P 又称为四分位数。

百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。

中位数是一个特定的百分位数即50P ,用符号M 表示。

把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。

中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。

中位数理论上可以用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。

其计算方法有直接法和频数表法两种。

直接法:当观察例数n 不大时,此法常用,先将观察值按大小次序排列,选用下列公式求M 。

医学统计学学习笔记

医学统计学学习笔记

医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。

统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。

概率为参数,频率为统计量。

4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。

不能用于开口型资料。

u(总体均数),X(样本均数)。

b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。

观察值不能为0 、不能同时有正有负。

同一资料算得的几何均数小于算术均数。

c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。

当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。

用频数表法计算百分位数时,组距不一定要相等。

P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。

计算方法为求倒数的均值后再取其倒数。

SPSS:在Transform中输入公式。

2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。

b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。

计数资料的统计描述

计数资料的统计描述

率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
式中比例基数,可以取100%、1000‰、 10万/10万…等。
常用的率有发病率、患病率、死亡率、 病死率、治愈率等。
例10-1 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
二、构成比(结构相对数)
构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重 或位次。
通常以100%为比例基数。其计算公式为:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
例10-2 某医院1990年和1998年住院病人死于五 种疾病的人数见表10-1。
表 10-1 某医院 1990 年和 1998 年住院病人五种疾病死亡人数和构成比
疾病构成
1990 年
1998 年
死亡人数 构成比(%)
死亡人数 构成比(%)
恶性肿瘤
58
30.53
40
26.85
循环系统疾病
44
23.16
﹡2、不能以构成比代替率
构成比是用以说明事物内部某种构成所 占比重或分布,并不说明某现象发生的 频率或强度。
统计描述是指选用适当的特征性统计指标
(即统计量)、合适的统计表、统计图正确地描
述资料的分布规律和数量特征。
计数资料的统计描述
常用相对数 应用相对数的注意事项 率的标准化法
一:常用相对数
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。
但绝对数通常不具有可比性:

卫生统计学题库

卫生统计学题库

最佳选择题1.收集资料的方法是:EA.收集各种报表B.收集各种工作记录C.进行专题调查D.进行科学实验E.以上都对2.统计工作的基本步骤是:DA.调查资料、审核资料、整理资料B.收集资料、审核资料、分析资料C.调查资料、整理资料、分析资料D.收集资料、整理资料、分析资料E.以上都对3.在抽样研究中样本是:DA.总体中的一部分B.总体中任意一部分C.总体中典型部分D.总体中有代表性的一部分E.总体中有意义的一部分4.计量资料、计数资料和等级资料的关系是:CA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D:A.普通线图B.直方图C.构成比直条图D.半对数线图E.直条图6.直方图可用于:A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度7.统计图表的要求是:A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时,分组数目一般为:E.>209.平均数作为一种统计指标是用来分析:A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是:A.全距B.标准差C.方差D.变异系数E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是:A.从未患过病的人B.健康达到了要求的人C.排除影响被研究指标的疾病和因素的人D.只患过小病但不影响研究指标的人E.排除了患过某病或接触过某因素的人 12.标准误:A.与标准差呈反比B.与标准差呈正比C.与标准差的平方呈反比D.与标准差平方呈正比E.以上都不对13.x σ是指:A.所有观察值对总体均数的离散程度B.某一个样本均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有含量相同的样本均数对总体均数的离散程度14.2.58XX S ±表示:%的正常值范围 %的可信区间 %的正常值范围 %的可信区间 E.以上都不对15.构成比通常以下列哪项指标为比例基数: % ‰ 万 10万 E.视具体情况而定 16.一事物各构成比部分相对数之和应为:A.大于1B.小于1C.等于1D.不一定E.以上都不对17.正态曲线下,横轴上从–∞到1.96μσ+的面积为A 、95%B 、45%C 、%D 、%E 、不能确定 18. 进行统计分析的资料必须是A 、完整、准确、及时的B 、随机取得的C 、满足条件齐同的D 、数量足够的E 、以上都对 19.指出下列变量中哪一个指标为统计量A.p B.σC.μD.πE.β20.计算样本率的抽样误差适用公式为:E.以上都不对×C 表的2χ检验的自由度为:A.1R -B.1C -C.1RC -D.(1)(1)R C --E.2R C ⨯-22.实验设计的基本原则为A.齐同原则B.随机原则C.对照原则D.重复原则E.以上都是 23.在相关分析中:A.r越接近1,散点图越集中 B.r越接近0,散点图越集中C.0r <,散点图越集中D.0r >,散点图越集中E.以上全不对24.已知1r =,则一定有:A.1b =B.1a =C. ,0Y X S = D.,Y X YS S = E.,Y X XS S =25.相关分析的主要内容包括:A.确定变量间的数量关系B.确定变量之间有无关系C.确定变量之间有无因果关系D.确定变量之间关系的密切程度E.以上都不是26.在配对法秩和检验中,共有8对数据,且差值中没出现0,27T -=,则T +=:A. -327.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说:A.正秩和的绝对值大于负秩和的绝对值B.正秩和的绝对值小于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等E.正秩和的绝对值与负秩和的绝对值相差很大28.在成组设计两样本比较的秩和检验中,甲组中最小数据有2个,,乙组中最小数据也有2个,,则数据的秩次为:当第二类错误β由变到时,则第一类错误α是:A.增大B.减小C.不确定D.不变化E.以上都不对30.下列指标除了哪项均为疾病统计指标:A.治愈率B.某病病死率C.某病死亡专率D.感染率E.发病率31.计算某抗体滴度的平均水平,一般宜选择A、算术均数B、几何均数C、中位数D、百分位数E、极差32.统计推断的内容A、是用样本指标估计相应的总体指标B、是检验统计上的“假设”C、估计正常值范围D、A、B均不是E、A、B均是33.比较身高与体重的变异程度宜用的指标是A、标准差B、标准误C、四分位间距D、变异系数E、全距34.观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是A、 B、 C、 D、 20 E、1035.当n一定时,第二类错误β由变到时,第一类错误A、增大B、减小C、不确定D、不变化E、以上都不对36.两小样本计量资料比较的假设检验,应首先考虑A、用t检验 B 、用u检验 C、用秩和检验 D 、资料符合t检验还是秩和检验的条件 E、任选一种检验方法37.抽样误差指的是A、个体值与总体值之差B、样本统计量之间及样本统计量与总体参数值之差C、个体值与统计量值之差D、总体参数值与总体参数值之差E、以上都不对38.同一双变量资料进行直线相关与回归分析,有A、0,0r b><B、0,0r b>>C、0,0r b<>D、r b=E、r与b的符号无关39.用均数和标准差可全面描述下列哪项资料的特征A、正偏态分布B、负偏态分布C、正态分布D、非对称分布40.四个样本率作比较,220.01,(3)χχ>,可认为各总体率不等或不全相等 B、各总体率均不相等 C、各样本率均不相等D、各样本率不等或不全相等E、各总体率相等二、填空题1、统计工作的基本步骤是、、 ;2、统计表的结构主要由、、和组成;3、平均数主要包括、和 ;4、统计资料可分为、和三种;5、图可描述一事物随另一事物变化的趋势, 图描述一事物随另一事物变化的速度;6、用和可全面描述偏态分布的计量资料的特征7、频数分布的两个特征是和三、是非题1.比较一批儿童的身高和体重的变异程度宜用标准差;2.直方图可以用于反映一批新生儿出生体重的分布情况;3.某地区某病连续3年患病率分别为%、%、%,则该病3年总的患病率为:++/3=%;4.当抽样研究的样本含量增大时,均数的标准误会变小;5.当自由度趋向无穷大时,t分布就是标准正态分布;6.两样均数比较的t检验的目的在于检验两样本均数差别是否等于0;7.χ2检验可用于两个样本均数的比较;8.直线相关反映两变量的相互直线关系;9.相关关系一定是因果关系;10.若t检验结果为拒绝H0,则P值越小,说明两总体均数差别越大;四、简答题1.计量标准化率时,通常以什么作为标准人口2.计算参考值范围的方法有哪些3.简述非参数检验的应用条件;4.等级相关特别适用于哪些资料五、计算题1.大量研究显示,汉族足月正常产男性新生儿临产前双顶径均数为;某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径cm资料如下:试问该山区男性新生儿临产前双顶径是否与一般新生儿相等假设检验统计量为2.某地抽样调查了360名健康成年男性的红细胞数,其均数为,标准差为,问该地男性红细胞数与标准值有无差别假设检验统计量为3.研究者为比较耳垂血和手指血的白细胞数,调查8名成年人,同时采取耳垂血和手指血,见下表;编号: 1 2 3 4 5 6 7 8耳垂血:手指血:问:1若资料服从正态分布,试比较两者的白细胞数是否相同假设检验统计量为2若资料不服从正态分布,试比较两者的白细胞数是否相同4.尿铅测定过去采用湿式热消法—双硫脲法,后改用硝酸—高锰酸钾冷消化法,资料如下, 患者号 1 2 3 4 5 6 7 8 9 10冷法热法问:1若资料服从正态分布,试比较两法所得结果有无差别假设检验统计量为2若资料不服从正态分布,试比较两法所得结果有无差别5.某医师用两种疗法治疗脑血管梗塞,结果见下表,试比较两种疗法的疗效是否相同假设检验统计量为10分两种疗法治疗脑梗塞效果疗法人数有效例数有效率%甲疗法 31 25乙疗法 32 296.欲了解甲乙两医学院卫生管理专业学生的英语水平,随机抽取108人进行达标考试,结果见下表,试比较两医学院卫生管理专业学生的英语达标率有无差别假设检验统计量为两医学院卫生管理专业学生的英语达标率医学院达标人数参加考试人数达标率%甲30 42乙32 66A.均数不变B.标准差不变C.两者均变D.两者均不变各观测值同时加或减某一常数B各观测值同时乘或除某一常数C用变异系数此较变异程度,适宜于医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于&not;&not;统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加或减同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+小时,问该食物中毒的平均潜伏期为多少小时 CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±B X±C μ±D μ±,υSXE X±17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<,有统计意义;P愈小则 EA 说明两样本均数差别愈大B 说明两总体均数差别愈大C 说明样本均数与总体均数差别愈大D 愈有理由认为两样本均数不同E 愈有理由认为两总体均数不同23.由10对20个数据组成的资料作配对t检验,其自由度等于CA 10B 20C 9D 18E 1924.t检验结果,P>,可以认为 BA两总体均数差别无显着性B两样本均数差别无显着性C两总体均数差别有显着性D两样本均数差别有显着性E以上都不对25.下列哪项不是t检验的注意事项 DA资料应具备可比性B下结论切忌绝对化C根据资料选择适宜的检验方法D分母不宜过小E资料应服从正态分布26.在一项抽样研究中,当样本量逐渐增大时 BA 标准差逐渐减少B 标准误逐渐减少C 标准差逐渐增大D 标准误逐渐增大E 标准差和标准误都逐渐增大27.t<v,统计上可认为 CA两总体均数,差别无显着性B两总体均数,差别有显着性C两样本均数,差别无显着性D两样本均数,差别有显着性E以上均不是28.两样本均数的t检验中,检验假设H0是BA μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X229.同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠AA. Sx B .S C .x D .CV E S230.标准差与标准误的关系是:CA两者相等B后者大于前者C前者大于后者D不一定 E 随样本例数不同31.在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内CA均数加减倍的标准差B均数加减倍的标准差C均数加减倍的标准误D均数加减倍的标准误E以上都不对32.同一自由度下,P值增大CA t值不变B t值增大C t值减小D t值与P值相等E t值增大或减小33.两样本作均数差别的t检验,要求资料分布近似正态,还要求 DA两样本均数相近,方差相等B两样本均数相近C两样本方差相等D两样本总体方差相等E两样本例数相等第十章分类变量资料的统计描述与推断34.构成比的重要特点是各组成部分的百分比之和 CA一定大于1 B一定小于l C一定等于1 D一定等于0 E随资料而异35.计算相对数的目的是CA为了进行显着性检验B为了表示绝对水平C为了便于比较D为了表示实际水平E为了表示相对水平36.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是BA率B构成比C相对比D绝对数E标化率37.四个样本率作比较,x2>3,可以认为AA各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同E样本率与总体率均不相同38.卡方检验中自由度的计算公式是DA行数×列数 B n-1 C N-k D行数-1列数-1 E行数×列数-139.作四格表卡方检验,当N>40,且__________时,应该使用校正公式EA T<5B T>5C T<1D T>5E 1<T<540.若X2≥X2 ν则AA P≤0.05B P≥0.05C P<0.05D P=0.05E P>0.05 41.相对数使用时要注意以下几点,其中哪一项是不正确的BA 比较时应做假设检验B 注意离散程度的影响C 不要把构成比当率分析D 二者之间的可比性E 分母不宜过小42.反映某一事件发生强度的指标应选用DA 构成比B 相对比C 绝对数D 率E变异系数43.反映事物内部组成部分的比重大小应选用 AA构成比 B 相对比C绝对数D率E变异系数44.计算标化率的目的是DA使大的率变小, B使小的率变大C使率能更好的代表实际水平D消除资料内部构成不同的影响,使率具有可比性E起加权平均的作用45.在两样本率比较的X2检验中,无效假设H0的正确表达应为CA μ1≠μ2B μ1=μ2 c π1=π2 D π1≠π2 E B=C46.四格表中四个格子基本数字是DA两个样本率的分子和分母B两个构成比的分子和分母C两对实测数和理论数D两对实测阳性绝对数和阴性绝对数E两对理论数第十二章统计表与统计图47.比较某地1990~1997年肝炎发病率宜绘制 CA直条图B构成图C普通线图D直方图E统计地图48.关于统计资料的列表原则,错误的是 BA.横标目是研究对象,列在表的左侧;纵题目是分析指标,列在表的右侧B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线C.数字右对齐,同一指标小数位数一致,表内不宜有空格D.备注用“”标出,写在表的下面E.标题在表的上端,简要说明表的内容49.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用AA直条图 B 线图 C 直方图 D 圆形图 E 百分条图50.描述某地某地210名健康成人发汞含量的分布,宜绘制BA直条图B直方图C线图D百分条图E散点图统计学试题二:一、概论l、统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体;B随意想象的研究对象的全体;C根据地区划分的研究对象的全体;D根据时间划分的研究对象的全体;E根据人群划分的研究对象的全体;2、从一个总体中抽取样本,产生抽样误差的原因是:A、总体中个体之间存在变异B、抽样未遵循随机化原则C、被抽取的个体不同质D、组成样本的个体较少E、分组不合理3、概率P=1,则表示:A、某事件必然不发生B、某事件必然发生C、某事件发生的可能性很小D、某事件发生的可能性很大E、以上均不对4、将计量资料制作成频数表的过程,属于&not;&not;统计工作哪个基本步骤:A、统计设计B、收集资料C、整理资料D、分析资料E、以上均不对5、统计学上通常认为P小于等于多少的事件,在一次观察中不会发生:A、B、C、D、E、6、抽样调查的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数7、抽签的方法属于:A、分层抽样B、系统抽样C、整群抽样D、单纯随机抽样E、二级抽样8、样本是总体中:A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分9、用某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA、集中型资料B、数值变量资料C、无序分类资料D、有序分类资料E、离散型资料10、某地区抽样调查1000名成年人的血压值,此资料属于:A、集中型资料B、数值变量资料C、无序分类资料D、有序分类资料E、离散型资料答案:1A 2A 3B 4C 5B 6E 7D 8D 9D 10B二、数值变量资料的统计描述11、常用平均数如下,除了:EA、均数B、几何均数C、中位数D、众数E、全距12、变异指标如下,除了:EA、全距B、标准差C、变异系数D、四分位数间距E、中位数13、某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:CA、XB、GC、MD、SE、CV14、各观察值均加或减同一数后:BA、均数不变,标准差改变B、均数改变,标准差不变C、两者均不变D、两者均改变E、以上均不对15、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+小时,问该食物中毒的平均潜伏期为多少小时:CA、5B、C、6D、lOE、1216、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA、全距B、标准差C、方差D、变异系数E、极差17、表示血清学滴度资料平均水平最常计算: BA、算术均数B、几何均数C、中位数D、全距E、率18、标准差越大的意义,下列认识中错误的是:BA、观察个体之间变异越大B、观察个体之间变异越小C、样本的抽样误差可能越大D、样本对总体的代表性可能越差E、以上均不对19、均数与标准差适用于:AA、正态分布的资料B、偏态分布C、正偏态分布D、负偏态分布E、不对称分布20、正态分布是以:E值为中心的频数分布 B.参数为中心的频数分布C.变量为中心的频数分布D.观察例数为中心的频数分布E.均数为中心的频数分布三、数值变量资料的统计推断21、反映均数抽样误差的统计指标是:A、标准差B、标准误C、变异系数D、全距E、方差22、下列哪个公式可用于估计总体均数95%可信区间:A、±B、±C、μ±,υSD、μ±,υSE、±,υS23、当自由度v→∞时,值:CA、≠B、<C、=D、>E、=24、α=, t>,ν,统计上可认为DA、两总体均数差别无显着意义B、两样本均数差别无显着意义C、两总体均数差别有显着意义D、两样本均数差别有显着意义E、以上均不对25、作单侧检验的前提是:DA、已知新药优于旧药B、已知新药差于旧药C、不知新药好还是旧药好D、已知新药不比旧药差E、已知新旧药差不多好26、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用:AA、配对设计t检验B、成组设计两样本均数比较的t检验C、成组设计两样本几何均数比较t检验D、两样本均数比较u检验E、x2检验27、对两组大样本率的比较,可选用:EA、u检验B、x2检验C、四格表确切计算概率法D、以上都不对E、A,B都可以28、在两样本均数比较的t检验中,无效假设H0的正确表达应为:BA、μ1≠μ2B、μl=μ2 c、1≠ 2 D、1= 2 E、π1=π229、在t检验中,当t> v时,则结论为:CA、P>B、P≥C、P<D、P≤E、P≤30、两个作t检验,除样本都应呈正态分布以外,还应具备的条件是:BA、两数值接近B、两S2数值接近C、两相差较大D、两S2相差较大E、以上都不对31、抽样调查男生和女生各100名,并分别统计出身高与体重均数,其中同性别的身高与体重均数不可作假设检验,是因为:AA、资料不具备可比性B、身高资料不呈正态分布C、体重资料不呈正态分布D、样本含量较小32、由10对20个数据组成的资料作配对t检验,其自由度等于:CA、10B、20C、9D、1833、对两样本均数作t检验,n1=20,n2=20,其自由度等于:CA、19B、20C、38D、40E、39四、分类资料的统计描述与推断34、计算相对数的目的是:EA、为了进行显着性检验B、为了表示绝对水平C、为了便于比较D、为了表示实际水平E、为了表示相对水平35、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是:BA、率B、构成比C、相对比D、绝对数E、标化率36、相对数使用时要注意以下几点,其中哪一项是不正确的:BA、比较时应做假设检验B、注意离散程度的影响C、不要把构成比当率分析D、二者之间的可比性E、分母不宜过小37、反映某一事件发生强度的指标应选用:DA、构成比B、相对比C、绝对数D、率E、变异系数38、反映事物内部组成部分的比重大小应选用:AA、构成比B、相对比C、绝对数D、率E、变异系数39、计算标化率的目的是:DA、使大的率变小,B、使小的率变大C、使率能更好的代表实际水平D、消除资料内部构成不同的影响,使率具有可比性E、起加权平均的作用40、在两样本率比较的X2检验中,无效假设H0的正确表达应为:CA、μ1≠μ2B、μ1=μ2 c、π1=π2 D、π1≠π2 E、B=C41、卡方检验中自由度的计算公式是:DA、行数×列数B、n-1C、N-kD、行数-1列数-1E、行数×列数-142、作四格表卡方检验,当N>40,且__________时,应该使用校正公式;EA、T<5B、T>5C、T<ID、T<5E、1<T<543、若X2≥X2 ν则:AA、P≤B、P≥C、P<D、P=E、P>44、四个样本率作比较,x2>3,可以认为:AA、各总体率不同或不全相同B、各总体率均不相同C、各样本率均不相同D、各样本率不同或不全相同E、样本率与总体率均不相同45、构成比的重要特点是各构成部分的总和为BA、>100%B、=100%C、<100%D、=0E、随资料不同而变化46、从统计学的角度看,下列指标属于绝对数的是DA、甲区的急性传染病人数为乙区的倍B、甲区某年急性传染病的发病率为382/10万C、甲区占某市急性传染病的比重为18%D、某区某男身高168厘米。

卫生统计学试题(含答案)

卫生统计学试题(含答案)

医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是: DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于&not;&not;统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1。

计数资料的统计描述与统计推断

计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数


病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3

生物统计学填空判断题

填空1.变量按其性质可以分为(连续)变量和(非连续)变量。

2.样本统计数是总体(参数)的估计值。

3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。

4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。

5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。

6.生物学研究中,一般将样本容量(n≥30)称为大样本。

7.试验误差可以分为(随机误差)和(系统误差)两类。

1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。

2. 直方图适合于表示(连续变量)资料的次数分布。

3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。

4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。

1.如果事件A和事件B为独立事件,则事件A与事件B同时发生的概率P(AB)= P(A)•P(B)。

2.二项分布的形状是由(n )和(p )两个参数决定的。

3.正态分布曲线上,(μ )确定曲线在x轴上的中心位置,(σ )确定曲线的展开程度。

4.样本平均数的标准误σ x =(。

σ/)5.t分布曲线与正态分布曲线相比,顶部偏(低),尾部偏(高)。

1.统计推断主要包括(假设检验)和(参数估计)两个方面。

2.参数估计包括(点)估计和(区间)估计。

3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。

4.在频率的假设检验中,当np或nq(<)30时,需进行连续性矫正。

1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。

2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。

3.在方差分析中,对缺失数据进行弥补2时,应使补上来数据后,(误差平方和)最小。

4.方差分析必须满足(正态性)、(可加性)和(方差同质性)3个基本假定。

计数资料的统计分析


Fisher确切概率法的应用范围

当四格表中由理论频数小于1或n≤40时,宜用
四格表的确切概率法;

当 2检验所得概率P略大于a时,应用Fisher确 切概率法。
实例
两种药物治疗某病结果见下表,试比较其差别有
无显著性。 表
组别 旧药 新药 合计
两种药物治疗某病结果比较
治愈 2(3.2) 4(2.8) 6 未愈 5(3.8) 2(3.2) 7 合计 7 6 13
缺点:①不利于保密;②不便于比较
表 某季度甲、乙两部队的感冒发生情况 部别 总人数 发病人数 发病率(%)
甲部队
乙部队 合计
1834
1313 3147
58
42 100
3.16
3.20 3.18
相对数指标(relative number ):有联系的两个 指标之比。
意义:便于表达事物出现的普遍程度;
率与构成比
率 构成比 发生的频率或强度 各组成部分所占的比重 随机发生事件 各部分的构成
概念 强调点
资料获得 特点
较难 不一定
容易 合计为100%
率与构成比的例子
年龄 组 ⑴ 40~ 50~ 60~ 70~ ≥80 合计 受检 人数 ⑵ 560 441 296 149 22 1468 白内障 例数 ⑶ 68 129 135 97 19 448 患者年龄构 患病率(%) 成比(%) ⑸=(3)/(2) ⑷ 15.18 12.14 28.79 29.25 30.13 45.61 21.65 65.10 4.24 86.36 100.00 30.52
防护服种类
阳性例数 1 10 11
阴性例数 14 18 32
患病率(%) 6.7 35.7 25.6

计量资料统计推断(t检验)-预防医学-课件


02
t检验的步骤
建立假设
假设检验的基本思想
设立原假设的依据
在假设检验中,通常先设立一个原假 设,然后基于样本数据对原假设进行 检验,判断是否拒绝原假设。
原假设的设立通常基于已有的研究结 果、理论或实践经验,并且原假设应 该是一个可以验证的命题。
原假设与备择假设
原假设通常是研究者想要否定的假设 ,备择假设则是研究者想要接受的假 设。
p值是用于判断是否拒绝原假设 的统计量,p值越小,说明样本 数据与原假设之间的差异越大,
越有理由拒绝原假设。
显著性水平
显著性水平是预先设定的一个临 界值,用于判断是否拒绝原假设
,通常取0.05或0.01。
结论的表述
根据p值与显著性水平的比较结 果,可以得出是否拒绝原假设的 结论,并进一步解释结果的意义
断实验处理或条件改变对数据的影响。
两独立样本t检验
总结词
用于比较两个独立样本的平均值是否存 在显著性差异。
VS
详细描述
两独立样本t检验,也称为两组独立样本t 检验,是统计学中常用的方法之一,用于 比较两个独立样本的平均值是否存在显著 差异。这种方法常用于比较不同组对象的 数据、不同条件下的独立测量等。通过计 算t统计量,我们可以判断两组独立样本 的均值是否存在显著差异,从而推断不同 组别或条件对数据的影响。在进行两独立 样本t检验时,需要注意样本来自的总体 是否具有方差齐性和正态分布等统计假设 ,以确保检验结果的准确性和可靠性。
t检验的适用范围
• t检验适用于样本量较小、数据分布情况未知或总体标准差未知的情况。在预防医学领域,t检验常用于比较两组人群的生理 指标、行为习惯等计量资料的差异。
t检验的假设条件
• 假设条件包括:样本数据来自正态分布总体、总体 方差齐性、独立样本等。在进行t检验之前,需要检 验样本数据是否满足这些假设条件,以确保统计推 断的准确性。

卫生统计学试题3含答案

《医学统计方法》试题三:1.两样本均数比较,经t检验,差异有显著性时,P越小,说明:CA.两样本均数差异越大B.两总体均数差异越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E•样本均数与总体均数不同2.某自然保护区狮子的平均密度为每平方公里100只,随机抽查其中一平方公里范围内狮子的数量,假设进行100次这样的抽查,其中的95次所得数据应在以下那个范围内。

(B 为加减,为什么?)BA •5-195B •-119.6C •90-110D •95-105E •-125.83.抽样研究中,S为定值,假设逐渐增大样本含量,则样本:AA .标准误减小B .标准误增大C.标准误不改变D.标准误的变化与样本含量无关E.以上都对4.以下关于统计表的要求,表达错误的选项是:EA.标题位于表的上方中央B.不宜有竖线及斜线C.备注不必列入表内D.线条要求三线式或四线式E.无数字时可以不填5.在统计学中,参数的含义是:DA •变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量6 .某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:CA.所有成年男子B .该市所有成年男子C .该市所有健康成年男子D •120名该市成年男子E •120名该市健康成年男子7.医学统计的研究内容是EA.研究样本B.研究个体C.研究变量之间的相关关系D•研究总体E •研究资料或信息的收集.整理和分析8.总体应该由DA.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成9.在统计学中,参数的含义是DA .变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量10.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于AA .计数资料B .计量资料C .总体D .个体E・样本11.统计学中的小概率事件,下面说法正确的选项是:BA.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件E.发生概率小于的事件12、统计上所说的样本是指:DA、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体13、以舒张压为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属〔〕资料。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
(一)率的抽样误差与标准误
抽样, 在同一总体中按一定的样本含量n抽样, 样本率和总体率或样本率之间也存在着 差异,这种差异称为率的抽样误差 率的抽样误差。 差异,这种差异称为率的抽样误差。 率的抽样误差的大小是用率的标准误来 率的抽样误差的大小是用率的标准误来 率的标准误 表示的。 表示的。
4
公式: 公式:
问题:CI意义?精密度、准确度如 何?
12
(2)
查表法
当样本含量较小( ≤50), (1- 当样本含量较小(如n≤50),np或n(1-p) 5时 样本率的分布呈二项分布, ≤ 5时,样本率的分布呈二项分布,总体 率的可信区间可据二项分布的理论求得。 率的可信区间可据二项分布的理论求得。 P552附表5 P552附表5百分率的可信区间 附表
27
吸烟者与不吸烟者慢性支气管炎患病率比较 组 别 患病人数 41 15 56 患病率( 未患病人数 患病率(%) 159 147 306 20.5 9.3 15.5
吸烟组 不吸烟组 合 计
28
吸烟组: 41/200=20. 吸烟组:n1=200 x1=41 p1=41/200=20.5 不吸烟组: 15/162= 不吸烟组:n2=162 x2=15 p2=15/162=9.3 检验步骤: 检验步骤:
17
案例8-6 案例
有研究者在某地对40岁以上成年女性进行了有关高血压防治的 有研究者在某地对40岁以上成年女性进行了有关高血压防治的 40 健康教育干预研究,经健康教育两年后,欲进行效果评价。 健康教育干预研究,经健康教育两年后,欲进行效果评价。 随机抽取该地40岁以上成年女子1000名,查出高血压患者49例, 随机抽取该地40岁以上成年女子1000名 查出高血压患者49例 40岁以上成年女子1000 49 患病率4.9% 4.9%。 患病率4.9%。 以往的调查数据显示该地40 40岁以上成年女性高血压患病率为 以往的调查数据显示该地40岁以上成年女性高血压患病率为 8.1%。 8.1%。 根据以上资料能否下结论说经过健康教育后,该地40 40岁以上成 根据以上资料能否下结论说经过健康教育后,该地40岁以上成 年女性高血压患病率有所下降? 年女性高血压患病率有所下降?
22
计算题 根据以往经验,一般胃溃疡病患者有20 20% 根据以往经验,一般胃溃疡病患者有20%(总体 发生胃出血症状。 现某医生观察65 65岁以上 率 ) 发生胃出血症状 。 现某医生观察 65 岁以上 胃溃疡病人152 152例 其中48 例发生胃出血, 48例发生胃出血 胃溃疡病人 152 例 , 其中 48 例发生胃出血 , 占 31. 样本率) 31.6%(样本率)。 问老年胃溃疡病患者是否较一般胃溃疡病患者 易发生胃出血。 易发生胃出血。
σp =
Sp =
π (1 − π )
n
p (1 − p ) n
σp: 率的标准误理论值 π: 总体阳性率 总体阳性率 总体阴性率 1~ π:总体阴性率 n: 样本含量 sp: 率的标准误估计值 样本阳性率 p: 样本阳性率 样本阴性率 1~p: 样本阴性率 n: 样本含量
5
题目:某地随机抽取了368名 岁儿童, 题目:某地随机抽取了368名5岁儿童, 368 检查得龋齿患病率为62.50% 62.50%, 检查得龋齿患病率为62.50%,试计算该 地5岁儿童龋齿患病率的标准误。 岁儿童龋齿患病率的标准误。
第8章 无序分类变量资料的统计分析 章
第二节 计数资料的统计推断
1
一.率的抽样误差 与总体率的估计
2
案例8-4
2003年 2003年,某学校欲了解大学生乙肝表面抗原 携带者情况以评价防控措施 随机抽取1000名大学生, 1000名大学生 随机抽取1000名大学生,做乙肝表面抗原检 查得乙肝表面抗原阳性者52 52人 查,查得乙肝表面抗原阳性者52人,乙肝 表面抗原阳性率5.2% 表面抗原阳性率5.2% 欲用此率推断该校大学生乙肝表面抗原总 体阳性率。 体阳性率。
10
p ± uα / 2 S p
当α/2=0.05时,u0.05/2=1.96, 总体率π的95%IC:p±1.96Sp , α/2=0.05时 IC: 1.96Sp 意义: 意义:此区间包括总体率π的概率为 α(95 1-α(95%) 当α/2=0.01时, u0.01/2 =2.58, 总体率π的99%IC: p±2.58Sp, α/2=0.01时 2.58Sp 意义: 意义:此区间包括总体率π的概率为 α(99 1-α(99%)
p (1 − p ) = n 62 . 50 %( 1 − 62 . 50 %) = 0 . 0252 368
Sp =
6
案例8 4 案例8-4 n=1000 p=5.2% 乙肝表面抗原阳性率的抽样误差为: 乙肝表面抗原阳性率的抽样误差为:
Sp =
p (1 − p ) 5.2%(1 − 5.2%) = = 0.007 n 1000
14
1.近视率95%(19%,53%) 近视率95%(19%,53%) 95%(19%,53 99%(15%,59%) %(15%,59 99%(15%,59%) 2.正常率95%(47%,81%) 正常率95%(47%,81%) 95%(47%,81 99%(41%,85%) %(41%,85 99%(41%,85%)
u=
| p −π0 |
σp
| p −π0 | = π 0 (1 − π 0 ) n
| 4.9% − 8.1% | = = 3.71 8.1%(1 − 8.1%) 1000
21
3. 确定P值,作出推断结论. 确定P 作出推断结论. u0.05=1.64<3.71,所以P<0.05 0.05=1.64<3.71,所以P<0.05 统计结论: α=0.05水准上拒绝 水准上拒绝H 统计结论:在α=0.05水准上拒绝H0接受H1 , 差异有统计学意义。 差异有统计学意义。 专业结论:健康教育后高血压患病率低于健康教育前。 专业结论:健康教育后高血压患病率低于健康教育前。
2 2
c
x1 + x = n1 + n
p1和p2分别为两个样本率 为两个样本率的合并样本率 pc为两个样本率的合并样本率 X1和X2分别为两个样本的阳性例数
26
案例8-7 案例 某地调查了50 50岁以上 某地调查了50岁以上 吸烟者200人患支气管炎者41 200人患支气管炎者41人 吸烟者200人患支气管炎者41人,患病率 20.5%;不吸烟者162人中患慢性支气管炎15 162人中患慢性支气管炎 20.5%;不吸烟者162人中患慢性支气管炎15 患病率为9.3% 9.3%。 人,患病率为9.3%。 根据以上资料能否说明吸烟者的支气管炎患 病率高于不吸烟者? 病率高于不吸烟者?
正态近似法 查表法
9
(1)正态近似法 足够大( 样本含量n足够大( n >50), p和1-p 均不太小, np与n(1-p)均 此时, 均不太小,且np与n(1-p)均>5时 ,此时, 样本率的分布近似于正态分布, 样本率的分布近似于正态分布,因此可根 据正态分布原理估计总体率可信区间, 据正态分布原理估计总体率可信区间,即 由下列公式估计: 由下列公式估计:
18
总体率: =8.1% 总体率:π0 =8.1% 样本: 样本:含量n=1000, p=4.9% 检查条件是否满足u检验的要求: 检查条件是否满足u检验的要求: n>50
p和1-p均不太小
故采用u检验法. 故采用u检验法.
p=4.9%, 1-p=1-4.9%= 91.9% =4.9%, 4.9%= n×p及n×(1-p)均大于5 (1- 均大于5 n×p=49>5.0 ,n×(1-p)=1000-49=951>5.0 (1- )=1000-
(一)样本率与总体率比较的u检验
u值的计算公式为
u=
| p −π0 |
σp
=
| p −π0 |
π 0 (1 − π 0 ) n
式中: 式中: P : 为样本率, 为样本率, π0: 为总体率, 为总体率, σp : 为根据总体率计算的标准误。 为根据总体率计算的标准误。 u: 值服从标准正态分布,故可根据临界值uα作出 值服从标准正态分布,故可根据临界值u 统验步骤: 假设检验步骤: 1. 建立检验假设,确定检验水准: 建立检验假设,确定检验水准: H0: π=π0=8.1%,
即健康教育后高血压患病率与健康教育前相同 H1: π<π0 =8.1%, 即健康教育后高血压患病率低于健康教育前
α=0 05(单侧) α=0.05(单侧)
20
2. 选择检验方法,计算检验统计量. 选择检验方法,计算检验统计量. 样本率与总体率比较的u检验法,计算统计量u 样本率与总体率比较的u检验法,计算统计量u值
两样本n均足够大( 两样本n均足够大( n >50) 两样本p 均不太小( 两样本p和1-p均不太小(>5%) 且两样本np n(1-p)均 np与 且两样本np与n(1-p)均>5
7
(二)总体率的估计
1.点估计 用样本率p 用样本率p作为总体率π 的点估计值 案例8 我们用样本率5.2 5.2% 如:案例8-4我们用样本率5.2%直接作 为总体率的估计值 该方法计算简便, 该方法计算简便,但是没有考虑到抽样误 差的大小
8
2.区间估计
样本率的理论分布与样本率p的大小及样本含量n 样本率的理论分布与样本率p的大小及样本含量n 的大小有关, 的大小有关,总体率的估计又与样本率的理论分布 有关,因此需要根据n 的大小选择推算方法。 有关,因此需要根据n和p的大小选择推算方法。
13
案例8-5 某眼科医生在某小学抽取5年级学生 年级学生32名进行 某眼科医生在某小学抽取 年级学生 名进行 视力测试,测得患近视眼的学生11名。 视力测试,测得患近视眼的学生11名 问题: 问题: 1、试估计该校 年级学生近视眼患病率 年级学生近视眼患病率95% 、 、试估计该校5年级学生近视眼患病率 99%可信区间。 99%可信区间。 2、如何估计该校 年级学生视力正常率的 、如何估计该校5年级学生视力正常率的 95%、99%可信区间。 、99%可信区间。
相关文档
最新文档