统计学:计数资料
医学统计学名词解释名解复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
常用统计学方法ppt课件

三、率(构成比)的统计分析
两样本率或构成比的比较用四格表2 配对设计时用配对2 多组率或构成比比较用行×列2
四格表2检验
1.当n≥40,且T≥5时,直接计算 2值
基本公式 χ2=
(A-T)2 ∑─────
T
专用公式
( a d-b c ) 2 n χ2= ───────────
(a+b)(c+d)(a+c)(b+d)
学习内容:
一、研究资料类型 二、均数的统计分析 三、率(构成比)的统计分析
一、研究资料类型
➢ 计量资料 ➢ 计数资料 ➢ 等级资料
计量资料:用定量方法对每个观察 单位某指标测量数值大小的资料。
常用表达方法:±s 常用统计方法:t检验
u检验 方差分析
计数资料:将观察单位按属性分组, 清点各观察单位个数的资料。 常用表达方法:率、百分构成等 常用统计方法:2检验
➢ 对同一受试对象分别给予两种处理, 推断两种处理效果有无差别;
➢ 对同一受试对象处理前、后比较,推 断该处理有无作用。
t检验:
样本均数与总体均数比较(P106); 配对设计计量资料比较(P107); 两样本均数比较(P108)。
u检验:
两大样本均数比较(P109)
方差分析(ANOVA):
多个样本均数比较(P109)
等级资料:将观察单位按属性的 不同程度分组,再清点各观察单 位个数的资料。 常用统计方法:秩和检验等
二、均数的统计分析
➢ 成组设计:
两小样本均数比较用t检验;
两大样本均数比较用u检验; 三个以上样本均数比较用方差分析。 对同对和两个受试对象分别给予两种 处理,推断两种处理效果有无差别;
2.当n≥40,且有1≤T<5时,计算校正的 2值
统计学必考

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大臵信度的包含总体参数的范围,该范围称为臵信区间(confidence interval,CI),又称可信区间。
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。
置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。
给出的是被测量参数的测量值的可信程度。
完全随机设计(completely random design):完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。
它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。
《卫生统计学》考试题及答案

《卫生统计学》一、名词解释1. 计量资料2. 计数资料3. 等级资料4. 总体5. 样本6. 抽样误差7. 频数表8. 算术均数9. 中位数10. 极差11. 方差12. 标准差13. 变异系数14. 正态分布15. 标准正态分布16. 统计推断17. 抽样误差18. 标准误19. 可信区间20. 参数估计21. 假设检验中P的含义22. I型和II型错误23. 检验效能24. 检验水准25. 方差分析26. 随机区组设计27. 相对数28. 标准化法29. 二项分布30. Yates校正31. 非参数统计32. 直线回归33. 直线相关34. 相关系数35. 回归系数36. 人口总数37. 老年人口系数38. 围产儿死亡率39. 新生儿死亡率40. 婴儿死亡率41. 孕产妇死亡率42. 死因顺位43. 人口金字塔二、单项选择题1.观察单位为研究中的( D )。
A.样本 B.全部对象C.影响因素 D.个体2.总体是由( C )。
A.个体组成 B.研究对象组成C.同质个体组成 D.研究指标组成3.抽样的目的是( B )。
A.研究样本统计量 B.由样本统计量推断总体参数C.研究典型案例研究误差 D.研究总体统计量4.参数是指( B )。
A.参与个体数 B.总体的统计指标C.样本的统计指标 D.样本的总和5.关于随机抽样,下列那一项说法是正确的( A )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( B )。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( A )。
A.变异系数 B.方差C.极差 D.标准差8.以下指标中( D )可用来描述计量资料的离散程度。
医学统计学名词解释 (1)

1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
生物统计学 第二章 资料的整理
1.6 划线归组,作次数分布表
资料的整理
规律:螭(chi)霖体长变异范围在7-16;大部分数据集中在9-13; 分布的中心趋向11.5;两头小、中间大的分布趋势。
资料的整理
2.间断性资料(计数资料)的次数分布表 单向分组法进行整理。常用变量的自然数值进 行分组,每组用一个变量值表示。然后把各个观察 值归入相应的组内。
资料的整理
1.5 确定组限 组下限=组中值-1/2组距;组上限=组中值 +1/2组距。本题:第一组下限=7.5-1/2*1=7,上 限7.5+1/2*1=8,所以,本题的分组为7-8;8-9; 9-10;…。 约定:当各组上限为整数时减去0.1,一位小 数时减去0.01; 本资料的分组可改写为7-7.9;88.9;…;这个样可解决临界值‘8’的分组归属。 这样8就归为第二组。
资料的整理
圆形图 用于表示计数资料、质量性状资料或半 定量资料的构成比例。 图1.某渔场鱼苗放养情况 鲢鱼 鲤鱼 鳜鱼 草鱼
524
351
126
438
资料的整理
线图
用于表示事物或现象随时间而变化发展的情况
资料的整理
多边形图 用于表示连续性资料的次数分布。横 轴表示组中值,纵轴表示次数。
30 25
资料的整理
资料的整理
2、统计图 直观清楚的表示数据分布规律,常用于PPT等报告。 2.1 基本要求 标题简明扼要,列于图的下方。 纵、横两轴应有刻度,注明单位。 横轴由左至右、纵轴由下而上,数值由小到大。 图中需用不同颜色或线条代表不同事物时,应有
图例说明。
资料的整理
2.2 范例 长条图 展示某一指标划分属性种类或等级的次数 或频数分布。
样本含量(n) 10—100 100—200 200—500 500以上 组 数 7—10 9—12 12—17 17—30
第6版卫生统计学考试复习题参考答案
中南大学现代远程教育课程考试复习题及参考答案《卫生统计学》一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P的含义22.I型和II型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.二项分布30.Yates校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题1.观察单位为研究中的( )。
A.样本B.全部对象C.影响因素D.个体2.总体是由()。
A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。
A.参与个体数B.总体的统计指标C .样本的统计指标D . 样本的总和 5.关于随机抽样,下列那一项说法是正确的( )。
A .抽样时应使得总体中的每一个个体都有同等的机会被抽取 B .研究者在抽样时应精心挑选个体,以使样本更能代表总体 C .随机抽样即随意抽取个体D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变C .两者均不变D .两者均改变 7.比较身高和体重两组数据变异度大小宜采用( )。
A .变异系数 B .方差 C .极差 D .标准差8.以下指标中( )可用来描述计量资料的离散程度。
A .算术均数 B .几何均数 C .中位数 D .标准差9.血清学滴度资料最常用来表示其平均水平的指标是( )。
医学统计学 名词解释 名解 复习资料
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
统计学——精选推荐
统计学统计学复习题名词解释:(5×3分=15分)计数资料变异系数标准误医学参考值范围P值总体抽样误差构成⽐发病率⼩概率事件四分位数间距计数资料:指先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得的资料变异系数:变异系数⼜称“标准差率”,是衡量资料中各观测值变异程度的另⼀个统计量。
标准误:标准误反映的是样本均数之间的变异(即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差⼤⼩的尺度)医学参考值范围:医学参考值是指正常⼈(或动物)的⼈体形态、功能和代谢产物等的各种⽣理及⽣化常数。
由于个体指标的变异,使其常数不仅因⼈⽽异,⽽且同⼀个体还会随机体内外环境的改变⽽改变,因此需要确定其波动的范围,即把绝⼤多数正常⼈的某指标值范围称为该指标的参考值范围,亦称正常值范围。
有了参考值范围,在评价个体某指标是否正常时便有了依据。
P 值即概率,反映某⼀事件发⽣的可能性⼤⼩。
总体:根据⼀定的⽬的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
抽样误差:抽样误差是指样本指标值与被推断的总体指标值之差构成⽐:各构成部分所占的⽐重发病率:某⼀段时期内某⼀特定风险⼈群发⽣某病的或然率。
⼩概率事件:在概率论中我们把概率很接近于0(即在⼤量重复试验中出现的频率⾮常低)的事件称为⼩概率事件,习惯上将P≤0.05或P≤0.01称为⼩概率事件四分位数间距:是上四分位数与下四分位数之差,⽤四分位数间距可反映变异程度的⼤⼩分析题:(3×5分=15分)1.关于校正X2四格表X2检验,分析变异系数再⽐较。
2.判断分析抽样调查,应⽤样本⽐率⽐较的X2检验。
3.计数可信区间,⽤标准误带⼊。
判断题:(⽆参考)选择题:(30题×2分=60分) 注:正确答案为斜体红字1.资料分析的主要内容包括:A.统计描述和统计学检验 B.区间估计和假设检验C.统计图表和统计报告D.统计描述和统计推断2. 根据变量的测验结果不同,可将统计资料的类型分为A.定量变量资料和分类变量资料 B.多项分类变量资料和⼆项分类变量资料C.正态分布变量资料和频数分布变量资料 D.数量变量资料和等级变量资料3. 统计学中所说的样本是指A.随意抽取的总体中任意部分B.有意识的选择总体中的典型部分C. 依照研究者要求选取总体中有意义的⼀部分D.依照随机原则抽取总体中有代表性的⼀部分4. 统计学中所说的总体是指A. 根据⼈群划分的研究对象的全体B. 根据研究⽬的确定的研究对象的全体C. 根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体5. 随机抽样研究中,由于抽样引起的样本指标与总体参数间的差别分为A. 抽样误差B.系统误差C. 过失误差D.随机测量误差6. 描述⼀组偏态分布资料的变异度,恰当的指标为A. 全距B.标准差C.变异系数D.四分位数间距7. ⽤均数与标准差可全⾯描述其资料分布的特点是A. 正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布8. 对于由⼀个错误的实验设计所产⽣的实验数据,在进⾏统计处理前,其补救办法靠A. 统计⽅法B.数学⽅法C.重做实验D.重新设计9. 描述正态分布离散程度最常⽤的指标是:A. 变异系数B.四位分数间距C.⽅差D. 标准差10. 频数分布的连个重要特征是A. 统计量与参数B.正态分布和偏态分布C.集中趋势与离散趋势D. 样本标准差和总体标准差11. 5⼈的⾎清滴数为1:8、1:16、1:32、1:64、1:128,描述其平均滴度宜采⽤A. 算数均数B.中位数C.⼏何均数D.平均数12. 最⼩组段⽆下限或最⼤组段⽆上限的频数表资料,描述其集中趋势宜⽤A.算数均数B.平均数C.众数D.中位数13. 下列哪项值越⼩,表⽰⽤该样本平均数估计总体平均数的可靠性越⼤A.变异系数B.标准差C.标准误D. 极差14. 6⼈的⾎清滴数为<1:20、1:20、1:40、1:80、1:160、1:320,秒速其平均滴数宜采⽤A.算数均数 B.中位数 C.⼏何均数 D.平均数15. 现调查20岁男⼤学⽣100名,升⾼标准差A.体重变异程度⼤B.⾝⾼变异程度⼤C.两者变异程度接近D.两者标准差不能直接⽐较16. 某患者8⼈的潜伏期分别为3、2、6、3、5、30、3、4天,则平均潜伏期为A. 7天B. 3天C. 4天D. 3.5天17. 正态分布曲线下,横轴上,从均数到+∞的⾯积为A.95%B.50%C.97.5%D.α越⼩18. 正态分布的两个参数中,正态曲线越低平,说明A.µ越⼤C.α越⼤D.α越⼩19. 下列关于医学参考值范围的描述中,正确的是A. 绝⼤部分正常⼈中某个指标的波动范围B.没有任何疾病的⼈的解剖、⽣理、⽣化等数据的波动范围C.百分界值选取95%,是因为它最准确D.不能根据专业知识确定取单侧界限或双侧界限20. 若X服从以正态分布µ,α为均数和标准差的正态分布,则X的第95个百分位数等于A. µ-1.64αB.µ+1.64αC. µ+1.96αD. µ+2.58α21. 要评价某市⼀名7岁⼉童的⾝⾼是否偏⾼或偏矮,其统计学⽅法是A.将这名⼉童的⾝⾼与该市其他7岁⼉童⾝⾼的均数做差别性的统计学检验B.⽤该市7岁⼉童⾝⾼的1-α参考值范围评价C.⽤该市7岁⼉童⾝⾼的均数来评价D.⽤该市7岁⼉童⾝⾼的1-α可信区间来评价22. Sx表⽰的是A.总体中各样本均数分布的离散情况B.标准误C.均数抽样误差的⼤⼩D.以上都是23. 在标准差和标准误的关系中A.⼆者均反映个体值变异的程度B.总体标准差减⼩时,总体标准误也减⼩C.总体标准差⼀定时,增⼤样本例数会减⼩标准误D.可信区间⼤⼩与标准差有关,⽽参考值范围与标准误有关24. 统计推断要完成的主要任务是A.统计描述与参数估计B.参数估计和假设检验C.区间估计和点估计D.统计预测和统计控制25. 可信区间估计的可信度是指A. αC.βD.1-β26. 配对设计的⽬的A.提⾼结果精确性B.提⾼结果准确性C.提⾼组间可⽐性D.使⽐较结果更有意义27. 下⾯关于参数估计的说法正确的是A.分点估计和区间估计B.⽤于估计未知参数C.区间估计不但能给出参数的所在范围,还能给出这种估计的可靠程度D.以上答案都对28. 在资料呈正态,⽅差齐时,两样本⽐较做t检验,差别有统计学意义,则P值越⼩说明A.两样本均数差些越⼤B.两总体均数差别越⼤C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同29. 两样本⽐较时,分别取以下检验⽔准,哪⼀个的第⼆类错误最⼤A. α=0.05B.α=0.01C.α=0.10D. C.α=0.2030. 当研究对象个体差异较⼤时,两组计数资料的成组设计与配对设计相⽐,⼀般情况下为A.⾸选成组t检验B.⾸选配对t检验C.两者效率相等D.配对t检验效率⾼⼀些31. 关于假设检验,下列那⼀项说法是正确的A. 单侧检验优于双侧检验B. 采⽤配对t检验还是成组t检验是由实验设计⽅法决定C. 检验结果若P值⼤于0.05,则接受H0的可能性很⼩D.⽤U检验进⾏两样本总体均数⽐较时,要求⽅差齐性32. 配对t检验的备择假设(双侧检验)⼀般可表⽰为A.µ1=µ2C.µd=0D. µd≠033. 假设检验中的第⼀类错误是指A.拒绝了实际上成⽴的H0B.不拒绝实际上成⽴的H0C.拒绝H0时所犯的错误D.不拒绝实际上不成⽴的H034. 当两总体⽅差不齐时,两样本均数⽐较宜采⽤A. t检验B. t’检验C.F检验D.q检验35.当统计分析结果是差别⽆统计学意义,但所求得的检验统计量在界值附近时,下结论应慎重,是因为A.如果将双侧检验改为单侧检验可能得到差别有显著性的结论B.如将检验⽔准α=0.05改为α=0.1可得到差别有显著性的结论C. 如改⽤其他统计分析⽅法可能得到差别有显著性的结论D.如加⼤样本含量可能得到差别有显著性的结论36. 完全随机设计与随机区组设计相⽐较A.两种设计实验效率⼀样B.随机区组设计的误差⼀定⼩于完全随机设计C.随机区组设计的变异来源⽐完全随机设计分得更细D.以上说法都不对37. 配对t检验可以⽤哪种设计类型的⽅差来替代A.完全随机设计B.随机区组设计C.两种设计都可以D.A、B都不⾏38. 某医院某年住院病⼈中胃癌患者占1%,则A.1%是强度百分数B. 1%是构成⽐C. 1%是相对⽐D. 1%是绝对数39. 欲⽐较两地死亡率,计算标准化率可以A.消除两地总⼈⼝数不同的影响B.消除两地各年龄组死亡⼈数不同的影响C.消除两地各年龄组⼈⼝数不同的影响D.消除两地抽样误差不同的影响40. 计算⿇疹疫苗接种后⾎清检查的阳转率,分母为A.⿇疹易感⼈群B.⿇疹患者数C.⿇疹疫苗接种⼈数D.⿇疹疫苗接种后转阳⼈数41.某病患者120⼈,其中男性114⼈,⼥性6⼈,分别占95%与5%,则结论为A.该病男性易得 B.该病⼥性易得 C.该病男性、⼥性患病率相等 D.尚不能得出结论42. 经调查得知A、B 两地的冠⼼病粗死亡率为40/10万,按年龄构成标化后,A地冠⼼病标化死亡率为45/10万,B地为38/10万,因此可以认为A. A地年龄⼈⼝构成较B地年轻B. B地年龄⼈⼝构成较A地年轻C. A地冠⼼病的诊断较B地准确D. A地年轻⼈患冠⼼病较B地多43.有52例可疑宫颈癌患者,分别⽤甲、⼄两法进⾏诊断,其中甲法阳性28例,⼄法阳性25例,两法均为阳性20例,欲⽐较两法阳性率有⽆差别,宜⽤A. 四格表X2检验B. 配对设计X2检验C. ⾏×列表X2检验D. t检验44. 分析四格表资料中,通常在什么情况下需⽤Fisher精确概率法A.140 B. T<5 C. T<1或n<40 D. T<1且n≥4045. X2值的取值范围为A.-∞< X2<+∞B.0≤X2≤+∞C. X2≤1D. -∞≤X2≤046. 三个样本率⽐较得到X2>X20.01(2),可以为A. 三个总体率不同或不全相同B. 三个总体率都不相同C. 三个样本率都不相同D.三个样本率不同或不全相同47.将⾼⾎压病患者随机分为三组,分别⽤甲、⼄、丙三种药物治疗,⽤治疗⾎压下降⽐值⽐较三种药物疗效,这种设计是。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
110
10.0
36.7
内部构成不同时,如需比较两个总率,可以用标准化法 标准化法的基本思想:采用统一的标准构成以消除构成 不同对总率的影响,使通过标准化后的标准化总率具有 可比性。
治疗分组 成人组 儿童组 合计
旧疗法 治疗人数 痊愈人数 治愈率% 100 200 300 50 20 70 50.0 10.0 23.3 200 100 300
死因构成
死因顺位
死亡原因 构成比(%) 死因顺位
恶性肿瘤
脑血管病 心脏病 呼吸系统 损伤与中毒
24.93
20.41 17.61 13.36 5.87
1
2 3 4 5
(二)率、频率
说明某种现象发生的机会大小的指标。
计算:率
该现象实际发生数 比例基数 可能发生某现象的总数
比例基数(k)可以是100%、1000‰、10000/万、 100000/10万等。
各构成比之间相互制约,某一组成部分数量的 变化会使所有组成部分的构成比都改变。
计算:
被观察事物内部某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位总数
例:计算下表中各种疾病病人数占总病人数的构成比
疾病名称 痢疾 肝炎 流脑 麻疹 其它 合计
发病人数 3685 2111 522 411 850 7579
1949 年死亡率 3.3 死亡率之比 33倍 1980 年死亡率 0.1
(四)动态数列
按照一定的时间顺序,将某事物的统计指标依次排列起来, 便于观察和比较该事物在时间上的发展变化趋势。
年份 (1) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 符号 (2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 学生 人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 绝对增长量 累计 逐年 (4) (5) --300 600 700 950 1120 1310 1580 1750 1800 300 300 100 250 170 190 270 170 50 发展速度(%) 定基比 环比 (6) (7) 100.0 100.0 107.1 114.3 116.7 122.6 126.7 131.2 137.6 141.7 142.9 107.1 106.7 102.1 105.1 103.3 103.6 104.9 102.9 100.8 增长速度(%) 定基比 环比 (8) (9) --7.1 14.3 16.7 22.6 26.7 31.2 37.6 41.7 42.9 7.1 6.7 2.1 5.1 3.3 3.6 4.9 2.9 0.8
同年死于某种疾病的人数 100000 / 10万 某年平均人口数
同期因该病死亡人数 100% 观察期间内某病患者数
某病死亡率
某病病死率
例:某地年平均人口数为1000000,计算下 表中各种传染病的发病率
疾病名称 发病人数 发病率(1/10万)
痢疾
肝炎 流脑
3685
2111 522
368.5
211.1 52.2
SP
95%可信区间:p±1.96SP= 25%±1.96×1.53%
22.0%~28.0%
99%可信区间:p±2.58SP= 25%±2.58×1.53% 21.1%~28.9% 如果按最多需要量准备,则需10000×0.289=2890份药物。
(三)率的z 检验
计数资料的假设检验是为了比较两个相对数是否来 自同一总体。通过比较两个样本率(构成比)去推 论其总体率(构成比)是否相同。 对率进行z 检验需满足: 样本量N不太小,P不太接近0或1 np>5且n(1-p)>5
畸形儿例数
构成%
1
2
14
19
16.4
24
20.7
18
15.5
19
16.4
13
11.2
3
2.6
1
0.86
1
0.86
1
0.86
116
100.0
0.86 1.70 12.1
2. 计算相对数时分母不宜过小
例:“某医师收治了4名风湿性关节炎患者,用秘方治疗 一年后患者病情明显好转,则该医生用祖传秘方治疗风湿 性关节炎的有效率为100%”,这种说法是否正确?为什么?
3. 正确计算平均率(总率) 所有组分子之和除以所有组分母之和 例:P49表5.4
4. 两个相对数比较时,注意可比性
治疗分组 成人组
旧疗法
治疗人数 痊愈人数 治愈率% 100 50 50.0 200
新疗法
治疗人数 痊愈人数 治愈率% 100 50.0
儿童组
合计
200
300
20
70
10.0
23.3
100
n1 p1 n2 p2 pc n1 n2
qc 1 pc
某研究调查了5000名服用口服避孕药的40~44岁妇女,3 年内有13人发生心肌梗塞;另调查10000名没有服用口服避 孕药的40~44岁妇女,3年内有7人发生心肌梗塞,口服避 孕药对40~44岁妇女发生心肌梗塞是否有影响?
麻疹 其它 合计
411 850 7579
41.1 85.0 757.9
注意计算构成比 和率的不同。
痢疾发病人数 痢疾发病率 100000/ 10万 年平均人口数
3685 100000/ 10万 368.5 / 10万 1000000
(三)相对比
定义:两个有联系的同类指标之比。
计算:
常用率指标:
发病率、患病率、漏诊率、误诊率、治愈率、死亡 率、病死率等。
发病率
同期内新发生某病的病例数 k 观察期内可能发生某病的平均人口数
(时点)患病率
检查时发现的某病现患病例数 k 该时点受检人口数
治愈病人数 100% 接受治疗人数
治愈率
(粗)死亡率
同年死亡总数 1000 ‰ 某年总人口数
例:某社区共有10000人。现随机抽检居民800人的粪便中, 蛔虫阳性200人,如在全社区进行驱虫治疗,需准备多少 份药物?(求蛔虫阳性率的95%或99%可信区间)
P 蛔虫阳性人数 200 100% 100% 25% 检查总人数 800
P(1 P) 0.25 (1 0.25) 1.53% n 800
(一)率的抽样误差与标准误
由于抽样的原因造成的样本率与总体率之间的差 别,叫做率的抽样误差。 样本率的抽样误差的大小用率的 标准误 表示
标准误越小,抽样误差越小,用样本率估计总体 率的可靠性越大。
计算方法
P
(1 )
n
SP
p(1 p) n
pq n
例:某市为了解已婚妇女子宫颈癌的患病情况进行抽样调查, 随机抽取了2000人,患者80例。试求此患病率的标准误。
3.58>1.96,P<0.05,拒绝H0,接受H1,差别有显著性,两总 体率不相等,老年溃疡病患者与一般患者胃出血发生率不同。
0 1 0
当样本量太小,或P接近0或1时,样本率不服从正态 分布,此时可以直接计算概率。
例:某微生物制品的企业标准是有害微生物感染不得 超过1%(0)。现从一批产品中随机抽出100件 (n),发现有害微生物感染的产品有3件(X)。问 这批产品是否合格?
(五)应用相对数的注意事项
1. 区别率和构成比
例:某产院拟分析畸形儿与母亲分娩年龄的关系,检查 了新生儿4470例,畸形儿116例,得以下资料,据此得 出结论:“母亲年龄在25~28岁时,畸形儿发生率最 高”,以上结论是否合理?为什么
母亲年龄 21 23 24 25 26 27 28 29 30 31 32 33 合计
50
20 70
甲组:标化率23.3%,乙组:标准化率23.3%
标准化法的注意事项 (1)标化率不能反映实际水平,只能用于比较。
(2)选用标准不同,标化率会改变,但比较结果 只能有一个,不能改变。
(3)对于标化率,也要作显著性检验。
三、 计数资料的统计推断
样本
总体
(样本率、样本构成)
(总体率、总体构成)
构成比(%) 48.6 27.9 6.9 5.4 11.2 100.0
痢疾构成比 = 痢疾发病人数/总人数×100% = 3685/7579×100% = 48.6%
人口构成
老年系数:
65岁及以上人口数 100% 总人口数
老龄化人口: 老年系数超过10% (发达国家为60岁及以上人口比重超过10%)
H0:该批产品合格,即该批产品有害微生物感染率为1% H1:该批产品不合格,即该批产品有害微生物感染率超过1% =0.05
本例,n=100,X=3<5,不满足近似正态分布的条件,不能 用正态分布来近似。可以直接计算H0成立的情况下,得到至 少发生3例的概率P。 P =P(X≥3)=1-P(X<3)=1-(P(X=0)+P(X=1)+P(X=2)) =1-[(1-0.01)100+C1100×0.01×(1-0.01)99+C2100×0.012×(1-0.01)98]
P
发生某现象的观察单位数 80 100% 100% 4% 可能发生该现象的观察单位数 2000
SP
p(1 p) 4% (1 4%) 0.44% n 2000
(二) 总体率的估计
用样本率P估计总体率π 95%(或99%)可信区 间。
样本量N不太小,P不太接近0或1,np>5且n(1p)>5时,样本率近似正态分布。此时总体率的 可信区间为: P±zαSP