《医学统计学》复习题

合集下载

医学统计学复习题一及答案

医学统计学复习题一及答案

医学统计学复习题一一、名词解释1. 变异即同质的观察单位之间某项特征所存在的差异2. 等级资料 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

3. 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。

固定的常数4. 统计量:样本的统计指标,如样本均数、标准差, 参数附近波动的随机变量5. 算术均数 简称均数,描述一组同质计量资料的平均水平。

统计学中常用希腊字母μ表示总体均数,用x 表演示样本均数6. 中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值7. 百分位数 :将顺序排列的一组观察值分为一百等分,位于某百分位置上的数值,以Px 表示,它是一种位置指标,理论上有x%的观察值比它小,有(100-X)%的观察值比它大。

二、单项选择1.表示事物内部各个组成部分所占比重的相对数是( b )。

A.相对比B.率C.构成比D.率的标准误E.均数2.说明样本均数抽样误差大小的指标是( c )。

A.变异系数B.标准差C.标准误D.全距 E 四分位数间距3.正态分布曲线下中间面积为95% 的变量值范围为( a )。

A.μσ±196.B.μσ±258.C.μσ±1D.μσ±125.E.σ±μ24.在两样本均数假设检验中,P ≤α时,拒绝H 0,认为( b )。

A.两样本均数有差别B.两总体均数有差别C.两样本均数无差别D.两总体均数无差别E.两总体均数差别很大5.下述( c )种资料为计数资料。

A.血红蛋白(g/L)B.红细胞计数(×1012/L)C.抗体滴度D.血型E.身高(cm)6.某地某年肺癌死亡率城区为郊区的194.1%,本指标是( b )。

A.率B.构成比C.相对比D.中位数E.百分率7.用均数和标准差可全面描述( b )资料的特征。

A.正偏态分布B.正态分布和近似正态分布C.负偏态分布D.t 分布E.χ2分布8.四格表的自由度( b )。

医学统计学总复习练习题(含答案)

医学统计学总复习练习题(含答案)

一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.xx σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ-15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与 值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为CA.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

医学统计学复习题

医学统计学复习题

中国医科大学网络教育学院医学统计学复习题一、最佳选择题1. 下列资料何为定性资料?A 体重(kg)B 血型(A、B、O、AB)C 血红蛋白(g/L)D 坐高指数(%,坐高/身高)E 白细胞计数(个/L)2. 下列资料属于等级资料的是_______A 白细胞计数(个/L)B 血型(A、B、O、AB)C 体重(kg)D 病人的病情分级(轻、中、重)E 坐高指数(%,坐高/身高)3.医学科学研究中的随机样本是指_______A 总体中的一部分B 研究对象的全体C 总体中特殊的一部分D 总体中有代表性的一部分E 研究对象中一部分有特殊代表性的样本4.统计工作的基本步骤是_______A 设计、搜集资料、整理资料和分析资料B 设计、统计分析、统计描述和统计推断C 选择对象、计算统计指标、参数估计和假设检验D 搜集资料、计算均数、标准差、标准误E 搜集资料、整理资料和分析资料5.统计学的小概率事件是指随机事件发生的概率_______A 等于0.05B 小于等于0.05C 大于0.05D 小于0.05E 大于等于0.056.医学统计学的主要研究对象是_____。

A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件7.编制组段数为10的频数表,在确定组距时______A常取最大值的1/10取整作为组距B常取最小值的1/10取整作为组距C常取极差的1/10取整作为组距D组距等于极差E常取极差的一半取整作为组距8.频数分布的两个重要特征是______A 集中趋势和分布类型B 集中趋势和离散趋势C 标准差和离均差D 对称分布和偏锋分布E 资料的类型9.一些以儿童为主的传染病,患者的年龄分布,集中位置偏向年龄小的一侧,称为______ A 正态分布 B 正偏态分布 C 负偏态分布 D 均匀分布E 对称分布10.欲表示末端无确定数据的资料平均水平时,宜采用的指标是______A 算术均数B 几何均数C 中位数D 百分位数E 算术均数和中位数11.一组变量值,其大小分别为13,10,12,9,8,11,98。

医学统计学复习题

医学统计学复习题

预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些?如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤0.05或P≤0.01的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于0.1的事件D.发生概率小于0.001的事件 E.发生概率小于0.1的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。

医学统计学复习题(名词解释和简答)

医学统计学复习题(名词解释和简答)

医学统计学复习题(名词解释和简答)一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。

是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、@计量资料:又称定量资料或数值变量资料。

为观测每个观察单位的某项指标的大小,而获得的资料。

其变量值是定量的,表现为数值大小,一般有度量衡单位。

根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。

其变量值是定性的,表现为互不相容的性或类别。

分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。

检验水平,就是预先规定的允许犯I型错误概率的最大值。

I型错误概率大小也用α表示,α可取单尾亦可取双尾。

12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。

其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。

医学统计学复习题

医学统计学复习题

医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。

2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。

2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。

4、随机抽样就是指在抽样研究中不要主观挑选研究个体。

8、同一总体中随机抽样,样本含量越大,则样本标准差越小。

9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。

10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。

11、同一批计量数据的标准差不会比标准误大。

12、t检验是对两样本均数的差别作统计检验的方法之一。

13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。

14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。

15、方差分析中均方就是方差。

16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。

17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。

18、回归系数越大,两变量的数量关系越密切。

19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。

20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。

21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。

22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。

医学统计学复习考试题库完整

医学统计学复习考试题库完整

第一部分复习练习题一.最讎择丿Y 表示一m 称分布的变量值的 ______________ a.平均水平 b.频数分布c.离散情况d.极差 一组正态分布资料,理论上有 ____________ a. T>M b.X <M c ・商 A X^MngKM 反映一组血淸学滴度资料或效价资料平均水平采用 a. Y b. M c. G d R 在O 未知且n 较大时,估计u 95%町售区间可用_ a. X+1.96S b. T±2.58S c. X±2. 58Sx d. T±1.96S X 来自同一总体中的两个样本,其中—小的那个样本均数估计u 时更可靠。

a. Sx b. S c. S : d. CV在假设检验中,由于抽样的偶然性,拒绝了实际上成立的Ho 假设,贝IJ —0 a.犯第I 类错误 b.犯第II 类错误 c.推断正确 d. a, b 都有可能 在假设检验中,由于抽样偶然性,接受了实际上不成立的比假设,贝9—o a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a, b 都有可能 在假设检验中,接受了实际上成立的出假设,则 _________ 。

a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a,b 都有可能 a 二0・05, t>t a os. v,统计•上可认为 o a.两总体均数差别无显著意义b.两样本均数差别无显著意义 c.两总体均数差别有显著意义d.两样本均数差别有显著意义 10、 在均数为方差为/的正态总体中随机抽样,每组样本含量n 相等,u=(X L u)/ox ;则u21. 96 的概率是 ______ 。

a. P>0.05 b. PW0.05 c. PM0.025 d. PW0.025 11、 ____________________________________________________________ 在均数为u,标准差为。

医学统计学复习题

医学统计学复习题

一、最正确选择题1.抽样研究是一种科学高效的方法,目的是研究〔B 〕• A.样本 B.总体• C.抽样误差 D.概率2.由样本推断总体,样本应该是〔D 〕• A.总体中的典型局部• B.总体中有意义的局部• C.总体中有价值的局部• D.总体中有代表性的局部3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中〔C 〕• A.四种误差都不可防止• B.过失误差和测量误差不可防止• C.测量误差和抽样误差不可防止• D.系统误差和抽样误差不可防止4.统计描述是指〔C 〕• A.比拟指标的差异有无显著性• B.估计参数• C.用统计指标描述事物的特征• D.判断无效假设是否成立5.统计推断是指〔D 〕• A.从总体推断样本特征• B.从总体推断总体特征• C.从样本推断样本特征• D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于〔A 〕• A.系统误差 B.随机测量误差• C.抽样误差 D.过失误差7.随机抽样的目的是〔D 〕• A.能消除系统误差• B.能消除测量误差• C.能消除抽样误差• D.能减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于〔B 〕• A.计量资料 B.计数资料• C.等级资料 D.三个都不是9.计量资料是〔C 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料10.计数资料是〔B 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料11.等级资料是〔D 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料12.以下哪种不属于计量资料〔C 〕• A.红细胞数 B.血钙浓度• C.阳性人数 D.脉搏13.以下哪种属于等级资料〔A 〕• A.治疗痊愈、有效、无效人数• B.各血型人数• C.白细胞分类百分比• D.贫血和不贫血人数二、判断题• 1.统计工作的主要内容是对资料进行统计分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学复习题一、名词解释1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。

变异是生物医学研究领域普遍存在的现象。

严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。

7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

等级资料又称有序资料。

如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。

8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。

0﹤P(A)﹤1。

9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。

当试验重复很多次时P(A)= m/n。

10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。

它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。

误差变量一般服从正态分布。

随机误差可以通过统计处理来估计。

11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计和完善技术措施来消除或使之减少。

12.参数:指总体的统计指标,如总体均数、总体率等。

总体参数是固定的常数。

多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

13.统计量:是指样本的统计指标,如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

14.频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。

对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。

对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。

15.算术均数(arithmetic mean )描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用 表示。

16.几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。

记为G 。

17.中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。

18.极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

19.百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。

百分位数的另一个重要用途是确定医学参考值范围。

20.四分位数间距(inter-quartile range )是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。

21.方差(variance ):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

22.标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

23.变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

用CV 表示。

24.正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution )。

通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。

25.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布(standard normal distribution ),通常记为2(0,1)N 。

26.抽样误差:抽样研究中,由抽样引起的样本统计量与总体参数间的差别称为抽样误差(sampling error )。

统计上用标准误(standard error ,SE )来衡量抽样误差的大小。

其产生的本质原因是由于个体间存在变异。

27.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

该范围称为总体参数的可信区间(confidence interval ,CI )。

它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。

28.相对数(relative number )是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。

29.率(rate )又称频率指标,说明一定时期内某现象发生的频率或强度。

30.构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。

31.标准化法(standardization method)是常用于内部构成不同的两个或多个率比较的一种方法。

标准化法的基本思想就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

32.统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table)。

狭义的统计表只表示统计指标。

33.统计图(statistical graph):是将统计指标以点的位置、线段的升降、直条的长短或面积的大小等几何图形直观的表示事物间的数量关系。

34.普通线图适用于连续性资料。

用线段的升降来表示一事物随另一事物变化的趋势。

35.散点图以点的密集程度和趋势表示两种事物间的相关关系。

二、简答题1. 一位研究人员欲做一项实验研究,研究设计应包括那几方面的内容?答:一般来讲,研究设计应包括两方面的设计:专业设计和统计设计。

专业设计是针对专业问题进行的研究设计,如选题、形成假说、干预措施、实验对象、实验方法等;统计设计是针对统计数据收集进行的设计,如样本来源、样本量、干预措施的分配、统计设计类型测量指标的选择等。

统计设计是统计分析的基础,任何设计上的缺陷,都不可能在统计分析阶段弥补和纠正。

2.试述极差、四分位数间距、标准差及变异系数的适用范围。

答:这三个指标均反映计量资料的离散程度。

极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。

3.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。

所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

制定参考值范围的一般步骤:(1)定义“正常人”,不同的指标“正常人”的定义也不同。

(2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的指标。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。

(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。

4.正态分布的特征:服从正态分布的变量的频数分布由均数、标准差完全决定。

(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以为对称轴,左右完全对称。

正态分布的均数、中位数、众数相同,均等于。

(2) 描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。

也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。

5. 四格表资料卡方检验校正条件:分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

6.统计表的结构与编制要求统计表由标题、标目、线条和数字所构成。

如下表所示:顶线表 号 标 题横标目名称纵标目名称 合计 横标目合 计数 字(1) 标题位于表的上方,概括表的主要内容,一般需注明时间与地点。

(2)标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚。

(3)线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线。

忌斜线和竖线。

(4)数字表内数据一律采用阿拉伯数字。

同一指标小数点位数要一致,位次要对齐。

表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“…”表示。

(5)备注不为表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。

7.统计表的种类统计表可分为简单表(simple table)和复合表(combinative table)两种类型。

简单表:只按单一特征或标志分组。

复合表:按两个或两个以上主要标志分组,如年龄和性别结合起来分组。

8.制图的基本要求(1)根据资料的性质和分析目的,选择合适的图形。

(2)标题扼要说明图的主要内容,位于图的下方,必要时注明时间和地点。

相关文档
最新文档