医学统计学 研究生期末考试版.doc
《医学统计学》期末考试试卷

《医学统计学》期末考试试卷一.单选题(每小题1.5分,共60分)1.卫生统计工作的步骤为() [单选题] *A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料(正确答案)D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有() [单选题] *A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断(正确答案)E.统计描述和统计图表3.统计资料的类型包括() [单选题] *A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料(正确答案)4.抽样误差是指() [单选题] *A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别(正确答案)C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指() [单选题] *A.任意想象的研究对象的全体(正确答案)B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用() [单选题] *A.全距B.标准差C.变异系数D.四分位数间距(正确答案)E.方差7.用均数与标准差可全面描述其资料分布特点的是() [单选题] *A.正偏态分布B.负偏态分布C.正态分布和近似正态分布(正确答案)D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用() [单选题] *A.变异系数(正确答案)B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是() [单选题] *A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势(正确答案)D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有() [单选题] *A.算术均数=几何均数B.算术均数=中位数(正确答案)C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为() [单选题] *A.μ+σB.μσC.μ+σD.μ+σ(正确答案)E.μσ12.下列哪个变量为标准正态变量() [单选题] *A.B.C.D.(正确答案)E.13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指() [单选题] *A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围(正确答案)D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t分布() [单选题] *A.B.C.D.E. (正确答案)15.统计推断的主要内容为() [单选题] *A.统计描述与统计图表B.参数估计和假设检验(正确答案)C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指() [单选题] *A.B. (正确答案)C.D.E.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大() [单选题] *A.变异系数B.标准差C.标准误(正确答案)D.极差E.四分位数间距18.两样本比较作t检验,差别有显著性时,P值越小说明() [单选题] *A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同(正确答案)D.越有理由认为两样本均数不同E. I型错误越大19.在假设检验中,P值和的关系为() [单选题] *A.P值越大,值就越大B.P值越大,值就越小C. P值和值均可由研究者事先设定D. P值和值都不可以由研究者事先设定E. P值的大小与值的大小无关(正确答案)20.假设检验中的第二类错误是指() [单选题] *A.拒绝了实际上成立的B.不拒绝实际上成立的C.拒绝了实际上成立的D.不拒绝实际上不成立的(正确答案)E.拒绝时所犯的错误21.多组均数的两两比较中,若不用q检验而用t检验,则() [单选题] *A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大(正确答案)D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对22.说明某现象发生强度的指标为() [单选题] *A.构成比B.相对比C.定基比D.环比E. 率(正确答案)23.对计数资料进行统计描述的主要指标是() [单选题] *A.平均数B.相对数(正确答案)C.标准差D.变异系数E.中位数24.构成比用来反映() [单选题] *A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重(正确答案)D.表示某一现象在时间顺序的排列E.上述A与C都对25.下列哪一指标为相对比() [单选题] *A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数(正确答案)26.两个样本率差别的假设检验,其目的是() [单选题] *A.推断两个样本率有无差别B.推断两个总体率有无差别(正确答案)C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同27.用正态近似法进行总体率的区间估计时,应满足() [单选题] *A. n足够大B. p或(1-p)不太小C. np或n(1-p)均大于5D. 以上均要求(正确答案)E. 以上均不要求28.由两样本率的差别推断两总体率的差别,若P〈,则() [单选题] *A.两样本率相差很大B.两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义(正确答案)E. 其中一个样本率和总体率的差别有统计意义29.假设对两个率差别的显著性检验同时用u检验和检验,则所得到的统计量u 与的关系为()u值较值准确 [单选题] *A.u值较值准确B. 值较u值准确C.u=D. u=(正确答案)E. =30.四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求的条件为() [单选题] *A. A≥5B. T≥5C. A≥5 且T≥5D. A≥5 且n≥40E. T≥5 且n≥40(正确答案)31.三个样本率比较得到>,可以为() [单选题] *A.三个总体率不同或不全相同(正确答案)B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同32.四格表检验的校正公式应用条件为() [单选题] *A. n>40 且T>5B. n<40 且T>5C. n>40 且 1(正确答案)D. n<40 且1E. n>40 且T<133.下述哪项不是非参数统计的优点() [单选题] *A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验(正确答案)E.适用于未知分布型资料34.秩和检验和t检验相比,其优点是() [单选题] *A. 计算简便,不受分布限制(正确答案)B.公式更为合理C.检验效能高D.抽样误差小35.等级资料比较宜用() [单选题] *A. t检验B. u检验C.秩和检验(正确答案)D. 检验E. F检验36.从文献中得到同类研究的两个率比较的四格表资料,其检验结果为:甲文,乙文,可认为() [单选题] *A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信(正确答案)D.乙文结果更可信E.甲文说明总体间的差别更大37.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用() [单选题] *A.普通线图(正确答案)B.直方图C.统计地图D.半对数线图E.圆形图38.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:() [单选题] *A.计量资料B.计数资料(正确答案)C.多项分类资料D.等级资料E.既是计量资料又是分类资料39. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
《医学统计学》期末模拟考试题(二)

《医学统计学》期末模拟考试题(二)学号______________ 姓名______________ 班级______________ 成绩____________一.填空题(每空0.5分,共15分)1. 假设检验的基本思想是_________________和____________________。
2. 医学原始资料的类型有_______________、______________、_____________。
3. 统计工作步骤为_______________、______________、_____________、_____________。
4. 两组正态分布资料的比较,当方差不齐时,可采用的方法是,_______________________,。
,_______________________,。
5. 抽样误差的意思是_____________________________________________。
6.Ⅰ类错误的意思是________________________________________________。
7. 作两样本率的比较时,如P>0.05,则应_________无效假设,结论为__________________。
8. 直线回归分析的前提是(1)______________;(2)________________;(3)_______________;(4)___________________。
9. 实验设计的基本原则是,,,。
,,,。
10. 重复原则是指_________________________________________________。
11. 常用相对数有__________________、___________________、________________。
12. 常见病是指_____________________________高的疾病。
研究生医学统计学试题

《医学统计学》试题注:满分300分。
最终成绩=总得分/3;说明1、试题意在考察研究生对《医学统计学》理论知识和SPSS统计软件的学习掌握情况。
2、研究生在答题过程中严禁抄袭、复印。
如发现答案雷同者,该科目成绩将判为“不及格”,后果由学生自负。
3、答题时,不写具体的操作过程(如“选择Analyze→General linear Models→Univariate…,弹出Univariate对话框”)。
4、答题时,首先应明确交代某题所用的具体统计方法。
5、答题时,只将答题有关的SPSS输出结果粘贴到答案中,并且对结果要做出必要的解释;对答题无关的输出结果不要粘贴到答案中。
如果对结果不做任何解释,或将跟答题无关的输出结果粘贴到答案中,将对成绩有严重影响。
6、试题(卷)的答案要求A4纸双面打印。
1、(20分)从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下表1,①求其均数,中位数,标准差,标准误,最大值,最小值,极差、第2.5、25、75、97.5百分位数(10分);②编制(改进)频数分布表、绘制直方图(各5分)。
表1 某年某单位101名正常成年的血清总胆固醇(mmol/L)2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.80 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.95 3.00 3.262、(10分)为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表2第(1)~(3)栏。
《医学统计学》期末考试试卷附答案

《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
硕士研究生医学统计学期末考试

硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1 分,共20 分)1. 用配对t 检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2. 对多个总体率有无差别做假设检验时,如果P< 0.05,则拒绝H),差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
( )4. 成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5•做t检验时,如果t > t0.05,v ,则P< 0.05,差别无统计学意义,可认为两总体均数不相等。
2的检验,当n A 40,T> 5时,只能用四格表x2检验的专用公式,不能用确切概率法。
()6. 四格表x的检验,当n A 40, T A 5时,只能用四格表x 2检验的专用公式,不能用确切概率法。
()7. Logistic 回归中, 因变量可为二分类, 多分类或等级资料。
( )8. 期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10. 机械抽样和立意抽样属于非概率抽样。
( )11. 样本含量的估计需要事先确定的是12. 多个样本比较的秩和检验,用K-WH 检验,当样本含量足够大时,可用z 检验近似。
()13. 同一资料,有 。
()14. 发病率高的疾病称为多见病。
( )15. Logistic 回归可用于筛选疾病的危险因素。
()20. 如果要控制其他变量的影响,看某两个变量的相关性,可用偏相关进行分析。
()、选择题(每题 1分,共20 分)1. 用两种药物治疗冠心病病人,结果见下表。
问两种药物治疗冠心病的疗效是否不同,较 好的统计方法是 _______a. R x C 表x 2检验b. Wilcox on 秩和检验c. Pearson 直线相16. 对于单向有序行列表,如果要做优劣检验,2检验中,x 2值越大,P 值越小, 17四格表的x大,P 值越小,说明两总体率的差别越大。
硕士研究生医学统计学期末考试

硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1分,共20分)1.用配对t检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2.对多个总体率有无差别做假设检验时, 如果P<0.05, 则拒绝H0, 差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
()4.成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5.做t检验时, 如果t>t0.05,v, 则P<0.05,差别无统计学意义, 可认为两总体均数不相等。
2的检验, 当n≥40,T≥5时, 只能用四格表χ2检验的专用公式, 不能用确切概率法。
( )6.四格表χ的检验, 当n≥40,T≥5时, 只能用四格表χ2检验的专用公式, 不能用确切概率法。
( )7.Logistic回归中, 因变量可为二分类, 多分类或等级资料。
( )8.期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10.机械抽样和立意抽样属于非概率抽样。
( )11.样本含量的估计需要事先确定的是δ,β,α,σ。
( )12.多个样本比较的秩和检验, 用K-W H检验, 当样本含量足够大时,可用z检验近似。
( )13. 同一资料,有。
( )14.发病率高的疾病称为多见病。
()15.Logistic回归可用于筛选疾病的危险因素。
( )16.对于单向有序行列表, 如果要做优劣检验,最好的方法是χ2检验。
( )17四格表的χ2检验中, χ2值越大, P值越小, 说明两总体率的差别越大。
( )检验中, χ2值越大, P值越小, 说明两总体率的差别越大。
研究生医学统计学试题

2.完全随机设计方差分析属于单向方差分析,随机区组设计方差分析属于双向方差分析。
3.前者变异拆分:SS总=SS组间+SS误差(或SS组内),后者变异拆分:SS总=SS区组+SS处理+SS误差。
故随机区组实验设计得方差分析检验效能更高。
3、率和构成比有何不同?为什么不能以比代率?一、率和比例的概念不同1、率:又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
率的比例基数可以是百分率,千分率,万分率,十分率等。
应该根据其在医学中的使用习惯来使用。
人口学指标如出生率,死亡率等习惯用千分率;恶性肿瘤的发病率,死亡率一般用万分率或十万分率;住院病人的病死率,床周转率等则常用百分率。
2、比例指标,通常计算构成比,说明某一事物内部各组成部分所占的比重或分布。
常以百分数表示。
二、率和比例的计算方法不同1、率的计算公式为:率=发生某现象的观察单位数/可能发生某现象的观察单位总数*KK为比例系数,可以为100%,10000/万,100000/10万等。
2、构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
4.举例说明回归分析的用途:回归分析主要是研究两个变量间的数量依存关系的统计学方法。
例如欲研究血清胆固醇含量与舒张压间是否存在依存关系,可在某大学随机抽取20名成年男性,测得他们的血清胆固醇含量和舒张压,并对两者指标采用简单线性回归方法进行分析可得是否存在依存关系。
5、简述非参数检验的优缺点,什么情况下会用非参数检验?优点:(1)对总体分布未做出任何假定,因此适用于任何分布的资料。
如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料。
(2)易于收集资料、统计分析比较简便。
缺点:不直接分析原始测量值,从而有可能会降低它的检验效率。
《医学统计学》期末考试试题及答案

一.单选题(每题Label 分)1 .体重指数(kg/m2)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B2 .统计量()。
A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标正确答案:E3 .血压(Kpa)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B4 .小概率事件在统计学上的含义是()。
A.指发生概率P≥0.5的随机事件B.指一次实验或者观察中绝对不发生的事件C.在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05D.在一次实验或者观察中发生的可能性较大的事件,一般指P>0.05E.以上说法均不正确正确答案:C5 .某次研究进行随机抽样,测量得到该市110名健康成年男子的血清总胆固醇值,则研究的总体是()。
A.所有成年男子的血清总胆固醇值B.该市所有成年男子的血清总胆固醇值C.该市所有健康成年男子的血清总胆固醇值D.110名健康成年男子的血清总胆固醇值E.所有男子的血清总胆固醇值正确答案:C6 .搞好统计工作,达到预期目标,最主要的是:()。
A.原始资料要多B.原始资料要准确C.整理资料要细D.分析资料要先进E.以上都不是正确答案:B7 .下面的变量中,属于定量变量的是()。
A.性别B.体重C.血型D.职业E.民族正确答案:B8 .表示血型(A.B.AB.O型)的资料,该资料为()。
A.观察单位B.数值变量C.分类变量D.等级变量E.研究个体正确答案:C9 .若要通过样本作统计推断,样本应是()。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分正确答案:C10 .脉搏数(次/分)是:()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B11 .下列关于概率的说法,错误的是()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释(考10对)1.总体;样本总体:根据研究目的确定的、同质的全部观察单位某一指标(或某些因素及结果)的测量值总体。
根据总体集合所包括元素是否有限,分为有限与无限总体。
总体具有特定的分布特征及参数;样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能够代表总体分布特征的一部分观察单位某指标数据的集合。
根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。
2.标准差;标准误标准差:是描述单个测量值对其均数的离散程度。
标准差越大,数据的离散程度就越大,均数的代表性越差;标准差越小,均数的代表性越好。
标准误:样本统计量的标准差称为标准误,它反映样本统计量的抽样误差的大小,也反映样本统计量对总体参数的离散程度。
标准误大,表示样本统计量对总体参数的代表性差;标3、s x 96.1±;x v s t x ⋅±)(2/αs x 96.1±:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围 x v s t x ⋅±)(2/α:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a 确定的总体均值的(1—a )的可信区间。
4.计量资料(数值变量资料);计数资料(分类变量资料)计量资料:通过度量的方法,测量每个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位或多为连续性资料。
计数资料:指将全体观察单位按某种属性分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量单位或多为非连续性资料5.点估计;区间估计点估计:直接利用样本统计量的一个数值来估计总体参数,比如基于一份随机样本,用x估计u,用p估计π,用S估计σ。
点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。
区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a)所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI)。
预先给定的概率(1—a)称为可信度或置信度,常取95%或99%。
6.回顾性研究;前瞻性研究回顾性研究:即病例—对照研究,是由果到因,即先选定病例组和对照组,然后分别回顾两组过去的暴露情况,比较其差异,探索与发病相关的可能因素。
回顾性研究的优点是对于患病率非常低的研究人群可获得较高的效果,研究周期较短和可以探索多个因素与患病的关联;其缺点是不能估计患病率和死亡率,容易产生回忆性偏倚和选择性偏倚。
前瞻性研究:即队列研究,是由因寻果,是将选定的人群按暴露状况分成暴露组和对照组,暴露组接触某个因素而对照组不接触某个因素,其他所有条件两组基本相同。
经过一定时间随访,比较暴露组和对照组在随访期间的发病率,如果两组发病率不同,则归因于该暴露因素。
前瞻性研究的优点是可以估计发病率,暴露测量可以做到无偏倚,结论比较可靠。
其缺点是研究效率比较低,研究周期比较长导致在研究期间可能出现失访及各种混杂因素影响。
7、完全随机设计;随机区组设计完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。
随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。
两种实验设计方案均为单因素实验设计。
区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。
8.独立性数据与重复性数据独立性:对一群观察指标独立测定一次,形成一个群体数据,观察值间互相独立,不相互影响。
重复性:一个观察对象,同一或不同时间测定产生的数据。
9.α值;P值α值:检验水准(显著性水准),即在假设检验中预先规定的判断小概率事件的概率尺度,通常为0.01或0.05,代表在原假设成立的前提下,拒接原假设所犯I类错误的概率。
P值:从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还H可能犯I 大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际欲拒绝类错误的概率。
P2710.观察性研究;实验性研究观察性研究:是指对研究对象不加任何干预措施,在完全“自然状态”下观察、记录各研究对象的特征,描述现象的本质,比较不同环境条件下疾病的发生、发展。
观察性研究可以在相应的人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组。
与实验性研究相比,调查中涉及的混杂因素较多,所需样本量较大,资料必须做多因素分析。
实验性研究:是指对研究对象人为施加干预的研究。
在干预前,研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。
两者的区别为:①处理因素能否由研究者主动设置;②对象能否随机分组;③样本大小不同;④混杂因素多少不同;⑤统计方法应用不同;⑥严谨性,重、再现性不同。
11、r;br:直线相关系数,描述样本资料的两变量之间线性相关性并判断其密切程度。
相关系数r 没有单位,在-1~+1范围内变动,相关系数的绝对值越接近1,两个变量的线性相关程度越强;相关系数的绝对值越接近0,两个变量的线性相关程度越弱。
相关系数若为正,说明一变量随另一变量增减而增减,方向相同,为正相关;若为负,表示一变量增加、另一变量减少,即方向相反,为负相关;若为零,两变量间没有任何伴随变化趋势,为不相关或零相关。
b:直线回归系数,为回归直线的斜率,也即总体回归系数β的估计值。
其统计学意义为X 每改变一个单位,Y 平均改变b 个单位。
两者相同点为:①均为数量协同变化研究;②同一资料,两者方向一致;③同一资料,两者假设检验一致;④均有一定的线性范围;⑤2r b b yx xy =⋅两者不同点为:①含义不同:r 表示服从双变量正态分布的两个变量间的数量协同变化的密切程度,b 表示变量Y 随变量X 呈现出的线性依存关系;②两者表达式不同;③两者应用范围不同:直线相关应用于流行病学、探索性实验研究;直线回归应用于实验室工作曲线研究。
12、灵敏度;特异度灵敏度:表示实际患病按检测结果正确判为有病的概率。
灵敏度反映诊断方法正确诊断某病的能力,灵敏度越高,诊断为假阴性的概率越小,即漏诊的可能性越小。
特异度:表示实际未患病按检测结果正确判为没病的概率。
特异度反映诊断方法正确排除某病的能力,其值越大,诊断为假阳性的概率越小,即误诊的可能性越小。
13、精密度;准确度精密度:表示用同种测试方法重复测定同一样品,其测定结果的一致性。
可用标准差或变异系数描述。
准确度:表示用某种测试方法测定某一样品,其测定值对真值的偏离程度,一般可用回收率表示。
14、关联性分析;趋势性分析关联性分析:是研究具有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。
关联性分析较趋势性分析内涵更宽泛,适用资料广,但量化含义相对粗犷,适合于社会学调查资料分析,对于定类变量一般不计方向。
趋势性分析:针对一个变量随同另一个变量的数量变化有规律地发生线性或非线性数量协变关系,研究其协变关系规律的统计分析方法称为“趋势性分析”。
两者的比较(ppt )15.筛查试验的阳性预测值与阴性预测值筛检的阳性预报率:表示某种诊断方法预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。
筛检的阴性预报率:表示某种诊断方法诊断结果为阴性者实际未患病的概率。
二、填空题(5个,20空)及选择题(单选,选正确或最优) 1.s x ±; M ;%)25(%)75(X X Q -= s x ±:表示一个算术均数为x ,标准差为s 的样本。
M:中位数,指的是在按大小顺序排列的一个变量的所有n 个观察值中,位于正中间的那个数值。
当计量资料中有离群值,或数据分布不对称(包括左偏和右偏)时,或数据的上限或下限不明确时,均宜使用中位数来描述数据的集中趋势。
%)25(%)75(X X Q -=:四分位数间距,为描述计量资料离散趋势的指标之一,对于计量单位相同的变量,四分位数间距越大,观察值的离散程度越大。
2.医学统计学的“六性分析”为:①估计性;②聚积性;③差异组间对比性——统计对比,临床效果对比;④关联性;⑤趋势性——方向性、单调性、无量纲性、变量匹配性;⑥协调性。
3.计量资料七种研究设计方案:①单因单结果变量:完全随机设计;随机区组设计;重复测量设计。
②多因单结果变量:交叉设计;析因设计;正交设计。
③单因多结果变量:多元2T 设计。
4.临床论文从理论上要包括四种分析(临床研究对比分析):①均衡性检验(影响结果的对比组结构性要一致);②纳入数据集汇总与描述;③效果分析:包括统计差异性检验和临床差异性检验(优效性检验、等效性检验、非劣效性检验);④安全性评价(医学伦理学要求)。
5.诊断实验研究设计要点:①要具备“金标准”,即当前国内外临床专业医师公认的诊断某种疾病的最可靠方法;②要有随机对照试验和真实两组人群(真病人组、非病人组、大样本);③执行试验者盲法检测(不知对象或样本的真实组别);④同期检测(防治病情变化和待测组分变化);⑤最好了解人群患病率,以便对比两种患病率(结构、人群)和计算预报率。
6.诊断实验准确度的三类评价指标:(1)基本指标:①敏感度;②特异度;(2)综合指标:①准确度;②尤登(金)指数;③阳性似然比;④阴性似然比;(3)其他指标:①结构预报率,包括阳性预报率及阴性预报率;②人群预报率,包括人群阳性预报率及人群阴性预报率。
7.实验设计的基本要素:①处理因素;②实验对象;③实验效应。
8.实验设计的四个基本原则:①随机化原则;②设置均衡对照原则;③足够样本含量;④盲法原则。
9.临床医学参考值范围统计方法上注意点:①抽取足够例数的同质“正常人”样本;②确定具有实际意义的统一测量标准;③根据指标的性质确定是否要分组;④根据指标含义确定单、双侧范围;⑤选择适当的百分范围,一般常用95%或99%医学参考值范围;⑥根据资料的分布类型选择相应的计算制定医学参考值范围的方法。
10.等级资料的对比分析:等级资料比较水平差异不能用卡方检验,只能用等级秩和检验。
11.结果指标多于2个的对比性分析:单因多结果变量用2T检验。
12.单向有序列联表:原因变量为等级变量资料,结果变量为二值变量资料可做趋势性卡方分析。
13.双向有序列联表:双向等级列联表可做相关分析。
14.常用随机抽样方法有:(1)基本抽样方法——①单纯随机抽样;②系统随机抽样;③分层随机抽样;④整群随机抽样。
(2)结合型抽样方法——①分层整群随机抽样;②多阶段随机抽样。
15.变量类型:(1)按性质分:①数值变量;②等级变量;③分类变量。