卫生统计学学习指导与习题集
医学统计学复习必过《卫生学习题集》

《卫生学习题集》6.0第八章、医学统计基本内容【A型题】1. 统计工作的前提和基础是A. 搜集资料B.调查资料C.整理资料D. 校对资料E.分析资料2. 为了由样本推断总体,样本应当是A. 总体中任意一部分B.总体中的典型部分C. 总体中有价值的一部分D.总体中有意义的一部分E. 总体中有代表性的一部分3. 计量数据、计数数据和等级数据的关系有A. 计数数据兼有计量数据和等级数据的一些性质B. 计量数据兼有计数数据和等级数据的一些性质C. 等级数据兼有计数数据和计量数据的一些性质D. 计数数据有计量数据的一些性质E. 等级数据又可叫半计数资料4. 统计表有简单表和复合表两种,复合表是指A. 有主辞和宾词B.主辞分成两个或两个以上标志C. 宾辞分成两个或两个以上标志D.包含两张简单表E.包含两张或两张以上简单表A. 年龄别B.性别C.死亡率D. 性别和年龄别E.性别、年龄别和死亡率A. 直方图B.圆图C.百分柱形图D. 柱形图E.普通线图问可以考虑7. 某研究者准备通过分析800人的血压数据以评价当地高血压患病情况,将血压测量值按哪种变量类型进行处理A. 计量资料B.计数资料C.等级数据D.以上均可E.以上均不可8. 半对数线图A. 纵横轴都必须为对数尺度B. 纵轴为对数尺度,横轴为算术尺度C. 横轴为对数尺度,纵轴为算术尺度D. 纵横轴都必须为算数尺度E. 以对数的1/2值作纵横轴尺度9. 比较某年某地四种病的病死率时,宜绘制A. 普通线图B.半对数线图C.直方图D.百分柱形图E.柱形图A. 柱形图B.直方图C.线图D.百分柱形图E.散点图11. 下列哪些统计图适用于计数资料A. 柱形图、直方图B.线图、半对数线图C. 柱形图、百分柱形图D.百分柱形图、直方图E. 散点图、线图12. 下列哪种统计图纵坐标必须从0开始A. 半对数线图B.散点图C.百分柱形图D. 普通线图E.柱形图13. 关于统计表的列表要求,下列哪项是错误..的A. 标题应写在表的上端,简要说明表的内容B. 横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧C. 线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线D. 数字右对齐,同一指针小数位数一致,表内不宜有空格E. 备注用“ * ”标出,写在表的下面14. 医学统计工作的基本步骤是A. 调查、搜集数据、整理数据、分析数据B. 统计数据收集、整理数据、统计描述、统计推断C. 设计、搜集数据、整理数据、分析数据D. 调查、统计描述、统计推断、统计图表E. 设计、统计描述、统计推断、统计图表A. 描述性统计和统计学检验B.区间估计与假设检验C.统计图表和统计报告E. 描述性统计和统计图表D.描述性统计和分析性统计A. 不同样本指针之间的差别B. 样本指针与总体指针之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别)C. 由于抽样产生的观测值之间的差别D. 样本中每个个体之间的差别E. 随机测量误差与过失误差的总称A. 其值的大小在0和1之间B. 当样本含量n充分大时,我们有理由将频率近似为概率C. 随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不可能发生D. 必然事件发生的概率为1A. 任意想象的研究对象的全体B. 根据研究目的确定的研究对象的全体C. 根据时间划分的研究对象的全体D. 根据人群划分的研究对象的全体E. 根据地区划分的研究对象的全体19. 搞好统计工作,达到预期目标,最重要的是A.原始数据要正确B.原始资料要多C.分析资料要先进D.整理资料要详细E.统计计算精度要高20. 医学统计工作的四个基本步骤中,搜集资料的过程不包括...A.实验B.统计报告C.日常医疗卫生工作记录D.专题调查E.录入计算机21. 对统计表和统计图标题的要求是A.两者标题都在下方B.两者标题都在上方C. 统计表标题在上方,统计图标题在下方D. 统计表标题在下方,统计图标题在上方E. 可随意设定位置22. 制作统计图时要求A. 纵横两轴应有标目,一般不注明单位B. 纵轴尺度必须从0开始C. 标题应注明图的主要内容,一般应写在图的上方D. 在制作柱形图和线图时,纵横两轴长度的比例一般取5:7E. 柱形图是以面积大小来表示数值的【B型题】A. 用清点数目数出来的资料B. 用仪器量出来的数据C. 按观察单位的类别清点各观察单位数得来的数据D. 用定量方法测定观察单位某个量的大小得来的数据E. 按观察单位的等级清点各等级观察单位数得来的数据23. 计量资料是24. 计数资料是25. 等级数据是A. 数值变数B. 独立的两类C. 不相容的多类D. 类间有程度差别E. 以上均不是26. 白细胞数属于27. 血型A 、B、AB、O 属于28. 痊愈、显效、进步、无效属于【X型题】29. 统计工作的基本步骤是A.搜集资料B.整理资料C.分析资料D.核对资料E.计算机录入数据30. 构成图是指A.柱形图B.圆图C.直方图D. 百分柱形图31. 整理数据的目的是A. 为了分组B. 使资料条理化C. 检查核对资料D. 便于统计分析E. 使资料系统化32. 统计资料可分为A. 计量资料B. 频数表资料C. 计数资料D. 四格表资料E. 等级数据33. 以下哪些属于计量资料A. 身高的测定值B. 体重的测定值C. 血压的测定值D. 脉搏数E. 白细胞数34. 以下数据中,按等级分组的数据是A. 治疗效果B. 血型分布C. 某项化验指标的测定结果D. 白细胞分类百分比E. 身高35. 根据医学研究资料的特点,医学统计中常用的分组方法有A. 品质分组B. 数量分组C. 年龄分组D. 性别分组E. 体重分组36. 以统计图表示连续性资料,可选用A. 普通线图B. 直方图C. 半对数线图E. 圆图37. 以统计图表示住院患者中主要疾病的构成情况,可用A. 柱形图B. 百分柱形图C. 直方图D. 圆图E. 普通线图【名词解释】38. 总体39. 样本40. 概率41. 计量资料42. 计数资料43. 等级数据44. 柱形图45. 普通线图46. 半对数线图47. 直方图【简答题】48. 何谓统计表?其基本结构是什么?49. 统计表的种类有哪几种?50. 统计表设计的基本要求是什么?51. 统计表和统计图在资料的表达中有什么作用?52. 常用的统计图有哪些种类?其各自的适用条件是什么?53. 普通线图与半对数线图的区别是什么?54. 资料搜集计划应包括哪些方面的内容?55. 统计工作的基本步骤是什么?56. 统计设计包括哪些内容?57. 统计资料的来源有哪些途径? 58. 直方图与百分柱形图有何区别?【应用题】59.请根据下表资料考虑:⑴若比较两个年龄组儿童四种疾病的发病率,应绘制什么图?⑵若比较两个年龄组儿童四种疾病的疾病构成情况 ,应绘制什么图?表某年某地两个年龄组四种疾病发病情况病种 0〜4岁组10〜14岁组例数 构成比(%) 发病率(%0) 例数 构成比(%)发病率(%0) 百日咳 80 16 4. 060 321.5麻疹 320 64 16. 0 48 25 1.2 猩红热 60 12 3. 0 45 24 1. 1 白喉4082. 036190.960.请按绘制统计表的要求对下表进行修改表某药治疗某病疗效观察8律参考答案【A 型题】 1. A 2. E 3. C 4. B 5. D【B 型题】23. D6. A 11. C 16. B 21. C7. D 12. E 17. E22. D8. B 13. B 18. B9. E 14. C 19. A10. C15. D20. E24. C 25. E【X型题】29.ABC32.ACE35.AB30.BD33.ABCDE36.ABC31.BDE34.AC37.BD【应用题】59. ⑴应绘制复式柱形图比较发病率⑵应绘制百分柱形图或圆图比较疾病构成60. 修改后的统计表如下:某药治疗某病疗效观察第九章、数值变量数据的统计分析【A型题】A. x愈大,s愈大B. x愈大,s愈小C. s愈大,x对各变数值的代表性愈好D. s愈小,x与总体均数的距离愈大E. s愈小,x对各变数值的代表性愈好A. 卩一c〜卩+ cB.卫1.96 o•〜卩+1.96 cC. 2. 58 o•〜卩+2. 58 cD. —x〜J+1. 96 cE. 0 〜J+1.96 c3. 设x符合均数为J标准差为c的正态分布,作u= (x —训c的变数变换,则A. u符合正态分布,且均数不变B. u符合正态分布,且标准差不变C. u符合正态分布,且均数和标准差都不变D. u 符合正态分布,但均数和标准差都改变E. u 不符合正态分布4. 从一个数值变量数据的总体中抽样,产生抽样误差的原因是A. 总体中的个体值存在差别B.总体均数不等于零C.样本中的个体值存在差别 D.样本均数不等于零E. 样本只包含总体的一部分A.x± 2. 58 S x B. x ± 1. 96 S x C. ± 2. 58D. ± 1.96 "E. ± 2. 58S x6. t 分布与标准正态分布相比A.均数要小B.均数要大C.标准差要小D.标准差要大E.均数和标准差都不相同A.两总体均数不等B.两样本均数不等C. 两样本均数和两总体均数都不等D. 其中一个样本均数和总体均数不等E. 以上都不是8. 要评价某市一名8岁女孩的身高是否偏高或偏矮,应选用的统计方法是A. 用该市8岁女孩身高的95%或99%正常值范围来评价B. 作身高差别的假设检验来评价C. 用身高均数的95%或99%可信区间来评价9.若正常人尿铅值的分布为对数正态分布,现测定了300例正常人的尿铅值,以尿铅过高者为异常,则其 95%参考值范围为名男孩体重的标准差大约为D. 不能作评价E.以上都不是A. lg 「1( G ± 1.96 S g x ) C. v lg 「( G+1.65 S g x )E. > lg "(G — 1.65 S lg x )B. lg —1( G ± 1.65 S x )D. v lg —1( G+1.96 S g x )(注:G 为几何均数)10.某市250名8岁男孩体重有95%的人在18〜30kg 范围内,由此可推知此250A. 2 kgB. 2.326 kgC. 6.122 kgD. 3.061 kgE. 6 kgA.个体差异B.测量误差C.个体差异和测量误差D.各处理组可能存在的差异E.以上都有A. 正态分布数据不能用均数标准差法B. 正态分布数据不能用百分位数法C. 偏态分布数据不能用均数标准差法D. 偏态分布数据不能用百分位数法E. 以上都不对13. 单因素设计的方差分析中,必然有A. SS 组内v SS 组间B. MS 组间v MS 组内C. MS 总=MS 组间+ MS 组内D. SS 组内> SS 组间E. SS 总=SS 组间+ SS 组内14.方差分析中,当 PV 0.05时,贝UA.可认为各总体均数都不相等B.证明各总体均数不等或不全相等C.可认为各样本均数都不相等D. 可认为各总体均数不等或不全相等E.以上都不对15.两样本中的每个数据减同一常数后, 再作其t 检验,则A. t 值不变B. t 值变小C. t 值变大D. 无法判断t 值变大还是变小E. t 值变大还是变小取决于该常数的正、负号 16. 在抽样研究中,当样本例数逐渐增多时A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0A.不会比均数大 D.决定于均数B.不会比均数小 E.不决定于均数C.不会等于均数18.均数是表示变量值的A.平均水平B.变化范围C.频数分布D.相互间差别大小E.离散趋势19. 各观察值均加(或减)同一个不等于零的数后A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.均数不变,标准差不一定改变20. 描述一组偏态分布数据的变异度,以下列哪个指标为好。
《卫生统计学II》(专升本)学习指导

《卫生统计学》(本)学习指导刘仁权(Liurq@、64286391)一、课程总说明(一)课程介绍统计学是一门研究数据的收集、整理、分析的科学。
卫生统计学是一门运用统计学原理和方法研究医药卫生工作中数据的收集、整理、分析的科学。
卫生统计学是医学体系的重要分支,是医学院校学生的必修课程。
随着医学的发展,作为医学科学研究方法学的卫生统计学已逐渐为广大医药卫生工作者所认识、所接受,并广为应用。
通过本课程的学习,可以掌握卫生统计学的基本概念、基本理论和基本方法,掌握收集、整理和分析资料的基本知识和方法,可以培养运用这些知识,对医药卫生工作中的数据进行统计处理的能力。
(二)教材、光盘和计算器在本课程的学习中,指定教材和课件光盘都很重要,同学们一定要准备好指定教材和课件光盘,并准备一个计算器或使用计算机Windows附件中的计算器。
1.课件光盘:北京大学医学网络教育学院多媒体网络课件《卫生统计学》光盘2张,主讲:刘仁权。
光盘中是按教材《医学统计学》(第4版,主编:马斌荣)第一章至第十章内容详细讲解的全程授课视频录像。
2.现在指定教材:《医学统计学》(第6版)主申:马斌荣,主编:李康、贺佳;人民卫生出版社(2013年3月)。
本教材是卫生部“十二五”规划教材、全国高等医药教材建设研究会“十二五”规划教材,是“十二五”普通高等教育本科国家级规划教材。
说明:课件光盘是以前录制的,当时的教材是《医学统计学》(第4版),现在已经没有第4版教材出售了,同学们现在拿到的教材是第6版。
不过两版教材内容基本相同,只是换了例题的数据,但解题过程完全相同。
同学们要注意,本课程比较难,大家要认真观看我教学光盘中的讲课录像,安照光盘的顺序和内容,对照教材学习。
为了方便同学们学习,下面的表格是课件光盘、第6版教材内容的比较。
说明2:光盘中“第七章相对数及其应用”是独立的,可以象教材那样提前学习,不影响其他章节的学习。
3.计算器:准备一个计算器或使用计算机Windows附件中的计算器。
卫生统计学习题及答案(精华版)

统计学习题二、简答1.简述描述一组资料的集中趋势和离散趋势的指标。
集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
2.举例说明变异系数适用于哪两种形式的资料,作变异程度的比较?度量衡单位不同的多组资料的变异度的比较。
例如,欲比较身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比较,而应用变异系数比较。
3. 试比较标准差和标准误的关系与区别。
区别:⑴标准差S:①意义:描述个体观察值变异程度的大小。
标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵标准误S X:①意义:描述样本均数变异程度及抽样误差的大小。
标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,S X越小。
联系:①都是描述变异程度的指标;②由S X=s/n-1可知,S X与S成正比。
n一定时,s越大,S X越大。
卫生统计学试题及答案

卫生统计学试题及答案一、单项选择题(每题2分,共20分)1. 卫生统计学中,以下哪个不是描述数据分布的度量?A. 平均数B. 中位数C. 众数D. 方差答案:D2. 在统计学中,以下哪个概念用于描述数据的离散程度?A. 均值B. 标准差C. 相关系数D. 回归系数答案:B3. 以下哪个不是卫生统计学中的抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:D4. 卫生统计学中,以下哪个是用于描述两个变量之间关系的度量?A. 相关系数B. 回归系数C. 标准差D. 方差答案:A5. 在卫生统计学中,以下哪个是用于估计总体参数的统计量?A. 样本均值B. 总体均值C. 样本方差D. 总体方差答案:A6. 卫生统计学中,以下哪个是用于比较两个独立样本均值的统计检验?A. t检验B. 卡方检验C. 方差分析D. 相关性检验答案:A7. 在卫生统计学中,以下哪个是用于描述数据分布偏斜程度的度量?A. 峰度B. 偏度C. 标准差D. 方差答案:B8. 卫生统计学中,以下哪个是用于比较两个相关样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:B9. 在卫生统计学中,以下哪个是用于比较多个样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:C10. 卫生统计学中,以下哪个是用于描述数据分布的集中趋势的度量?A. 方差B. 标准差C. 均值D. 偏度答案:C二、多项选择题(每题3分,共15分)11. 卫生统计学中,以下哪些是描述数据分布的度量?A. 平均数B. 中位数C. 众数D. 标准差答案:ABCD12. 在卫生统计学中,以下哪些是用于估计总体参数的统计量?A. 样本均值B. 样本方差C. 总体均值D. 总体方差答案:AB13. 卫生统计学中,以下哪些是用于比较两个样本均值的统计检验?A. t检验B. 卡方检验C. 方差分析D. 配对t检验答案:AD14. 在卫生统计学中,以下哪些是用于描述数据分布偏斜程度的度量?A. 峰度B. 偏度C. 标准差D. 方差答案:AB15. 卫生统计学中,以下哪些是用于比较多个样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:C三、填空题(每题2分,共20分)16. 卫生统计学中,用于描述数据分布的离散程度的度量包括________、________和________。
实用卫生统计学习题与答案

实用卫生统计学习题与答案一、单选题(共80题,每题1分,共80分)1、符合正态分布的资料估计医学参考值不必具备A、均数B、标准差C、Z值D、标准误正确答案:D2、对男女两个样本的小学生饮食习惯的不良发生率作假设检验,这种方法属于A、统计推断B、统计描述C、总体研究D、实验设计正确答案:A3、两组均数比较时应具备可比性是描指A、相比较的样本均数必须相等B、相比较的样本必须方差相等C、相比较的样本必须例数相等D、相比较的各组除了处理因素外,其它可能影响结果的非处理因素在各组间尽可能相同或相近正确答案:D4、样本均数的标准误越小说明A、观察个体的变异越小B、观察个体的变异越大C、由样本均数估计总体均数的可靠性越大D、由样本均数估计总体均数的可靠性越小正确答案:C5、三个样本率比较的假设检验,自由度是A、1B、无法确定C、2D、3正确答案:C6、对两所学校学生体质检测抽样调查结果(优、良、中、差)进行比较的假设检验,应选择A、F检验B、t检验C、秩和检验D、四格表χ²检验正确答案:C7、抽样误差是A、随机误差B、测量误差C、过失误差D、系统误差正确答案:A8、中位数的优点之一是A、易受极端值的影响B、抽样误差小C、适用于分布类型不明的资料D、标准差小正确答案:C9、差别有统计学意义的含义是A、接受H0,不拒绝H1B、接受H0,拒绝H1C、不拒绝H0.接受H1D、拒绝H0,接受H1正确答案:D10、要求样本数据满足来自正态总体、相互独立、总体方差齐性三个条件的统计假设检验方法是A、回归分析B、相关分析C、方差分析D、检验正确答案:C11、描述连续型变量频数分布的统计图是A、直方图B、散点图C、普通线图D、直条图正确答案:A12、在同一总体中抽样,样本例数逐渐增多,则抽样误差A、逐渐加大B、逐渐减小直至为0C、逐渐减小,但不会消失D、不变正确答案:C13、下列不宜首选秩和检验的情况为A、数据的端式两端无确切值B、数据的总体服从偏态分布C、对数据总体分布不作要求D、数据的总体服从正态分布正确答案:D14、实验研究的基本原则是A、单纯随机抽样、系统抽样、分层抽样B、对照、重复、随机化C、收集资料、整理资料、分析资料D、动物实验、临床试验、社区干预试验正确答案:B15、比较甲、乙两所学校学生体育成绩的不同,采用达标与未达标作为评价指标,适宜的检验方法是A、方差分析B、相关分析C、t检验D、X²检验正确答案:D16、其有理论数小于1的两组阳性率进行比较应,选用的检验方法是A、四格表资料X2检验B、配对资料X2检验C、四格表的确切概率法D、行x列表的X2检验正确答案:C17、用标准差表示一组计量资料的离散程度,其数据分布要求是A、正态分布B、偏态分布C、离散型分布D、任意分布正确答案:A18、可用来描述对数正态分布资料集中趋势的指标是A、算数平均数B、几何均数C、中位数D、标准差正确答案:B19、描述呈偏态分布的血铅含铅(μg/100g)集中趋势的指标是A、算术均数B、标准误C、标准差D、中位数正确答案:D20、比较三个地区的剖宫产率,对其检验假设描述正确的是A、H0:三个地区剖宫产率各不相等B、H1:三个地区剖宫产率两两不相等C、H1:三个地区剖宫产率不等或不全相等D、H0:三个地区剖宫产率不全相等正确答案:C21、实验研究与调查研究的主要区别是A、实验研究的对象只是动物,调查研究的对象是人群B、实验研究的样本是随机概率抽样,调查研究的样本只能非概率抽样C、实验研究可以不设对照,调查研究则必须设立对照D、实验研究对研究对象施加干预,调查研究不需要干预正确答案:D22、成组设计四格表检验的自由度为A、1B、2C、3D、4正确答案:A23、描述正态分布离散趋势的指标是A、均数B、四分位数C、标准差D、中位数正确答案:C24、比较身高和体重两组数据变异度大小,宜采用A、方差B、变异系数C、极差D、四分位数间距正确答案:B25、在研究中用仪器测量的数据在一定允许范围内随机波动,其数据误差属于A、系统误差B、随机测量误差C、信息偏倚D、抽样误差正确答案:B26、某方法对同一个样品测定5次的结果不完全一致,这种误差属于A、系统误差B、过失误差C、随机测量误差D、抽样误差正确答案:C27、某校一年级10名女大学生的体重和肺活量数据如下表,该资料宜绘制编号 1 2 3 4 5 6 7 8 9 10 体重(kg) 42 42 46 46 50 50 52 5258 58 肺活量(L)2.5 2.2 2.8 2.5 3.1 3.2 3.6 3.5 3.8 3.6A、线图B、散点图C、半对数线图D、直条图正确答案:B28、为了解2001-2015年大学生体检时体重指数的变化趋势,宜绘制A、圆图B、普通线图C、直方图D、散点图正确答案:B29、变异系数的取值范围A、一定等于 1B、一定大于 1C、可以大于 1,也可以小于 1D、一定小于 1正确答案:C30、对某样品进行测量时,由于操作方法不正确导致的测量数据偏高,这种误差属于A、随机测量误差B、系统误差C、抽样误差D、随机误差正确答案:B31、某地调查 5000 名成年男子的舒张压数据,其中 376 人为高血压病人,此资料属于A、等级资料B、计数资料C、参数资料D、计量资料正确答案:D32、某市1982年抽样测得100名健康成年男子血胆固醇含量,其均数为180mg/dl,标准差为2mg/dl,计算该人群胆固醇95%的参考值范围为A、(176.08,183.92)mg/dlB、(140.80,219.20)mg/dlC、<178.36mg/dlD、(128.40,231.60)mg/dl正确答案:A33、作成组设计的两小样本数值变量的假设检验首先应该考虑A、用t检验B、用u检验C、用秩和检验D、资料是否满足t检验条件正确答案:D34、针对相关系数的统计检验方法,应选用A、t检验B、秩和检验C、F检验D、X²检验正确答案:A35、两变量的相关分析结果为r=0.511,p=0.015,则二者的相关密切程度为A、高度相B、弱相关C、微弱相关D、中度相关正确答案:D36、三个样本率比较的x检验,若P<0.05,则结论是A、总体率之间两两有差别B、各总体率间不同或不全相同C、三个样本率各不相同D、总体率间无差别正确答案:B37、当四格表的周边合计数不变时,如果某个格的实际频数有变化,则其理论频数A、不确定B、增大C、减小D、不变正确答案:D38、50名病人体重测定结果为:小于50kg13人,介于50kg和80kg之间20人,大约70kg17人,此时体重转化为A、定量变量B、等级变量C、连续型变量D、分类变量正确答案:B39、实验研究通常要设立对照组,常用的对照形式是A、随机对照、重复对照、配对对照B、空白对照、实验对照、标准对照C、受试者对照、处理因素对照、混杂因素对照D、自身对照、偶遇对照、随机化对照正确答案:B40、标准误反映的是A、计数资料的相对水平B、计量资料的平均水平C、抽样误差大小D、两变量的相关程度正确答案:C41、描述5岁女童身高(cm)的集中趋势应计算的指标是A、几何均数B、变异系数C、算术均数D、标准差正确答案:C42、标准正态分布是A、μ=0,σ=1的正态分布B、μ=0,σ任意的正态分布C、σ=0,σ=0的正态分布D、μ=1,σ=0的正态分布正确答案:A43、四格表中有理论值小于1时,应选择的统计分析方法是A、确切概率法B、行x列表的X2检验C、秩和检验D、四格表资料的X2检验正确答案:A44、体重X(kg)和肺活量Y(L)的回分析,回归系致b=0.06,P<0.05,结论是A、体重每增加1(kg),肺活量平均增加0.06(L)B、肺活量每增加1(L),体重平均增加0.06(kg)C、体重每增加1(kg),肺活量平均减少0.06(L)D、肺活量每增加1(L),体重平均减少0.06(kg)正确答案:A45、正态分布的位置参数是A、标准差σB、变异系数CVC、均数μD、全距R正确答案:C46、发展速度与增长速度的关系为A、发展速度=增长速度-1B、增长速度=发展速度-100C、增长速度=发展速度-1D、发展速度=发展速度-100正确答案:C47、关于标准误的四种说法,下面不正确的是A、标准误是个体观察值的变异程度B、均数标准误反映了样本均数的离散程度C、率的标准误反映了样本率的离散程度D、标准误反映了抽样误差的大小正确答案:A48、对三个样本率所完成的检验中.当获得P<0.05的检验结果时,其含义为A、三个总体率不同或不全相同B、三个样本率不同或不全相同C、三个样本率各不相同D、三个样本率不全相同正确答案:A49、抽样研究中出现系统误差的可能是A、由于随机测量误差B、实验操作方法不正确C、由于抽样误差D、由于偶然机遇造成正确答案:B50、研究某疗法的排铅效果,以健康人群的正常值为对照。
卫生统计学题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数(parameter)2. 统计量(statistic)3. 总体(population)4. 样本(sample)5. 同质(homogeneity)6. 变异(variation)7. 概率(probability) 8. 抽样误差(sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布(normal distribution)2. 中位数(median)3. 四分位数间距(quartile interval)4. 方差(variance)5. 正偏态分布(positively skewed distribution)6. 负偏态分布(negatively skewed distribution)7. 对数正态分布(logarithmic normal distribution )8. 医学参考值范围(medical reference range)二、单选题1. μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
实用卫生统计学全部练习题
实用卫生统计学第1、2练习一、单项选择题(每小题5分,共15小题,共75分)题目1下面有关病人的变量中,属于分类变量的是()。
A. 性别?B. 脉搏C. 血压D. 年龄题目2随着测定次数的增加,正负误差可以相互抵偿,误差的平均值将逐渐趋向于零,是指哪种误差?()A. 系统误差B.?抽样误差C. 以上全部的误差D. 随机测量误差?题目3某护士记录了50名婴儿出生体重的测定结果,小于2500克15人,介于2500克和3999克的有25人,大于4000克的有10人,此资料属于()。
A. 分类变量资料B. 二分类资料C. 有序分类变量资料?题目4某医院用某种新疗法治疗某病患者,治疗结果见下表,请问该资料的类型是?()A. 数值变量资料B. 分类变量资料C. 二分类资料D. 有序分类变量资料?题目5测量6名健康男子,获得其血清总胆固醇(mmol/L)的资料是()。
A. 二分类资料B. 有序分类变量资料C. 数值变量资料?D. 分类变量资料题目6一组变量值,其大小分别为10,15,11,6,13,24,23,9,其中位数是?A. 13B. 11C. 14D. 12?题目7某组资料共5例,变量的平方和以及变量的和分别是190和30,则均数和标准差分别为?A. 6、1.58?B. 38、6.78C. 6、1.29D. 6.33、2.5题目8正常男子的血铅含量系偏态分布资料,对数变换后的呈正态分布。
欲描述血铅含量的平均水平宜用以下哪种指标?A. 原始数据的中位数B. 原始数据的变异系数C. 原始数据的算术均数D. 原始数据的几何均数?题目9用均数和标准差可全面描述下列哪种资料的分布特征?A. 正态分布资料?B. 对数正态分布资料C. 负偏态资料D. 正偏态资料题目10关于标准差,下面哪个说法是的?A. 标准差必定大于或等于零B. 标准差无单位C. 同一资料的标准差一定比其均数小?D. 标准差可以是负数题目11关于变异系数,下面哪个说法是错误的?A. 两组资料均数相差悬殊时,应用变异系数描述其变异程度B. 变异系数的单位与原生数据相同?C. 比较同一人群的身高、体重两项指标的变异度时宜采用变异系数D. 变异系数就是均数与标准差的比值题目12均数和标准差的关系是?A. 均数越大,标准差越小B. 标准差越小,均数对各变量值的代表性越好?C. 均数越小,标准差越大D. 标准差越大,均数对各变量值的代表性越好题目13变异系数越大,则以下哪项?A. 平均数越小B. 标准差越大C. 以均数为准变异程度小D. 以均数为准变异程度大?题目14用频数表计算平均数时,各组的组中值应为。
医学统计学学习与实习题集
医学统计学学习与实习题集医学统计学学习与实习题集⽬录第四章定量资料的统计描述2第五章定性资料的统计描述7第六章总体均数的估计10第七章假设检验13第⼋章 t检验16第九章⽅差分析20第⼗章⼆项分布和Poisson分布及其应⽤25第⼗⼀章2检验27第⼗⼆章秩和检验31第⼗三章双变量关联性分析35第⼗四章直线回归分析40第⼗五章⽣存分析43第四章定量资料的统计描述【思考与习题】⼀、思考题1.均数、中位数、⼏何均数的适⽤范围有何异同?2.同⼀资料的标准差是否⼀定⼩于均数?3.极差、四分位数间距、标准差、变异系数的适⽤范围有何异同?4.正态分布有哪些基本特征?5.制定医学参考值范围时,正态分布法和百分位数法分别适⽤于何种资料?⼆、案例辨析题某市抽样测定了150名健康成年男性的⾎清⽢油三酯(TG)含量(mmol/L),资料如下,据此资料计算集中趋势指标和离散程度指标。
0.23 0.84 1.16 1.39 1.64 1.76 1.89 2.04 2.18 2.280.34 0.85 1.24 1.39 1.68 1.78 1.91 2.05 2.21 2.290.49 0.86 1.25 1.41 1.70 1.79 1.91 2.06 2.21 2.300.57 0.87 1.30 1.41 1.71 1.81 1.91 2.06 2.21 2.300.62 0.91 1.30 1.43 1.71 1.82 1.92 2.06 2.22 2.320.62 0.95 1.33 1.44 1.71 1.83 1.93 2.10 2.24 2.330.65 0.96 1.33 1.47 1.72 1.83 1.94 2.10 2.24 2.350.67 0.99 1.34 1.53 1.73 1.83 1.96 2.10 2.25 2.360.68 1.04 1.35 1.56 1.74 1.84 1.97 2.12 2.25 2.360.71 1.08 1.35 1.58 1.74 1.84 1.98 2.14 2.25 2.370.71 1.08 1.36 1.58 1.74 1.86 2.00 2.15 2.25 2.380.72 1.09 1.36 1.58 1.75 1.87 2.01 2.15 2.26 2.390.78 1.14 1.37 1.60 1.75 1.87 2.01 2.15 2.27 2.390.80 1.15 1.39 1.60 1.75 1.88 2.02 2.16 2.27 2.400.80 1.16 1.39 1.61 1.75 1.89 2.03 2.17 2.28 2.41X=(mmol/L)计算结果为:集中趋势指标 1.6839离散程度指标0.5599S=(mmol/L)以上分析是否恰当,为什么?三、最佳选择题1. 频数分布的两个重要特征是A. 总体与样本B.集中趋势与离散程度C.统计量与参数D.标准差与标准误E. 样本均数与总体均数2. 描述⼀组正态分布资料的平均⽔平,宜选⽤的指标是A. CVB. 2SC. GD. SE. X3.数据分布类型⽆法确定时,描述集中趋势宜选⽤的指标是A.XB.MC.GD.S4.反映⼀组⾎清抗体滴度资料的平均⽔平,常选⽤的指标是 A. X B. M C. G D. R E. CV5. 以下资料类型中,适宜⽤均数与标准差进⾏统计描述的是 A.正偏态分布 B.负偏态分布 C.对称分布 D.正态分布 E.任意分布6. 当资料两端含有不确切值时,描述其变异度宜采⽤ A. R B.CV C. 2S D.SE.四分位数间距 7. CV 越⼤,表⽰ A.资料变异程度越⼤ B. 资料变异程度越⼩ C.均数越⼤ D. 样本含量越⼤ E.均数的代表性越好8. 正态分布曲线下( 2.58, 2.58)µσµσ-+范围内的⾯积(%)为 A .95 B .90 C .97.5E .99.59. 某地拟制定正常学龄前⼉童⾎铅值99%参考值范围,若正常学龄前⼉童⾎铅含量服从近似对数正态分布,宜采⽤ A .2.58X S + B .1lg lg lg ( 2.58)XX XS -+C . 4.84(mmol/L) 0.96(mmol/L)X S ,==D .1lg lg lg ( 2.32)XX XS -+E . 2.32X S + 四、综合分析题1.测定了176名燃煤型砷中毒患者的尿总砷含量(µg/L ),资料如下,0.0169 0.0262 0.3433 0.0505 0.2266 0.1690 0.0165 0.0356 0.0968 0.1628 0.0904 0.1059 0.05820.0211 0.0867 0.0318 0.0256 0.0267 0.1592 0.13640.0583 0.0275 0.2285 0.0246 0.0508 0.1076 0.0195 0.0400 0.06460.11090.0212 0.0164 0.1401 0.0646 0.0139 0.0377 0.0161 0.0121 0.0617 0.2686 0.0532 0.0724 0.1280 0.0143 0.0980 0.5678 0.0228 0.1279 0.0872 0.0675 0.0361 0.0680 0.0591 0.0821 0.1418 0.1051 0.0662 0.1033 0.11880.08870.0102 0.0154 0.1775 0.0223 0.0319 0.0986 0.1019 0.0419 0.0678 0.0347 0.0753 0.0532 0.0151 0.0219 0.11390.11240.0524 0.0290 0.0376 0.15100.1250 0.0339 0.0549 0.0974 0.0753 0.2902 0.0222 0.0204 0.1325 0.0462 0.3047 0.0464 0.1486 0.0271 0.3953 0.0288 0.1520 0.0559 0.1244 0.1264 0.0576 0.0112 0.0222 0.4085 0.1128 0.0463 0.1240 0.0226 0.0809 0.0371 0.0183 0.1430 0.0559 0.0353 0.1333 0.2383 0.0929 0.0209 0.2748 0.0189 0.4542 0.0782 0.0741 0.1460 0.1317 0.0456 0.0499 0.0317 0.0863 0.0505 0.2691 0.3570 0.0227 0.0392 0.0406 0.0596 0.0260 0.0906 0.1516 0.0695 0.0723 0.0389 0.0810 0.2326 0.0311 0.0174 0.0868 0.0516 0.0970 0.0372 0.0126 0.0678 0.2133 0.5265 0.4385 0.0357 0.3706 0.06210.2330 0.0947 0.1591 0.0636 0.1845 0.0445 0.0430 0.0236 0.04290.0134 0.5805 0.0600 0.0387 0.0392 0.0747 0.0470 0.0425 0.2218(1) 绘制频数分布图,简述分布类型和分布特征;(2) 计算适当的集中趋势指标。
卫生统计学复习指导书
第一章绪论一、教学大纲(一)教学目的和要求1、掌握统计学的若干概念;2、熟悉统计学与公共卫生互相推动的关系3、了解统计学的学习方法与技能(二)教学内容第一节:医学中统计思维的进化第二节统计学与公共卫生互相推动(一)统计学是公共卫生专业人员的得力工具(二)现代公共卫生领域对统计学的挑战第三节统计学的若干概念(一)总体与样本(二)同质与变异(三)变量的类型(四)参数与统计量(五)设计与分析(六)因果与联系第四节目标与方法(一)基本概念、方法与技能(二)教与学的方法二、教学内容精要1、重要名词和概念总体(population)、样本(sample)、同质性(homogeneity)、变异(variation)、分类变量(categorical)、有序变量(ordinal variable)、定量变量、参数(parameter)、统计量(statistic)、概率、抽样误差2、授课重点1.总体与样本。
2.变量的类型。
3.统计推断的含义。
4.现代公共卫生领域对统计学的挑战。
三、复习题(一)名词解释1.总体 2.样本 3.定量变量 4. 分类变量(二)单选题1、抽样误差是指A.不同样本指标之间的差别B. 样本指标与总体指标之间由于抽样产生的差别C. 样本中每个体之间的差别D. 由于抽样产生的观察值之间的差别E. 测量误差与过失误差的总称2、为了由样本推断总体, 样本应该是A. 总体中任意的一部分B. 总体中的典型部分C. 总体中有意义的部分D. 总体中有价值的部分E. 总体中有代表性的部分3、随机样本的特点有A. 能消除系统误差B. 能消除测量误差C. 能缩小抽样误差D. 能消除样本偏差E. 以上都不是4、搞好统计工作, 达到预期目标, 最重要的是A. 原始资料要多B. 原始资料要正确C. 分析资料要先进D. 整理资料要详细E. 统计计算精度要高5、计数资料、计量资料和等级资料的关系是A. 计量资料兼有计数资料和等级资料的一些性质B. 计数资料兼有计量资料和等级资料的一些性质C. 等级资料兼有计量资料和计数资料的一些性质D. 计数资料有计量资料的一些性质E. 以上都不是6、统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的个体E.根据人群划分的研究对象的全体7、统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料(三)填空题1、统计工作的基本步骤包括、、、其中最关键的是。
卫生统计学学习指导与习题集
卫⽣统计学学习指导与习题集卫⽣统计学学习指导与习题集第⼀章绪论【教学要求】了解:医学统计学的发展史;统计学与公共卫⽣的关系。
熟悉:统计学习的⽬标与⽅法掌握:统计学基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。
【重点难点】第⼀节医学中统计思维的进化第⼆节统计学与公共卫⽣互动推动⼀、统计学是公共卫⽣专业⼈员的得⼒⼯具公共卫⽣是群体科学,应⽤统计探索群体规律。
统计抽样技术;设计群体调查,掌握⼈群的卫⽣状况和需求;统计描述:反映疾病和卫⽣资源的分布特征;统计推断:偶然性的背景中识别危险因素、评价卫⽣措施、进⾏科学决策。
⼆、现代公共卫⽣领域对统计学的挑战公共卫⽣不仅应⽤统计学,⽽且不断提出新要求和新问题,是现代统计学研究和发展的巨⼤功⼒。
第三节统计学的若⼲概念⼀、总体与样本总体是根据研究⽬的确定的同质研究对象的全体,按研究对象来源⼜有⽬标总体和研究总体。
样本是指从研究总体中抽取的⼀部分有代表性的个体。
抽样研究的⽬的是⽤样本推断总体。
⼆、同质与变异同质是指同⼀总体中个体的性质、影响条件或背景相同或⾮常相近。
变异是指同质的个体之间存在的差异。
统计学的任务是在变异的背景上描述同⼀总体的同质性,揭⽰不同总体的异质性。
三、变量的类型定量变量可分为离散型变量和连续型变量。
变量类型可以转化:定量→有序→分类→⼆值。
注意转化⽅向只能由信息量多向信息量少。
四、参数与统计量参数是指反映总体特征的统计指标。
五、设计与分析统计设计是医药卫⽣设计科研不可或缺的部分。
统计设计包括抽样⽅法、统计学原则、统计⽅法数据如何收集、样本量多⼤等统计学内容。
设计决定了统计分析的⽅法。
统计设计分类变量{ 有序变量和统计分析是不可分割的两项内容。
六、因果与联系探究因果关系⾸先考虑是否存在联系。
但存在联系未必有因果联系,因为存在⼤量的混杂因素。
单靠统计学分析⼤多只能考虑变量之间的联系,难于证明因果联系。
第四节⽬标与⽅法⼀、基本概念⽅法与技能正确理解基本概念、掌握常⽤的设计和经典的分析⽅法、学会⽤统计软件完成有关计算。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学学习指导与习题集第一章 绪论【教学要求】了解:医学统计学的发展史;统计学与公共卫生的关系。
熟悉:统计学习的目标与方法掌握:统计学基本概念:总体与样本、同质与变异、变量的类型、参数与统计量。
【重点难点】第一节 医学中统计思维的进化第二节 统计学与公共卫生互动推动一、 统计学是公共卫生专业人员的得力工具公共卫生是群体科学,应用统计探索群体规律。
统计抽样技术;设计群体调查,掌握人群的卫生状况和需求;统计描述:反映疾病和卫生资源的分布特征;统计推断:偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。
二、 现代公共卫生领域对统计学的挑战公共卫生不仅应用统计学,而且不断提出新要求和新问题,是现代统计学研究和发展的巨大功力。
第三节 统计学的若干概念一、 总体与样本总体是根据研究目的确定的同质研究对象的全体,按研究对象来源又有目标总体和研究总体。
样本是指从研究总体中抽取的一部分有代表性的个体。
抽样研究的目的是用样本推断总体。
二、 同质与变异同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。
变异是指同质的个体之间存在的差异。
统计学的任务是在变异的背景上描述同一总体的同质性,揭示不同总体的异质性。
三、 变量的类型定量变量可分为离散型变量和连续型变量。
变量类型可以转化:定量→有序→分类→二值。
注意转化方向只能由信息量多向信息量少。
四、 参数与统计量参数是指反映总体特征的统计指标。
五、 设计与分析统计设计是医药卫生设计科研不可或缺的部分。
统计设计包括抽样方法、统计学原则、分类变量{ 有序变量统计方法数据如何收集、样本量多大等统计学内容。
设计决定了统计分析的方法。
统计设计和统计分析是不可分割的两项内容。
六、因果与联系探究因果关系首先考虑是否存在联系。
但存在联系未必有因果联系,因为存在大量的混杂因素。
单靠统计学分析大多只能考虑变量之间的联系,难于证明因果联系。
第四节目标与方法一、基本概念方法与技能正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。
二、教与学的方法应用是根本目的,理解概念与动手实践才是根本。
要结合生活经验、医学实际来教与学。
借助统计学实验理解统计现象与理论,借助案例讨论从反面吸取教训。
【补充习题】一、选择题(一)A1题每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。
1.下面的变量中,属于分类变量的是(B)A.脉搏B.血型C.肺活量D.红细胞计数E.血压2. 下面的变量中,属于定量变量的是(B)A.性别B.体重C.血型D.职业E.民族3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于(A)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料4.上述资料可以转换为(C)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是(C)A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量(E)A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7.因果关系(C)A.就是变量间数量上的联系B.可以用统计方法证明C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是(C)A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2.上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对(C)而言。
A.180万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题1.定量变量、分类变量和有序变量可以相互转换。
(×)2.假变量可以参与计算,所以假变量是定量变量。
(×)3.离散变量在数值很大时。
单位为“千”或“万”时可以取小数值,此时可接近地视为连续型变量(√)4.同质的个体间不存在差异。
(×)5.如果个体间有变异,则它们一定不是来自同一总体。
(×)第二章 定量资料的统计描述【重点难点】第一节 频率分布表与频率分布图一、离散型定量变量的频率分布对离散型定量变量,变量值的取值是不连续的。
直接清点各变量值出现的频数,即为频率分布表。
离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。
二、连续型定量变量的频率分布对连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。
连续型定量变量的频率分布图可用直方图表达。
即纵坐标为频率密度,即频率/组距,直方图的面积之和等于1.三、频率分布表(图)的用途频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。
第二节 描述集中趋势的统计指标对于连续型定量变量,平均数是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。
常用的平均数有3种:算数均数、几何均数和中位数。
一、算术均数意义:算术均数简称均数,常用μ表示总体均数,X̅表示样本均数。
反映全部数量观察值的平均数量水平。
适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。
计算:1.直接法(基于原始数据)X̅=X 1+X 2+⋯+X n n =∑X n其中,n 为样本含量,X 1+X 2+⋯+X n 为观察值。
2. 频率表法(也叫加权法,基于频率表资料) X ̅=∑ fx 0∑ f =∑ fx 0n其中, f 为组段的频数,x 0为组段的中值,x 0=(组段上限+组段下限)/2。
二、几何均数意义:几何均数以符号G 表示,常用来反映一组含多个数量级数据的集中位置。
适用条件:适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。
观察值间常呈倍数关系,或变化范围跨越多个数量级。
计算:1.直接法(基于原始数据)G =√X 1X 2…X n n 或 G =log −1[∑log X n ] 2.频率表法(也称加权法,基于频率表资料)G=log−1[∑flogXn]三、中位数意义:中位数常用符号M表示,是指将原始观察值从小到大排序后,位次居中的那个数,即理论上有一半的观察值低于中位数,一般都观察值高于中位数。
适用条件:中位数适用于各种分布的资料,特别是偏峰分布资料、分布末端无确定值的资料等。
计算:1.直接法(基于原始数据)将n例观察值从小到大排列,第i个数据用X I∗表示。
n为奇数时,M=X n+12∗n为偶数时,M=12(X n2∗+X n2+1∗)2.百分位数法(基于频率表资料)百分位数常用符号P x表示,是排序后的全部实测值的某百等份分割值,即在全部实测值中有x%个体观察值比它小,有1-x%个体观察值比它大。
中位数就是一个特定的百分位数,即M=P50。
P x=L+iF L+i−F L(n*x%-F L)其中L为欲求的百分位数所在组段的下限,i为该组段的组距,F L为截止至L的累计频数,F L+i−F L为该组段内的频数,n为总频数。
四、众数意义:全部实测值中出现次数最多的数值即为众数。
第三节描述离散趋势的统计指标同一总体中不同个体存在的差异称为变异。
为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。
常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。
一、极差意义:极差,也称全距。
样本量接近的同类资料比较,极差越大意味着数据间变异越大。
极差只考虑数据的最大值和最小值,所以用极差反映数据的变异程度常常比较粗略和不稳定。
计算:R=最大值—最小值适用条件:资料不限。
二、四分位数间距意义:四分位数间距表示百分位数P75和百分位数P25之差,理论上P25与P75之间恰好包括总体中间50%的个体观察值。
同类资料比较,Q越大意味着数据间变异越大。
用四分位数间距反映数据的变异程度比极差稳定。
计算:Q=P75—P25其中,P75和P25的求法参见前述百分位数求法。
适用条件:四分位数间距可用于各种分布资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
三、方 差意义:方差考虑了全部观察值的变异程度。
总体方差用σ2表示,定义为观察值离均差平方和的算术均数;样本方差用S 2表示,是总体方差的无偏估计。
同类资料比较时,方差越大意味着数据间变异度越大。
计算:总体方差σ2=∑(X−μ)2N样本方差S 2=∑(X−X ̅)2n−1 适用条件:见标准差。
四、标 准 差意义:方差的算术平方根称为标准差。
总体标准差用σ表示,样本标准差用S 表示。
标准差的量纲与原变量一致,故实际应用中常使用标准差。
同类资料比较时,标准差越大意味着观察值间变异度越大。
计算:总体标准差σ=√∑(X−μ)2N 样本标准差S=√∑(X−X ̅)2n−1 其中,n -1称为自由度。
适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述的集中趋势和离散趋势。
五、变 异 系 数意义:变异系数用CV 表示,为标准差与算术均数之比,是一个不带量纲的相对数。
计算:CV = 适用条件:方差和标准差都适用于对称分布的资料,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述资料的集中趋势和离散趋势。
第四节 描述分布形态的统计指标一、偏度系数意义:理论上总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰;取负值时分布为负偏峰。
计算:SKEW =n(n−1)(n−2)∑(X−X ̅S)3 二、峰度系数意义:理论上正态分布的总体峰度系数为0;取负值时,其分布较正态分布的峰平阔取正值时,其分布较正态分布的峰尖峭。
计算:KURT=n(n+1)(n−1)(n−2)(n−3)∑(X−X ̅S )4−3(n−1)2(n−2)(n−3)【补充练习题】选择题(一)A1型每一道题下面有A 、B 、C 、D 、E 五个备选答案,请从中选择一个最佳答案。
1.用频率表计算平均数时各组的组中值应为(E )A .本组段变量值的平均数 B.本组段变量值的中位数C.本组段的上限值D.本组段的下限值E.(本组段上限值+本组段下限值)/22.离散型定量变量的频率分布图可以用(B)表达。