颜虹的医学统计学案例选
《医学统计学》教学大纲(医学检验)

《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
分享医学统计学科研实验中的几个小故事

医学统计学是一门很值得医生朋友们学习的科学。
只要熟练掌握了,绝大多数的科学研究都不在话下。
然而,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
很多医生朋友在学习医学统计学时,都抱着一副“比葫芦画瓢”的态度,试图套用统计学方法来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。
笔者在这里和大家分享几则与医学统计学相关的小故事,并加以分析说明,希望可以帮助大家学到更多的知识。
1、甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P<0.0001)。
甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?小故事大道理:统计学阳性的结果未必是“好结果”。
2.甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P<0.01)。
很明显,方案A的准确性要高于方案B。
甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
医学统计学参考答案 颜虹第二版

《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
医学统计学案例分析(1)

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药 6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。
(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。
(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。
医学统计学参考答案 颜虹第二版

《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
颜虹-医学统计学案例选

医学统计学案例选第一章绪论部分案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。
简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。
你发现了什么问题,应如何修改?你的收获是什么?第二章实验设计部分案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(河南中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。
将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。
请讨论该分组方法是否随机?案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。
而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。
A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩张宫颈后吸宫。
作者认为该法“符合随机分配法则”。
请讨论对照组的设置是否合适?案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。
得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。
医学统计学课后习题答案.

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《医学统计学》计算题答案

《医学统计学》最佳选择题和计算分析题答案教材:孙振球,徐勇勇主编. 医学统计学. 第4版. 北京:人民卫生出版社,2014最佳选择题答案第二章计量资料的统计描述(第20-21页)(1)D (2)C (3)D (4)D (5)C (6)E (7)E (8)D (9)E (10)B第三章总体均数的估计与假设检验(第43-44页)(1)E (2)C (3)E (4)E (5)B (6)E (7)D (8)E (9)D (10)C第四章多个样本均数比较的方差分析(第63-64页)(1)D (2)C (3)D (4)A (5)C (6)A (7)A第五章计数资料的统计描述(第20-21页)(1)B (2)D (3)A (4)A (5)E (6)D (7)C (8)E (9)B (10)D第六章几种离散型变量的分布及其应用(第94页)(1)A (2) 不要求(3) 不要求(4)E (5)不要求(6)不要求第七章c2检验(第112-113页)(1)D (2)C (3)C (4)A (5)不要求(6)A (7)不要求第八章秩转换的非参数检验(第128页)(1)E (2)D (3)D (4)D (5)A (6)C第九章双变量回归与相关(第151-152页)(1)B (2)E (3)C (4)C (5)不要求(6)D (7)B (8) 不要求第十章统计表与统计图(第163-164页)(1)B (2)D (3)B (4)E (5)选项有误 (6)D (7)E (8)D (9)C (10)C 注:第(5)题的选项是(箱式图),但5个选项中没有“箱式图”。
第十九章生存分析(第300页)(1)A (2) E (3)B (4)D (5)D第三十四章观察性研究设计(第544-545页)(1)C (2)C (3)C (4)C (5)D (6)C (7)A (8)D (9)D (10)A (11)E (12)E (13)B (14)A (15)B第三十六章试验研究设计(第582页)(1)D (2)D (3)D (4)E (5)A (6)D第三十七章临床试验研究设计(第603-604页)(1)C (2)C (3)C (4)D计算分析题参考答案第二章计量资料的统计描述计算分析题(P21)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学案例选第一章绪论部分案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。
简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。
你发现了什么问题,应如何修改?你的收获是什么?第二章实验设计部分案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(河南中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。
将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。
请讨论该分组方法是否随机?案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。
而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。
A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩张宫颈后吸宫。
作者认为该法“符合随机分配法则”。
请讨论对照组的设置是否合适?案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。
得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。
原文共收集骨质疏松症患者307例,其中试验组612例使用强骨胶囊,对照组93例使用骨松宝颗粒,其余开放组52例。
但对开放组患者的特征、所用药物、用药方法、观察方法、是否设盲等没有交代。
请讨论3组之间有无可比性?小结1、一项研究设计的内容包括:提出假说,确定研究类型,确定研究对象的范围和数量,计划的实施与质量控制,数据管理,统计分析,结果与讨论。
2、实验设计包括3个基本要素:处理因素、实验对象和实验效应。
3、实验设计必须遵循:对照、随机、重复的基本原则。
研究中所设立的对照组应尽可能达到对等、同步、专设的条件;随机包括3方面的内容,及随机抽样、随机分组和随机实验顺序;重复是指研究结果的重复、观察对象的重复和观察指标的重复。
思考与练习简答题1、研究设计的作用是什么?2、研究设计的基本内容是什么?3、实验设计应该遵循的基本原则是什么?4、实验设计为什么要设立对照?设立对照要注意些什么?5、随机化的含义是什么?目的是什么?6、区组化的目的是什么?第三章观察性研究设计概述案例3-1某地(100万人口)拟开展当地中老年人非胰岛素依赖型糖尿病的现况调查,目的是了解当地糖尿病的流行状况,以及与糖尿病患病相关的危险因素。
调查对象是当地居住超过5年、40岁以上的常住居民。
该研究采取分层、整群随机的抽样方法,将该地区15个镇按城镇或乡村,经济发展水平分成3个层,每层随机抽取2个镇或街道,再从被抽中的镇或街道中随机抽取两个村或居委。
被抽中村或居委的全部40岁以上居民包括原糖尿病患者均参加调查。
调查结果男女两性比例为0.94:1,并划分为5个年龄组,性别和各年龄组构成比与当地人口性别和年龄的分布情况相符。
调查内容包括:①问卷调查:被调查者的一般情况、糖尿病及其他病史、家族史、糖尿病临床表现、饮食调查、吸烟、饮酒情况及体力活动等;②体格检查:包括身高、体重、腰围、臀围及血压等;③血糖测定。
⑴该研究采用的是全面调查还是抽样调查?各有何优缺点?⑵该研究采用的抽样方法有何优点?是否有更好的抽样方法?⑶该研究的设计方案是否合理?请你设计一个研究的方案。
⑷该研究采用的调查表应该包括哪些项目?请你设计该调查表。
小结1、观察性研究是有目的地观察或测量自然接触不同因素人群的结果事件发生状况,通过对比分析发现事件的分布特点与差异,从而获得有关因果假设的启示,为进一步研究提供线索。
2、观察性研究包括描述性研究和分析性研究两大类。
3、横断面研究是按照事先制定的计划,调查特定人群特定时点某种疾病的患病情况,以及与患病有关的因素。
横断面研究的设计要考虑研究目的、对象、调查方法、调查表设计、样本量、组织计划、质量控制和分析计划等。
4、问卷是调查研究中用来收集资料的一种工具,它的形式是一份精心设计好的问题表格,它的用途在于测量人们的行为、态度和特征。
问卷设计的好坏是保证调查质量的关键,本章介绍问卷设计的基本原则和步骤。
5、随机抽样是抽样调查中样本具有代表性和能进行总体参数估计的保证,常用的抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。
简答题1、观察性研究与实验性研究有何异同?二者能否同时使用或结合使用?2、观察性研究主要有哪些方法?各有何优缺点?3、为什么大多数的观察性研究是抽样调查研究?4、根据对全国出生缺陷监测资料的统计分析,发现神经管缺陷的发生具有明显的季节性,表现为1~3月份出生的孩子的发生率比较高。
今欲调查其原因,应采取什么调查方法?请做出完整的调查设计并制定出调查表。
5、欲了解某市乙型病毒性肝炎患病情况及其影响因素,请做一个调查设计。
6、现拟在大学生中进行一项吸烟习惯调查,请你考虑调查问卷应包括哪些项目,并设计出调查问卷。
第四章统计描述案例4-1表4-24是某研究者在一项回顾性调查中收集的部分资料,其目的是研究抗生素的使用效果。
表4-24 某医院内、外科25例住院病人使用抗生素的情况病人编号性别年龄(岁) 入院体温(℃) 入院时白细胞计数(×103) 抗生素使用细菌培养所在科室住院时间1 2 30 37.2 8 2 2 1 52 2 73 36.7 5 2 1 1 103 2 40 37.2 12 2 2 2 64 2 47 36.8 4 2 2 2 115 2 25 36.9 11 2 2 2 56 1 82 36.0 6 1 2 2 147 1 60 37.5 8 1 1 1 308 2 56 37.0 7 2 2 1 119 2 43 36.7 7 2 2 1 1710 1 50 36.7 12 2 1 2 311 2 59 36.4 7 2 1 1 912 1 4 36.6 3 2 2 2 313 2 22 37.5 11 1 2 2 814 2 33 36.9 14 1 1 2 815 2 20 36.9 11 2 1 2 516 1 32 37.2 9 2 2 2 517 1 36 37.3 6 1 2 2 718 1 69 36.7 6 2 2 2 419 1 47 36.1 5 1 2 1 320 1 22 36.8 6 2 2 2 721 1 11 36.8 10 2 2 2 922 2 19 37.0 14 1 2 2 1123 2 67 36.4 4 2 2 1 1124 2 43 37.0 5 2 2 2 9注:性别:1=男,2=女;抗生素使用:1=是,2=否;细菌培养:1=是,2=否;所在科室:1=内科,2=外科。
试分析:⑴构造性别的频数分布表,并绘制性别的频数分布条图;⑵以20岁为组距,构造年龄的频数分布表,并绘制年龄的频数分布直方图;⑶以5天为组距,构造住院时间的频数分布表,并绘制住院时间的频数分布直方图,观察其分布特征;⑷计算住院时间的算术均数、几何均数、中位数;⑸计算住院时间的最大值、最小值、四分位数与四分位数间距;⑹计算住院时间的全距、方差、标准差和变异系数;⑺构造内、外科使用抗生素情况的统计表、条图和圆图;⑻构造内、外科采用细菌培养情况的统计表、条图和圆图;⑼构造内、外科使用抗生素和采用细菌培养情况的统计表、条图和圆图;⑽绘制箱图,比较用与不用抗生素的住院患者住院天数的差异;⑾以住院天数为纵坐标,以年龄为横坐标,绘制散点图;小结1、计量资料的统计描述,主要了解数据的分布范围、集中位置以及分布形态等特征。
大样本数据,需要编制频数分布表,通过频数分布表观察数据的分布特征。
2、频数分布表的主要作用是揭示资料的分布特征;描述其集中趋势和离散趋势,有助于发现数据中远离数据群体的离群值。
3、数据的分布形状分为对称分布与偏态分布。
偏态又分为右偏态和左偏态。
4、描述计量资料集中趋势的平均指标有:算术均数、几何均数、中位数等。
算术均数适合于对称分布资料,几何均数、中位数等。
算术均数适合于对称分布资料,几何均数适用于2右偏态和呈现比例递增的资料,中位数适合于任意分布的资料。
5、描述计量资料离散趋势的变异指标有:全距、方差、标准差和变异系数、四分位数间距等。
其中标准差是最常用的变异指标,适合于对称资料特别是正态分布资料;四分位数间距适合任意分布资料,尤其适合于大样本偏态分布资料。
变异系数主要用于比较几个量纲不同的变量之间的离散程度的差异,也可以用来比较量纲相同但均数相差悬殊的几个变量之间离散程度的差异。
6、描述计数资料基本特征的指标有:比、比例和率。
比可以是任意两个数值之比,包括比和比率。
当分子是分母的一部分时,称为比例;当比例与观察时限有关时,称为率。
比例又分为构成比和频率。
而率与时间单位有关,即率有速率和强度的含义,它表示单位时间某事件发生的可能性大小。
流行病学研究中常用的两个比是相对危险度和优势比(比数比)。
7、内部构成不同的两个率比较时,应计算标准化率。
8、动态数列用来描述一组按照时间顺序排列起来的统计指标,如绝对数、相对数、平均数等,在时间的变化和发展趋势。
9、医学常用统计指标有:人口统计指标、出生与死亡统计指标、生育统计指标、疾病统计指标、期望寿命等。
10、表达统计结果的数表称为统计表。
统计表由标题、标目、线条、数字4部分组成,必要时增加注释。
11、常用统计图有:条图、百分条图、园图、线图、半对数线图、箱图、散点图等,这些统计图所适用的数据类型,绘图目的和有关说明列在表4-25中。
第五章 概率分布案例5-1 一般人群先天性心脏病的发病率为8‰,某研究者为探讨母亲吸烟是否会增大其子女的先天性心脏病发病的危险,对一群20~35岁有吸烟嗜好的孕妇进行了生育考察,在 他们生育的320名子女中,经筛查有4人患先天性心脏病。
试讨论:⑴ 若以X 表示观察中患先天性心脏病的小孩数,X 的分布是什么分布?⑵ 若按人群先天性心脏病的发病率为8‰,计算320名子女中,至少有4名小孩患先天性心脏病的概率。