卫生统计学 第八版(李晓松)习题解答03
《卫生统计学》课后思考题答案

第一章:ECDBB第二章:BDABC第三章:DEBCD AEA第四章:DCCDD DCBD第五章:DCBDB AEEEC第六章:CBEDC DDDDA第七章:ACCBB DACEA第八章:ABCDD BDADB第九章:DDBCD AEA第十章:BDCCE BDAEA第十一章:CAEDC DBCCD第十二章:BCAEE BA第十三章:DDBCC BCDE第十四章:无第十五章:无第十六章:无第十七章:DBABC BDE第十八章:无第十九章:BDCDC CCADC《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
医学统计学课后思考题答案(李晓松版)

第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于 2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为 2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
卫生统计学第八版李晓松第一章 数据分布的描述

累计频率(%) (5) 1.69 5.08 14.41 35.59 60.17 81.36 93.22 98.31 100.00 —
第一节 数据分布表与直方图
(二)直方图
慢性鼻窦炎患者生命质量评估总分的直方图
慢性鼻窦炎患者生命质量评估总分的直方图
(非等距分组造成错觉)
第一节 数据分布表与直方图
(三)数据分布特征
值) 都适用。日常应用中,对称分布资料更常用均数。 (2)与均数相比,中位数存在一些不足:
①中位数未考虑大部分观测值的实际大小,而均数充分利用了全部数据的信息;
②两组数据合并时,合并后的中位数不能用原来两组的中位数表达,而均数可 基于两组的均数和例数用求得; ③均数可通过如估计截尾均数等方法进行修正,而中位数无法进行此修正。
(4)确定组段的上、下限:每个组段的起点为下限(lower limit),终点为上限(upper
limit)。每个组段均包含组段的下限值,最后一组的组段写出上限值。 (5)列表整理:计算频数、频率、累计频数及累计频率。
第一节 数据分布表与直方图
(一)频数分布表
广州市118名慢性鼻窦炎患者生命质量评估总分的频数分布表
1. 分布形态分类
(1)对称分布:集中位置在正中,左右两侧频数分布对称。
(2)偏态分布:集中位置偏向一侧,左右两侧频数分布不对称。 ①正偏态(positive skewness):有小部分数据偏大、直方图呈现右侧拖尾,又 称右偏态(right skewness); ②负偏态(negative skewness):有小部分数据偏小、直方图呈现左侧拖尾, 又称左偏态(left skewness)。
组段 (1) 10~ 20~ 30~ 40~ 50~ 60~ 70~ 80~ 90~100 合计
卫生统计学试题及答案(附解释)

卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~____年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.A.大约有95人的潜伏期小于57.8小时B.大约有5人的潜伏期大于57.8小时C.大约有5人的潜伏期小于57.8小时D.大约有8人的潜伏期大于57.8小时(全体的百分之五,即是约有8人)E.大约有8人的潜伏期小于57.8小时【答案】D9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内【答案】A10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.A.t值不变B.t值变小C.t值变大D.t值变小或变大E.不能判断【答案】A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对【答案】D12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数【答案】B13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计【答案】D14.以下属于分类变量的是___________.A.IQ得分B.心率C.住院天数D.性别E.胸围【答案】D15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0【答案】D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄(岁):10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图【答案】C17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小(某现象发生的强度大小用“概率”即“率”表示)C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%【答案】B18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究【答案】C19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对【答案】C20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同【答案】C卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义(r有统计学意义,b也有统计学意义)D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5<P<0.5< P>【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
卫生统计学第八版李晓松第三章数据的产生

第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就 能够被平均化,两组的区别就会减少。 (2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
第五节 伦理问题
(一)知情同意与个人隐私
1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法
(1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。 (2)以医院为研究单位时,应当获得当地伦理审查委员会的同意。 (3)当研究单位是学校、工作场所或社区时,应征得有关负责人的同意;同时,尽 可能告知社区民众该试验的研究目的、预期收益和可能的不方便或危险,并告知不同 意的人如何免受干预措施的影响。
第四节 样本的可靠性与代表性
(一)抽样分布
1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计 量会有些什么样的值,以及每个值出现的可能性大小。
例3 某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测。 图 (A)采用某环 图 (B) 从这个总体中随机抽样(每次样本量为50),共抽取100次得到的100个样本均 数的分布。
卫生统计学
第三章 数据的产生
夏结来
第四军医大学
目录
01 02
03 04 05
第一节:数据的来源 第二节:随机对照试验 第三节:简单随机抽样 第四节:抽样的可靠性与代表性 第五节:伦理问题
重点难点
卫生统计学第八版李晓松第六章 统计推断

第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(一)统计信心
第一节 置信区间的估计
(二)置信区间
来自同一总体的25次抽样及其95%置信区间
C z
第一节置信区间的估计
(二)置信区间
C z
第一节 置信区间的估计
(二)置信区间
标准正态曲线下C与z’之间的关系
※ 基于决策的推断中两类错误的含义 ※ 两类错误、检验水准及检验效能之间的关系
第一节 置信区间的估计
x
第一节 置信区间的估计
(一)统计信心
统计推断
定义
统计推断是基于样本统计量对总体参数给出统计学结论
常用方法 置信区间估计和假设检验 注:为避免繁杂的计算而掩盖统计推断的基本逻辑和核心思想,本 章以总体方差已知的情形为例,叙述推断总体均数的过程
(四)注意事项
第一节 置信区间的估计
(四)注意事项
4. 统计分析无法拯救糟糕的数据。 5. 实际操作中的问题(如无应答与失访)会给抽样研究带来额外的误差,这些误差可能
比随机抽样误差大得多,并且研究结果中这些误差并不能被误差范围所反映。
6. 统计推断的概率是指该方法重复进行的正确频率,但并不知道某一次结果的正确性。
第二节 假设检验
第二节 假设检验
(一)基本思想
假设检验:假设是指我们对总体特征(如参数、分布)的
某种推测,进而用概率来判断样本数据所提供的信息和我
们对总体特征猜想的一致性,从而结合专业知识判断这一 猜想的正确性。
第二节 假设检验
(一)基本思想
例2 为了解某高校在校大学生2015年平均网上购物花费情况:
卫生统计学第八版李晓松第七章基本情形参数推断

第二节 两个总体均数
(二)两总体均数之差的置信区间
两组儿童体重资料(kg)
分组
安慰剂组
44
27.2
0.9
硒补充剂组
48
27.3
0.8
第二节 两个总体均数
(二)两总体均数之差的置信区间
第二节 两个总体均数
(二)两总体均数之差的置信区间
第二节 两个总体均数
(二)两总体均数之差的置信区间
v' (0.32(/0 1 .0 32 )2//19 0 (0 0 .1 .1 22//2 2 9 9 ))22/2810
(二)单样本情形
第一节 单个总体均数
(二)单样本情形
第一节 单个总体均数
(三)配对设计的情形
d
(dt/2,
n
第一节 单个总体均数
(三)配对设计的情形
例4 对某地区因患大骨节病进行换膝手术的患者进行术后效果评价,共纳 入11名患者,每名患者分别在术前、术后各测量一次下肢力线角度(下肢 力线角度定义为:股骨机械轴与胫骨机械轴的夹角)并分别求出与标准角 度(180°)的差别,同一患者术前和术后的差别可视为配对资料,数据如 表所示。术前、术后下肢力线角度与标准角度分别获得的偏差度数的差值 服从正态分布。现估计术前术后下肢力线角与标准角度偏差度数的差值的 95%置信区间。
(一)t 分布
单个样本均数的抽样分布与t分布
第一节 单个总体均数
(一)t 分布
第一节 单个总体均数
(一)t 分布
第一节 单个总体均数
(二)单样本情形
(xt/2,
sn, xt/2,
s) n
第一节 单个总体均数
(二)单样本情形
s
s
卫生统计学第八版李晓松第十七章寿命表

第十七章寿命表目录第一节:寿命表的概念与计算方法第二节:简略现时寿命表第三节:去死因寿命表第四节:健康期望寿命表第五节:寿命表相关指标的分析与应用0102030405第六节:伤残调整寿命年及模型寿命表 06重点难点※现时寿命表的概念和计算方法※简略现时寿命表的编制方法※去死因寿命表的编制方法※健康期望寿命表的编制方法※伤残调整寿命年及模型寿命表的概念第一节寿命表的概念与计算方法1.寿命表的概念寿命表(life table)也称为死亡率表或保险计算表,在人口学、流行病学、保险精算学等领域广泛应用,是一种呈现不同年龄组死亡概率、期望寿命及相关指标的表格。
这些指标可以反映某群体的生命全过程,反映该人群健康水平及死亡状况。
编制原理期望寿命本质上就是令假想的人口数根据当地各年龄组的实际死亡率来死亡时,同年龄人的平均余寿。
因此,现时寿命表相当于进行标准化,有关的计算与标准化法类似。
只要知道各年龄组的平均人口数和死亡数即可编制寿命表。
期望寿命既可综合反映各年龄组的死亡水平,又能以期望寿命的长短表明人群的健康水平,它是社会、经济、文化和卫生发展水平的综合体现。
通过期望寿命的比较,可以衡量不同地区或国家人群的健康水平,这是不同国家、不同时期健康水平进行比较的最常用指标。
据2015年《中国卫生和计划生育统计年鉴》报告,我国1990年、2000年、2005年和2010年的期望寿命分别为68.6岁、71.4岁、73.0岁和74.8岁,反映了我国卫生事业和社会经济发展迅速。
第二节简略寿命表的编制第二节简略寿命表的编制第三节去死因寿命表第三节去死因寿命表去死因寿命表(cause eliminated life table)。
研究某种死因对居民死亡的影响,可编制去死因寿命表基本思想是:假使消除了某种死因,则原死于该死因的人不死于该死因,寿命就会有所延长。
显然,如果消除了对生命威胁大的死因,寿命就会延长更多。
优点:①以某死因耗损的期望寿命和尚存人数合理地说明了该死因对群体生命的影响程度;②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用;③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
阳性率的比较: 2 5.10 。请讨论:该医生的统计处理是否正确?若否,请分析
原因并加以修正。
答:不正确,在对 P53 阳性率差异性就行检验的时候,表格理论频数出现 1<T<5 的情况,故应该采用连续用校正公式计算卡方值( 2=0.012,p>0.05)。
7. 什么是非参数检验?与参数检验相比,非参数检验有哪些优点? 答:不依赖于总体分布类型,也不对参数进行推断,而是对总体分布进行分析 的假设检验方法。与参数检验相比,非参数检验对资料要求低,适用范围广,计算 过程相对简单。
18. 生存数据分析的基本内容是什么?分析方法有哪些? 答:基本内容: (1)描述生存时间的分布特点。通过生存时间和生存结局的数据估计平均存 活时间及生存率,绘制生存曲线,根据生存曲线分析其生存特点等。例如上例中肾 上腺皮质癌研究所绘制的生存率曲线可提供预期治疗价值评估信息。 (2)比较生存曲线。通过相应的假设检验方法对不同样本的生存曲线进行比 较,以推断各总体的生存状况是否存在差别,比较不同治疗方法预后效果的差异。 例如本研究比较手术治疗和药物治疗肾上腺皮质癌患者的生存曲线,以推断两种疗 法的效果优劣。 (3)分析影响生存状况的因素。通过生存分析模型来探讨影响生存状况的因 素,通常以生存时间和结局作为因变量,而将可能的影响因素作为自变量,比如年 龄、性别、病理分型、临床分期、治疗方式等。通过拟合生存分析模型,筛选具有 统计学意义的生存状况的影响因素。 分析方法: (1)生存曲线的估计常用的方法有 Kaplan-Meier 法和寿命表法。 (2)生存曲线的比较常用的方法有 log-rank 检验。 (3)分析影响生存状况的因素的方法有 Cox 回归模型。
5. 某职业病防治院希望了解矽肺不同分期患者的胸部平片密度是否存在差异,
收集矽肺患者 492 例,数据见下表 3-2。
矽肺分期
1期 2期 3期 合计
表 3-2 不同分期矽肺患者的胸片密度
密度
低
中
高
43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169 78 492
某医生采用 R×C 交叉表 2 检验,求得统计量 2 163.01,ν= 4,P<0.01,认
4. 多重比较方法 SNK 法、Dunnett-t 法以及 Bonferroni 法有何不同?同一数据 进行多个均数的两两比较,是否存在 SNK 法、Dunnett-t 法以及 Bonferroni 法结果 不一致的情况?
答:SNK 法应用于各组两两间均进行多重比较,考虑到比较均数跨越的组数, 借 助 q 界 值 表 , 做 推 断 结 论 ; Dunnett-t 法 各 实 验 组 均 与 对 照 组 进 行 比 较 ;
Bonferroni 法则是通过调整 水平,使多重比较的整体犯错误的概率不超过 0.05, 调整的水平为 / m (m 为多重比较的次数)。
同一数据进行多个均数的两两比较,可能会存在 SNK 法、Dunnett-t 法以及 Bonferroni 法结果不一致的情况,需结合实际情况慎重下结论,或者进一步增大样 本含量,使最终两两比较结果保持稳定。
xij x 2 ,反映了每个个体观测值与总均数之间的差异。总的自由度为������ − 1。
ij
3. 通过配对 t 检验和两样本均数 t 检验的数据,讨论并验证 t 检验和方差分析 间存在什么关系?
答:配对设计两均数的比较的 t 检验,可以采用随机区组设计的方差分析,结 果完全等价,方差分析的 F 值与配对 t 检验的 t 值存在关系: F t2 ;两独立样本 均数 t 检验,可以采用完全随机设计方差分析,结果完全等价,方差分析的 F 值与 t 检验存在关系: F t2 。
为矽肺不同分期的平片密度不同,且 2、3 期患者胸片密度比 1 期患者高。
(1)该医生的统计处理是否正确?若否,请分析原因。
(2)为了达到本研究目的,宜采用何种统计分析方法?
答:(1)不正确,该资料为双向有序资料,不能用卡方检验。 (2)应采用基于秩次的非参数检验。
6. 某医生对 26 名前列腺癌患者和 20 名直肠癌患者病理标本中 CEA,Pgp,
第三篇 常用推断方法
一、讨论题
1. 某研究选取体重接近的雌体中年大鼠 20 只,随机分为甲、乙两组,每组 10
只。乙组每只大鼠接受 3mg/kg 内毒素,甲组作为对照组,分别测得两组大鼠的肌
酐(mg/L)见表 3-1,为检验两总体均值之间有无差别,该研究先计算两组差值并
进行正态性检验,服从条件后采用配对设计 t 检验:t=3.540,P=0.006。你是否同
意这种统计分析方法?
表 3-1 甲、乙两组大鼠肌酐(mg/L)数据
组别 1
2
3
4
5
6
7
8
9
10
甲组 6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.9
乙组 8.5 6.8 11.3 9.4 9.3 7.3 5.8 7.8 7.2 8.2
差值 2.3 3.1 5.5 6.7 5.4 1.2 -0.9 0.0 3.4 1.3
10. 两组独立样本比较的秩和检验,检验假设( H0 )是否可以用 1 2 表示?
为什么? 答:不可以,因为是一般用于描述正态分布集中趋势的统计指标,而秩和检
验比较的总体分布,而不是某个服从某种特定分布的参数。
11. 在秩和检验中,若遇到相同的观测值,为什么要取平均秩? 答:为保证相同观测值的秩和不变,而且相同数值的秩又不能有差别,因而, 这些相同的数值应取相同秩。
数的差值,正差值表示样本中个体值大于给定中位数,负差值则为样本中个体值小 于给定中位数。进而根据所有差值的绝对值进行编秩,将所有正差值的秩相加就得 到正差值的秩和 R+,同理,所有负差值的秩相加即为负差值的秩和 R-。若 R+与 R相差悬殊,均远离 M0,则有理由拒绝 H0。
配对数据符号秩和检验的基本思想与单样本符号秩和检验是一致的。配对数据 中每个配对数值的差值可以看作是一个单独的样本,给定的总体中位数为 0,即推 断差值的单样本是否来自给定中位数为 0 的总体。其余部分则与单样本符号秩和检 验并无差别。
13. 多组独立样本比较的秩和检验的基本思想是什么? 答:Kruskal-Wallis 检验的基本思想就是用所有观测值的秩代替原始观测值进 行单因素方差分析。若所有观测值的总例数为 N,秩只能是 1 到 N 之间的某个整数 (假设没有相同的观测值出现),不管原始观测值是什么,秩的离均差平方和会是 一个固定的数值,因此无需组间变异和组内变异两个都用。Kruskal-Wallis 检验的
17. 生存分析的统计描述指标有哪些?各指标的含义是什么? 答:(1)死亡概率与生存概率:死亡概率指某时段开始时存活的个体,在该 时段内死亡的可能性。
生存概率指某时段开始时存活的个体,到该时段结束时仍存活的可能性。 (2)生存率:生存率表示观察对象的生存时间 T 大于时间 t 的概率,常用 S(t) 表示,即 S(t) Pr(T t) 。生存函数又称为累积生存率,简称生存率。 (3)中位生存时间:生存函数取值为 0.5 时对应的生存时间称为中位生存时 间(median survival time),又称中位生存期或半数生存期。它表示有 50%的个体 可以存活到比更长时间,通常用于描述生存期的平均水平。
P53 三项指标的阳性率进行差异性检验,结果见表 3-3。
表 3-3 两种患者病理标本三项指标的阳性率比较
指标
疾病
直肠癌
前列腺癌
2值
P值
阳性
2
13
CEA
阴性
24
7
阳性
21
15
P53
阴性
5
5
阳性
7
12Байду номын сангаас
Pgp
阴性
19
8
14.39 0.22 5.10
<0.05 >0.05 <0.05
其中,CEA阳性率的比较: 2 14.39 ,P53阳性率的比较: 2 0.22 ,Pgp
的。
16. 举例说明生存资料的特点及生存资料收集时的注意事项。 答:生存资料的特点: (1)生存资料是既考虑生存结局又考虑生存时间的数据。 (2)生存时间指从观察起点到终点事件的时间间隔,往往不满足正态分布, 且存在删失数据。 (3)生存资料通常进行生存分析,可充分利用删失数据所提供的不完全信息。 生存资料收集时注意事项: (1)明确观察对象的起止时间。如肿瘤术后疗效,是以术后第二天为开始时 间,还是出院日为开始时间? (2)明确观察对象的结局事件。如肿瘤术后疗效,以因肿瘤死亡为结局事件, 还是肿瘤出现转移或(和)复发? (3)注意删失数据的随访时间。当这次随访时发生删失,则该观察对象的随 访终止时间为上次随访记录的时间。
检验统计量实质是用秩计算组间变异,当组间变异的数值较大,有理由认为组间存 在差异。
14. 简述直线相关和回归的区别与联系。 答:区别: (1)资料要求不同:直线相关要求 X、Y 服从双变量正态分布;直线回归要 求固定 X 时,反应变量 Y 服从正态分布且等方差,X 可以是精确测量和严格控制 的变量,也可以是随机变量。 (2)应用目的不同:直线相关说明的是两变量间的密切程度,两变量是平等 关系;直线回归说明的是两变量间数量上的依存关系。 (3)指标计算不同:r 与 b 的计算公式不同, r lXY lXX lYY , b lXY lXX 。 (4)指标取值范围不同: 1 r 1, b 。 (5)指标意义不同:r 表示具有直线相关关系的两变量间的相关程度与方向; b 表示 X 每改变一个单位时,Y 平均改变 b 个单位。 (6)指标单位不同:r 没有单位,b 有单位。 联系: (1)对于同一组资料若能同时计算 b 和 r,则二者的正负号一致。 (2)对于同一资料,r 和 b 的假设检验等价,计算得的 t 统计量值相等,即 tr tb 。 (3)用回归解释相关:由于决定系数 R2 SS回 SS总 ,当总平方和固定时,回 归平方和越大, R2 越接近于 1,说明两变量间的相关关系越密切。 (4)对于同一资料,相关系数和回归系数间可以相互换算。