医学统计学9~13章

合集下载

医学统计学知识点总结

医学统计学知识点总结

医学统计学1. 对定量资料进行统计描述时,如何选择适宜的指标定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平;均数个体的平均值·对称分布几何均数平均倍数取对数后对称分布中位数[位次居中的观察值①非对称分布;②半定量资料;③末端开口资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析?调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(方差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距?居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较定性资料:阳性事件的概率,概率分布,强度和相对比。

¥2. 应用相对数时应注意哪些问题答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。

(2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。

(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。

(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。

3. 常用统计图有哪些分别适用于什么分析目的常用统计图的适用资料及实施方法<图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图用直条的面积表示各组段的频数或频率(定量资料的分布百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系、线图半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图}双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布'用茎表示组段的设置情形,叶片为个体值,叶长为频数第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。

医学统计学-第9章 关联性分析

医学统计学-第9章 关联性分析
双向有序分类资料的关联性检验某矿工医院探讨矽肺不同期次患者的胸部片密度变化492例患者资料整理如下表所示问矽肺患者肺门密度的增加与期次有无关本表是按两个变量从小到大顺序分类整理出来的目的为研究两个变量之间有无关联性此从表的左上角往右下角方向看频数有集中于此对角线偏上趋势即肺门密度有随着矽肺期次增加而变大趋势换言之这两个变量似有关联性
关于两种属性的关联程度,我们用pearson
列联系数表达:
对于2×2列联表
关联系数r介于
(9-10)(110-1~2) 0.5 = 0.71 之 间, 该值越大,关
联程度越高。
理论上我们还要作总体为列联系数为0的假设 检验,但这个假设等价于以上的χ2检验。
例9-3 为观察行为类型与冠心病的关系,某研究
r的取值范围在±1之间,为正值时,正相关。 为负值时,负相关。 r=0时为零相关。 ρ是总 体相关系数,r是ρ的估计值。 假设是建立ρ的基础上。。。
相关系数的计算
利用例题的资料试计算凝血酶浓度X与凝 血时间Y之间的样本相关系数。
4.相关分析条件
用于双变量正态分布资料, X、Y都是正态分布。
9.2 两个连续随机变量间的相关分析
例 某地研究2-7岁急性白血病患儿的血小
板数与出血症状程度之间的相关性,结果见下 表:试用秩相关进行分析。
首先先将实测原始数据由小到大排序 编秩,以pi表示Xi秩次;qi表示Yi的
次,见上表所示。
观察值相同的取平均秩次;将pi、qi直接 替换(9-1)中的X和Y的均数,直接得 到如下算式:
计算结果如下:

(9-11)
关联系数为:
关联系数的范围:
其中,R是列联表的行数,C是列联表列数。
双向有序分类资料的关联性检验

本科《医学统计学》第6版单选题

本科《医学统计学》第6版单选题

《医学统计学》单项选择题摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,2013第一章绪论1. 医学统计学研究的对象是()A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E.疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是()A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是()A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由操作失误引起的误差5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是()A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差8. 统计学中所谓的总体通常指的是()A. 自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9. 医学统计学中所谓的样本通常指的是A. 可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10. 医学研究中抽样误差的主要来源是()A. 测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案:1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A. 中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3. 将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5. 变异系数主要用于()A. 比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是()A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用()A.全距B.标准差C.变异系数D.方差E.四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是()A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为()A.50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为()A.0,1 B. 1,0 C. µ,σ D. σ,µ E. S,X3. 正态分布的均数、中位数和几何均数之间的关系为()A. 均数与几何均数相等B. 均数与中位数相等C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78×1012/L ,S=0.38×1012/L ,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为( )A .高于4.78×1012/L 的成年男子占97.98%B .低于4.78×1012/L 的成年男子占97.98%C .高于4.00×1012/L 的成年男子占97.98%D .低于4.00×1012/L 的成年男子占97.98%E .在4.00×1012/L 至4.78×1012/L 的成年男子占97.98%5. 某项指标95%医学参考值范围表示的是( )A. 在此范围 “异常”的概率大于或等于95%B. 在此范围 “正常”的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 在人群中检测指标有5%的可能超出此范围6. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人7. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8. 要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是( )A. 用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是( )A .数据服从正态分布B .数据服从偏态分布C .有大样本数据D .数据服从对称分布E .数据变异不能太大10.某市1974年238名居民的发汞含量(µmol/kg )如下,则该地居民发汞值的95%医学参考值范围是( )发汞值(µmol/kg )15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数 20 66 60 48 18 16 6 1 0 3A .<P 95B .>P 5C .(P 2.5,P 97.5)D .S X 96.1±E .S X 96.1±答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为()A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女性居民多,而乙乡男性居多,适当的比较方法是()A. 两个率直接比较B. 两个率间接比较C. 直接对感染人数进行比较D. 计算标准化率比较E. 不具备可比性5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是()A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人口中所占比例更大6. 相对危险度RR的计算方法是()A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR值表示的是()A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度8. 计算患病率时的平均人口数的计算方法是()A. 年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9. 死因构成比反映的是()A. 各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10. 患病率与发病率的区别是()A. 患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A. 便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A. 复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A. 直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A. 直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7. 有些资料构成统计表时,下列哪一项可以省略()A. 标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A. 圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A. 圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A. 圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1. 样本均数的标准误越小说明()A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 要减少抽样误差,通常的做法是()A. 减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5. 用某种中成药治疗高血压患者100名,总有效率为80.2%,标准误为0.038,则总有效率的95%可信区间估计为()A. 0.082±1.64×0.083B. 0.082±1.96×0.083C. 0.082±2.58×0.083D. > (0.082-1.64×0.083)E. <(0.082+1.64×0.083)6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96×1.20B. 3.64±1.20C. 200/20.196.164.3×±D. 200/20.158.264.3×±E. 3.64±2.58×1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C 5. B 6. E 7. C 8. D 9. D 10. D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度2. 两样本均数比较,检验结果05.0>P 说明( )A. 两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指( )A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别4. 两样本均数比较,差别具有统计学意义时,P 值越小说明( )A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是( )A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6. 减少假设检验的Ⅱ类错误,应该使用的方法是( )A. 减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7. 以下不能用配对检验方法的是( )A. 比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B. 比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C. 比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E. 比较15名受试者针刺檀中穴前后的痛阈值8. 两独立样本均数 t 检验,其前提条件是( )A. 两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9. 若将配对设计的数据进行两独立样本均数 t 检验,容易出现的问题是( )A. 增加出现I 类错误的概率B. 增加出现II 类错误的概率C. 检验结果的P 值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件10.两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t ′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D 5. C 6. E 7. C 8. C 9. B 10. B第八章 方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指( )A. 各比较组相应的样本方差相等B. 各比较组相应的总体方差相等C. 组内方差=组间方差D. 总方差=各组方差之和E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是( )A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5.多组均数比较的方差分析,如果0.05P <,则应该进一步做的是( )A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK-q 检验E .确定单独效应6.完全随机设计的多个样本均数比较,经方差分析,如果0.05P <,则结论为( )A .各样本均数全相等B .各样本均数全不相等C .至少有两个样本均数不等D .至少有两个总体均数不等E .各总体均数全相等7.完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理论上应接近于( )A .()21,F νναB .误差处理SS SS / C. 0 D. 1 E. 任意值8.对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9.析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10.某职业病防治院测定了年龄相近的45名男性用力肺活量,其中石棉肺患者、石棉肺可疑患者和正常人各15名,其中用力肺活量分别为(1.79±0.74)L 、(2.31±0.87)L 和(3.08±0.65)L ,拟推断石棉肺患者、石棉肺可疑患者和正常人的用力肺活量是否不同,宜采用的假设检验方法是( )A .两组均数比较的 t 检验B .方差齐性检验C .完全随机设计方差分析D .随机区组设计方差分析E .析因设计方差分析答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第九章 χ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( )A. 两样本率差别越大B. 两总体率差别越大C. 越有理由认为两样本率不同D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用的假设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3.进行四组样本率比较的χ2检验,如220.01,3χχ>,可认为( )A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为( ) A. 两文结果有矛盾 B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较的检验功效相关因素是( )A. 检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6. 通常分析四格表需用连续性校正χ2检验的情况是( )A. T < 5B. T < 1或 n < 40C. T < 5且n < 40D. 1≤T< 5且n > 40E. T < 5或n < 407. 当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是( )A. 增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8. 对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni 方法校正后的检验水准(进行了6次多重比较,校正后的检验水准为0.05/6)应该是( )A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139. 对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni 方法校正后的检验水准(进行了3次多重比较,校正后的检验水准为0.05/3)应该是( )A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710. 利用χ2检验公式不适合解决的实际问题是( )A. 比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第十章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A. 适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2. 对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A. 增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3. 两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A. 两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4. 多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A. 方差分析B.Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5. 两组数据的秩和检验和t检验相比,其优点是()A. 计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6. 两样本比较的秩和检验,其检验统计量T是()A. 例数较小的秩和B. 例数较大的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7. 两样本比较的秩和检验,其无效假设是()A. 两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8. 两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A. 比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon 秩和检验B. 24×列联表χ2检验C. 四格表χ2检验D. Fisher 确切概率法E. 计算标准化率10. 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次是( )A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十一章 线性相关与回归1. 两数值变量相关关系越强,对应的是( )A. 相关系数越大B. 相关系数的绝对值越大B. 回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t 值越大2. 回归分析的决定系数2R 越接近于1,说明( )A. 相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3. 对两变量X 和Y 作简单线性相关分析,要求的条件是( )A. X 和Y 服从双变量正态分布B. X 服从正态分布C. Y 服从正态分布D. X 和Y 有回归关系E. X 和Y 至少有一个服从正态分布4. 两组资料作回归分析,直线回归系数b 较大的一组,表示( )A .相关系数r 也较大较大B .假设检验的P 值较小C .决定系数R 2较大D .决定系数R 2较小E .Y 随X 变化其数量关系有更大的变化5. 1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为ˆ144YX =+,若将体重换成国际单位kg ,则此方程( )A .常数项改变B .回归系数改变C .常数项和回归系数都改变D .常数项和回归系数都不改变E .决定系数改变6. 对同一资料进行线性回归与相关分析时,下列正确的情形是( )A .ρ=0时,r=0B .ρ>0时,r>0C .r>0时,b<0D .r<0时,b<0E .ρ<0时,r>07. 下列双变量中,适用于进行线性相关分析的是( )A .年龄与体重B .民族与血型C .体重与体表面积D .母亲文化水平与子女智商E .工龄与患病率8. 若直线回归系数的假设检验结果P<0.05,则可认为两变量间( )A .有密切的关系B .有一定的因果关系C .相关关系密切D .存在数量依存关系E .有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r 界值表823.010,2/001.0=r ,795.010,2/002.0=r ,750.010,2/005.0=r ,则P 值范围为( )A .0.001<P<0.002B .P<0.001C .P<0.002D .P>0.005E .0.002<P<0.00510. 通过线性回归分析(n =48),得决定系数R 2=0.49,则下列说法中错误的是( )A .两个变量具有回归关系B .一定有相关系数r=0.70或r= - 0.70C .假设检验的自由度ν=46D .回归平方和大于剩余平方和E .Y 的总变异有49%可以由X 的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十二章 多元线性回归1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是( )A .节省样本B .提高分析效率C .克服共线影响D .减少异常值的影响E .减少混杂的影响2. 多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是( )A. 简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R 23. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是( )A .决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

《医学统计学》医统-第九章卡方检验

《医学统计学》医统-第九章卡方检验

卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1

医学统计学 -第09章 卡方检验


0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,

医学统计学题库一

第九章医学统计学的基本内容一、单选题1.以下有关小概率事件的描述,正确的是A、在一次抽样中就会发生的事件B、在一次抽样中发生的概率≤0.05C、在一次抽样中不可能发生的事件D、即使多次抽样也不可能发生的事件E、在多次抽样中发生的概率≤0.052.医学统计学的研究内容是A、样本B、个体C、变量之间的相关关系D、总体E、资料或信息的收集、整理和分析3.医学统计工作的基本步骤是A、搜集资料、整理资料、描述资料、设计B、搜集资料、整理资料、推断资料、设计C、设计、搜集资料、整理资料、分析资料D、统计描述、统计推断、统计设计E、搜集资料、描述资料、推断资料4.用某种新药治疗白血病患者50名,治疗的结果如下死亡恶化好转显效治愈治疗结果369284治疗人数该资料的类型是A、计量资料B、计数资料C、等级资料D、分层资料E、定量资料5.随机样本的特点是A、能消除系统误差B、能消除随机测量误差C、能减少抽样误差D、能消除研究者有意无意带来的样本偏性E、能消除过失误差6.统计学中的总体是指A、任意想象的研究对象的全体B、根据研究目的确定的研究对象的全体C、根据地区划分的研究对象的全体D、根据时间划分的研究对象的全体E、根据人群划分的研究对象的全体7.为了由样本推断总体,样本应该是A、总体中任意的一部分B、总体中的典型部分C、总体中有意义的部分D、总体中有价值的一部分E、总体中有代表性的一部分8.抽样误差是指A、不同样本指标之间的差别B、样本指标与总体指标之间由于抽样产生的差别C、样本中每个个体之间的差别D、由于抽样产生的观测值之间的差别E、系统误差与过失误差之间的差别9.可以通过增加例数的方法减少的误差是A、系统误差B、随机测量误差C、抽样误差D、过失误差E、以上均无法减少10.关于统计学中的过失误差、系统误差、随机测量误差和抽样误差,正确的是A、4种误差均不可避免B、系统误差和随机测量误差不可避免C、系统误差和抽样误差不可避免D、随机测量误差和抽样误差不可避免E、过失误差和抽样误差不可避免11. P(A)=0时,表示事件A、很可能发生B、极可能发生C、不可能发生D、在一次抽样中不会发生E、已经发生二、判断题1.概率是描述随机事件发生的可能性大小的一种度量,用P表示,其值介于0.01~100之间。

医学统计学-第9章 关联性分析

9.2.1 解决什么问题? ⑴统计描述:推断两变量是否有联系?是否
线性?程度如何?是正相关还是负相关? ⑵统计推断:两者的关系是否有统计学意
义?根据专业知识下结论。
9.2.2 相关系数的统计推断
r是样本相关系数,是总体相关系数ρ的估计
值,要想判断X、Y间是否有相关关系,就要检
验r是否来自总体相关系数ρ为零的总体。方法
本例 ν=n对-2=15-2=13,r0.05,13=0.514, 得到: p<0.05,即相关系数有统计学意义。
tr =
− 0.926 = −8.874,
1 − (0.926)2
ν = 15 − 2 = 13
15 − 2
可按公式(9-2) 计算
查附表C2(教材560),t 0.05,13=2.160;t> t 0.05,13,按α=0.05水准,拒绝H0,接受H1,故 可以认为凝血酶浓度与凝血时间呈负相关关系。
9.2.3 Spearman 秩相关
一、秩相关的概念及其统计描述 前面指出:Pearson积矩相关的假设检验要求
X和Y均服从正态分布。对那些不服从正态 分布或等级资料、总体分布未知的资料,因 难以进行分析,所以就不宜用积矩相关系数 来描述相关性。
此时,可采用等级相关(rank correlation), 或称秩相关来描述两个变量间相关的程度与方 向。该法是利用两变量的秩次大小作线性相关 分析,对原变量的分布不作要求,属非参数统 计方法。
例 某地研究2-7岁急性白血病患儿的血小
板数与出血症状程度之间的相关性,结果见下 表:试用秩相关进行分析。
首先先将实测原始数据由小到大排序 编秩,以pi表示Xi秩次;qi表示Yi的
次,见上表所示。
观察值相同的取平均秩次;将pi、qi直接 替换(9-1)中的X和Y的均数,直接得 到如下算式:

医学统计学(潍坊医学院)智慧树知到答案章节测试2023年

第一章测试1.样本是从总体中抽取部分观察单位,其实测值的集合。

A:对B:错答案:B2.总体是由()。

A:研究对象组成B:研究指标组成C:个体组成D:同质个体组成答案:D3.抽样的目的是()。

A:研究样本统计量B:由样本统计量推断总体参数C:研究总体统计量D:研究典型案例研究误差答案:B4.参数是指()。

A:样本的总和B:样本的统计指标C:参与个体数D:总体的统计指标答案:B5.关于随机抽样,下列那一项说法是正确的()。

A:抽样时应使得总体中的每一个个体都有同等的机会被抽取B:研究者在抽样时应精心挑选个体,以使样本更能代表总体C:随机抽样即随意抽取个体D:随机化抽样可以令样本有较好的代表性答案:AD第二章测试1.频数分布表可以描述频数分布的特征。

A:对B:错答案:A2.特别适合描述正态分布资料集中趋势的指标为:A:百分位数B:中位数C:算术均数D:几何均数答案:C3.计算标准差的方法有A:直接计算法B:正态分布法C:频数表法D:百分位数法答案:AC4.标准正态分布的位置参数分别是?A:2B:-1C:1D:0答案:D5.A:AB:DC:CD:B答案:CD第三章测试1.构成比的特点是各组成部分的百分比总和A:随着各构成部分大小改变而改变B:必小于1C:必等于1D:必大小1答案:C2.相对比的特点有A:一定要大于100%B:相对比的特点有C:各相对比的和等于100%D:可小于100%也可大于100%答案:D第四章测试1.制统计表时,哪种做法不符合要求?A:横标目在表上方,纵标目在表左侧B:数字一律用阿拉伯数字C:标题置于表上方中央D:表内无斜线、纵线答案:A2.普通线图和半对数线图均可以揭示事物发展变化的趋势。

A:错B:对答案:B第五章测试1.A:DB:CC:BD:A答案:B2.标准差已知和标准差未知但样本含量比较大两种情况下,计算可信区间的方法是一样的,只是计算公式略有不同。

A:对B:错答案:A第六章测试1.进行假设检验时,若α=0.05,则若P小于0.05,则拒绝H0,此时可能犯Ⅱ型错误。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章方差分析⏹方差分析的基本思想和应用条件⏹完全随机设计的方差分析⏹随机区组设计的方差分析方差分析的基本思想总变异组间变异方差?!变异离均差(X-u)离均差平方和∑(X-u)2均方(方差)2()SS X=-∑总1Nν=-总SSMSν=总总总1-=k组间νSSMSν=组间组间组间∑---=iiixxnss2)(组间组内变异变异来源F 统计量的构造F 值服从分子自由度为v 组间,分母自由度为v 组内的F 分布。

方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义方差分析的应用条件①各样本是相互独立的随机样本②均服从正态分布③方差齐性∑--=iji ij x x ss 2)(组内kN -=组内νSS MS ν=组内组内组内MS F MS =组间组内方差分析与t 检验的异同⏹相同点:两者都要求样本的正态性、独立性、和方差齐性。

⏹不同点:t检验只能用于两样本资料的比较,而方差分析可以用于两组或两组以上的均数比较;t检验可进行单双侧检验,而方差分析是单尾检验。

(例)解题步骤2.计算统计量3.确定P值,作出统计推断V1=??v2=??查F界值表,比较P值,按α=0.05水准,拒绝h0(h1),差别有统计学意义,可以认为喂养三种不同饲料的大鼠红细胞数的总体均数不全相同。

SPSS第十章 二项分布一、定义二项分布(binomial distribution) 是指在只会产生两种可能结果如“阳性”或“阴性”之一的n 次独立重复试验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2, Λ,n 的一种概率分布。

记为X ~B (n ,π ), n 为试验次数, π为“阳性”概率。

二、适用条件1. 每次试验只会发生两种对立的结果之一,两种互斥结果的概率之和恒等于1;2. 每次试验产生某种结果(如“阳性”)的概率π固定不变;3. 各次试验是互相独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。

随机变量 概率分布连续型: u 、t 、F 分布离散型二项分布 Poisson 分布 负二项分布每次实验n 个独立个体中出现X 个“阳性”概率数学中二项式定理 三、性质1.平均数 μ=n πμp=π(以率表示) 2.标准差四、二项分布的应用 (重点)1. 总体率的区间估计2. 样本率与总体率的比较3. 两样本率的比较4. 研究非遗传性疾病的家族集聚性5. 群检验1.总体率的区间估计查表法对于n ≤50小样本资料,直接查附表6“百分率的可信区间”表。

得总体率1-α可信区间。

附表6中X 最大为25,当X >n/2时,按“阴性”数n-X 查得总体阴性率的1-α可信区间QL ~QU ,再转换成阳性率的1-α可信区间:Cx n从n 个不同元素中每次取出x 个不同元素的组⎪⎪⎭⎫ ⎝⎛x n 也记作 n)1()1(n p π-π=σπ-π=σ(以率表示)n ,0,1,2,x )1(x)!-(n x!n!)1()x (p x n x x n x xn C =π-π=π-π=--∑=----=+++++=+n0x xx -n xn n nn 1n 1n n 22n 2n 1n 1n n 0n nb a b ab b a b a a b a C C C C C C )(PL=1-QU ,PU=1-QL 。

☐ 正态近似法当n 较大、p 和1-p 均不太小,如np 和 n(1-p)均大于5时:(P - u α/2 Sp , P + u α/2 Sp )2.样本率与总体率的比较☐ 直接法(单侧检验)若回答“差”或“低”的问题,需计算出现“阳性”次数至多为K 次的概率:若回答“优”或“高”的问题,需计算出现“阳性”次数至少为K 次的概率☐ 直接法(双侧检验)回答的是“有无差别”,所要计算的双侧概率P 值应为实际样本(记“阳性”次数为k 次)出现的概率与更背离无效假设的极端样本(“阳性”次数i ≠k)出现的概率之和。

☐ 正态近似法当n 较大、p 和1-p 均不太小,如np 和n(1-p) 均大于5时,利用样本率的分布近似正态分布的原理,可作样本率p 与总体率π0的比较。

检验统计量u 值的计算公式为:3.两样本率的比较当n1与n2均较大,p1、1-p1和p2、1-p2均不太小,如n1 p1、 n1(1-p1)和n2 p2、 n2(1-p2)均大于5时:∑∑π-π==--==≤k0X kX X n X )1()X n (!X !n )X (P )k X (P !∑∑π-π==--==≥nk X nkX X n X)1()X n (!X !n )X (P )k X (P !n/)1(p u 000π-ππ-=21p p 21S p p u --=⎪⎪⎭⎫⎝⎛+⎪⎪⎭⎫ ⎝⎛++-++=-2121212121p p n 1n 1n n X X 1n n X X S 21第十一章2χ检验一四格表资料的χ2检验(重)*二配对四格表资料的χ2检验(重) *三 Fisher确切概率检验四行×列表资料的χ2检验(重) *五多个样本率比较的χ2分割法[教学要求]掌握:单个样本分布的拟合优度检验;独立样本2×2列联表资料的χ2检验;独立样本R ×C列联表资料的χ2检验;配对2×2列联表资料的χ2检验。

熟悉:配对R ×R列联表资料的χ2检验;四格表资料的Fisher确切概率法。

了解:连续型随机变量的χ2分布;分类数据χ2检验的基本思想。

1.四格表的卡方检验式中符号含义:A:实际频数,表中实际发生的阳性或阴性频数T:理论频数,按某H0假设计算理论上的阳性或阴性频数2.配对四格表的卡方检验Pearson 检验计算与步骤 1.建立假设:H0:π1= π2 = πc (两组总体率相等) H1:π1 ≠ π2 (两组总体率不等)α=0.05 2.计算统计量3.确定概率(P )和自由度(ν)自由度(ν)=(行数-1)×(列数-1)4.结论:在α=0.05水准上,p <0.01,拒绝H0,两样本率差别有统计意义,具本例可认为试验组对降低颅内压有效率高于对照组[重点难点]第一节 2χ分布和拟合优度检验一、χ2分布基本概念:χ2分布是一种连续型随机变量的概率分布,如果12,,,Z Z Z ν 是v 个相互独立的标准正态分布随机变量,则22221νZ Z Z +++ 的分布称为服从自由度为ν的χ2分布。

2χ分布的概率密度曲线的形状依赖于自由度ν的大小。

二、拟合优度χ2检验的基本思想拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理论分布。

2χ值反映了样本实际频率分布与理论分布的符合程度。

三、χ2检验的基本公式大样本时检验统计量∑=-=ki i i i T T A 122)(χ近似地服从χ2分布,自由度为ν= k -1-(计算T i 时利用样本资料估计的参数个数)其中,A i 和T i 分别为实际观察频数和0H 成立时的理论频数,k 为频数分布的类别总数。

四、拟合优度χ2检验注意事项1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。

2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为∑=--=ki i i i T T A 122)5.0(χ第二节 独立样本2×2列联表资料的χ2检验一、2×2列联表资料χ2检验目的两独立样本率差异的比较。

即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。

二、统计量计算公式可直接使用χ2检验基本公式也可使用等价的专用公式或校正公式。

专用公式22()()()()()ad bc na b c d a c b d χ-=++++校正公式22(||/2)()()()()ad bc n na b c d a c b d χ--=++++ 自由度ν=1。

三、2×2列联表资料χ2检验的注意事项1.使用专用公式要求:n 不小于40,T 不小于5;2.在n ≥40时,如果有某个格子出现1≤T <5,需用校正公式; 3.当n <40或T <1时,用Fisher 确切概率法检验。

第三节 独立样本R ×C 列联表资料的χ2检验一、R ×C 列联表资料χ2检验目的1.多个独立样本率的比较:根据R 个独立样本的频率分布,检验R 个二项分布总体的概率是否相同。

2.多个独立样本频率分布的比较:根据R 个独立样本的频率分布,检验R 个总体分布是否相同。

二、统计量计算公式)1(1122-=∑∑==Ri Cj ji ijm n A n χ自由度 ν=(R -1)(C -1)三、R ×C 列联表资料χ2检验的注意事项1.对于多个率或频率分布比较的χ2检验,结论为拒绝0H 时,仅表示多组之间有差别,并不是任2组之间都有差别。

若要明确哪两组间不同,还需进一步作多组间的两两比较;2.R ×C 列联表χ2检验要求理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1;3.χ2检验不适用于有序分类资料的比较分析。

第四节 配对设计资料的χ2检验一、配对2×2列联表资料的χ2检验1. 配对2×2列联表资料χ2检验目的:通过配对设计的两样本资料来推断两方法的阳性概率有无差别。

2.统计量计算公式当40≥+c b 时, 22()b c b cχ-=+ ν=1当40b c +<时,需对公式进行校正, 校正公式为22(||1)b c b cχ--=+二、配对R ×R 列联表资料的χ2检验1.配对R ×R 列联表资料χ2检验目的:通过样本资料来推断两个变量的总体概率分布是否相同。

2.统计量计算公式21()12k i i i i i iin m k T k n m A =--=+-∑ 自由度ν=1-k 。

第五节 2×2列联表资料的确切概率法(一)当2×2列联表资料出现以下情况时,需用确切概率法直接计算概率以作判断:①样本含量n < 40; ②理论频数T <1;③χ2检验后所得概率P 接近检验水准α。

(二)确切概率计算法的基本思想和步骤1.在四格表边缘合计固定不变的条件下,计算表内4个实际频数变动时的各种组合的概率P i()()()()!!!!!!!!!i a b c d a c b d P a b c d n ++++=式中a 、b 、c 、d 为四格表中的四个频数,n 为总例数,其和1i P =∑。

2. 按检验假设计算单侧或双侧的累计概率P 。

相关文档
最新文档