医学统计学课件
合集下载
《医学统计学》完整课件课件

医学研究中其他因素的考虑
研究设计
研究设计是医学统计学中的重要因素,应合理地考虑研 究设计。
研究对象的选择
在医学研究中,应合理地选择研究对象,以确保研究结 果的可信度。
06
医学统计学案例分析
二型糖尿病合并脑梗死的危险因素研究
01
研究பைடு நூலகம்的
探讨二型糖尿病合并脑梗死的危险因素,为预防和治疗提供科学依据
医学统计学是医学生的必修课程,培养医学生 的统计思维和数据处理能力。
医学统计学的发展历程
起源与发展
医学统计学起源于19世纪中叶的英国,当时主要用于医学研究和医疗数据的统计分析。
不断扩展的应用领域
随着医学科学的发展,医学统计学的应用领域不断扩展,涉及到流行病学、公共卫生、临床试验等方面。
方法和理论创新
研究结果
发现多个生物标记物与常见疾病 相关,如高血压、糖尿病等,为 疾病的预防和治疗提供新靶点。
THANK YOU.
模型选择
根据数据特征和实际需求,选择合适的模型。
模型评估
通过交叉验证、ROC曲线等手段对模型进行评估,以便了解模型的准确性和 稳定性。
05
医学统计学的挑战与解决方案
数据缺失与数据完整性的保持
缺失数据
对于缺失的数据,应了解其产生的原因,并合理地利用 它们进行分析。
数据完整性
数据的完整性是指数据的准确性和可靠性,应采取措施 来确保数据的准确性。
2023
《医学统计学》完整课件
目 录
• 医学统计学概述 • 医学统计学的核心概念 • 医学统计学在医学研究中的应用 • 医学统计学的数据处理 • 医学统计学的挑战与解决方案 • 医学统计学案例分析
01
2024版全新《医学统计学》完整ppt课件

THANKS
感谢观看
协方差分析
在方差分析的基础上,引入协变量, 以消除其对观察变量的影响,从而 更准确地评估控制变量对观察变量 的效应。
05
医学统计图表与可视化技术
统计图表的类型及特点
条形图
用于展示分类数据,可直观比较 各类别之间的差异。
折线图
用于展示时间序列数据或连续性 数据的变化趋势。
散点图
用于展示两个变量之间的关系, 可判断是否存在相关性。
森林图
用于展示多组数据的比较结果,可直观比较各组之 间的差异和联系。绘制时需选择合适的统计方法和 图形类型,如t检验或方差分析,并将结果以森林图 的形式呈现出来。
06
医学统计学在临床研究中的应用
临床试验设计与评价
01
02
03
试验设计类型
包括随机对照试验、交叉 设计、析因设计等,确保 试验的科学性和可比性。
参数估计
讲述点估计、区间估计 的方法及评价标准。
假设检验
介绍假设检验的基本思 想、步骤及常见错误类
型。
方差分析
阐述方差分析的基本原 理、假设条件及常用方
法。
常用统计指标与参数
01
02
03
04
描述性统计指标
介绍均数、中位数、众数、标 准差等描述性统计指标的计算
方法及意义。
推断性统计参数
讲解置信区间、假设检验中的 检验统计量、P值等推断性统
箱线图
用于展示一组数据的分布情况,可观察数据的中心 趋势、离散程度和异常值。绘制时需计算数据的四 分位数、中位数和异常值,并将它们以箱线图的形 式呈现出来。
ROC曲线图
用于评估诊断试验的准确性,可判断试验的灵敏度 和特异度。绘制时需计算不同临界值下的灵敏度和 特异度,并绘制出ROC曲线,计算出曲线下面积 (AUC)以评估试验的准确性。
医学统计学(统计图表)ppt课件

案例三
不同治疗方案对患者生存 率的影响。通过饼图展示 各治疗方案的生存率,比 较方案优劣。
前沿动态和未来发展趋势
数据可视化技术的创新应用
01
如交互式图表、动态图表等,提高数据呈现效果和用
户体验。
大数据在医学领域的应用
02 利用大数据技术分析海量医学数据,挖掘潜在规律和
关联,为医学研究和实践提供支持。
相关系数计算
用于量化两个变量之间的线性关系强度和方向。常见的相关系数包括皮尔逊相关 系数、斯皮尔曼相关系数和肯德尔相关系数等。通过计算相关系数,可以对两个 变量之间的关系进行定量分析和假设检验。
03 推断性统计图表
假设检验原理及流程
假设检验的基本原理
通过设定原假设和备择假设,根据样 本数据对原假设进行检验,判断其是 否成立。
临床意义
AUC值越大,说明待评价试验的诊断价值越高。同时,AUC值还可以用来比较不同诊断性试验的诊断价值,以及 在同一诊断性试验中比较不同临界值的诊断价值。此外,AUC值还可以用来估计诊断性试验的阳性似然比和阴性 似然比等参数,为临床决策提供更多的信息。
05 生存分析与寿命 表制作
生存分析基本概念
计算灵敏度和特异度
根据金标准和待评价试验的结果,计算出不同临界值下的 灵敏度和特异度。
绘制ROC曲线
以特异度为横坐标,灵敏度为纵坐标,将不同临界值下的 灵敏度和特异度描绘在坐标图上,连接各点即得ROC曲线 。
AUC值计算和临床意义
AUC值计算
通过计算ROC曲线下的面积得到AUC值,其取值范围在0.5~1之间。当AUC=0.5时,说明待评价试验完全无效; 当AUC=1时,说明待评价试验具有完美的诊断价值。
人工智能在统计图表分析中的应用
《医学统计学》完整课件

总结词
详细描述
总结词
流行病学统计案例主要探讨如何运用统计学方法对流行病学数据进行分析,以评估疾病在人群中的分布和影响因素。
详细描述
流行病学研究旨在揭示疾病在人群中的分布特征和影响因素,为制定预防和控制策略提供科学依据。在流行病学研究中,统计方法的应用对于揭示疾病分布和影响因素至关重要。例如,在分析不同地区或不同人群的疾病发病率或死亡率时,研究者通常会采用描述性流行病学方法和比较流行病学方法,如率比、率差、相对危险度等指标来评估疾病分布和影响因素。此外,回归分析、逻辑回归等统计工具也被广泛应用于流行病学研究中。
详细描述
生存分析是一种专门针对生存时间数据的统计分析方法,包括描述生存时间的分布特征、比较不同组间的生存差异、预测生存时间等。在生存分析中,常用的统计方法包括Kaplan-Meier曲线、Cox比例风险模型、Log-rank检验等。这些方法可以帮助研究者了解患者的生存状况,为制定治疗方案和评估预后提供科学依据。
医学统计软件与数据分析
04
总结词
SPSS(Statistical Package for the Social Sciences)是一款广泛使用的统计软件,适用于各种社会科学数据分析。
总结词
在操作SPSS时,用户需要掌握基本的统计分析方法和数据管理技巧,以便更好地利用软件进行数据分析。
详细描述
SPSS的操作界面友好,易于上手。用户可以通过菜单和对话框选择需要的分析方法,并设置相应的参数。此外,SPSS还提供了丰富的帮助文档和教程,方便用户学习和掌握软件操作。
统计检验是用于判断样本数据是否符合某种假设或理论的过程。
统计检验的基本概念
包括提出假设、构造检验统计量、确定临界值、做出决策等步骤。
详细描述
总结词
流行病学统计案例主要探讨如何运用统计学方法对流行病学数据进行分析,以评估疾病在人群中的分布和影响因素。
详细描述
流行病学研究旨在揭示疾病在人群中的分布特征和影响因素,为制定预防和控制策略提供科学依据。在流行病学研究中,统计方法的应用对于揭示疾病分布和影响因素至关重要。例如,在分析不同地区或不同人群的疾病发病率或死亡率时,研究者通常会采用描述性流行病学方法和比较流行病学方法,如率比、率差、相对危险度等指标来评估疾病分布和影响因素。此外,回归分析、逻辑回归等统计工具也被广泛应用于流行病学研究中。
详细描述
生存分析是一种专门针对生存时间数据的统计分析方法,包括描述生存时间的分布特征、比较不同组间的生存差异、预测生存时间等。在生存分析中,常用的统计方法包括Kaplan-Meier曲线、Cox比例风险模型、Log-rank检验等。这些方法可以帮助研究者了解患者的生存状况,为制定治疗方案和评估预后提供科学依据。
医学统计软件与数据分析
04
总结词
SPSS(Statistical Package for the Social Sciences)是一款广泛使用的统计软件,适用于各种社会科学数据分析。
总结词
在操作SPSS时,用户需要掌握基本的统计分析方法和数据管理技巧,以便更好地利用软件进行数据分析。
详细描述
SPSS的操作界面友好,易于上手。用户可以通过菜单和对话框选择需要的分析方法,并设置相应的参数。此外,SPSS还提供了丰富的帮助文档和教程,方便用户学习和掌握软件操作。
统计检验是用于判断样本数据是否符合某种假设或理论的过程。
统计检验的基本概念
包括提出假设、构造检验统计量、确定临界值、做出决策等步骤。
《医学统计学》完整课件-超级

模型
时间序列分 析(TSA): 用于分析时 间序列数据, 预测未来趋
势
大数据与机器学习方法
机器学习:通过大量数据训练模型,预测 未来结果
深度学习:使用多层神经网络,实现更复 杂的学习任务
强化学习:通过与环境交互,不断优化策 略
自然语言处理:处理和分析文本数据,理 解语言含义
图像识别:识别和分析图像数据,提取特 征信息
重复测量设计:对 同一研究对象在不 同时间点进行多次 测量,研究其变化 趋势
调查设计方法
确定研究目的和研究问题
添加标题
确定样本量,考虑研究人群、 研究变量等因素
添加标题
制定数据收集计划,包括时 间、地点、人员等
添加标题
数据整理和分析,包括描述 性统计、推断性统计等
添加标题
添加标题
添加标题
选择合适的研究设计类型, 如横断面研究、病例对照研
YOUR LOGO
20XX.XX.XX
医学统计学完整课件
,
汇报人:
目 录
01 单 击 添 加 目 录 项 标 题
02 医 学 统 计 学 概 述
03 医 学 统 计 学 基 本 概 念
04 医 学 统 计 学 基 本 方 法
05 医 学 统 计 学 中 的 常 用 概 率 分 布
06 医 学 统 计 学 的 数 据 分 析 方 法
t分布的均值和 方差与自由度有 关,自由度越大, t分布越接近正 态分布。
t分布在医学统 计学中常用于检 验小样本情况下 的假设检验,如 t检验。
卡方分布
卡方分布是一种 连续概率分布, 用于描述随机变 量服从卡方分布
的情况。
卡方分布的性质: 对称性、无偏性、 可加性、可乘性、
时间序列分 析(TSA): 用于分析时 间序列数据, 预测未来趋
势
大数据与机器学习方法
机器学习:通过大量数据训练模型,预测 未来结果
深度学习:使用多层神经网络,实现更复 杂的学习任务
强化学习:通过与环境交互,不断优化策 略
自然语言处理:处理和分析文本数据,理 解语言含义
图像识别:识别和分析图像数据,提取特 征信息
重复测量设计:对 同一研究对象在不 同时间点进行多次 测量,研究其变化 趋势
调查设计方法
确定研究目的和研究问题
添加标题
确定样本量,考虑研究人群、 研究变量等因素
添加标题
制定数据收集计划,包括时 间、地点、人员等
添加标题
数据整理和分析,包括描述 性统计、推断性统计等
添加标题
添加标题
添加标题
选择合适的研究设计类型, 如横断面研究、病例对照研
YOUR LOGO
20XX.XX.XX
医学统计学完整课件
,
汇报人:
目 录
01 单 击 添 加 目 录 项 标 题
02 医 学 统 计 学 概 述
03 医 学 统 计 学 基 本 概 念
04 医 学 统 计 学 基 本 方 法
05 医 学 统 计 学 中 的 常 用 概 率 分 布
06 医 学 统 计 学 的 数 据 分 析 方 法
t分布的均值和 方差与自由度有 关,自由度越大, t分布越接近正 态分布。
t分布在医学统 计学中常用于检 验小样本情况下 的假设检验,如 t检验。
卡方分布
卡方分布是一种 连续概率分布, 用于描述随机变 量服从卡方分布
的情况。
卡方分布的性质: 对称性、无偏性、 可加性、可乘性、
《医学统计学》PPT课件

提高医学研究的科学性和准确性
02
通过医学统计学的应用,可以对医学数据进行更科学、更准确
的分析和推断,从而提高医学研究的科学性和准确性。
为医学决策提供科学依据
03
医学统计学可以为医学决策提供科学依据,如制定卫生政策、
评价医疗质量等。
医学统计学的研究对象与内容
研究对象
医学统计学的研究对象主要是人体及与 人体健康有关的各种具有不确定性的数 据。
配对设计
将实验对象按照一定条件进行配对,再 随机分配到不同处理组,比较配对组之 间的差异。
随机区组设计
将实验对象按照区组进行划分,每个区 组内再随机分配到不同处理组,比较区 组间的差异。
重复测量设计
对同一实验对象在不同时间或条件下进 行重复测量,比较不同时间或条件下的 差异。
04
医学统计学的应用
临床试验中的统计学应用
样本量不足问题
01
样本量过小,导致结果不稳 定,缺乏代表性;
02
样本量不足,无法检测到真 实的效应或关系;
03
样本量计算不准确,未能充 分考虑变异度和效应大小。
数据处理不当问题
01
数据清洗不彻底,存在异常值、缺失值或重复数据 ;
02
数据转换不合理,导致信息损失或失真;
03
数据分析方法选择不当,未能充分利用数据信息。
VS
研究内容
医学统计学的研究内容包括统计设计、数 据收集、整理、分析、推断以及统计方法 的选择和应用等。其中,统计设计是医学 统计学的基础,数据收集是医学统计学的 前提,数据整理是医学统计学的关键,数 据分析是医学统计学的核心,统计推断是 医学统计学的目的。
02
医学统计学的基本概念
图文《医学统计学》PPT课件

步骤
提出假设、构造检验统计量、确定拒绝域、计算p值、做出决策。
t检验和方差分析
t检验
用于比较两组均数是否有差别,包括单样本t检验、配对样本t检验和独立样本t检验。
方差分析
用于比较多组均数是否有差别,包括单因素方差分析和多因素方差分析。
卡方检验和秩和检验
卡方检验
用于推断两个或多个总体率或构成比之 间有无差别,多用于分类资料的统计分 析。
特点
以医学为背景,以数据为基础, 运用统计学方法揭示医学现象的 数量特征和规律。
发展历程及现状
发展历程
医学统计学经历了从描述性统计到推 断性统计,再到现代多元统计分析的 发展历程。
现状
随着计算机技术的发展和大数据时代 的到来,医学统计学在医学研究和实 践中发挥着越来越重要的作用。
研究对象与任务
研究对象
样本量
样本中所包含的个体数目 。
随机抽样与非随机抽样
随机抽样
按照随机原则从总体中抽取样本的方法,保证每个个体被抽 中的机会相等。
非随机抽样
根据研究者的主观意愿或方便性选择样本的方法,可能导致 选择偏倚。
变量与数据类型
变量
研究中观察或测量的特征或属性。
数据类型
根据变量的性质可分为定量数据和定性数据。定量数据包括连续型数据和离散型 数据,定性数据包括分类数据和顺序数据。
医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务
医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分 析影响医学现象的因素、预测医学现象的发展趋势等。
02
医学统计学基本概念
总体与样本
01
02
03
总体
提出假设、构造检验统计量、确定拒绝域、计算p值、做出决策。
t检验和方差分析
t检验
用于比较两组均数是否有差别,包括单样本t检验、配对样本t检验和独立样本t检验。
方差分析
用于比较多组均数是否有差别,包括单因素方差分析和多因素方差分析。
卡方检验和秩和检验
卡方检验
用于推断两个或多个总体率或构成比之 间有无差别,多用于分类资料的统计分 析。
特点
以医学为背景,以数据为基础, 运用统计学方法揭示医学现象的 数量特征和规律。
发展历程及现状
发展历程
医学统计学经历了从描述性统计到推 断性统计,再到现代多元统计分析的 发展历程。
现状
随着计算机技术的发展和大数据时代 的到来,医学统计学在医学研究和实 践中发挥着越来越重要的作用。
研究对象与任务
研究对象
样本量
样本中所包含的个体数目 。
随机抽样与非随机抽样
随机抽样
按照随机原则从总体中抽取样本的方法,保证每个个体被抽 中的机会相等。
非随机抽样
根据研究者的主观意愿或方便性选择样本的方法,可能导致 选择偏倚。
变量与数据类型
变量
研究中观察或测量的特征或属性。
数据类型
根据变量的性质可分为定量数据和定性数据。定量数据包括连续型数据和离散型 数据,定性数据包括分类数据和顺序数据。
医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务
医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分 析影响医学现象的因素、预测医学现象的发展趋势等。
02
医学统计学基本概念
总体与样本
01
02
03
总体
医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
• 特点:1)不可避免性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
v=2, x2 =5.99
学习交流PPT
8
四格表χ2检验公式
当n≥40,T≥5时
2
(ARC TRC)2 TRC
2aca adbbcc 2dnbd
学习交流PPT
9
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
α=0.05
2. 计算检验统计
2
a
ad bc2 n ca bc d b
d
68116522 137
nC n
自由度=(R-1)x(C-1)
R行数, C列数,
n 是A 所在行的合计学,习交n流PPT是A 所在列的合计
7
x2分布界值
• 自由度一定时,P值越小, x2值越大。 • 当P 值一定时,自由度越大, x2越大。 • v=1时, P=0.05, x2 =3.84
P=0.01, x2 =6.63 • P=0.05时, v=1, x2 =3.84
学习交流PPT
4
• 1.假设两总体率相等,用两样本合并的阳性率
• •
估 23..计 实计算际π,理频即论数mn 1 频与数理:论频数T rc的 差nrnn1值c 服2 从mn1分布
x2
AT2
T
学习交流PPT
5
• χ2值反映了实际频数与理论频数的吻合程度,
如果H0成立,则实际频数与理论频数之差一般
不会很大,若实际频数与理论频数差别很大,
出现大的χ2值的概率P是很小的,P≤α时我们
就怀疑假设成立,因而拒绝假设,若P>α,则
没有理由拒绝它。
学习交流PPT
6
基本公式
2
(ARC TRC)2 TRC
A:表示实际频数,即实际观察到的例数。
T:理论频数,即如果假设检验成立,应该观察到的
例数。
TRC
nR
• 某医生用A、B两种药物治疗急性下呼吸道感染,A 药治疗74例,有效68例, B药治疗63例,有效52例, 结果见表10-1。问两种药的有效率是否有差别?
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理
有效例数
无效例数
合计
有效率(%)
A药
68(64.818)a
6(9.182)b
74 (a+b)
第十章 χ2检验
(chi-square test)
学习交流PPT
1
χ2 检验是一种用途广泛的假设检验方法,本章 只介绍它在分类变量资料中的应用:
推断两个或两个以上总体率或构成比之间有无差 别;
两个分类变量间有无关系;
检验频数分布的拟合优度(实际分布是否服从某 理论分布)。
学习交流PPT
2
例10-1
46 2
2
46
1.69
3016406
2. 3. P>0.05 差异无统计学意义。
学习交流PPT
ห้องสมุดไป่ตู้
13
交叉分类2×2表的关联性分析
• 例10-3 为观察婴儿腹泻是否与喂养方式有关, 某医院儿科随机调查了消化不良儿童82例,对每 个个体分别观察腹泻与否和喂养方式两种属性, 结果如下,分析两种属性的关联性。
学习交流PPT
18
四格表确切概率法
• 该方法是由R.A.Fisher提出的,其理论依据是超 几何分布
• 四格表资料,若有理论数小于1或n<40,或作 χ2检验后所得概率P接近检验水准α,需要用确 切概率法直接计算概率以作判断。实际上,当 有统计软件条件下,大样本四格表的资料也可 用确切概率检验
学习交流PPT
2. 计算检验统计
2
ad bc2 n
a ca bc d b d
302510172 82
9.98
40424735
3. P<0.05 差异有统计学意义。
学习交流PPT
17
列联系数(contingency coefficient)
2 r 2n
0 <r<1
本 例r 15.347 = 0.18 15.347484
学习交流PPT
15
基本思想
所谓两属性X和Y互相独立,是指属性X的概率和 属性Y的概率分布无关,否则称这两种属性之间 存在关联性。即
ij
ricj
(nri )(ncj ) nn
Tij
nij
nrincj n
学习交流PPT
16
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立
α=0.05
喂养方式
腹泻
有
无
合计
人工
30
10
40
母乳
17
25
42
合计
47
35 82
学习交流PPT
14
2×2交叉分类表的一般形式及概率表达
属性X
X1 X2 合计
属性Y
Y1 A11 (π11) A21 (π21) m1(πc1)
Y2 A12 (π12) A22 (π22) m2 (πc2)
合计
n1(πr1) n2(πr2) n(1.0)
• 公式:
2
(ARC TRC)2 TRC
2
n
A2 nRnC
1
自由度=(R-1)x(C-1)
R行数, C列数,
nR是ARC所在行的合计学习,交流nPPTC是ARC所在列的合计
21
例题10-6
• 某医院用3种穴位针刺治疗急性腰扭伤民,数 据如下,试比较3 组总体治愈率有无差别。
91.89
B药 合计
52(55.182)c 120 (a+c)
11(7.818)d
63 (c+d)
17 (b+d)
137 (n=a+b+c+d)
82.54 87.59
学习交流PPT
3
x2检验基本思想
组别
+
-
合计
A
a
B
c
合计
m1
b
n1
d
n2
m2
n
四格表资料可用上表表示,a、b、c、d这四个格子的数据是 基本数据,行之间、列之间的数据相互独立,互不包含。
2.74
746312017
3. P>0.05 差异无统计学意义。
学习交流PPT
10
四格表资料χ2统计量的校正公式
当n≥40,1≤T<5时
2 (AT0.5)2
T
2
adbc
n22
n
acabcdbd
学习交流PPT
11
• 例10-2 两种药物治疗葡萄球菌败血症疗效 的试验结果如下,问两种药物的疗效有无差 异?
19
四格表确切概率法
• 确切概率计算方法的基本思想:在四格表边缘合计 固定不变的条件下,利用公式
ab!cb!ac!bd!
p 直接计算表内四个格子a 数!b 据!c 的!d 各!种组合的概率,然 后计算单侧或双侧累计概率,并与检验水准比较, 作出是否拒绝H0的结论
学习交流PPT
20
行×列表χ2检验
药物
疗效
有效
无效
甲 乙 合计
28(26.09) 12(13.91)
40
2(3.91) 4(2.09)
6
合计
30 16 46
学习交流PPT
12
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
α=0.05
2. 计算检验统计
2
ad
bc
n 2
2
n
a ca bc d b d
28 4 212
学习交流PPT
8
四格表χ2检验公式
当n≥40,T≥5时
2
(ARC TRC)2 TRC
2aca adbbcc 2dnbd
学习交流PPT
9
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
α=0.05
2. 计算检验统计
2
a
ad bc2 n ca bc d b
d
68116522 137
nC n
自由度=(R-1)x(C-1)
R行数, C列数,
n 是A 所在行的合计学,习交n流PPT是A 所在列的合计
7
x2分布界值
• 自由度一定时,P值越小, x2值越大。 • 当P 值一定时,自由度越大, x2越大。 • v=1时, P=0.05, x2 =3.84
P=0.01, x2 =6.63 • P=0.05时, v=1, x2 =3.84
学习交流PPT
4
• 1.假设两总体率相等,用两样本合并的阳性率
• •
估 23..计 实计算际π,理频即论数mn 1 频与数理:论频数T rc的 差nrnn1值c 服2 从mn1分布
x2
AT2
T
学习交流PPT
5
• χ2值反映了实际频数与理论频数的吻合程度,
如果H0成立,则实际频数与理论频数之差一般
不会很大,若实际频数与理论频数差别很大,
出现大的χ2值的概率P是很小的,P≤α时我们
就怀疑假设成立,因而拒绝假设,若P>α,则
没有理由拒绝它。
学习交流PPT
6
基本公式
2
(ARC TRC)2 TRC
A:表示实际频数,即实际观察到的例数。
T:理论频数,即如果假设检验成立,应该观察到的
例数。
TRC
nR
• 某医生用A、B两种药物治疗急性下呼吸道感染,A 药治疗74例,有效68例, B药治疗63例,有效52例, 结果见表10-1。问两种药的有效率是否有差别?
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理
有效例数
无效例数
合计
有效率(%)
A药
68(64.818)a
6(9.182)b
74 (a+b)
第十章 χ2检验
(chi-square test)
学习交流PPT
1
χ2 检验是一种用途广泛的假设检验方法,本章 只介绍它在分类变量资料中的应用:
推断两个或两个以上总体率或构成比之间有无差 别;
两个分类变量间有无关系;
检验频数分布的拟合优度(实际分布是否服从某 理论分布)。
学习交流PPT
2
例10-1
46 2
2
46
1.69
3016406
2. 3. P>0.05 差异无统计学意义。
学习交流PPT
ห้องสมุดไป่ตู้
13
交叉分类2×2表的关联性分析
• 例10-3 为观察婴儿腹泻是否与喂养方式有关, 某医院儿科随机调查了消化不良儿童82例,对每 个个体分别观察腹泻与否和喂养方式两种属性, 结果如下,分析两种属性的关联性。
学习交流PPT
18
四格表确切概率法
• 该方法是由R.A.Fisher提出的,其理论依据是超 几何分布
• 四格表资料,若有理论数小于1或n<40,或作 χ2检验后所得概率P接近检验水准α,需要用确 切概率法直接计算概率以作判断。实际上,当 有统计软件条件下,大样本四格表的资料也可 用确切概率检验
学习交流PPT
2. 计算检验统计
2
ad bc2 n
a ca bc d b d
302510172 82
9.98
40424735
3. P<0.05 差异有统计学意义。
学习交流PPT
17
列联系数(contingency coefficient)
2 r 2n
0 <r<1
本 例r 15.347 = 0.18 15.347484
学习交流PPT
15
基本思想
所谓两属性X和Y互相独立,是指属性X的概率和 属性Y的概率分布无关,否则称这两种属性之间 存在关联性。即
ij
ricj
(nri )(ncj ) nn
Tij
nij
nrincj n
学习交流PPT
16
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立
α=0.05
喂养方式
腹泻
有
无
合计
人工
30
10
40
母乳
17
25
42
合计
47
35 82
学习交流PPT
14
2×2交叉分类表的一般形式及概率表达
属性X
X1 X2 合计
属性Y
Y1 A11 (π11) A21 (π21) m1(πc1)
Y2 A12 (π12) A22 (π22) m2 (πc2)
合计
n1(πr1) n2(πr2) n(1.0)
• 公式:
2
(ARC TRC)2 TRC
2
n
A2 nRnC
1
自由度=(R-1)x(C-1)
R行数, C列数,
nR是ARC所在行的合计学习,交流nPPTC是ARC所在列的合计
21
例题10-6
• 某医院用3种穴位针刺治疗急性腰扭伤民,数 据如下,试比较3 组总体治愈率有无差别。
91.89
B药 合计
52(55.182)c 120 (a+c)
11(7.818)d
63 (c+d)
17 (b+d)
137 (n=a+b+c+d)
82.54 87.59
学习交流PPT
3
x2检验基本思想
组别
+
-
合计
A
a
B
c
合计
m1
b
n1
d
n2
m2
n
四格表资料可用上表表示,a、b、c、d这四个格子的数据是 基本数据,行之间、列之间的数据相互独立,互不包含。
2.74
746312017
3. P>0.05 差异无统计学意义。
学习交流PPT
10
四格表资料χ2统计量的校正公式
当n≥40,1≤T<5时
2 (AT0.5)2
T
2
adbc
n22
n
acabcdbd
学习交流PPT
11
• 例10-2 两种药物治疗葡萄球菌败血症疗效 的试验结果如下,问两种药物的疗效有无差 异?
19
四格表确切概率法
• 确切概率计算方法的基本思想:在四格表边缘合计 固定不变的条件下,利用公式
ab!cb!ac!bd!
p 直接计算表内四个格子a 数!b 据!c 的!d 各!种组合的概率,然 后计算单侧或双侧累计概率,并与检验水准比较, 作出是否拒绝H0的结论
学习交流PPT
20
行×列表χ2检验
药物
疗效
有效
无效
甲 乙 合计
28(26.09) 12(13.91)
40
2(3.91) 4(2.09)
6
合计
30 16 46
学习交流PPT
12
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
α=0.05
2. 计算检验统计
2
ad
bc
n 2
2
n
a ca bc d b d
28 4 212