医学统计学 第四讲 计量资料的统计推断-抽样误差及t分布(1学时)
计量资料的统计推断专题培训(ppt 41页)

▲ 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。
已知: (1) 一个总体均数:3.20kg ; (2) 一个样本均数:3.42kg ; (3) 可计算出样本标准误:3.42/ 5 (4) n =25 < 100;
第一节
复习两个概念: ▲ 正态分布 ▲ 标准正态分布
u(z) 分布
z X X S
t 分布
对X进行标准正态转化以后:
X
x
Байду номын сангаасX
sx
Z~N(0, 1 ); ~t
t 分布的主要内容:
t 分布的概念:小样本的概率分布 t 分布图形: t 分布面积特征( t界值表):
t 分布(与u 分布 比较的特点)
已知: (1) 一个样本: 均数491.4, 标准差138.5 (mg/100ml); (2) 另一个样本:均数672.3, 标准差150.7 (mg/100ml); (2) n1=25; n2=23 (3) 近似正态分布:138.5 ×2 < 491.4; 150.7 × 2 < 672.3 (4) 方差齐:25/23 < 2
意义
第三节 均数的 t 检验
一、小样本均数与已知总体均数比较的t 检验 二、 两个小样本均数比较的t 检验 三、配对资料的t 检验
例题:请选用合适的统计学方法进行分析
例1.已知某地婴儿的出生体重均数为3.20kg,一个产科 医生随机调查25名难产儿,其平均体重为3.42kg,问??
例2.某内科医生随机测量了25名健康人血中ß脂旦白含 量,均数为491.4 mg/100ml,标准差为138.5 mg/100ml; 同时测量23名心肌梗塞病人血中ß 脂旦白含量,均数为 672.3 mg/100ml,标准差为150.7 mg/100ml;问??
(医学课件)医学统计学计量资料的统计推断

2023-11-05
目录
• 引言 • 计量资料数据的描述和分析 • 参数估计与假设检验 • 方差分析及其拓展技术 • 非参数统计推断方法 • 回归分析及其拓展技术 • 临床实践中的统计应用实例
01
引言
概念与定义
医学统计学
是运用数理统计学的原理和方法,在医学领域中进行数据资料的 收集、整理、分析和推断的一门学科。
适用于存在拉丁方设计的实验设计。
05
非参数统计推断方法
符号检验
符号检验
适用于配对资料和两个独立样本资料,通过计 算正号和负号的数目来检验差异是否显著。
适用条件
当理论分布或样本分布未知,或无法从理论分 布推导出适当的统计量时使用。
优缺点
计算简单,适用于小样本数据,但不适用于大样本数据。
秩和检验
秩和检验
频数分布
对收集到的数据进行频数分布分析,统计 各数据值的出现次数和频率。
集中趋势
通过平均数、中位数等指标,反映数据的 集中趋势。
离散程度
通过标准差、四分位数间距等指标,反映 数据的离散程度。
偏态和峰态
通过偏度系数和峰度系数等指标,反映数 据的偏态和峰态。
数据的质量控制
数据清洗
对采集到的数据进行预处理,去除无效、错误或重 复的数据。
确定研究目的和研究对象
在收集数据前,需明确研究目的和研究对象 ,以便确定所需收集的数据类型和范围。
设计调查方案
根据研究目的和研究对象,制定合适的调查方案, 包括调查方法、问卷设计、样本量等。
数据采集
根据调查方案,采取合适的方式和方法采集 数据,包括线上和线下的问卷调查、临床观 察、实验室检测等。
计量资料的统计推断

的代表程度。
用于估计总体均数的可信区间;
用于假设检验。
减少SE的途径
克服系统误差和减少随机误差;
增大样本含量。
2020/10/6
第四章与第五章 统计推断
9
一 标准误
下一页
7 标准差SD与标准误SE的区别
离散指标,用于说明变异程度的大小。
意义上:
S 描述变量 X 的变异程度,说明变量值分布; SX 描述 X 的变异程度,说明 X 分布情况。
作用上:
S 描述 X 对 X 的代表性,说明 X 对的代表程度; SX 描述 X 对的代表性,说明 X 代表的可靠性。
应用上:
S 用于参考值范围的估计。
当总体标准差未知时,用 S 估计,得样本均数
标准误的估计值 SE s s
X
n
例 4.1
SE SX
S n
0.38 0.032(估 计 值) 140
2020/10/6
第四章与第五章 统计推断
8
一 标准误
下一页
6 SE的应用及减少的途径
抽样误差的大小,样本均数变异度,说明样
本均数估计总体均数的可靠性;
样本均数标准误
越小,说明样本均数与总体均数的差异程度越小, 用该样本均数估计总体均数越可靠。
越大,样本均数的抽样误差就越大。
2020/10/6
第四章与第五章 统计推断
7
一 标准误
下一页
5 标准误SE
若 X~N(,2),则 X 也服从正态分布,即
X
~
N(, X 2)
N(, 2
n
)
/ n 为样本均数标准差(标准误)。
医学统计学抽样误差与统计推断

盾,则拒绝H0 ,接受H1;否则(即实际 结果与理论假设H0不矛盾) ,接受H0 (严格 讲应是“尚不能拒绝H0 ”)
(二)Ⅰ类错误与Ⅱ类错误
Ⅰ类错误: H0本质上是成立的,但下结 论时却拒绝了H0 ,即“弃真” 的错误,概率水平为 。
Ⅱ类错误: H0本质上是不成立的,但下
结论时却接受了H0 ,即“取 伪”的错误,概率水平为。
则SS误差
SS总= SS干预+ SS误差
二、方差分析的基本原理
1.完全随机设计 的方差分析
SS总= SS组间+ SS误差 不考虑混杂因素的 作用,即干预措施 仅为试验因素(如 药物)
完全随机设计
完全随机设计方差分析的数据格式
组别编号
12
3
…
X11 X 21
X 31
…
X 12 X 22
X 32
…
估计总体(参数)?
一致问题(检验统计量t值)
X
抽样误差 S X
影响
消除影响
本质差异
t|X |
SX
估计问题(解下面的不等式)
|
X SX
|
t
总体均数的 (1-a)可信区间
X t S X
假设检验
(一)检验的基本原理及步骤
1.建立无效假设 H0:… 无… H1:…有…
2.选择判别水平 (=0.05或0.01) 3.计算检验统计量:评价H0是否成立? 4.作出判别结论:实际结果与理论假设H0
正交、交叉、拉丁方、析因设计等
一、方差分析的基本思想
总体
?
1 2 ……k
k个样本是否 来自同一总体?
k个样本是否来自同一总体?
是
否
(医学课件)医学统计学-计量资料的统计推断

样本含量的计算
依据检验效能和检验水准的设计
样本含量计算是依据特定的检验效能和检验水准来进行计算的。
依据样本均数标准误和两样本均数差的标准
样本含量计算需要依据样本均数的标准误以及两样本均数差的标准,来推算出样 本含量。
检验效能的概念与计算
Байду номын сангаас
检验效能的概念
检验效能是指当拒绝一个无效假设时,犯第二类错误的概率 ,也就是说检验效能是衡量错误拒绝一个有效假设的指标。
检验效能的计算
检验效能可以通过计算来得出,一般是通过计算出无效假设 下犯第二类错误的概率来得出检验效能。
提高检验效能的方法
提高样本含量
增加样本含量可以提高检验效能,因为样本含量的增加可以减少随机误差,从而降低无效 假设犯第二类错误的概率。
提高检验水准
提高检验水准也可以提高检验效能,因为当检验水准提高时,临界区域会缩小,从而可以 减少无效假设被拒绝的概率。
要点二
数据管理(Data Manage…
可以对数据进行整理、编辑、分类和 计算,支持多种数据格式,包括Excel 、Access、文本文件等。
要点三
高级统计( Advanced St…
可以进行复杂的数据分析,如结构方 程模型、多因素方差分析、重复测量 等。
06
医学研究中统计方法的合理选择与应 用
研究设计对统计方法选择的影响
医学统计学-计量资料的统计推断
xx年xx月xx日
目录
• 引言 • 参数估计 • 假设检验 • 样本含量与检验效能 • 常用的统计软件及其在医学中的应用 • 医学研究中统计方法的合理选择与应用
01
引言
课程背景
医学科学研究的复杂性
(医学课件)医学统计学-计量资料的统计推断

用于比较多个组间的均值是否存在显著差异,以及判断因素对因变量的影响是否显著。
方差分析的应用
数据独立、数据正态分布、各组方差齐性。
方差分析的假设
05
线性回归分析
03
线性回归模型的适用条件
满足线性关系、误差项独立同分布、误差项无序列相关、满足正态性和同方差性等假设。
线性回归模型
01
引言
临床试验设计和数据分析流行病学调查和疾病预防医学图像分析和诊断临床决策和循证医学
对样本数据的分布特征进行描述和解释利用样本信息对总体特征进行估计和推断通过数据分析和模型预测,为医学研究和临床实践提供科学依据
课程背景
统计学在医学中的应用
计量资料统计推断的目的和重要性
02
描述性统计
数值数据
用于描述定量特征,包括连续型和离散型两种。
数据处理和分析的医学应用
介绍了医学统计学未来的发展趋势和研究方向,包括生物信息学、遗传统计学、多变量统计方法等。
医学统计学的未来发展
选择正确的统计方法
实际应用中需要注意的问题
数据的预处理
假设检验的解读
临床意义的解释
生物信息学的应用
随着生物信息学的快速发展,医学统计学在基因组学、蛋白质组学、代谢组学等领域的应用将更加广泛。
2023
医学课件:医学统计学-计量资料的统计推断
CATALOGUE
目录
引言描述性统计参数估计假设检验线性回归分析多因素分析临床医学中的统计应用讨论与总结
01
引言
医学统计学是医学科研和临床实践中的重要工具医学研究中产生大量的计量资料,需要对这些数据进行统计分析医学统计学在预防、诊断和治疗方面有着广泛的应用
医学统计学计量资料的统计推断

医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。
由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。
一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。
2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。
标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。
当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。
医学统计学-计量资料的统计推断

假设检验的基本原理
零假设(H0)
假设总体参数等于某一特定值,如总体均数等于某一数值。
对立假设(H1)
与零假设相对立的假设,如总体均数不等于某一数值。
统计意义
根据样本数据计算出统计量,并依据零假设的分布规律,得出P值,判断是否拒绝零假设 。
t检验
01
单样本t检验
比较样本均数与已知的参考值或正常值。
况的分布情况。
队列调查
02
根据是否暴露于某因素或暴露程度,将研究对象分为不同队列
,以评估因素与结局的关系。
病例对照调查
03
通过选取病例和对照,比较两组之间暴露因素的差异,以评估
因素与结局的关系。
临床试验设计
01
随机对照试验
将研究对象随机分为试验组和对照组 ,给予不同干预措施,以评估干预措 施的有效性和安全性。
02
双样本t检验
比较两组独立样本的均数是否相等。
03
配对t检验
比较两组配对样本的均数是否相等。
方差分析
方差分析的基本思想
将数据的变异分解为组间变异和组内变异,并计算各组 对总变异的贡献率。
方差分析的应用
用于比较多个处理组与一个对照组之间的差异,以及比 较多个处理组之间的差异。
04
回归分析
线性回归分析
性和安全性
比如公共卫生监测中,通过对群体健康指标 的统计分析,可以评估公共卫生干预措施的
效果和评价健康政策的效果
医学研究中计量资料统计推断的应用范围广 泛
比如流行病学研究中,通过对群体暴露和疾 病发生之间的计量资料统计分析,可以探讨 病因和疾病预防措施
02
计量资料的描述性统计
均值和标准差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体标准差
总体率
一、均数的抽样误差
总体
参 数
抽取部分观察单位
抽样误差
样本
统计推断 如:总体均数µ 如:样本均数X
总体标准差σ 总体率π 样本标准差S 样本率 P
统计量
(sampling error) :由 于个体差异导 致的样本统计 量之间以及统 计量与总体参 数间的差别。
4
从偏态分布总体中抽 样,n足够大时,样 本均数也服从正态分 布
说错的概率是5%。
5%是小概率事件,所以在实际应用中就认为
总体均数在算得的可信区间。
(2)t 分布法
应用条件: σ未知,且n较小(n≤100)时.
根据t分布的特点可知,95%的t值分布在
± t0.05/2,ν之间,即:-t0.05/2, ν ≤t≤ t0.05/2, ν
x - t 0.05/2, sx ≤ μ ≤ x + t 0.05/2, sx
(124.0±1.96×0.33)= (123.4, 124.6) 即:该地7岁男孩平均身高的95%可信区间为 (123.4cm , 124.6cm)
21
意义:
虽然不能知道某市全体7岁男孩身高均数的
确切数值,但有95%的把握说该市全体7岁男孩身
高均数在123.4 ~ 124.6cm之间,。 换句话说,做出该市全体7岁男孩身高均数在 123.4 ~ 124.6cm之间的结论,说对的概率是95%,
p= 0.05(双侧)
-t
t(0.05/2,ν)
相同自由度下 t 值越大,对应的尾侧 面积越小,即p值越小,反之亦然。
13
●
t 分布的应用 1、估计总体均数的可信区间; 2、作 t 检验。
三 总体均数的估计
统计推断的任务就是用样本信息推论总体特征。参数估 计是任务之一。用样本均数估计总体均数(参数)有两 种方法。 点估计:由样本统计量 X、S、p 参数的估计 区间估计:在一定可信度下,同 时考虑抽样误差
8
标准正态变量变换
随机变量X
u X m
N(m,2)
u变换
标准正态分布
N(0,12)
均数 X
N ( m , n)
2
X m u n
标准正态分布
u变换
N(0,12)
9
二、t分布
均数 X
N ( m , n)
2
X m u n
标准正态分布
u变换
N(0,12)
Student t分布 自由度:n-1
187.11 ±2.045 ×42.32/(29)1/2=(171.04, 203.18)
24
区别点 含 义
总体均数可信区间
参考值范围
按预先给定的概率,确定未知参数m 的可能范围。实际上一 “正常人”的解剖,生理, 次抽样算得的可信区间要么包含了总体均数,要么不包含。 生化某项指标的波动范围。 但可以说:当=0.05 时,95%CI 估计正确的概率为 0.95,估 计错误的概率小于或等于 0.05,即有 95%的可能性包含了总 体均数。 计算 公式 用途 总体均数的波动范围 未知: X t , S X * 个体值的波动范围 正态分布: X u S 偏态分布:PX~P100X 绝大多数(如 95%)观察对象 某项指标的分布范围
n
x1 x2
n
N(μ,σ2)
n n
. . .
中心极限定理:
n
μ x x σ x .
3 4
. .
xn
①样本均数服从正态分布;②样本均数的均数等于总体均数,样 5 本均数的标准差就是标准误。
●(均数)标准误的
●
计算
X n
理论值
sx
估计值
s n
●
影响因素:σ 一定时,n↑,标准误↓
6
●标准误的意义:反映抽样误差的大小。标准误越
15
直接作为总体参数估计值 m、、
总体均数的区间估计(interval estimation)
▲ 概念:根据样本均数,按一定的可信度(概率,1-
а)估计总体均数可能所在的一个数值范围,称为
总体均数的可信区间(confidence interval, CI)。
▲ 习惯上用总体均数的95%(或99%)可信区间,表示
①σ已知 ② σ未知但n足够大
18
u分布法估计总体均数可信区间
① 已知,总体均数95%的可信区间为:
X 1.96
X
≤ 1.96
根据样本均数服从u分布,95%的样本均数u值在 ±1.96之间,即 x -μ
- 1.96 ≤
σx
x - 1.96σ x ≤μ ≤x + 1.96σ x
19
u分布法估计总体均数可信区间
23
例题 随机抽查某地30名40~44岁哈萨克族成年男性 的骨密度,测得其骨密度均数为187.11mg/cm2 标准差为42.32mg/cm2, 试估计骨密度总体均 数的95%可信区间。 n=30, ν=n-1=29 查表 t(0.05/2, 29)=2.045
代入公式:X±t(а/2 ,ν) ×Sx , 即:
该区间包 含总体均数m的概率为95%(或99%),用此 范围估计总体平均数,表示100次抽样中,有 95(99) 次包含总体均数。
16
总体均数的区间估计(interval estimation)
▲ 方法:根据已知条件不同,采用不同
的方法:
(1) u 分布法 (2) t 分布法
17
(1)u分布法
应用条件:
② 未知,但样本例数n足够大(n>100), 总体均数95%的可信区间可近似地表达为:
X 1.96 S X20 Nhomakorabea例题 已知抽样调查某市7岁男童200名,平均身高 为124.0cm, 标准误为0.33cm,试估计该市7岁 男孩身高总体均数的95%可信区间。 (x1.96· s x ,x1.96 · s x)即
小,抽样误差越小,用样本均数估计总体均数的可
靠性越大。
例题:随机抽取某市200名7岁男孩,其 身高均数为124.0cm,标准差为4.6cm, 试估计其抽样误差.
S 4.6 SX 0.33cm n 120
7
●标准误的作用
1、反映抽样误差的大小,说明样本 均数的可靠性。通常用 x s x表示。 2、利用标准误作总体均的区间估计。 3、用标准误作假设检验。
第一节
抽样误差和总体均数估计
2
统计推断 statistical inference
内容:
样本
总体
参 数
如:总体均数
抽取部分观察单位
统计推断
统计量
1. 参数估计 (estimation of parameters) 包括:点估计与 区间估计
2. 假设检验(test of hypothesis)
3
如:样本均数 样本标准差S 样本率 P
**
已知或未知但 n>100: X u X 或 X u S X **
总体均数的区间估计
* t , 也可用 t / 2, (对应于双尾概率时) ** u , 也可用 u / 2, (对应于双尾概率时)
25
③ u分布是t分布的特殊形式。
11
t 分布的图形(u分布是t分布的特殊形式)
t分布不是一条曲线,而是一簇曲线,自由度一定时,t 分布曲线下面积分布有一定规律。为便于使用,可根 据t值表查找。
12
t 界值表(p262 附表2
)
横坐标:自由度υ 纵坐标:概率p,即曲线下尾侧阴影部分的面积; 表中 的数字:相应的 |t | 界值。
X m X m t , v n 1 SX S n
这时,对正态变量 X采取的不是 u 变换而是 t 变换了, t 值的分布为t分布。也称为student 分布。 10
t 分布的图形(u分布是t分布的特殊形式)
t 分布特征: ①以纵轴为对称轴的单峰曲线 ②t分布为一簇曲线,其形态与自由度有关。