医学统计学第4讲抽样误差与t分布

合集下载

统计学中的抽样误差分布

统计学中的抽样误差分布

统计学中的抽样误差分布在统计学中,抽样误差是指样本统计量与总体参数之间的差异。

当我们从总体中抽取一个样本,并用样本统计量来估计总体参数时,由于抽取的样本并不是总体的全部,因此存在抽样误差。

抽样误差的分布是统计学中一个重要的概念,它描述了抽样误差的概率分布情况。

本文将介绍统计学中的抽样误差分布。

一、抽样误差的产生原因抽样误差的产生主要有以下几个原因:1. 随机抽样:在统计学中,我们通常采用随机抽样的方法来获取样本。

由于样本是从总体中随机选择的,因此样本与总体之间的差异是不可避免的。

2. 样本大小:样本大小对抽样误差有影响。

样本越大,抽样误差越小;样本越小,抽样误差越大。

3. 总体分布的形状:总体分布的形状也会对抽样误差的分布产生影响。

当总体呈正态分布时,抽样误差往往服从正态分布。

二、抽样误差的分布在统计学中,常见的抽样误差分布有以下几种:1. 正态分布:当总体分布是正态分布,并且样本大小足够大时,根据中心极限定理,样本均值的抽样误差大致服从正态分布。

这也是许多统计推断方法的基础。

2. t分布:在实际应用中,当总体分布未知且样本大小较小的情况下,我们通常使用t分布来描述样本均值的抽样误差。

3. 二项分布:在二项分布中,我们关注的是成功与失败的次数。

当样本来自二项分布总体时,样本比例的抽样误差可以用二项分布来描述。

4. 指数分布:在某些情况下,我们关注的是事件发生的时间间隔。

当事件按照指数分布发生时,我们可以使用指数分布来描述事件发生时间的抽样误差。

三、抽样误差的影响抽样误差的分布对统计推断和决策具有重要影响:1. 置信区间:在统计推断中,我们常常需要给出一个参数的置信区间。

抽样误差的分布决定了置信区间的宽度,即置信水平的精度。

2. 假设检验:在假设检验中,我们常常需要计算p值来判断统计显著性。

抽样误差的分布决定了p值的计算方式。

3. 决策风险:在决策分析中,我们常常需要权衡风险和效益。

抽样误差的分布决定了决策的可靠性和风险程度。

4 第四章 均数的抽样误差与t分布

4 第四章  均数的抽样误差与t分布
数值变量资料的统计推断
统计推断包括两个方面: 统计推断包括两个方面: 参数估计( 1、参数估计(总体均数的可信区 间估计) 间估计) 假设检验(均数的假设检验) 2、假设检验(均数的假设检验) 两样本均数必较( 检验、 ⑴、两样本均数必较(u检验、 检验) t检验) 多样本均数必较( 检验) ⑵、多样本均数必较(F检验)
t分布
(t - distribution) distribution)
从正态总体中随机抽取含量为n 从正态总体中随机抽取含量为n的若 干样本,由样本算得样本均数x 干样本,由样本算得样本均数x,x服从 正态分布, 则称为正态变量。若已知µ 正态分布,x则称为正态变量。若已知µ, 但未知σ 为了应用方便,可用s代替σ 但未知σ,为了应用方便,可用s代替σ, 求得σ 的估计值S 正态变量x 求得σx的估计值Sx,正态变量x可作变量 变换:t=(x变量变成t变量。 变换:t=(x-µ)/Sx, x变量变成t变量。每 个样本x可算得一个t变量, 个样本x可算得一个t变量,所有可能含量 的样本的t值构成t变量总体, 分布。 为n的样本的t值构成t变量总体,即t分布。
可信区间的两个要素
1.准确度 反映在可信度1 1.准确度:反映在可信度1–α的大 准确度: 小上,即区间包含总体均数的概率大小。 小上,即区间包含总体均数的概率大小。 概率越大越准确。 概率越大越准确。 2.精度 反映在可信区间的长度上。 2.精度:反映在可信区间的长度上。 精度: 长度越小越精密。 长度越小越精密。 在 n 确定的情况下,二者是矛盾的。 确定的情况下,二者是矛盾的。 (α ↓, tα.ν ↑) 如提高可信度 ,则区间变 在可信度确定的情况下, 长。在可信度确定的情况下,增加样本 减小区间长度, 例数 (SX ↓, tα,减小区间长度,提高 ↓) .ν 精度。 精度。

医学统计学课件:抽样误差

医学统计学课件:抽样误差

9
.15
樣本均數服從正態分佈
.1
.05
0
正態總體分佈
80.0
90.0
100.0 Sample Mean
110.0
120.0
從N(100,62)中隨機抽樣,樣本含量為4的 1000個樣本均數的頻數分佈圖
10
Sampling distribution for means
n=2 n=4
X Population A
24
t分佈的性質
t分佈為一簇單峰分佈曲線。 t分佈以0為中心,左右對稱。
t分佈與自由度v有關,自由度越小,t分佈的峰越
低,而兩側尾部翹得越高;自由度逐漸增大時,t 分佈逐漸逼近標準正態分佈;當自由度為無窮大 時,t分佈就是標準正態分佈。 每一自由度下的t分佈曲線都有其自身分佈規律。t 界值表 。
標準誤的大小與標準差有關,在例數n一定時,從 標準差大的總體中抽樣,標準誤較大;而當總體 一定時,樣本例數越多,標準誤越小。說明我們 可以通過增加樣本含量來減少抽樣誤差的大小。
17
抽樣誤差的規律性(1)
• 均數的抽樣誤差規律:
– 在樣本含量足夠大時,無論總體分佈如何,其 均數的分佈趨於正態分布(大數定律)
– 抽樣誤差是不可避免的! – 抽樣誤差是有規律的!
5
模擬試驗
• 假設一個已知總體,從該總體中抽樣,對 每個樣本計算樣本統計量(均數、方差等), 觀察樣本統計量的分佈規律--抽樣分佈 規律。
• 考察:
– 不同的分佈 – 不同的樣本含量
對統計量的影響。
6
均數的模擬試驗
• 從不同總體中進行抽樣,觀察均數的抽樣分佈規 律。 – 正態總體 – 偏三角分佈總體 – 均勻分佈總體 – 指數分佈總體 – 雙峰分佈總體

抽样误差和假设检验t检验PPT讲稿

抽样误差和假设检验t检验PPT讲稿

样本均数的标准差,也称为标准误 ,反映了样本均数间的离散程度, 也反映了样本均数与总体均数的差 异。
例4.1 某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差 6.85cm,计算标准误。
sx
s 6.85 0.685(cm) n 100
当前你正在浏览到的事第五页PPTT,共六十七页。
p(t / 2( )
x
sx
t / 2( ) )
1
• 对上式进行变换,得置信度为1-α的总体均数可信区间
的通式为:
x t / 2( ) sx x t / 2( ) sx
• 习惯将上式写成:
(x t /2( ) sx , x t /2( ) sx )
当前你正在浏览到的事第二十页PPTT,共六十七页。
(3) 越小,则
越大,t值越分散,和N(0, 1)
s 相比,集中在这部分的比例越少,尾部翘得越
高。
x
当前你正在浏览到的事第十页PPTT,共六十七页。
第四章 抽样误差与假设检验
当前你正在浏览到的事第十一页PPTT,共六十七页。
第四章 抽样误差与假设检验
t 分布(与u 分布 比较的特点)
当前你正在浏览到的事第十二页PPTT,共六十七页。
• 反证法:当一件事情的发生只有两种可能A和B,为
了肯定其中的一种情况A,但又不能直接证实A,这 时否定另一种可能B,则间接的肯定了A。
• 小概率事件原理: 小概率事件在一次抽样中不可能发生.
• 概率论:事件的发生不是绝对的,只是可能性大小而已。
即,带有风险性的推断.
当前你正在浏览到的事第三十二页PPTT,共六十七页。
一、点估计
第四章 抽样误差与假设检验

抽样误差及t检验PPT课件

抽样误差及t检验PPT课件

如样本均数的标准差称为均数的标准误, x
n
均数的标准误表示样本均数的变异度
当总体标准差未知时,用样本方差代替,s x 前者称为理论标准误,后者称为样本标准误
s n
因为标准差S随着样本含量的增加而趋于稳定,故增 加样本含量可以降低抽样误差。
-
7
• n 越大,均数的均数就越接近总体均数;
• n 越大,变异越小,分布越窄;
区间。
3、与样本含量
• 标准差是随着样本含量- 的增多,逐渐趋于稳定。 9 • 标准误是随着样本含量的增多,逐渐减少。
与标准差的关系
• 首先,标准差和标准误都是变异指标,说明个 体之间的变异用标准差,说明统计量之间的变
联 异用标准误。
• 其次,当样本含量不变时,标准差大,标准误
系 亦越大,均数的标准误与标准差成正比。
抽样误差及t检验
盛法林,华海峰
-
1
抽样误差的概念
• 抽样研究的过程中,样本统计量与总体参数间的差异称为抽样误差。
这在抽样研究中是不可避免的。

抽样误差的表现形式:
• 异
1)总体参数与样本统计量之间的差异;如μ与 X 之间的差
• 差异
2)样本统计量与样本统计量之间的差异;如X 与X 之间的
-
2
• 理论上,如果进行n次抽样,可能会得到n 个各个不相同的样本统计量。如果我们的 抽样方法一致的话则n多个统计量之间存在 着规律可循。
-
5
均数的抽样误差及标准误
• 各样本均数未必等于总体均数; • 样本均数间存在差异;
• X 的分布很有规律,围绕着,中间多,两边少,
左右基本对称; • 样本均数的变异范围较之原变量的变异范围大大

医学统计学PPT(南医大)04-2-t分布课件

医学统计学PPT(南医大)04-2-t分布课件

-t
0
t
[例] 查t界值表得t值表达式
t 0.05/2,10 =2.228 (双侧)
t 0.05,10 =1.812 (单侧)
7
t分布 t界值释义 ★★
双侧t 0.05, 10=2.228 表明: 从正态分布总体中抽取样本含量n=11的样本,则由该样本计算的t值 大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025
6
0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
-t
0
t
8
0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
t 分布
统计推断 (statistical inference)
统计推断:从总体中随机抽取一定含量的样本进行研究,通过样 ★★★ 本的信息判断总体的特征。
参数估计 (parameter estimation)
假设检验 (hypothesis test)
抽样误差的分 布规律为基础
1
t分布的演化 ★★
9
0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11
0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437

标准误、t 分布

标准误、t 分布

教 学 内 容 标准误 t分布
二、 t 分布: 三)、应用: 2、t 检验: 2)、配对计量资料的比较: t = ( d-0)/Sd v=n-1
例: 某药对Hb的影响研究结果 病人编号 治疗前 治疗后 差数 d 1 140 113 27 2 138 150 -12
3 140 150 … … .. 10 120 123 问:某药对Hb有无影响? -10 … -3
t = (X1-X2)/SX1-X2
P = 95% f
-t0.05,v -t0.01,v
0
t0.05,v tt0 Nhomakorabea01,v
(-t0.05,v , t0.05,v) 有 95%的 t 值,P=95%=0.95 (-t0.01,v , t0.01,v) 有 99%的 t 值,P=99%=0.99
P > 0.1
教 学 内 容 标准误 t分布
P 值含义与两类错误:
P 值含义:由H0所规定的总体做随机抽样,获得等于及大
于(或等于及小于)依据现有样本信息所计算得到的检验统 计量的概率。 I类错误:H0正确,但由于抽样的偶然性得到 t>=tα , P<=α 的检验结果,拒绝了H0 (即“弃真”) ,接受了H1, 这种错误称I类错误(“弃真”错误),其概率大小为α ; II类错误:H0不正确,但由于抽样的偶然性得到 t<tα , P>α 的检验结果,接受了H0 (即“存伪”) ,拒绝了H1, 这种错误称I类错误(“弃真”错误),其概率大小为 。

教 学 内 容 标准误 t分布
教 学 内 容
一、样本均数的标准误:样本均数的标准差。其大小与标 准差成正比,与样本含量n的算术平方根成反比。 σ X =σ /n1/2 或 SX = S/n1/2

医学统计学第4讲抽样误差与t分布

医学统计学第4讲抽样误差与t分布

•不同男童 的身高不同
•每次抽到 的人几乎不

•个体变异
•随机抽样
•抽样误差

•【定义】由于个体变异的存在,在抽 样研究中产生样本统计量和总体参数 之间的差异,称为抽样误差( sampling error)。
•各种参数估计都有抽样误差,这里我们以 均数为研究对象

抽样误差产生的条件
• 抽样研究 • 个体变异
•标准误的大小与标准差有关,在例数n一定时,从 标准差大的总体中抽样,标准误较大;而当总体一 定时,样本例数越多,标准误越小。说明我们可以 通过增加样本含量来减少抽样误差的大小。

•用途:
•(1)衡量样本均值的可靠性 •(2)估计总体均值的可信区间 •(3)用于均数的假设检验

•随机变量X
•N(,s2
•u变
) •均数

•t变换
•标准正态分 布
•N(0,12)
•标准正态分 布
••NS(tu0d,en1t2)t分

•自由度ν=n-1

•由W.S. Gosset提出


•x-
t=
•s/
n
•对于不同的n,有不同的t分布曲线。

•自由度分别为1、5、 ∞时的 t 分布
• f(t)
•0.3
• =∞(标准正态曲线) • =5 • =1
• 按上述方法再做样本含量n=10、样本 含量n=30的抽样实验;比较计算结果。

抽样试验(n=5)

抽样试验(n=10)

抽样试验(n=30)

1000份样本抽样计算结果
总体的 总体标 均数的 均数 准差s 均数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

200
200
频数 频数
250
250
n10;SX0.1580
400 350 300
n5;SX 0.2212
400 350 300
450
450
3个抽样实验结果图示
非正态分布抽样
• 分别从各总体中抽取10000个样本含量为 n的样本,计算每个样本的均数,并绘制 频数分布图。
• n分别取2、4、10、25。
• 随着样本含量的增加,样本均数的离散程度 越来越小,表现为样本均数的分布范围越来 越窄,其高峰越来越尖。
医学课件ppt
24
中心极限定理
从正态总体中随机抽取例数为n的样本,样 本均数x也服从正态分布,即使从偏态总体 中抽样,只要样本例数足够大,如n>50, 样本均数x也近似正态分布。
从均数为 ,标准差为的正态总体中随机
医学课件ppt
27
x 标准误 x = / n sx = s / n
n100,4.38cm
x
4.380.438cm
n 100
医学课件ppt
28
标准误的意义
反映了样本统计量(样本均数,样本率)分布的 离散程度,体现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数,样本率) 的离散程度越大,即用样本统计量来直接估计总体 参数越不可靠。反之亦然。
医学课件ppt
19
偏三角分布抽样
医学课件ppt
20
均匀分布
医学课件ppt
21
指数分布
医学课件ppt
22
双峰分布
医学课件ppt
23
• 从正态总体中随机抽样,其样本均数服从正 态分布;
• 从任意总体中随机抽样,当样本含量足够大 时,其样本均数的分布逐渐逼近正态分布;
• 样本均数之均数的位置始终在总体均数的附 近;
第三章 抽样误差与t分布
医学课件ppt
1
统计推断
总体
抽取部分观察单位
样本
参数
统计推断
统计量
如:总体均数
总体标准差
如:样本均数 X 样本标准差S
医学课件ppt
2
在医疗卫生实践和医学研究中,往往难以对所要 研究的总体进行全部观察,通常从总体中随机抽 取样本进行观察,然后由样本的信息去推断总体 特征,这种研究方法叫做抽样研究方法。
抽取例数为n的样本,样本均数的总体均数
为 ,标准差为x
医学课件ppt
25
中心极限定理
医学课件ppt
26
标准误的定义
样本统计量(如均数)也服从一定的分布。
与描述观测值离散趋势的指标类似,样本统 计量的标准差就反映了从某个总体中随机抽 样所得样本之均数分布的离散程度。
用样本统计量的标准差来反映抽样误差的大 小。又称标准误(standard error)。
用样本的信息去推断总体特征,这种分析方法称 为统计推断。
基本手段
直接推断(参数估计) 间接推断(假设检验)
医学课件ppt
3
总体参数的估计
• 均数的抽样误差 • t分布 • 总体均数的估计
医学课件ppt
4
抽样误差的定义
• 假如事先知道某地七岁男童的平均身高为119.41cm。为了 估计七岁男童的平均身高(总体均数),研究者从所有符 合要求的七岁男童中每次抽取100人,共计抽取了三次。
医学课件ppt
13
抽样试验(n=5)
医学课件ppt
14
抽样试验(n=10)
医学课件ppt
15
抽样试验(n=30)
医学课件ppt
16
1000份样本抽样计算结果
总体的 总体标 均数的 均数 准差 均数
n=5 5.00 0.50 4.99
n=10 5.00 0.50 5.00 n=30 5.00 0.50 5.00
各种参数估计都有抽样误差,这里我们以均 数为研究对象
医学课件ppt
10
抽样误医学课件ppt
11



误 差


样本均数和 总体均数间 的差别 X i
样本均数和 样本均数间 的差别 X i X j
抽样误差是不可避免的,可以通过保证总体 的同质性及增大样本含量来缩小抽样误差。
医学课件ppt
12
抽样误差的规律 性—正态分布抽样
从正态分布总体N(5.00,0.502)中,每 次随机抽取样本含量n=5,并计算其均数与标
准差;重复抽取1000次,获得1000份样本;计 算1000份样本的均数与标准差,并对1000份样 本的均数作直方图。
按上述方法再做样本含量n=10、样本含 量n=30的抽样实验;比较计算结果。
均数标准差
Sn
0.2212 0.1580 0.0920
n
0.2236 0.1581 0.0913
医学课件ppt
17
n30;SX0.0920
18
均数
450 400 350 300 250 200 150 100 50
0
医学课件ppt
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
均数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
0
0
50
50
100
100
150
150
μ=119.41cm σ= 4.38cm
X 118.21cm s=4.45cm
X 120.81cm s=4.33cm医学课件ppt
X 120.18cm s=4.90cm
5
三次抽样得到了不同的结果!!!! 原因何在????
医学课件ppt
6
No Variation! No Sampling Error!
标准误的大小与标准差有关,在例数n一定时,从 标准差大的总体中抽样,标准误较大;而当总体一 定时,样本例数越多,标准误越小。说明我们可以 通过增加样本含量来减少抽样误差的大小。
医学课件ppt
29
用途:
(1)衡量样本均值的可靠性 (2)估计总体均值的可信区间 (3)用于均数的假设检验
如果没有个体变异……
医学课件ppt
7
如果没有抽样研究……
No Random sampling! No Sampling Error!
医学课件ppt
8
• 三次抽样得到了不同的结果,原因何在?
不同男童的 身高不同
每次抽到的 人几乎不同
个体变异
随机抽样
抽样误差
医学课件ppt
9
【定义】由于个体变异的存在,在抽 样研究中产生样本统计量和总体参数 之间的差异,称为抽样误差 (sampling error)。
相关文档
最新文档