定量资料的统计推断分析

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

t分布曲线下面积（附表2）
双侧t0.05，9＝2.262 ＝单侧t0.025，9
单侧t0.05，9＝1.833 双侧t0.01，9＝3.250
＝单侧t0.005，9 单侧t0.01，9＝2.821 双侧t0.05，∞＝1.96
＝单侧t0.025，∞ 单侧t0.05，∞ ＝1.64
万州疾控中心陈春蓉
统计推断：用样本信息来推断相应总体的特征，这一过程称为统计推断。统计推断包括两方面的内容：参数估计和假设检验
参数？
（、、）
随机抽样
总体
（一锅）
样本
（一勺）
统计推断
参数估计假设检验
统计量
（X、s、p）
2
参数估计的概念
参数估计是统计推断中的一个重要内容。在实际工作中，总体参数常是未知的或不可能对总体进行研究，故需要用样本指标（统计量）推断总体指标（参数），如用样本均数 X 估计总体均数等。
x
t ,v
s x
复习两个概念： ▲ 正态分布 ▲ 标准正态分布
N (0,1)
u x
14
样本均数的分布
样本均数
X
的分布服从正态分布N
(μ，
2 X
)
，按照标准
正态分布变换方法，也可变换成标准正态分布N(0，1)：
X X
~N（0， 1 ）;
由于总体标准差σ往往未知或样本含量n较小（n≤50）
时，常用样本标准差s作为σ的估计值，则此时称为对变量采用t变换，t变换后样本均数服从ν=n-1的t分布:
抽样误差在抽样研究中是不可避免的。但有一定的规律可循，我们可以用特定的指标来描述抽样误差的大小。
❖样本均数的分布特点：
1.各样本均数未必等于总体均数； 2.样本均数之间也不一定相等； 3.样本均数的分布很有规律，围绕着总体均数，中间多，两边少，左右基本对称，也服从正态分布。
标准误的概念
标准误：为了与反映观察值离散程度的标准差相区别，统计学上把样本均数的标准差称为均数的标准误，简称为标准误，统计符号 X，标准误的估计值符号 SX , 其值越大就说明样本均数的离散程度越大，也就是样本均数与总体均数间的抽样误差越大，反之，抽样误差越小。
t
t 分布有如下性质：
自由度为1的t分布自由度为9的t分布标准正态分布
①单峰分布，曲线在t＝0 处最高，并以t＝0为中心
左右对称
②与正态分布相比，曲线最高处较矮，两尾部翘得高（见绿线）
③ 随自由度增大，曲线逐渐接近正态分布；分布的 2 3 4 极限为标准正态分布。
t 分布的特征
通过以上学习，t分布是由标准正态分布派生出来的，其形态变化与自由度v的大小有关，因此t值的符号是 t ,v 。自由度v=n-1。当v和α确定时，可查t界值表（附录3p327）,表中数字表示对应的t界值。
标准差与标准误的联系：标准差和标准误都是描述变异程度的指标，标准误的大小与标准差成正比，即个体差异越大，抽样误差越大。
总体均数的估计
总体均数的估计，即用样本均数估计总体均数，有以下两种方法：（1）点估计：直接用统计量 X 估计总体参数μ。例：于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L，试估计其总体均数。 X →μ，即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。
（2）区间估计：即按一定的概率估计总体均数可能的数值范围，统计学称这一范围为被估计参数的可信区间（CI）,预先给定的概率水准称为可信度1-α，常取95%CI或99%CI。
可信区间的计算
(1)当总体标准差σ已知或样本含量n足够大（n>50）时：
x
Leabharlann Baidu
s x
(2)当总体标准差σ未知或样本含量n较小（n≤50）时：
S SX n
例：某市110名12岁健康男孩平均身高为 144.67cm，标准差为6.42cm，求其标准误。
sX
S n
6.42 110
0.612 (cm)
标准误的作用
表示抽样误差的大小，衡量样本均数的可靠性，标准误越小则用样本均数估计总体均数越可靠；
结合样本均数和正态分布曲线下的面积分布规律，可用于估计总体均数的可信区间（后述）；
由于存在个体差异，抽样研究必然有抽样误差，所以统计推断必须考虑抽样误差的大小。
3
抽样误差的概念
均数的抽样误差：
均数的抽样误差是因抽样产生的样本均数与总体均数之间的差异。由于存在个体差异，样本均数一般不恰好等于总体均数，例如从同一个总体中随机抽取100次样本含量为n的样本，可以计算出100个样本均数，这些样本均数与总体均数不一定相等，样本均数之间彼此也不一定相等，这种由个体变异产生的、由抽样误差造成的样本均数与样本均数之间以及样本均数与总体均数之间的差异称为均数的抽样误差。
数理统计证明
➢从正态分布N(μ，σ2)中随机抽取例数为n的样
本，其样本均数的分布仍服从正态分布；即使
总体不呈正态分布，只要n>100，X 的分布也
近似服从正态分布N(μ， X2 )。
抽样误差的大小取决于总体中个体差异的
大小和抽样样本含量的大小，所以，均数标准
误的计算公式为：
X
n
而在实际工作中只有用样本标准差S估计总体标准差σ，故标准误的估计值计算公式为：
t X
sX
t变换
随机变量X N（，2）
u X
u变换
均数 X
N(, 2 n)
u X n
t X X , v n 1
S n SX
标准正态分布
N（0，12）
标准正态分布
N（0，12） Student t分布自由度：n-1
17
t分布曲线
0.4 f( t) 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0 -4 -3 -2 -1 0 1
用于均数的假设检验（后述）。
思考！
标准差与标准误的区别：
（1）标准差表示各个观察值间的变异程度，即个体差异的大小。标准误表示同质样本均数间的变异程度，即抽样误差的大小。（2）标准差越小，样本均数的平均水平代表性越好，反之则越差。标准误越小，由样本均数估计总体均数的可靠性越大，反之则可靠性越小。（3）标准差结合样本均数可确定正态分布资料的医学参考值范围，标准误结合样本均数可估计总体的可信区间。（4）标准差可用于计算变异系数，标准误。标准误用于计算可信区间和进行均数间比较的假设检验。