《医学统计概论》第3章统计推断基础

合集下载

医学统计学---统计推断

医学统计学---统计推断

第一节 常用相对数
例5-1 某医院1998年在某城区随机调查 了8589例60岁及以上老人,体检发现高 血压患者为2823例。 高血压患病率为: 2823 / 8589 100% = 32.87% 。

第一节 常用相对数
二、构成比 构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用来 说明各构成部分在总体中所占的比重或分 布。 通常以100%为比例基数。其计算公式为
表 5-4 甲、乙两种疗法治疗某病的治愈率比较 治愈率(%) 60.0 35.0 53.8 病人数 100 300 400 乙疗法 治愈数 65 125 190 治愈率(%) 65.0 41.7 47.5


普通型 重 型 合 计
病人数 300 100 400
甲疗法 治愈数 180 35 215
第三节 率的标准化法

第三节 率的标准化法
标准化法计算的关键是选择统一的标准构成。 选择标准构成的方法通常有三种: 1.两组资料中任选一组资料的人口数(或人口 构成)作为两者的“共同标准”。这种方法适 用于直接法。 2.两组资料各部分人口之和组成的人口数(或 人口构成)作为两者的“共同标准”。这种方 法适用于直接法。 3.另外选用一个通用的或便于比较的标准作 为两者的“共同标准”,如采用全国、全省或 全地区的数据作为标准。

式中两指标可以是绝对数、相对数或平均 数。
第一节 常用相对数
例5-3 某年某医院出生婴儿中,男性婴儿为370 人,女性婴儿为358人,则出生婴儿性别比例为 370/358×100 = 103,说明该医院该年每出生 100名女婴儿,就有103名男性婴儿出生,它反 映了男性婴儿与女性婴儿出生的对比水平。 据大量观察,出生婴儿男多于女,出生性别比 一般在104~107之间。这个医院的出生性别比 为103,说明该年该医院出生女婴相对较多。

(医学课件)医学统计学计量资料的统计推断

(医学课件)医学统计学计量资料的统计推断
(医学课件)医学统计学计量 资料的统计推断
2023-11-05
目录
• 引言 • 计量资料数据的描述和分析 • 参数估计与假设检验 • 方差分析及其拓展技术 • 非参数统计推断方法 • 回归分析及其拓展技术 • 临床实践中的统计应用实例
01
引言
概念与定义
医学统计学
是运用数理统计学的原理和方法,在医学领域中进行数据资料的 收集、整理、分析和推断的一门学科。
适用于存在拉丁方设计的实验设计。
05
非参数统计推断方法
符号检验
符号检验
适用于配对资料和两个独立样本资料,通过计 算正号和负号的数目来检验差异是否显著。
适用条件
当理论分布或样本分布未知,或无法从理论分 布推导出适当的统计量时使用。
优缺点
计算简单,适用于小样本数据,但不适用于大样本数据。
秩和检验
秩和检验
频数分布
对收集到的数据进行频数分布分析,统计 各数据值的出现次数和频率。
集中趋势
通过平均数、中位数等指标,反映数据的 集中趋势。
离散程度
通过标准差、四分位数间距等指标,反映 数据的离散程度。
偏态和峰态
通过偏度系数和峰度系数等指标,反映数 据的偏态和峰态。
数据的质量控制
数据清洗
对采集到的数据进行预处理,去除无效、错误或重 复的数据。
确定研究目的和研究对象
在收集数据前,需明确研究目的和研究对象 ,以便确定所需收集的数据类型和范围。
设计调查方案
根据研究目的和研究对象,制定合适的调查方案, 包括调查方法、问卷设计、样本量等。
数据采集
根据调查方案,采取合适的方式和方法采集 数据,包括线上和线下的问卷调查、临床观 察、实验室检测等。

医学统计推断基础

医学统计推断基础

医学统计推断基础21 某年某地随机调查了部分正常成年人红细胞数和血红蛋白含量,结果见下表某年某地部分正常成年人红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 标准误95%CI红细胞数男360 4.66 0.58 4.84 0.0306 4.60~4.72 (1012/L)女255 4.18 0.29 4.33 0.0182 4.14~4.22 血红蛋白男360 134.5 7.1 140.2 0.3742 133.77~135.23 (g/L)女255 117.6 10.2 124.7 0.6387 116.35~118.85 请就上表资料:(1)试比较女性红细胞数与血红蛋白含量的变异程度何者为大?(CV rbc=6.94%,CV hb =8.67%,hb的变异比hbc大)(2)分别计算男、女两项指标的抽样误差。

(3)试估计该地正常成年男、女的红细胞总体均数。

(4)该地正常成年男、女血红蛋白含量有无差异?(成组比较u检验,u=22.83,男性高于女性)(5)该地男、女的两项指标是否均低于上表的标准值(若测定方法相同)?(男女两项指标均低于标准值)22为了了解某高寒地区小学生血红蛋白含量的平均水平,某人于1993年6月随机抽取了该地小学生708名,算得其血红蛋白含量均数为103.5g/L,标准差为1.59g/L。

试求该地小学生血红蛋白含量均数的95%可信区间。

(s x=0.0598,95%可信区间:103.38~103.62g/L)23一药厂为了解其生产的某药物(同一批次)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg,标准差为2.22mg。

试估计该批药剂有效成分的平均含量。

(s x=0.702,t=0.262,95%可信区间:101.41~104.59mg)24随机抽取某地101例30~49岁健康男子,测得血清总胆固醇均值为4.723mmol/L,标准差为0.878mmol/L,现测得一名40岁男子的血清总胆固醇值为6.993mmol/L,若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,还有百分之几的人血清总胆固醇比他高?(95%参考值范围:4.723±1.96×0.878=(3.002,6.444),u=(6.993-4.723)/0.878=2.585,还有(0.5-0.495)×100%=0.5%的人血清总胆固醇比他高)思考题:标准差和标准误有何区别与练习?均数的可信区间与参考值范围有何不同?假设检验和区间估计有何联系?u分布与t分布有何区别与联系?t 检验与单因素方差分析25为了解聋哑学生学习成绩与血清锌含量的关系,某人按年龄、性别和班级在聋哑学校随机抽取成绩优、差的14对学生进行配对研究,得其结果如下表所示,问聋哑学生学习成绩与血清锌含量有无关系?(配对t 检验,t =-0.06,P>0.5,尚不能认为优生和差生的血清锌含量有差别,即不能认为聋哑学生学习成绩与血清锌含量有关系。

医学统计学-分类资料的统计推断

医学统计学-分类资料的统计推断
✓在这样的假设前提下,可以计算各组理论 频数(theoretical frequency) T。
理论频数的计算
理论频数=53 76.15%
处理 试验组
有效 人数
理论 频数
无效 人数
理论 频数
合计 有效率 (%)
43 40.36 10 12.64 53 7861..1153
对照组 40 42.64 16 13.36 56 7761..1453
基本思想
• 四格表确切概率的基本思想是:在四格表的周 边合计不变的条件下,用公式
Pi
(a
b)!(c
d )!(a c)!(b a!b!c!d!n!
d )!
直接计算表内四个数据的各种组合之概率。
每一种组合的概率
a
b
a+b
c
d
c+d
a+c b+d
n
Pi
(a
b)!(c d )!(a c)!(b d )! a!b!c!d !n!
组别 试验组 对照组
合计
表6.2 表6.1资料理论频数的计算
有效 40.36 42.64
83
无效 12.64 13.36
26
合计 53 56 109
T11=53×83/109=40.36;T12=53×26/109=12.64 T21=56×83/109=42.64;T22=56×26/109=13.36。
合计 83
26
109 76.15
Trc
nr nc n
理论频数=56 76.15%
四格表的理论频数由下式求得 :
nn
TRC
RC
n
式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。

统计推断

统计推断
医学统计学---统计推断
E-mail: xybms@

统计学是搜集、整理、 统计学是搜集、整理、 总结、 总结、分析数据以及 依据数据进行推断的科学
定义
统计描述: 统计描述:包括搜集数 整理数据、 据、整理数据、总结数 据、分析数据以及将数 据呈现出来 统计推断: 统计推断:包括进行推 假设检验、 测、假设检验、确定关 系然后作出预测
肺癌病人 RD值 RD值 2.78 3.23 4.20 4.87 5.12 6.21 7.18 8.05 8.56 9.60 矽肺0期工人 矽肺0 RD值 RD值 3.23 3.50 4.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.95 5.10
1. Tests for Normality
研究阶段 随访 周数 体格检查 实验室检查 尿妊娠试验2 心电图 胸部X-ray3
模拟剂期 V1 –2周 X X X X X X X X X X
V2 第1天 X
药物治疗期 V3 V4 V5 2周末 4周末 X X 6周末 X
V6 8周末 X X X X
伴随用药情况 X 分发研究药物 回收研究药物 动态血压评价 不良事件评估
五、 分析思路
• • • • • 实验研究的目的是什么?研究变量是什么? 实验研究的目的是什么?研究变量是什么? 该资料属何种类型资料?属什么实验设计 属什么实验设计? 该资料属何种类型资料 属什么实验设计? 可以采用什么假设检验方法进行分析? 可以采用什么假设检验方法进行分析? 怎样建立检验假设? 怎样建立检验假设? 如果根据假设检验的统计量如何下结论? 如果根据假设检验的统计量如何下结论?
Equality of Variances
Variable

(医学课件)医学统计学-计量资料的统计推断

(医学课件)医学统计学-计量资料的统计推断

样本含量的计算
依据检验效能和检验水准的设计
样本含量计算是依据特定的检验效能和检验水准来进行计算的。
依据样本均数标准误和两样本均数差的标准
样本含量计算需要依据样本均数的标准误以及两样本均数差的标准,来推算出样 本含量。
检验效能的概念与计算
Байду номын сангаас
检验效能的概念
检验效能是指当拒绝一个无效假设时,犯第二类错误的概率 ,也就是说检验效能是衡量错误拒绝一个有效假设的指标。
检验效能的计算
检验效能可以通过计算来得出,一般是通过计算出无效假设 下犯第二类错误的概率来得出检验效能。
提高检验效能的方法
提高样本含量
增加样本含量可以提高检验效能,因为样本含量的增加可以减少随机误差,从而降低无效 假设犯第二类错误的概率。
提高检验水准
提高检验水准也可以提高检验效能,因为当检验水准提高时,临界区域会缩小,从而可以 减少无效假设被拒绝的概率。
要点二
数据管理(Data Manage…
可以对数据进行整理、编辑、分类和 计算,支持多种数据格式,包括Excel 、Access、文本文件等。
要点三
高级统计( Advanced St…
可以进行复杂的数据分析,如结构方 程模型、多因素方差分析、重复测量 等。
06
医学研究中统计方法的合理选择与应 用
研究设计对统计方法选择的影响
医学统计学-计量资料的统计推断
xx年xx月xx日
目录
• 引言 • 参数估计 • 假设检验 • 样本含量与检验效能 • 常用的统计软件及其在医学中的应用 • 医学研究中统计方法的合理选择与应用
01
引言
课程背景
医学科学研究的复杂性

2020年智慧树知道网课《医学统计学(安徽中医药大学)》课后章节测试满分答案

第一章测试1【单选题】(2分)医学统计工作的步骤为()A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、统计描述、统计推断、统计图表D.统计研究设计、搜集资料、整理资料、分析资料E.统计研究调查、统计描述、统计推断、统计图表2【单选题】(2分)统计分析的主要内容有()A.统计图表和统计报告B.统计描述和统计学检验C.统计描述和统计图表D.统计描述和统计推断E.区间估计与假设检验3【单选题】(2分)医学统计学研究的对象是()A.疾病的预防与治疗B.有变异的医学事件C.医学中的小概率事件D.各种类型的数据E.动物和人的本质4【单选题】(2分)用样本推论总体,具有代表性的样本指的是()A.挑选总体中的有代表性的部分个体B.总体中最容易获得的部分个体C.用配对方法抽取的部分个体D.在总体中随意抽取任意个体E.依照随机原则抽取总体中的部分个体5【单选题】(2分)下列观测结果属于等级资料的是()A.脉搏数B.住院天数C.收缩压测量值D.病情程度E.四种血型6【判断题】(2分)对于无限总体我们采用抽样方式进行研究,而对于有限总体,不用抽样()A.错B.对7【判断题】(2分)统计量是随机的,会随着抽样方法、样本量和测量方法而发生变化()A.错B.对8【判断题】(2分)系统误差不可以避免,也没有倾向性()A.错B.对9【判断题】(2分)随机误差因为随机而没有规律,因此无法估计和控制()A.对B.错10【判断题】(2分)小概率事件原理是统计推断的基础,基于其推断的结果,依然会出错的可能性()A.对B.错11【判断题】(2分)同一变量的不同数据类型是可以转换的()A.对B.错12【判断题】(2分)只要进行随机化抽样,得到的样本统计量就有很好的代表性A.对B.错第二章测试1【单选题】(2分)从偏态总体抽样,当n足够大时(比如n>60),样本均数的分布()A.近似对数正态分布B.近似对称分布C.近似正态分布D.仍为偏态分布2【单选题】(2分)医学中确定参考值范围时应注意()A.正态分布资料不能用均数标准差法B.偏态分布资料不能用均数标准差法C.正态分布资料不能用百分位数法D.偏态分布资料不能用百分位数法3【单选题】(2分)计算样本资料的标准差这个指标()A.不会比均数小B.不会比均数大C.决定于均数D.不决定于均数4【判断题】(2分)中位数永远等于均数A.错B.对5【判断题】(2分)中位数永远等于P50A.对B.错6【判断题】(2分)标准差大于标准误A.对B.错7【判断题】(2分)标准误大,则抽样误差大A.错B.对8【判断题】(2分)数值变量分布包括集中趋势和离散趋势两方面A.对B.错第三章测试1【单选题】(2分)影响总体率估计的抽样误差大小的因素是()A.总体率估计的容许误差B.样本率估计的容许误差C.检验水准和样本含量D.检验的把握度和样本含量E.总体率和样本含量2【判断题】(2分)检验效能是指如果总体间确实存在差异,按照检验水准α能够发现该差异的能力()A.对B.错3【多选题】(2分)如果H0假设为μ1=μ2,那么H1假设可能为()A.μ1≥μ2B.μ1>μ2C.μ1<μ2D.μ1≤μ2E.μ1≠μ24【判断题】(2分)假设检验中α和β是跷跷板的关系A.错B.对5【判断题】(2分)参数估计和假设检验均可以进行总体参数是否有差异的判定方法()A.错B.对6【判断题】(2分)总体率参数估计肯定可以用正态分布法A.错B.对7【单选题】(2分)在抽样研究中,当样本例数逐渐增多时()A.标准差逐渐减小B.标准误逐渐减小C.标准误逐渐加大D.标准差逐渐加大8【单选题】(2分)当n足够大,且np和n(1-p)均大于5时,总体率的95%可信区间用()式求出。

(医学课件)医学统计学-计量资料的统计推断

方差分析的基本思想
用于比较多个组间的均值是否存在显著差异,以及判断因素对因变量的影响是否显著。
方差分析的应用
数据独立、数据正态分布、各组方差齐性。
方差分析的假设
05
线性回归分析
03
线性回归模型的适用条件
满足线性关系、误差项独立同分布、误差项无序列相关、满足正态性和同方差性等假设。
线性回归模型
01
引言
临床试验设计和数据分析流行病学调查和疾病预防医学图像分析和诊断临床决策和循证医学
对样本数据的分布特征进行描述和解释利用样本信息对总体特征进行估计和推断通过数据分析和模型预测,为医学研究和临床实践提供科学依据
课程背景
统计学在医学中的应用
计量资料统计推断的目的和重要性
02
描述性统计
数值数据
用于描述定量特征,包括连续型和离散型两种。
数据处理和分析的医学应用
介绍了医学统计学未来的发展趋势和研究方向,包括生物信息学、遗传统计学、多变量统计方法等。
医学统计学的未来发展
选择正确的统计方法
实际应用中需要注意的问题
数据的预处理
假设检验的解读
临床意义的解释
生物信息学的应用
随着生物信息学的快速发展,医学统计学在基因组学、蛋白质组学、代谢组学等领域的应用将更加广泛。
2023
医学课件:医学统计学-计量资料的统计推断
CATALOGUE
目录
引言描述性统计参数估计假设检验线性回归分析多因素分析临床医学中的统计应用讨论与总结
01
引言
医学统计学是医学科研和临床实践中的重要工具医学研究中产生大量的计量资料,需要对这些数据进行统计分析医学统计学在预防、诊断和治疗方面有着广泛的应用

《医学统计学》教学课件 计数资料的统计推断 ——x2检验


2
ad bc2 n
a ca bc db d
11
例8.1
为了解某中药治疗原发性高血压的疗效,将 70名高血压患者随机分为两组。试验组用该 药加辅助治疗,对照组用安慰剂加辅助治疗, 观察结果如表8-1,问该药治疗原发性高血 压是否有效?
12
表8-1 两种疗法治疗原发性高血压的疗效
组别 对照组 试验组 合计
大,说明实际频数和理论频数的差距大,如果假
设检验成立,A与T不应该相差太大。理论上可以
证明
2 ( A T )2
T
服从x2分布,计算出x2值后,查表判断这么大的x2
是否为小概率事件,以判断建设检验是否成立。
7
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84
v=2, x2 =5.99
9
三、四格表χ2检验
一般格式
处理组 甲组 乙组
四格表格式
发生数 未发生数
a
b
a+b
c
d
c+d
a+c
b+d n=a+b+c+d
10
四格表统计量公式
当n≥40,T≥5时
2
( ARC TRC )2 TRC
21
年级 四年级 五年级
合计
表 8-2 两个年级大学生的近视眼患病率比较
近视
非近视
合计 近视率(%)
2(4.67) 26(23.33)
28
7.14
5(2.33) 9 (11.67)

医学统计学计量资料的统计推断

医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。

由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。

一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。

2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。

标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。

标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。

当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t X X , v n 1
S n SX
标准正态分布
N(0,1)
标准正态分布
N(0,1) t分布 t(n-1)
t分布的概率密度函数
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
式中 (•) 为伽玛函数; 圆周率 为自由度(degree of freedom),是t分布
统计推断基础
统计推断
statistical inference
内容:
总体
抽样研究
样本
1. 参数估计 (estimation of
参 数 统计推断 统计量
如:总体均数
如:样本均数 X
parameters)
2. 假设检验(test of hypothesis)
总体标准差
样本标准差S
总体率
样本率 P
的唯一参数;t为随机变量。
以t为横轴,f(t)为纵轴,可绘制t分布曲线。
t分布曲线
0.4 f( t) 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0 -4 -3 -2 -1 0 1
t
t 分布有如下性质:
自由度为1的t分布 自由度为9的t分布 标准正态分布
①单峰分布,曲线在t=0 处最高,并以t=0为中心
(normality test) 统计指标:偏度系数、峰度系数;W 值、D值等 统计图:P-P图、Q-Q图、直方图、 茎叶图、箱图等
二. 方差齐性检验
1) F统计量(最常用) 2) Levene’s test(日浙增多)
经验:最大方差与最小方差不超过3倍, 可认为方差齐性条件满足。
的离散程度,反映 x 对该组观察值的代表性。
论文中常用表达
(x s)
标准误描述的是抽样误差的大小,反映了 x
的可靠性。
论文中也可表达
(x Sx )
第二节 t分布
(Student’s t distribution)
一、t分布
随机变量X~ N(,)
u X
u变换
均数X ~
N (, x )
u X n
d 的总体均数 d =0,故可将配对设计资料的假设检验视为样 本均数d 与总体均数 d =0 的比较,所用方法称为配对 t 检验
(paired t-test)方法。 t | d d | | d | , n 1
Sd
Sd / n
t= d-d = d ,
Sd Sd n
=n-1
例3-6 (P49)
(7)报告结果应注明样本含量、统计量值、具体P值,单
侧时应注明;95%CI既能说明差别的大小,也具有检验
的作用,建议使用。
第六节 t检验的条件检查
正态性检验 方差齐性检验
若条件不满足时, 方法之一:变量变换(P63) 方法之二:近似t检验(P52-P54) 方法之三:秩和检验(后述)
一、正态性检验
n1 - 1 n2 - 1
n1 n2 - 2
第五节 注意事项
二类错误 假设检验应注意的问题
假设检验结果可能的两类错误
假设检验的结果
真实情况
拒绝H0
H0成立 Ⅰ型错误 ()
接受H0
推断正确(1- )
H0不成立 推断正确(1-b) Ⅱ型错误(b)
(1-b)即把握度(power of a test):两总
样(如1000次)时,样本区间包含总体参数()
的百分数。常用100(1-α)%或(1-α)表示,
α值一般取0.05或0.01。
1
P t
2,
X
S X
t
2,
100(1 )%可信区间为(X
t / 2, S X,X
t
/
2,
S

X
或写成X
t
/
2,
S

X
或(X
t / 2, S X
X
t
/
2,
S

偏态分布:PX~P100X
用途 总体均数的区间估计
* t, 也可用 t /2, (对应于双尾概率时) ** u, 也可用 u /2, (对应于双尾概率时)
绝大多数(如 95%)观察对象 某项指标的分布范围
第四节 t 检验 (Student’s t test)
问题的提出
例3.5 某医生测量了36名从事铅作业男性工 人的Hb, 算得其均数为130.83 g/L,标准差为 25.74 g/L。问能否认为从事铅作业工人的 Hb不同于正常男性Hb的平均值140.0 g/L?
杂因素配成对子,每对中的两个个体随机分配给两种 处理(如处理组与对照组);
2)或者同一受试对象作两次不同的处理(自身对照); 3)一份标本一分为二,再用两种方法测定,比较两 种检测方法。
优点:配对设计减少了个体差异。
特点:资料成对,每对数据不可拆分。
配对t检验思路
计算出各对子差值d 的均数d 。当比较组间效果相同时,
差异原因
1. 仅仅是个体差异(抽样误差)所致; 2. 总体间固有差异(本质差别)。
判断差别属于哪一种情况的统计学检验, 就是假设检验(test of hypothesis)。
t检验是最常用的假设检验之一。
反证法的思路
小概率原理
在随机试验中,如果一个事件发生的概率很小, 称为小概率事件,则认为一次试验中是不会发生 的;但是,若一次试验,该事件居然发生了的话, 可以认为原先的假设存在错误。
体确有差别,被检出有差别的能力。 (1-)即信度(confidence level):重复
抽样时,样本CI包含总体参数()的概率。
通常情况下Ⅱ型错误未知
对于一般的假设检验,定为0.05 (或0.01),b的大小取决于H1。通常
情况下,比较总体间有无差异并不知道
,即H1不明确, b值的大小无法确定,
4、结合专业知识下结论。
一、样本均数与总体均数的比较
推断样本所代表的未知总体均数µ与 已知总体均数µ0有无差别。
已知总体均数µ0一般为理论值、标准 值或经大量观察所得的稳定值。
要求:资料呈正态分布。
检验统计量t的计算公式:
t X X ,
SX
Sn
n 1
二、配对资料的比较
配对设计:
1)配对设计(paired design)是将受试对象按某些混
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
第三节 总体均数的估计
1. 总体均数的点估计与区间估计
参数的估计
点估计:由样本统计量 x、S
直接估计 总体参数 、
Байду номын сангаас
区间估计:在一定可信度 (Confidence level) 下,同时考虑抽样误差,给 出参数一个区间范围。
可信度与可信区间
区间的可信度(如95%或99%)是重复抽
X
可信度实验
三、可信区间的解释
95%可信区间:从总体中作随机抽样,作100次 抽样,每个样本可算得一个可信区间,得100个可
信区间,平均有95个可信区间包括μ(估计正确), 只有5个可信区间不包括μ(估计错误)。
95%可信区间 99%可信区间
公区间式范围 窄 宽 X t S , X t S 0.05/ 2, X
Sx=S n
从正态总体N(,)中抽取样本,获得均数
的分布仍近似呈正态分布N(, X) 。
补充:中心极限定理
central limit theorem
①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②随着样本含量的增大, 样本均数的变异范围逐渐变窄。
注意比较
S 与 Sx
标准差描述的是一组观察值 ( x1, x2,..., xn )
注:所有检验统计量均在无效假设成立的前提下,可以证明其分布。
3、确定P值,作出判断(利用小概率原理)
P值是指在H0成立的前提下,获得现有检验统计量值以及比该统计 量值更极端情况下的概率。
P≤α(0.05) 样本差别有统计学意义(significance);
P >α(0.05) 样本差别
无统计学意义(NS).
第一节 均数的抽样误差
总体
样本m n
xm
样本2 n
x2
样本1 n
x1
抽样误差
sampling error:
由于抽样导致的样本统 计量与总体参数间的差 别; 以及统计量间的差别。
一、抽样试验
从正态分布总体N(5.00,0.50)中,每次随机 抽取样本含量n=5,并计算其均数与标准差;重复
抽取1000次,获得1000份样本;计算1000份样本的 均数与标准差,并对1000份样本的均数作直方图。
均数
频数
频数
450
400 350 300
n 10; SX
0.1580
250
200
150
100
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
450
400 350
n 30; SX
0.0920
300
250
计算公式:
t X1 - X2 , S
X1-X 2
其中,均数差的标准误
n1 - 1 n2 - 1 n1 n2 - 2
S X1-X 2
Sc
2
(
1 n1
1 n2
)
∑ ∑ ∑ ∑ Sc2
X1 2 - ( X1 )2 / n1 X 2 2 - ( X 2 )2 / n2 (n1 - 1)S12 (n2 - 1)S22
但可以说:当=0.05 时,95%CI 估计正确的概率为 0.95,估
相关文档
最新文档