t分布与t检验
t分布与t检验

本讲自测(占一定期末成绩)1【单选题】关于t分布,以下说法不正确的是•A、t分布是一种连续性分布•B、是以0为中心的对称分布•C、t分布就是样本均数的分布•D、当自由度为无穷大时,t分布就是标准正态分布•E、t分布的曲线形状固定正确答案:E 我的答案:E得分:3.3分2【单选题】α=0.05, t>t0.05,ν,统计上可认为()•A、两总体均数差别无统计学意义•B、两样本均数差别无统计学意义•C、两总体均数差别有统计学意义•D、两样本均数差别有统计学意义•E、以上均不对正确答案:C 我的答案:A得分:0.0分3【单选题】12名妇女分别用两种测量肺活量的仪器测最大呼气率(l/min),比较两种方法检测结果有无差别,可进行:•A、卡方检验•B、两独立样本t检验•C、配对卡方检验•D、配对样本t检验正确答案:D 我的答案:D得分:3.3分4【单选题】两样本均数比较,经t 检验,差别有统计学意义时,P 越小,说明:•A、两样本均数差别越大•B、两总体均数差别越大•C、越有理由认为两总体均数不同•D、越有理由认为两样本均数不同•E、样本均数与总体均数不同正确答案:C 我的答案:C得分:3.3分5【单选题】关于学生t分布,下面哪种说法不正确()。
•A、要求随机样本•B、适用于任何形式的总体分布•C、可用于小样本•D、可用样本标准差S代替总体标准差正确答案:B 我的答案:B得分:3.3分6【单选题】在由两样本均数的差别推断两总体均数的差别的t检验中,检验假设的无效假设是: ( ) •A、两样本均数差别无统计意义•B、两总体均数差别无统计意义•C、两样本均数相等•D、两总体均数相等•E、两总体均数不等正确答案:D 我的答案:D得分:3.3分7【单选题】同一个地区中,随机抽取20名8岁正常男孩,测得其平均收缩压为90.0mmHg,标准差为9.8mmHg。
估计该地8岁正常男孩的平均收缩压的95%置信区间为•A、113.0±×9.8•B、90.0±1.96×9.8•C、90.0±×9.8/•D、90.0±1. 96×9.8/•E、90.0±×9.8正确答案:C 我的答案:C得分:3.3分8【单选题】当自由度ν→∞时,t0.05 值•A、≠1.96•B、<1.96•C、=1.96•D、>1.96正确答案:C 我的答案:B得分:0.0分9【单选题】作两样本均数的t检验,当有差别时,t值越大则•A、两样本均数差异越大•B、两总体均数差异越大•C、越有理由认为两总体均数不同•D、越有理由认为两样本均数不同•E、两样本均数差异越小正确答案:C 我的答案:C得分:3.3分10【单选题】配对t检验的无效假设(双侧检验)一般可表示为________ •A、μ1=μ2•B、μ1≠μ2•C、μd=0•D、μd≠0•E、两样本均数无差别正确答案:C 我的答案:C得分:3.3分11【单选题】在样本均数与总体均数差别的统计学意义检验中,结果为P<α而拒绝H0,接受H1,原因是_______•A、H1假设成立的可能性大小1-α•B、H0成立的可能性小于α且H1成立的可能性大于1-α•C、从H0成立的总体中抽样得到样本的可能性小于α•D、以上都不对正确答案:C 我的答案:C得分:3.3分12【单选题】两样本比较作t检验,差别有统计学意义时,P值越小说明•A、两样本均数差别越大•B、两总体均数差别越大•C、越有理由认为两总体均数不同•D、越有理由认为两样本均数不同•E、I型错误越大正确答案:C 我的答案:C得分:3.3分13【单选题】在由两样本均数的差别推断两总体均数的差别的t检验中,检验假设的无效假设是:•A、两样本均数差别无统计意义•B、两总体均数差别无统计意义•C、两样本均数相等•D、两总体均数相等•E、两总体均数不等正确答案:D 我的答案:D得分:3.3分14【单选题】与标准正态分布(Z分布)比较,t分布的:•A、均数要小些•B、均数要大些•C、标准差要小些•D、标准差要大些•E、以上都不是正确答案:D 我的答案:D得分:3.3分15【单选题】在研究两种药物治疗高血压的效果的配对t检验中,要求()。
t分布 名词解释(一)

t分布名词解释(一)t分布名词解释1. t分布•定义:t分布是一种用于统计推断的概率分布。
在统计学中,t 分布是根据样本量较小的情况下,通过估计总体均值与标准差的统计量来进行推断。
它类似于正态分布,但更宽,因为在样本较小的情况下,样本均值的抽样分布的不确定性较大。
2. 自由度•定义:自由度是指用于计算t分布概率的参数。
在t分布中,自由度是样本量减去1。
自由度越大,t分布的形状越接近于正态分布。
3. t值•定义:t值是指在t分布中的一个具体数值,用于测试某个样本均值是否与总体均值有显著差异。
根据t值可以计算出p值,从而确定差异是否显著。
4. p值•定义:p值是指在假设检验中,根据观察到的样本统计量计算出来的概率。
它表示了观察到的样本统计量相对于原假设的极端程度。
p值小于显著性水平(通常为)时,我们拒绝原假设,认为差异显著。
5. 单样本t检验•定义:单样本t检验是一种用于比较一个样本均值与一个已知或者理论均值之间差异是否显著的统计方法。
该方法适用于样本量较小(小于30)或者总体标准差未知的情况。
示例解释:假设我们想要探究某一产品的平均销售量是否达到预期目标。
我们收集了20个样本点,用来计算样本均值,并与预期目标进行比较。
通过单样本t检验,我们可以计算得到t值,并根据p值来判断平均销售量是否显著与预期目标不同。
6. 独立样本t检验•定义:独立样本t检验是一种用于比较两个独立样本均值是否有显著差异的统计方法。
该方法适用于两个样本均值的差异,其中样本量较小(小于30)或者总体标准差未知的情况。
示例解释:假设我们想要比较两种不同的药物治疗方法对于某种疾病的疗效是否有显著差异。
我们将患者随机分为两组,一组接受药物A治疗,另一组接受药物B治疗。
通过独立样本t检验,我们可以计算得到t值,并根据p值来判断两种药物治疗方法的疗效是否显著不同。
7. 配对样本t检验•定义:配对样本t检验是一种用于比较两个配对样本均值是否有显著差异的统计方法。
卫生统计学专题八:t检验

专题八 t 检验⒈t 检验基础t 检验是一种以t 分布为基础,以t 值为检验统计量资料的假设检验方法。
⑴t 检验的基本思想:假设在H 0成立的条件下做随机抽样,按照t 分布的规律得现有样本统计量t 值的概率为P ,将P 值与事先设定的检验水准进行比较,判断是否拒绝H 0。
⑵t 检验的应用条件:①样本含量较少(n <50);②样本来自正态总体(两样本均数比较时还要求两样本的总体方差相等,即方差齐性)。
【注】实际应用时,与上述条件略有偏离,只要其分布为单峰近似对称分布,对结果影响不大。
⑶t 检验的主要应用:①单个样本均数与总体均数的比较;②配对设计资料的差值均数与总体均数0的比较;③成组设计的两样本均数差异的比较。
⑷单样本t 检验基本公式:t=x0s x μ-=nsx 0μ- υ=n-1⒉z 检验z 分布(标准正态分布)是t 分布的特例,当样本n ≥50或者总体σ已知时用z 检验。
⑴单样本z 检验基本公式:z=nsx 0μ- 或 z=nx 0σμ-⑵单样本z 检验的步骤与单样本t 检验的基本相似。
⒊配对设计均数的比较 配对设计是为了控制某些非处理因素对实验结果的影响而采用的设计方式,应用配对设计可以减少实验误差和个体差异对结果的影响,提高统计处理的效率。
⑴配对设计的主要四种情况:①配对的两受试对象分别接受两种处理,如在动物实验中,常先将动物按照窝别、体重等配对成若干对,同一对的两受试对象随机分配到实验组和对照组,然后观察比较两组的实验结果。
②同一样品用两种不同方法测量同一指标或接受不同处理。
③自身对比,即将同一受试对象(实验或治疗)前后的结果进行比较。
④同一对象的两个部位给予不同处理。
⑵对配对资料的分析:一般用配对t 检验,其检验假设为:差值的总体均数为0即μd =0。
计算统计量的公式为:t=ns 0d d-,υ=n-1式中d 为差值的均数;s d 为差值的标准差;n 为对子数。
⑶关于自身对照(同体比较)的t 检验:①在医学研究中,我们常常对同一批患者治疗前后的某些生理、生化指标进行测量以观察疗效,对于这些资料可以按照配对t 检验。
t分布的总体矩条件

t分布的总体矩条件一、什么是t分布t分布是由英国统计学家威廉·塞奇威克提出的,它是一种理论上的概率分布,用于描述小样本情况下样本均值的分布情况。
t分布的形状呈钟形曲线,类似于正态分布,但相对来说更平坦一些。
t分布的形状由自由度参数决定,自由度越大,t分布趋近于正态分布。
二、t分布的性质1. 对称性:t分布是关于均值0对称的,即其概率密度函数在均值两侧相等。
2. 峰度:相对于正态分布来说,t分布的峰度要低一些,即其尾部的概率相对较高。
3. 自由度:自由度是t分布的重要参数,它决定了t分布的形状。
自由度越大,t分布越接近正态分布。
4. 标准差:t分布的标准差随着自由度的增加而减小,即样本容量增加,t分布趋于稳定。
三、t分布的应用t分布广泛应用于小样本的统计推断和参数估计中,特别是在总体标准差未知的情况下。
以下是t分布的几个典型应用场景。
1. 学生t检验:t分布常用于比较两个样本均值是否有显著差异。
例如,我们可以使用t分布来判断某个新药物的疗效是否优于常规治疗。
2. 置信区间估计:在样本容量较小的情况下,使用t分布可以估计总体均值的置信区间。
例如,我们可以利用t分布来估计一批产品的平均寿命。
3. 回归分析:在线性回归中,当样本容量较小,总体标准差未知时,使用t分布来对回归系数进行显著性检验。
例如,我们可以利用t 分布来判断某个自变量对因变量的影响是否显著。
4. 贝叶斯统计:t分布还可用于贝叶斯统计中的参数估计。
通过结合先验分布和样本数据,可以得到后验分布,进而对总体参数进行估计。
t分布作为一种概率分布,在小样本情况下具有重要的应用价值。
它不仅可以进行假设检验和置信区间估计,还可以用于回归分析和贝叶斯统计。
在实际应用中,我们需要根据具体问题选择适当的方法和自由度来进行分析,以得出准确可靠的结论。
t检验的计算方法

t检验的计算方法
t检验的计算方法可以分为两种:单样本t检验和配对样本t检验。
1. 单样本t检验:
- 计算样本均值:计算样本数据的均值X。
- 计算标准误差:计算样本数据的标准误差SE,SE=SD/√n,其中SD为样本数据的标准差,n为样本大小。
- 计算t值:计算t值,t=(X-μ)/SE,其中μ为总体均值。
- 查找t分布表:根据自由度(n-1)和所选的α水平,在t
分布表中找到临界值tα/2。
- 判断结果:当|t|>tα/2时,拒绝原假设,认为样本均值与总
体均值不同。
当|t|<=tα/2时,接受原假设,认为样本均值与总
体均值无显著差异。
2. 配对样本t检验:
- 计算差值:计算配对样本的差值d,d=X - Y,其中X和Y
分别为两组配对样本数据。
- 计算差值的均值和标准误差:计算差值的均值d和标准误
差SEd,SEd=SDd/√n,其中SDd为差值的标准差,n为配对
样本大小。
- 计算t值:计算t值,t=d/SEd。
- 查找t分布表:根据自由度(n-1)和所选的α水平,在t
分布表中找到临界值tα/2。
- 判断结果:当|t|>tα/2时,拒绝原假设,认为配对样本均值
存在显著差异。
当|t|<=tα/2时,接受原假设,认为配对样本均
值无显著差异。
分析化学中t检验的名词解释

分析化学中t检验的名词解释在分析化学中,t检验(t-test)是一种常用的统计方法,用于比较两组数据之间的差异性是否显著。
它是由英国统计学家William Sealy Gosset(更为人所熟知的是他的笔名Student)于1908年提出的。
1. t检验的基本原理t检验基于t分布,是统计学中一类常见的概率分布。
当数据符合特定条件(包括总体近似正态分布、总体方差未知等)时,t检验可以使用t分布进行推断。
t分布相对于正态分布拥有更宽的尾部,这意味着它可以更好地处理样本量较小的情况。
2. t检验的类型根据研究设计和实验目的的不同,t检验可以分为两种类型:独立样本t检验和配对样本t检验。
2.1 独立样本t检验独立样本t检验用于比较两组独立的样本之间的差异。
例如,我们可以通过独立样本t检验来确定两种不同施肥方式对作物生长的影响是否显著。
2.2 配对样本t检验配对样本t检验适用于对同一组样本进行两次测量,比较两次测量结果之间的差异是否显著。
例如,我们可以通过配对样本t检验来验证某种新药物在治疗前后的疗效是否有统计学上的显著差异。
3. t检验的计算步骤进行t检验时,我们需要按照以下步骤进行计算:3.1 收集数据首先,我们需要收集所需的数据样本。
对于独立样本t检验,我们需要分别获得两个独立群体的数据;对于配对样本t检验,我们需要获取同一群体的两个相关变量的数据。
3.2 计算均值和标准差接下来,我们计算每个样本的均值和标准差。
均值表示数据的中心趋势,标准差表示数据的离散程度。
3.3 计算t值根据独立样本t检验和配对样本t检验的具体公式,我们可以计算得出t值。
t 值表示样本之间的差异程度,t值越大说明差异越显著。
3.4 判断差异的显著性最后,我们使用t分布表来查找对应t值的显著性。
通常,在设定的显著性水平(如α=0.05)下,查找t分布表中的临界值。
如果计算得到的t值大于临界值,则可认为差异是显著的。
4. t检验的应用场景t检验在分析化学中广泛应用于各种实验设计和数据分析中。
第5章t检验

1. 建立检验假设,确定检验水准 H0: σ12= σ 22 两组体重的总体方差相等 H1: σ12≠ σ22 两组体重的总体方差不等 α=0.05 2. 计算检验统计量 已知:n1=12 X1=45.75 S12=17.659 n2=13 X2=36.538 S22=3.269
S1 (较大) 17.659 F 2 5.402 S 2(较小) 3.269
注: P<0.01 差别有高度统计学意义 (P越小,越有理由拒绝H0)。
第三节
配对样本t检验
d 0 d t Sd Sd / n
配对设计主要有以下两种形式:
①同源配对: 同一受试对象处理前后的数据;同一受 试对象两个部位的数据;同一样品用两 种方法(仪器)检验的结果; ②异源配对: 配对的两个受试对象分别接受两种处理 后的数据。
第四节 两独立样本 t 检验 Two independent sample t-test • 又称成组t检验 • 适用于完全随机设计的两样本均数的比 较
将受试对象完全 随机地分配到两 组中
一、总体方差相等时的两独立样本 t 检验
应用条件:1. 两样本所代表的总体服从正态分布
2. 两总体方差具有齐性
s1 s12 17.659 2 sx 1.472 1 n n1 12 1
2 s2 s2 3.269 2 sx 2.179 2 n n2 12 2 2
2
三、完全随机分组两组几何均数比较的t检验
宜用几何平均数表示集中水平的资料,不服从 正态分布,但是测量值的对数值服从正态分布, 如抗体滴度的资料。此时可对lgx进行t检验。
t
' 2 2 S x t (1 ) S x t ( 2 )
生物统计学 第五章 t分布

2 =4/16=1/4=(1/2)/2= / n
x 1/ 4 1 2 / 2
2 x
n
n=4时:
x
768 / 256 3
4
2 x 32 / 256 1 / 8 (1 / 2) / 4 2 / n
x 18 12
n
总体 X1 X2 ������1 X3 X4 ������2 f(x) X5 X6 …Xn ������3 …
样本统计量(如������ ) 函数(统计量)
1.3 抽样分布 从一个总体中,按一定的样本容量随机抽取所有可能 的样本,由这些样本计算出的统计量[样本函数f(x); ������, ������ 2 ]必然形成一种分布(亦即一个新的总体),这种分 布称为该统计量的随机抽样分布或抽样分布 。 t分布&t检验
1.显著性检验的意义
饲喂相同饲料,随机抽测10尾甲品种鱼和10尾乙品种鱼 增重情况(g/month),资料如下: 甲型鱼:11,11,9,12,10,13,13,8,10,13 乙型鱼:8,11,12,10,9,8,8,9,10,7 甲型鱼平均增重=11,标准差S1=1.76;甲型鱼平均增重 =9.2,标准差S2=1.549。能否仅凭这两个平均数的差值 11-9.2=1.8,立即得出两品种鱼增重不同的结论呢? 观测值x i 包含两部分,即x i = + i 。总体平均数 反映了 总体特征, i表示误差。
样本1 样本2(总体) … t检验、 F检验、 2检验
差异:本质 差异(处理 效应)or 试验误差?
t分布&t检验
3.统计假设 无效假设( ������������ ):是直接检验的假设,是对总体 提出的一个假想目标,又称为“零假设”。“无效” 意指处理效应与总体参数之间没有真实的差异,试 验结果中的差异乃误差所致。 无效假设的两原则:无效假设是有意义;据之可 算出因抽样误差而获得样本结果的概率。 备择假设( ������������ ) :是和无效假设相反的一种假设, 即认为试验结果中差异是由于总体参数不同所引起 的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t分布从数理统计的理论上讲,并且上节的实例也已说明,在总体均数为μ,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布。
而当样本含量n不太小时,即使总体不呈正态分布,样本均数的分布也接近正态。
在下式中,由于μ与(样本均数的标准差)都是常量,又X呈正态分布,所以u也呈正态分布。
但实际上总体标准差往往是不知道的,上式分母中的σ要由S替代,成为,那么由于样本标准差有抽样波动,SX也有抽样波动,于是,在用S代替σ后上式等号右边的变量便不呈正态分布而呈t分布,其定义公式是(6.5)t分布也是左右对称,但在总体均数附近的面积较正态分布的少些,两端尾部的面积则比正态分布的多些。
t分布曲线随自由度而不同(如图6.1)。
随着自由度的增大,t分布逐渐接近正态分布,当自由度为无限大时,t分布成为正态分布。
图6.1t分布(实线)与正态分布(虚线)与正态分布相似,我们把t分布左右两端尾部面积之和α=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,,这里ν是自由度。
把左右两端尾部面积之和α为0.01相应的t值称为1%界,符号为t0.01,,。
t的5%界与1%界可查附表3,t值表。
例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。
可信区间的估计一、参数估计的意义一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。
由于样本特征值是通过统计求得的,所以又称为统计量以区别于总体特征值。
总体特征值一般称为参数(总体量)。
我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。
本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。
但由于存在抽样误差,不同样本(如再检查110人)可能得到不同的估计值。
因此我们常用“区间估计”总体率(或总体均数)大概在那一个范围内,这个范围就叫可信区间。
区间小的一端叫下限,大的一端叫上限。
常用的有95%可信区间与99%可信区间。
根据同一资料所作95%可信区间比99%可信区间窄些(上、下限较靠近),但估计错误的概率后者为1%,前者为5%,进行总体参数的区间估计时可根据研究目的与标准误的大小选用95%、或99%。
二、总体均数的估计http://127.0.0.1:11643/library/stats/html/Distributions.html本文来自: 人大经济论坛R语言论坛版,详细出处参考:/forum.php?mod=viewt hread&tid=3615789&page=1为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。
由求t的基本公式我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5%界即t0.05,,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求出区间来估计总体均数μ所在范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。
下面用实例说明其求法。
95%可信区间X-t0.05,νSX<μ<X+T0.05,ΝSX(6.6)< p>99%可信区间X-t0.05,νSX<μ<X+T0.01,ΝSX(6.7)< p>例6.2上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,试求95%与99%可信区间。
1.求标准误95%可信区间488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内99%可信区间488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估计μ是在425.22~551.98区间内这里两个可信区间都包含μ=500在内,所以这次估计是估计对了。
抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。
我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,它们是:样本号X 95%可信区间 6 546.7 515.78~577.62 7 524.5 500.45~548.55 28 476.1 454.91~497.29 72 4 65.3 447.02~483.58 75 526.6 503.10~550.10平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很难说了。
如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本,以至总体均数并不在我们提出的区间内。
不过,我们具体所作的这次估计到底属于前种情况还是后一种,这是无法知道的,因为我们不知道μ是多少(若已知μ便不必估计它了)。
然而象后种情况那样作出错估的概率终究很小,只5%或1%,所以用这样的方法估计总体均数还是可行的。
三、总体率的估计上面已经提到,计数资料可以计算相对数(率)。
我们若由样本统计量P估计总体参数π,同样要考虑率的抽样误差,据数理统计研究结果,样本率的分布也近似正态分布,尤其当π比较靠近50%且样本较大时。
于是对样本,百分率的可信区间可利用正态分布规律估计,公式是:95%可信区间P-1.96Sp<π< p>99%可信区间P-2.58Sp<π< p>(按正态分布,双侧尾部面积α=0.05时的u值为1.96,α=0.01时的u值为2.58,故用这两式求可信区间时不必查表找临界u值,记住这两数即可。
)例6.3某医院收治200例急性菌痢患者,其中粪便细菌培养阳性者共80例,试估计菌痢细菌培养的总体阳性率95%与99%可信区间。
1.求阳性率P=80/200×100%=40%(或0.40)2.3.求可信区间95%可信区间40%-1.96(3.46%)<π<40%+1.96(3.46%),即估计π在33.22%~46.78%之间99%可信区间40%-2.58(3.46%)<π<40%+2.58(3.46%),即估计π在31.07%~48.93%之间如果是小样本的百分率,求可信区间可通过查表获得,附表4是n为10、15、20、30时查95%与99%可信区间的一个简表。
此外,统计学专著中还有更详细的表可查t检验与u检验抽样研究包含参数估计与通过假设检验作统计推断这样一些重要内容。
前者在第六章最后一节中已经涉及,后者如X2检验,我们亦已有过接触。
本章将介绍两均数相比时的假设检验。
第一节t检验一、样本均数与总体均数的比较为了判断观察到的一组计量数据是否与其总体均数接近,两者的相差系同一总体中样本与总体之间的误差,相差不大;还是已超出抽样误差的一般允许范围而存在显著差别?应进行假设检验,下面通过实例介绍t检验的方法步骤。
例7.1根据大量调查得知,健康成年男子脉搏均数为72次/分,某医生在某山区随机抽查健康成年男子25人,其脉搏均数为74.2次/分,标准差为6.5次/分。
根据这个资料能否认为某山区健康成年男子的脉搏数与一般健康成年男子的不同?在医学领域中有一些公认的生理常数如本例提到的健康成人平均脉搏次数72次/分,一般可看作为总体均数μ。
已知在总体均数μ和总体标准差σ已知的情况下可以予测样本均数分布情况,现缺总体标准差,则需用样本标准差来估计它,那么样本均数围绕总体均数散布的情况服从t分布(尤其当样本含量n较小时,)。
t分布的基本公式即6.5。
从式中可知,t是样本均数与总体均数之差(以标准误为单位),t的绝对值越大也即X距μ越远。
在t分布中距μ越远的样本均数分布得越少(所占百分比小,P值小),后面附表3右上角的示意图中展示了这种关系,如欲知各自由度下t值与其相应的P值可查附表3。
下面回答本例提出的问题而进行假设检验。
按一般步骤:(1)提出检验假设H0与备择假设H1。
本例H0为某山区成年男子的脉搏均数与一般成年男子的相等,μ=μ0=72次/分;H1为两者不相等μ≠μ0,即μ大于或小于μ0(这是双侧检验,如果事先已肯定山区人的脉搏不可能低于一般人,只检验它是否高于一般人,则应用单侧检验,H1必为μ>μ)。
(2)定显著性水准α,并查出临界t值。
α是:若检验假设为真但被错误地拒绝的概率。
现令α=0.05,本例自由度ν=n-1=25-1=24、查附表3得t0.05,24=2.064。
若从观察资料中求出的∣t∣值小于此数,我们就接受H0;若等于或大于此值则在α=0.05水准处拒绝H0而接受H1。
(3)求样本均数X、标准差S及标准误Sχ并进而算出检验统计量t。
现已知X=74.2次/分,S=6.5次/分,只要求出Sχ及t值即可。
(4)下结论:因∣t∣t0.05,24=2.064,所以检验假设H0得以接受,从而认为就本资料看,尚不能得出山区健康成年人的脉搏数不同于一般人而具有显著差别的结论。
二、成对资料样本均数的比较上面介绍了已知总体均数时的显著性检验方法,但有时我们并不知道总体均数,且医学数据资料中更为常见的是成对资料,若一批某病病人治疗前有某项测定记录,治疗后再次测定以观察疗效,这样,观察n例就有n对数据,这即是成对资料(也可对动物做成病理模型进行治疗实验以收集类似的成对资料);如果有两种处理要比较,将每一份标本分成两份各接受一种处理,这样观察到的一批数据也是成对资料,医学科研中有时无法对同一批对象进行前后或对应观察,而只得将病人(或实验动物)配成对子,尽量使同对中的两者在性别、年龄或其它可能会影响处理效果的各种条件方面极为相似,然后分别给以一种不同的处理后观察反应,这样获得的许多对不可拆散的数据同样是成对资料。
由于成对资料可控制个体差异使之较小,故检验效率是较高的。
关于成对资料,每对数据始终相联这是它的特点,我们可以先初步观察每对数据的差别情况,进一步算出平均相差作为样本均数,再与假设的总体均数比较看相差是否显著,下面举实例说明检验过程。
表7.1豚鼠注入上腺素前后每分钟灌流滴数豚鼠号每分钟灌流滴数用药前用药后增加数d 1 30 46 16 2 38 50 12 3 48 52 4 4 48 52 4 5 60 5 8 -2 6 46 64 18 7 26 56 30 8 58 54 -4 9 46 54 8 10 48 58 10 11 44 36 -8 12 46 54 8 总计——96例7.2为了验证肾上腺素有无降低呼吸道阻力的作用,以豚鼠12只,进行支气管灌流实验,在注入定量肾上腺素前后,测定每分钟灌流滴数,结果见表7.1,问用药后灌流速度有无显著增加?(1)假设用药前后灌流滴数相同,则相差的总体均数μ为0;即H0:μ=μ0;H1:μ≠μ0。