实验7 假设检验(一)
假设检验的一般步骤

假设检验的一般步骤各位读友大家好,此文档由网络收集而来,欢迎您下载,谢谢1简述假设检验的一般步骤1 简述假设检验的一般步骤。
(1) 建立假设确定显著性水平计算统计量确定概率值p做出推断结论简述文献检索的基本步骤。
1)明确检索课题,明确检索目的,制定检索策略2)选择检索工具,查找文献线索3)选择检索途径,确定检索标识4)查找文献线索5)获取原始文献3 简述选择研究问题的注意事项。
实用性,创新性,范围不可过大,可行性,结合自己熟悉的专业选题4 简述知情同意书应该包括的基本内容介绍研究目的介绍研究的过程介绍研究的风险和可能带来的不舒适之处介绍研究的益处匿名和保密的保证提供回答受试者问题的途径非强制性的放弃退出研究的选择权5简述减少抽样误差的方法。
1)选取合适的抽样方法,使样本更具有代表性;2)增加样本量到适当水平;3)选择变异程度小的研究指标。
6简述选择研究样本的注意事项。
1、严格规定总体的条件。
2、按随机原则选取样本,并应注意具有代表性。
3、每项研究课题都应规定有足够的样本数,例数太少则无代表性,而样本数太大实验条件不易严格控制。
7按文献的外表特征进行检索的途径。
1、书名途径;2、著者途径;3、序号途径8按文献的内容特征进行检索的途径。
1、分类途径;2、主题途径;3、关键词途径;4、分类主题途径9文献按载体类型划分可分为哪些?印刷型文献、缩微型文献、视听型文献、机读型文献。
10实验性研究的特点有哪些?干预、设对照组、随机取样和随机分组11简述变量的分类。
自变量、依变量、外变量12选择指标时应注意哪些问题?1、客观性2、合理性3、灵敏性4、关联性5、稳定性和准确性13简述概率抽样的类型。
单纯随机抽样、等距抽样、分层抽样、整群抽样14简述非概率抽样的类型。
配额抽样、主观抽样、网络抽样、方便抽样15简述选择性偏倚的种类。
1、诊断性偏倚2、入院率偏倚3、无应答偏倚4、分组偏倚16简述衡量性偏倚的种类。
1、回忆偏倚2、诊断怀疑偏倚3、调查者偏倚4、被调查者偏倚17简述偏倚的控制方法。
第七章假设检验

第七章 假设检验一、单项选择1.关于学生t 分布,下面哪种说法不正确( )。
A 要求随机样本B 适用于任何形式的总体分布C 可用于小样本D 可用样本标准差S 代替总体标准差σ2.二项分布的数学期望为( )。
A n(1-n)pB np(1- p)C npD n(1- p)。
3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( )。
A 大于0.5B -0.5C 1D 0.5。
4.假设检验的基本思想可用( )来解释。
A 中心极限定理B 置信区间C 小概率事件D 正态分布的性质5.成数与成数方差的关系是( )。
A 成数的数值越接近0,成数的方差越大B 成数的数值越接近0.3,成数的方差越大C 成数的数值越接近1,成数的方差越大D 成数的数值越接近0.5,成数的方差越大6.在统计检验中,那些不大可能的结果称为( )。
如果这类结果真的发生了,我们将否定假设。
A 检验统计量B 显著性水平C 零假设D 否定域7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Z α/2=1.96,则当零假设被否定时,犯第一类错误的概率是( )。
A 20%B 10%C 5%D .1%8.关于二项分布,下面不正确的描述是( )。
A 它为连续型随机变量的分布;B 它的图形当p =0.5时是对称的,当p ≠ 0.5时是非对称的,而当n 愈大时非对称性愈不明显;C 二项分布的数学期望)(X E =μ=np ,变异数)(XD =2σ=npq ;D 二项分布只受成功事件概率p 和试验次数n 两个参数变化的影响。
9.事件A 在一次试验中发生的概率为41,则在3次独立重复试验中,事件A 恰好发生2次的概率为( )。
A21 B 161 C 643 D 649 10.设离散型随机变量X ~),2(p B ,若数学期望4.2)(=X E ,方差44.1)(=X D ,则参数p n ,的值为( ).A 4=n ,p =0.6B 6=n ,p =0.4C 8=n ,p =0.3D 12=n ,p =0.2三、多项选择1.关于正态分布的性质,下面正确的说法是( )。
7.假设检验方法----方差齐性检验、方差分析

单因素完全随机设计方差分析的过程
• 例3 某小学语文教研组为研究学习环境对小 学生学习成绩的影响,从三年级中随机抽取20 名学生,随机分成四组,在四种环境下进行学 习,其效果如表8-5,四种不同的学习环境对 学习成绩的影响是否有显著差异?
方差分析概要表
离差平方和其它求法
• 方差分析中关键步骤:求离差平方和. 为计算方便,往往用原始观测值直接求平 方和,公式如下:
处理 区组 A B C D Xi.
I II III X.j Xi
91 92.5 91.5 275 91.67
64.5 59 54 177.5 59.17
83.5 91.5 83.5 258.5 86.17
75.5 74 71 220.5 73.5
314.5 317 300.0 931.5
单因素随机区组设计方差分析的过程
平均数间的多重比较
单因素随机区组设计方差分析的过程
例 1、 有四种小学语文实验教材,分别代号为A、B、C、D。 为比较其教学效果,按随机区组实验(设计)原则,将小学分 为城镇重点小学、城镇一般小学和乡村小学三个区组,分 别代号为I、II、III,并分别在每个区组中随机地抽取4所 小学,它们分别被随机地指派实验一种教材。经一年教学 后通过统一考试得到各校的平均成绩如下表。问四种教材 的教学效果是否一致?
单因素随机区组设计方差分析的过程
被试的分配分三种情况: (1) 一个被试作为一个区组,不同的被试(区组)均需接受全 部k个实验处理; (2) 每一区组内被试的人数是实验处理数的整数倍; (3) 区组内的基本单元不是个别被试,而是以一个团体为 单元。
随机区组设计由于同一区组接受所有实验处理,试 实验处理之间有相关,所以也称为相关组设计(被试内 设计)。它把区组效应从组内平方和中分离出来。这时, 总平方和=组间平方和+区组平方和+误差项平方和
假设检验与样本数量分析①——单样本Z检验和单样本t检验

X
32.03 + 32.14 + … + 31.87 15
…
1.9 2.0
…
0.029 0.023
…
0.028 0.022
…
0.027 0.022
…
0.0226 0.020
…
0.025 0.020
…
0.024 0.019
…
0.024 0.019
…
0.023 0.018
原假设 (零假设)即上述的可能,符号是H0
备择假设(与原假设对立的假设),符号是H1
如本例:假设外径尺寸 H0:(μ = 32) H1: (μ≠32) 确立检验水准: α——显著水平(通常取α=0.05)
显著水平α是当原假设正确却被拒绝的概率 通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其正确的可 能性(概率)95% 或99% 概率是0~1之间的一个数,因此小概率就是接近0的 一个数 英国统计家Ronald Fisher 把0.05作为标准,从此0.05 或比0.05小的概率都被认为是小概率
8 作出不拒绝零假设的统计结论,即外径尺寸 均值没有偏离目标Ф 32
<6>
单样本 Z 检验 单样本 t 检验
预备知识
接上页
假设检验的例子(1)
检验 α = 0.05
临界值 临界值
2
=0.025
拒绝范围
1 – α = 95%
不拒绝H0范围
2
=0.025
根据小概率原理,可以先假设总体参数的 某项取值为真,也就是假设其发生的可能 性很大,然后抽取一个样本进行观察,如 果样本信息显示出现了与事先假设相反的 结果(显示出小概率),则说明原来假定 的小概率事件(一次实验中是几乎不可能发 生)在一次实验中居然真的发生了,这是 一个违背小概率原理的不合理现象,因此 有理由怀疑和拒绝原假设;否则不能拒绝 原假设。 在给定了显著水平α 后,根据容量为n的样 本,按照统计量的理论概率分布规律,可 以确定据以判断拒绝和接受原假设的检验 统计量的临界值。 临界值将统计量的所有可能取值区间分为 两个互不相交的部分,即原假设的拒绝域 和接受域。
假设检验

单侧检验的否定域
例如 : H 0为 9 , H A为 9 ,
因为总体、样本和原假设都没有改变, 所以检验统计量不用改变,其值还是 Z 3.1623 只需要在检验统计量抽样分布的左尾确定一 个否定域,其面积等于显著性水平α,在双 侧分位数表中查到临界值 u 2 使P ( Z u 2 ) 当Z的值落在否定域内时认为 9
(二)选择单侧检验 如果根据专业知识可以判断优劣: 例如,根据药理知识判断,某两种药物同时使用, 其疗效一定高于原药单独使用 相反,根据专业知识,作为饲料资源的农副产品 或肉食品中有毒、有害物质的含量不能高于某一
规定值
5)相伴概率:在原假设成立时检验统计 量的观测值以及比它更极端的可能值出 现的概率之和。
单、双侧检验的关系
双侧Zα
>
单侧Zα
双侧检验显著,择单、双侧检验
例:某猪场随机抽测了甲、乙两品种猪血液中白细胞的
密度,测得甲品种13头猪白细胞数的平均值为
10.73×103/mm3,标准差为1.28×103/mm3, 乙品种15头猪白细胞数的平均值为 16.40×103/mm3,标准差为3.44×103/mm3。 两品种猪的白细胞数是否有显著的差异。
( 300 1.96 156.25 275.5,
N(300,156.2)
~N(300,156.2)
300 1.96 156.25 324.5)
1-α
275.5 300
324.5
275. 5
μ0 – 1.96
y
μ0
300
μ1
310
324. 5
μ0 +1.96
接受域H0
y
假定另一个正态总体,μ=310,σ2=625
假设检验例子

例2: 在一项新广告活动的跟踪调查中,在被调查 的400人中有240人会记起广告的标语,试求会 记起广告标语占总体比率的95%置信度的估计区 间。
假设检验: 1:某橡胶厂生产汽车轮胎,根据历史资料统计结 果,平均里程为25000公里,标准差为1900公里。 现采用一种新的工艺制作流程,从新批量的轮胎 中随机抽取400个作实验,求得样本平均里程为 25300公里,试按5%的显著性水平判断新批量 轮胎的平均耐用里程与以前生产的轮胎的耐用里 程有没有显著的差异,或者它们属于同一总体的 假设是否成立。
参数估计: 例1: 麦当劳餐馆在7星期内抽查49位顾客的消费额(元)如 下,求在概率90%的保证下,顾客平均消费额度估计区 间。 15 、24、38、26、30、42、18 30、25、26、34、44、20、35 24、26、34、48、18、28、46 19、30、36、42、24、32、45 36、21、47、26、28、31、42 45、36、24、28、27、32、36 47、53、22、24、3者满意其产品 的质量,一家市场调查公司受委托调查该公司此 项声明是否属实,随机抽样调查625位消费者, 表示满意该公司产品质量者有500人,试问在 0.05的显著性水平下,该公司的声明是否属实。
第五章 假设检验(1)

关于平均数差异的显著性检验
一、两个总体都是正态分布,两个总体方差都已知。 (一)两个样本相互独立:(独立样本的Z检验) (二)两个相关样本:(相关样本的Z检验) 二、两个总体都是正态分布,两总体方差都未知。 (一)两个样本相互独立: 1.两个总体方差一致(独立样本的t检验) 2.两个总体方差不等,(柯克兰--柯克斯检验) (二)两个相关样本: 1.相关系数未知(相关样本的t检验) 2.相关系数已知(相关样本的t检验)
总体平均数的假设检验例题2
某心理学家认为一般司机的视反应时平均175毫 秒,有人随机抽取36名汽车司机作为研究样本进 行了测定,结果平均值为180毫秒,标准差25毫秒. 能否根据测试结果否定该心理学家的结论.(假定 人的视反应时符合正态分布)
X
总体平均数的假设检验例题3
某省进行数学竞赛,结果分数的分布不是正态, 总平均分43.5.其中某县参加竞赛的学生 168人,平均分45.1,标准差18.7,该县平均分 与全省平均分有否显著差异?
课堂练习4
医学上测定,正常人的血色素应该是每100毫升13克, 某学校进行抽查,37名学生血色素平均值为12.1克/ 毫升,标准差是1.5克/毫升,试问该校学生的血色素 是否显著低于正常值 ?
课堂练习5
12名被试作为实验组,经过训练后测量深度知觉,结 果误差的平均值为4厘米,标准差为2厘米;另外12名 被试作为控制组不加任何训练,测量结果,误差的平 均值为6.5厘米,标准差为2.5厘米,问训练是否明显 减小了深度知觉的误差?
例
某数学教育家随机抽取49名高一学生进行 ****教学法的教学改革实验研究。已知这些 学生原来所在的总体数学的平均水平为80分, 标准差为10分。经过一学期的教学改革实验 之后,这49名学生在统考中的数学平均成绩 为83分。问:教学改革是否改变了学生的数 学水平。
应用统计学 经管类 第7章 假设检验

• • • • • •
二、假设检验的步骤 (一)提出原假设与备择假设 (二)构造检验统计量 (三)确定拒绝域 (四)计算检验统计量的样本观测值 (五)做出结论
1、提出原假设与备择假设
• 消费者协会实际要进行的是一项统计检验 H0 工作。检验总体平均 =250是否成立。这 就是一个原假设(null hypothesis),通常用 表示,即: H0 : =250
第三节 自由分布检验
一、自由分布检验概述 自由分布检验与限定分布检验不同, 它是指在假设检验时不对总体分布的形状和参数加 以限制的检验。与参数检验相对应,自由分布检验又称为非参数检验,但这里的非参数只是 指未对检验统计量服从的分布及其参数做出限制, 并不意味着在检验中 “不涉及参数” “不 或 对参数进行检验” 。
• 解:通过统计软件进行计算。
(二)配对样本的均值检验 设配对观察值为(x,y),其差值是 d = x-y。设 d 为差值的总体均值,要检验的是:
H 0 : d 0 , H1 : d 0
记d
d ,则其方差是: n
2
2 d d / n Sd n(n 1) n
t
X 1000 S/ n
第三步:确定显著性水平,确定拒绝域。 α=0.05,查 t-分布表(自由度为 8),得临界值是 t / 2, n 1 t0.025,8 =2.306, 拒绝域是(-,-2.306]∪[2.306,+)。在 Excel 中,可以使用函数 TINV(0.05,8) 得到临界值 t0.025,8 。 第四步:计算检验统计量的样本观测值。 将 X 986 ,n=9,S=24,代入 t 统计量得:
H1 • 与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否 定时另一种可能成立的结论。备选假设比 原假设还重要,这要由实际问题来确定, 一般把期望出现的结论作为备选假设。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验7 假设检验(一)一、实验目的:1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个总体方差的检验,二项分布总体的检验);2.掌握若干重要的非参数检验方法(Pearson拟合优度 2检验,Kolmogorov-Smirnov单样本和双样本检验)。
二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“09张立1”,表示学号为09的张立同学的第1次实,法1Alt,即完法2:图标,工具。
)1.2.H0:H1:alternative hypothesis: true mean is not equal to 22595 percent confidence interval:172.3827 211.9173sample estimates:mean of x192.15P=0.002516<0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异3.(习题5.2)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948求这个星期生产出的灯泡能使用1000小时以上的概率。
解:源代码及运行结果:(复制到此处,不需要截图)> x<-c(1067, 919, 1196, 785, 1126, 936, 918, 1156, 920, 948)> p<-pnorm(1000,mean(x),sd(x))> 1-p[1] 0.4912059结论:这个星期生产出的灯泡能使用1000小时以上的概率为0.49120594.(习题5.3)为研究某铁剂治疗和饮食治疗营养性缺铁性贫血的效果,将16名患者按年龄、体重、病程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异?H0:H1:5.,分别测试验组与对照组空腹腔血糖下降值(mmol/L)(1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度 2检验;解:提出假设:H0:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同H1:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同①正态性W检验方法源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> shapiro.test(x)Shapiro-Wilk normality testdata: xW = 0.9699, p-value = 0.7527>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3②结论:试验组p=0.9771>0.05,对照组p=0.9368>0.05,所以检验试验组和对照组的的数据是来自正态分布③Pearson拟合优度 2检验源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> A<-table(cut(x,br=c(-6,-3,0,3,6,9)))> p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x))> p> p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4])> p> chisq.test(A,p=p)Chi-squared test for given probabilitiesdata: AX-squared = 0.56387, df = 4, p-value = 0.967Warning message:In chisq.test(A, p = p) : Chi-squared近似算法有可能不准>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> B<-table(cut(y,br=c(-2,1,2,4,7)))> p<-pnorm( c(-2,1,2,4,7),mean(y),sd(y))> p> p(2H0:H1:t = -0.64187, df = 38, p-value = 0.5248alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-2.326179 1.206179sample estimates:mean of x mean of y2.065 2.625结论:p=0.5248>0.05,不拒绝原假设,两组数据均值没有差异②方差不同模型源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> t.test(x,y)Welch Two Sample t-testdata: x and yt = -0.64187, df = 36.086, p-value = 0.525alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:(3解:提出假设:H0:试验组与对照组的方差相同H1:试验组与对照组的方差不相同源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.5984, num df = 19, denom df = 19, p-value = 0.3153alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.6326505 4.0381795sample estimates:ratio of variances1.598361结论:p= 0.3153>0.05,不拒绝原假设,试验组与对照组的方差相同6.(习题5.5)为研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例,(1(2(3解:(1H0:H1:H0:H1:> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> ks.test(y,"pnorm",mean(y),sd(y))One-sample Kolmogorov-Smirnov testdata: yD = 0.22216, p-value = 0.707alternative hypothesis: two-sidedWarning message:In ks.test(y, "pnorm", mean(y), sd(y)) :Kolmogorov - Smirnov检验里不应该有连结(2)检验两组样本方差是否相同;提出假设:H0:两组样本方差相同H1:两组样本方差不相同源代码及运行结果:(复制到此处,不需要截图)> x<-c(126,125,136,128,123,138,142,116,110,108,115,140)> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.9646, num df = 11, denom df = 9, p-value = 0.32alternative hypothesis: true ratio of variances is not equal to 1(3H0:H1:7.靠,随机抽选了400名居民,发现其中有57人是老年人。
问调查结果是否支持该市老年人口比重为14.7%的看法( =0.05)。
(提示,此题是二项分布总体的检验)解:提出假设:H0:p=p0=0.147H1:p≠p0源代码及运行结果:(复制到此处,不需要截图)> binom.test(57,400,p=0.147)Exact binomial testdata: 57 and 400number of successes = 57, number of trials = 400, p-value = 0.8876alternative hypothesis: true probability of success is not equal to 0.14795 percent confidence interval:0.1097477 0.1806511sample estimates:probability of success0.1425结论:P值= 0.8876>0.05,不拒绝原假设,调查结果支持该市老年人口比重为14.7%的看法8.(习题5.7)作性别控制试验,经某种处理后,共有雏鸡328只,其中公雏150只,母雏178只,试问这种处理能否增加母雏的比例?(性别比应为1:1)。