第五章 非参数统计

合集下载

非参数统计课件

非参数统计课件

什么是假设 检验?
假设检验用来判断 一个统计假设在给 定数据下是否成立。
非参数假设 检验的基本 思想
非参数假设检验不
依赖于总体参数的
具体分布。
U检验
U检验是一种常见的 非参数假设检验方 法。
KolmogorovSmirnov检验
KolmogorovSmirnov检验用来检 验样本是否符合给 定分布。
什么是核密度估计?
核密度估计是一种估计概率密度函数
概率密度函数和密度函数的区
2
的非参数方法。

概率密度函数是连续随机变量的密度
函数,而密度函数是离散随机变量的
3
高斯核密度估计
密度函数。
高斯核密度估计使用高斯核函数来估
计概率密度函数。
交叉验证方法
4
交叉验证方法可以用来选择合适的核 函数带宽。
分析?
回归分析用来建立变量之间的依赖关系。
Nadaraya-Watson核回归
Nadaraya-Watson核回归通过核函数加权来 估计回归函数。
非参数回归分析的基本思想
非参数回归分析不需要对回归函数做具体的 形式假设。
局部加权回归
局部加权回归在核回归的基础上引入了距离 权重来进一步提高估计精度。
非参数统计ppt课件
# 非参数统计PPT课件 ## 简介 - 什么是非参数统计? - 非参数统计和参数统计的区别
统计分布
什么是统计分布?
统计分布描述随机变量的不确定性和可能性。
常见的统计分布
包括正态分布、二项分布、泊松分布等。
经验分布函数
经验分布函数用样本数据来近似未知总体分布函数。
核密度估计
1
总结
1

非参数统计方法介绍

非参数统计方法介绍

非参数统计方法介绍非参数统计方法是一种不依赖于总体分布形态的统计方法,它不对总体分布做出任何假设,而是直接利用样本数据进行统计推断。

非参数统计方法的优势在于适用范围广,可以处理各种类型的数据,不受总体分布形态的限制。

本文将介绍非参数统计方法的基本原理和常用的方法。

一、非参数统计方法的基本原理非参数统计方法是基于样本数据进行统计推断的方法,不对总体分布形态做出任何假设。

其基本原理是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。

非参数统计方法主要包括秩和检验、分布自由度检验和重抽样方法等。

二、秩和检验秩和检验是一种常用的非参数统计方法,它主要用于比较两个独立样本的差异。

秩和检验的基本思想是将两个样本合并后,对样本数据进行排序,然后根据排序结果计算秩和统计量,再通过对比临界值来判断两个样本是否存在显著差异。

三、分布自由度检验分布自由度检验是一种用于检验总体分布是否符合某种特定分布的非参数统计方法。

它不依赖于总体分布形态的假设,而是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。

常见的分布自由度检验方法包括Kolmogorov-Smirnov检验、Anderson-Darling检验和Cramér-von Mises检验等。

四、重抽样方法重抽样方法是一种通过对样本数据进行有放回抽样来获得总体统计特征的非参数统计方法。

重抽样方法的基本思想是通过对样本数据的重复抽样,来模拟总体分布,并通过对模拟样本数据的分析,得到总体的统计特征。

常见的重抽样方法包括自助法、Jackknife法和Bootstrap法等。

五、非参数统计方法的应用领域非参数统计方法广泛应用于各个领域的数据分析中。

在生物医学领域,非参数统计方法常用于比较不同治疗方法的疗效、评估药物的副作用等。

在金融领域,非参数统计方法常用于风险评估、投资组合优化等。

在环境科学领域,非参数统计方法常用于分析环境污染物的浓度分布、评估环境质量等。

《非参数统计》课程教学大纲

《非参数统计》课程教学大纲

非参数统计Non-parametricStatistics一、课程基本信息学时:48(含实验8学时)学分:3考核方式:考试,平时成绩占总成绩30%。

中文简介:非参数统计为有效地分析试验设计及其实际问题中所获得的数据提供了丰富的统计工具。

本课程从问题背景与动机、方法引进、理论基础、计算机实现、应用实例等诸多方面介绍了非参数统计方法,其内容包括:基于二项分布的检验、列联表、秩检验、Ko1mogorov-Smirnov 型统计量等。

本课程在强调实用性的同时,突出了应用方法与理论的结合。

在人才培养体系中,该课程属于选修课程,但建议每个统计学专业的学生必须掌握若干种非参数统计方法,以其作为其他重要统计方法的补充。

特别是针对名义数据分析及有序数据分析时相当有用。

二、教学目的与要求非参数统计是研究随机现象存在的统计规律的学科,其在经济、工农业生产和科学技术等领域有广泛的应用,是一门应用性很强的一门课程。

本课程(1)使学生掌握非参数理论的基本原理和方法,重点掌握单样本,多样本的位置检验和尺度检验,以及相关检验和分布检验。

注意与参数统计的区别;(2)结合实际例子,运用非参数理论,提高学生运用该工具解决实际问题的能力。

(3)使学生进一步掌握具体与抽象、偶然与必然、特殊与一般等辨证关系,培养学生辨证唯物主义观点。

三、教学方法与手段教学中主要采用课堂教学的方法,当中穿插大量的案例,同时预留课堂讨论与练习的时间让学生进行实际的操作。

本课程同时设立计算机上机课程,由老师自编实验指导书详细指导学生进行上机实践,强调动脑与动手相结合,理论与实践相结合。

o五、推荐教材和教学参考资源教材:非参数统计:基于R语言案例分析,柳向东编,暨南大学出版社,2010年12月(第1版)参考资料:1)非参数统计,王星编著,北京:中国人民大学出版社,2(X)5年1月(第一版)2)非参数统计方法,吴喜之等,北京:高等教育出版社,1996年(第1版)3)孙山泽.非参数统计讲义.北京:北京大学出版社,2000。

非参数统计讲义通用课件

非参数统计讲义通用课件

假设检验方法
总结词
假设检验方法用于检验一个关于总体 参数的假设是否成立。
详细描述
假设检验方法包括提出假设、构造检 验统计量、确定临界值和做出决策等 步骤。常见的假设检验方法有t检验、 卡方检验、F检验等,用于判断样本数 据是否支持假设。
关联性分析方法
总结词
关联性分析方法用于研究变量之间的相关性。
02
非参数统计方法
描述性统计方法
总结词
描述性统计方法用于收集、整理、描述数据,并从数据中提取有意义的信息。
详细描述
描述性统计方法包括数据的收集、整理、描述和可视化,例如均值、中位数、 众数、标准差等统计量,以及直方图、箱线图等图形化表示。这些方法可以帮 助我们了解数据的分布、中心趋势和离散程度。
非数统计与机器学习算法的结 合将有助于解决复杂的数据分析 问题。
02
与大数据技术的融 合
非参数统计将借助大数据技术处 理海量数据,挖掘数据背后的规 律和模式。
03
与社会科学研究的 互动
非参数统计方法将为社会科学研 究提供更有效的研究工具和方法 。
决策树分析方法
总结词
决策树分析方法是一种基于树形结构的非参 数统计学习方法。
详细描述
决策树分析方法通过递归地将数据集划分为 更小的子集,构建出一棵决策树。决策树的 每个节点表示一个特征属性上的判断条件, 每个分支代表一个可能的属性值,每个叶子 节点表示一个分类结果。决策树分析可以帮 助我们进行分类、预测和特征选择等任务。
非参数统计的发展趋势
多元化发展
非参数统计将不断拓展其应用领域,从传统的医学、生物 、经济领域向金融、环境、社会学等领域延伸。
01
算法优化
随着计算能力的提升,非参数统计的算 法将进一步优化,提高计算效率和准确 性。

第五章 非参数统计

第五章  非参数统计

符号检验是不考虑差值为零的。除3个差
值为零的以外,共有17个差值,n=17。其中
n+=14,n—=3。若总体A与总体B有相同的分 布,这17个符号中的“+”号与“—”号应大
约各占1/2。若与这个值偏离较大,说明A和B
可能有不同的分布。符号检验所用的统计量S 是n+,n—中较小的一个。
S min(n , n )
本章所提出的统计检验方法,不必考虑总
体分布类型。这里要解决的问题不是对总体参
量做检验,而是对总体的某些一般性假设进行 检验(例如,检验两个总体分布是否相同)。 这样的检验称为非参量统计。第一章讲过的离 散型数据的 c2 检验,就是一种非参量检验。c2
检验既不需要假设总体的分布类型,也不需要
提出假设的总体参量值。
H0:群体A的IQ等于群体B的IQ。
HA:群体A的IQ高于群体B的IQ。 因为备择假设是群体A的IQ高于群体B的IQ, 所以本实验为单侧检验。样本A的含量较小,以其 秩和为检验的统计量,其秩和为:
T 5.5 9 11 13 14 15 16 18 20 22 143.5 n1 10, n2 12, 将n1 , n2 , T (5 2)代入式, 得 : u 143.5 10(10 12 1) 28.5 2 188 (10)(12)(10 12 1) 230 12
N ( N 1) 总秩和 2
(5 1)
当N=10时,总秩和为10(10+1)/2=55。因
此,B的秩和为55-17=38。A的秩和大约只有B的 秩和的一半,说明A肥料的效应远不如B肥料的效应, 可以拒绝H0。假若A的秩和与B的秩和之间有差异, 但又不是很悬殊,这时很难做出抉择。为了能以一

非参数统计部分课后习题参考答案

非参数统计部分课后习题参考答案

课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。

我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。

第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。

”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。

”(注意:该组均值为74.000)。

你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。

答:这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。

非参数统计_第五章 两独立样本(修正版)(1)

3
1
2
1
5
2
1
0
0
5
4
1
4
2
3
1
双样本检验举例1
解(1)建立 假设: H 0 : 培训对服务质量没有影响 H1 : 培训对服务质量产生影响 (2)计算检验统计量 D 0.5.
(3) n m 8, 给定显著性水平 0.05, 否定域为 D | D 0.625. (4)接受零假设,即培训对服务质量没有影响。
Z
Wx ( N 1)n / 2 ~ N (0,1) mn( N 1) /12
Mann-Whitney U 检验举例1
例 5.1 为了检验两个小组工人的生产效率是否具有显著性差异,从 两个组中随机抽取20个工人,其每日生产量和组别如下表。 表 5-1 两组工人生产量
产量 标记 产量 标记 产量 标记 产量 标记
习题
作业:某社会系的两名大学生随机地从该校三年级的学生中
抽取了若干名,询问他们每周看多长时间的电视, 记录如下:
男生
女生
10 14 11 3 10 5 7 12 40 19 6 8 15 11 8 25 10 7 6 7 5 25 30 6 5 42 7 4 38 15 6 4 1 15 22
试问男生和女生看电视的时间分布是否相同(α=0.05)
Wx 135 .5, W y 74 .5,
Wxy Wx 1 n(n 1) 80.5, 2
1 Wyx Wy m(m 1) 19.5, 2
U min(Wxy , W yx ) 19 .5
Mann-Whitney U 检验举例1
(3) n m 10, 给定显著性水平 0.05, 可查得U统计量的下界为 28. (4) U=19.5<28, 拒绝零假设,即两组工人的 生产效率存在显著差异.

非参数统计

非参数统计定义数理统计学的一个分支。

如果在一个统计问题中,其总体分布不能用有限个实参数来刻画,只能对它作一些诸如分布连续、有密度、具有某阶矩等一般性的假定,则称之为非参数统计问题。

举例说明例如,检验“两个总体有相同分布”这个假设,若假定两总体的分布分别为正态分布N(μ1,σ2)和N(μ2,σ2),则问题只涉及三个实参数μ1,μ2,σ2,这是参数统计问题。

若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,则这是非参数统计问题。

又如,估计总体分布的期望μ,若假定总体分布为正态 N(μ,σ2),则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。

不过参数统计与非参数统计之间并没有泾渭分明的界线例外有的统计问题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。

例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的。

但是,如果对随机误差的分布类型没有作任何假定,则从问题的总体分布这个角度看,也可以看成是非参数性的。

统计方法重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。

设有样本X1,X2,…,Xn,把它们由小到大排列,若Xi 在这个次序中占第Ri个位置(最小的占第1个位置), 则称Xi的秩为Ri(i=1,2,…,n)。

1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。

设X1,X2,…,Xm和Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设H:θ=0,备择假设为θ>0(见假设检验)。

记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri,且为诸秩的和,当W >C时,否定假设H,这里C 决定于检验的水平。

这是一个性能良好的检验。

秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。

非参数统计讲义通用课件

案例分析
通过实际案例展示如何使用Python进行非 参数统计,包括分布拟合、假设检验和模 型选择等步骤。
SPSS实现
SPSS简介
SPSS(Statistical Package for the Social Sciences) 是一款流行的社会科学统计 软件。
操作界面
SPSS的非参数统计功能通常 在“分析”菜单下的“非参 数检验”选项中,用户可以 通过直观的界面进行操作。
聚类分析方法在数据挖掘、 市场细分等领域有广泛应用, 可以帮助我们发现数据的内 在结构和模式。
异常值检测方法
• 异常值检测方法用于识别和剔除数据中的异常值,提高数据分析的准确性和可靠性。
• 常见的异常值检测方法包括基于统计的方法、基于距离的方法、基于密度的方等。 • 基于统计的方法利用统计学原理,如z分数、IQR等,判断数据是否为异常值;基于距离的方法通过计算对象与其它对象的距离来判断是否为异常值;基于密度的方法则根据对象周围的密度变化来判断是否
解释性较差
相对于参数统计,非参数统计结果通 常较为抽象,难以直接解释其具体含 义。
假设检验能力较弱
非参数统计在假设检验方面的能力相 对较弱,对于确定性的结论和预测不 如参数统计准确。
如何克服非参数统计的局限性
01
02
03
04
利用高效计算方法
采用并行计算、分布式计算等 高效计算方法,提高非参数统
计的计算效率和准确性。
描述性统计方法在数据分析中起到基 础作用,为后续的统计推断提供数据 基础和初步分析结果。
假设检验方法
假设检验方法是一种统计推断 方法,通过提出假设并对其进
行检验,判断假设是否成立。
假设检验方法包括参数检验和 非参数检验,其中非参数检验 不依赖于总体分布的具体形式,

非参数统计概述课件

对数据量要求较高
对于小样本数据,非参数统计 方法可能无法提供稳定和可靠
的结果。
04
非参数统计与其他统计方 法的比较
与参数统计的比较
非参数统计
不依赖于特定的概率分布模型,灵活 性更强,能适应多种数据类型和分布 。
参数统计
基于特定的概率分布模型,需要对模 型假设进行验证,适用范围相对有限 。
与贝叶斯统计的比较
02
大数据为非参数统计提供了丰富 的数据资源和计算能力,有助于 发现更多隐藏在数据中的信息和 规律,推动非参数统计的发展。
非参数统计与其他学科的交叉研究
非参数统计与计算机科学、数学、物 理学、生物学等学科的交叉研究有助 于拓展非参数统计的应用领域和理论 框架。
不同学科的交叉融合可以促进非参数 统计的创新和发展,推动其在各个领 域的实际应用。
在秩次相关性检验中,变量值被转换为秩次,然后使用秩 次计算相关系数(如Spearman或Kendall秩次相关系数 )。这种方法适用于非正态分布的数据,且不受数据异常 值的影响。
分布拟合检验
分布拟合检验是一种非参数统计方法,用于检验数据是否符合特定的概率分布。
分布拟合检验通过比较数据的实际分布与理论分布的统计量(如Kolmogorov-Smirnov、 Anderson-Darling等),来评估数据是否符合特定的概率分布。这种方法在统计学中广泛应用于模 型的假设检验和数据的探索分析。
特点
灵活性、稳健性、无分布假设、 适用于多样本数据等。
与参数统计的区别
01
02而参数统计 则依赖于特定的分布假设 。
方法
非参数统计通常采用中位 数、四分位数等统计量, 而参数统计则采用平均数 、方差等统计量。
应用范围
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Chi-Square=0.5073740056269,Asymp. Sig.=0.9172684137493>0.05。接受 H0,否定HA。即本实验结果附合自由组合规律。
独立性检验 二、应用 是利用样本资料对总体的两个变量的数据是否彼此关联的检验, 是利用样本资料对总体的两个变量的数据是否彼此关联的检验, 如果不关联,即为独立。 如果不关联,即为独立。 检验步骤
第五章 非参数统计
非参数统计(亦称非参数检验),是根据样本资料对总体的某 非参数统计(亦称非参数检验),是根据样本资料对总体的某 ), 种性质或关系进行假设检验的统计推断方法。 种性质或关系进行假设检验的统计推断方法。 主要特点 (1)不要求总体分布已知或对总体分布作任何限制性假定; )不要求总体分布已知或对总体分布作任何限制性假定; (2)不以估计总体参数为目的; )不以估计总体参数为目的; (3)能用于定性变量(即定名测定和序列测定的变量); )能用于定性变量(即定名测定和序列测定的变量); (4)方法直观,易于理解,运算比较简单。 )方法直观,易于理解,运算比较简单。 (5)缺点是检验的功效不如参数检验方法。 )缺点是检验的功效不如参数检验方法。
例5.3
孟德尔用豌豆的两对相对性状进行杂交实验, 孟德尔用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与 绿色皱缩种子的豌豆杂交后, 代分离的情况为:黄圆315粒, 绿色皱缩种子的豌豆杂交后,F2代分离的情况为:黄圆 粒 黄皱101粒,绿圆 粒,绿皱 粒,共556粒,问此结果是否 黄皱 粒 绿圆108粒 绿皱32粒 粒 符合自由组合规律? 符合自由组合规律
根据自由组合规律。理论分离比为:
[SPSS处理] 处理]
变量还是1个 分别有 种状态 可以用1、 、 、 表 种状态, 变量还是 个,分别有4种状态,可以用 、2、3、4表 先计算出9/ 、 / 和 / , 示。先计算出 /16、3/16和1/16,即可以进行分 析了! 析了!
Test Statistics
na −b )2 (d c 2 χ= (a+c (b+d (a+b(c+d ) ) ) )
例5.4
某猪场采用两种配种方法进行配种,即单次配和两次配, 某猪场采用两种配种方法进行配种,即单次配和两次配,其受胎 结果如表5- 所示 所示, 结果如表 -6所示,试检验这两种配种方法的受胎率是否有显著 差异? 差异
i= 1 j= 1 r c
O ij ( ij −E ) E ij
2
(6)比较χ2值与临界值 ) 作出检验判断
要点说明 •列联表形式(r×c) 列联表形式( 列联表形式 × ) x y 1 行 2 3 (r) . ) . . r 合计 1 O11 O21 O31 . . . Or1 n.1 2 O12 O22 O32 . . . Or2 n.2 列(c) ) 合计 3 O13 O23 O33 . . . Or3 n.3 … … … … . . . … … c O1c O2c O3c . . . Orc n.c O1 O2 O3 . . . Or n
Ranks
受受交
Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed)
a. Grouping Variable: 交交交交
131.45
8574.000
17089.000 -5.031 .000
ห้องสมุดไป่ตู้
[例]
研究吸烟习惯与慢性气管炎发病的关系,调查了 研究吸烟习惯与慢性气管炎发病的关系,调查了205名吸烟 名吸烟 者及134名不吸烟者,所得结果如表,试作吸烟组和不吸烟 名不吸烟者, 者及 名不吸烟者 所得结果如表, 组慢性气管炎患病率差别的统计意义检验。 组慢性气管炎患病率差别的统计意义检验。
[SPSS处理] 处理]
分析:本例有两种处理,处理后出现两种状态: 分析:本例有两种处理,处理后出现两种状态:即单次 交配与两次交配;受胎与未受胎。因此,可以用1个变量 交配与两次交配;受胎与未受胎。因此,可以用 个变量 来表示两种状态, 个分组变量。 来表示两种状态,设1个分组变量。 个分组变量
建立数据文件
Wilcoxon W Z Asymp. Sig. (2-tailed)
a. Grouping Variable: 年年
33301.500 -2.729 .006
2×c列联表的独立性检验 × 列联表的独立性检验 生物学研究中。经常遇到的是2× 列联表 列联表, 生物学研究中。经常遇到的是 ×2列联表,但有时也会遇到 2×c列联表,即横行分为两组,纵行分为 ≥3组的资料。2×c 列联表, 组的资料。 × × 列联表 即横行分为两组,纵行分为c≥ 组的资料 列联表的一般形式如表5- 。 列联表的一般形式如表 -7。
H0:大豆花色 分离符合 比率:HA:大豆花色 分离不符合 比率。 大豆花色F2分离符合 比率: 分离符合3:1比率 大豆花色F2分离不符合 比率。 分离不符合3:1比率
[SPSS数据处理] 数据处理]
X Test Statistics
Observed N 1.00 2.00 Total Expected N 208 216.8 a Chi-Square 81 72.3 df 289 Asymp. Sig. Residual X -8.8
[SPSS统 计处理] 计处理]
本例只有1个变量。即x,表示两种状态,以“1”代表“青灰色 表现型”,“2”代表“红色表现型”。
X
Observed N 1.00 2.00 Total 1503 99 1602 Expected N 1201.5 400.5 Residual 301.5 -301.5
分析: 分析: 为典型的判断两组样本独立性。本例有两种处理(吸烟组与不吸烟组), Test Statistics a 处理后出现两种状态:患病与非患病。设1个分组变量(group),两个 水平,即吸烟组与非吸烟组;变量一个,变量有两种状态,即患病与非 患患生患 患病。 Mann-Whitney U 12186.500 。 假设检验: 两组样本互不独立, 两组样本相互独立, 假设检验:H0:两组样本互不独立,P>0.05;HA:两组样本相互独立,P<0.05。 两组样本互不独立 ; 两组样本相互独立 Mann-Whitney Test 结论:计算结果表明,Asymp. Sig. (2-tailed)=0.006<0.01,因此 抽烟组与慢性气管炎组两组样本 相互独立。
分析过程: 分析过程:
假设检验
H0:两个样本互不独立,P>0.05;HA:两个样本互相独立, P<0.05。 Mann-Whitney Test
Test Statistics a
受受交 交交交交 单交 两交
Total N 178 130 308 Mean Rank 171.33 Sum of Ranks 30497.00 17089.00
Chi-Square(即χ2)=302.629,Asymp.Sig.=0.000,表明结果与3:1的理论值 相差极显著。从而否定H0,接受HA。即实验结果不符合一对等位基因的分 离定律。
例5.2
进行大豆花色的遗传研究,共观测 代 进行大豆花色的遗传研究,共观测F2代289株,其中紫色 株 其中紫色208株,白 株 的分离规律? 色81株,试检验大豆花色分离是否符合 的分离规律 株 试检验大豆花色分离是否符合3:1的分离规律
主要内容 χ2检验 惠特尼U检验 曼—惠特尼 检验 惠特尼 游程检验 等级相关检验 多个样本的检验
成对比较检验
χ2检验 检验
χ2
2/E =∑(Oi-Ei) i
1、适合性检验 二、应用 、 这是利用随机样本资料对总体是否服从某种理论分布的检验
(1)对总体分布建立假设 ) H0:总体服从某种理论分布 H1:总体不服从该理论分布 原假设H (3)以“原假设 0 ) 为真” 为真”导出一组 期望频数( 期望频数(fe) (5) χ2 =∑(f0-fe)2/fe ) 给定的α查 给定的 查χ2表,得到 临界值 注意事项 (1)各组理论 ) 频数f 不得小于5 频数 e不得小于 如不足5, ,如不足 ,可 合并组; 合并组; (2)为使组数 ) 不致太少, 不致太少,总频 数n>50; > ; (3)根据具 ) 体情况确定自 由度。 由度。
nn n n j i j i Q 频 为, ∴ 论 数ij =n ⋅ )= 总 数 n 理 频 E ( n n n
df=(3-1)(4-1)=6
•r·c=2×2的列联表资料,χ2值简算公式 × 的列联表资料 的列联表资料, x y 1 2 合计 1 a c a+c 2 b d b+d 合计 a+b c+d n
检验步骤
(2)抽样并对样 ) 本资料编成频数 分布( 分布(f0)
(4)计算检验统计量 )
χ2 =∑(f0-fe)2/fe
(6)比较χ2值与临界值 ) 作出检验判断
例5.1
有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰色)杂交,其 F2代获得如表5-2所列的体色分离尾数,问这一资料的实际观察值 是否符合孟德尔的青:红=3:1一对等位基因的遗传规律?
(1)对总体的两个变量建立假设 ) H0:两变量独立 H1:两变量关联 (3)计算理论频数 ) nnj i E= ij n (5) 给定的α查χ2 ) 给定的α 表,得到临界值
(2)将样本资料编 ) 列联表, 成r×c列联表,并列 × 列联表 出实际频数O 出实际频数 ij
(4)计算检验统计量 )
χ2 =∑∑
Test Statistics
X
χ2
1 .000
Chi-Square a df Asymp. Sig.
302.629
显著性
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 400.5.
相关文档
最新文档