如何讲好FISHER确切概率法

合集下载

精确概率法和确切概率法

精确概率法和确切概率法

精确概率法和确切概率法
 精确概率法是Fisher RA于1934年提出的基于超几何分布运用精
确概率法直接计算概率,从而判断组间差异是否具有统计学意义
的方法,她是卡方检验的有益补充。

 确定概率法是由R.A.Fisher提出的,概率计算的理论依据是超几
何分布。Fisher确切概率法和Pearson卡方相比,确切概率法不
需要近似,相应的P值更为准确。因此,当样本量不满足要求或
所得的P值接近检验水准时,可采用确切概率法。

fisher确切概率 超几何分布公式数学推导

fisher确切概率 超几何分布公式数学推导

fisher确切概率超几何分布公式数学推导超几何分布描述了在不放回地从有限个物件中抽取特定数量的情况下,成功事件发生的次数的分布。

假设总共有N个物件,其中包含K 个成功物件和N-K个失败物件。

从这N个物件中不放回地抽取n个物件,超几何分布的概率质量函数为:P(X=k) = (C(K,k) * C(N-K,n-k)) / C(N,n)其中,P(X=k)表示成功事件发生k次的概率,C(N,n)表示从N个物件中抽取n个物件的组合数。

上述超几何分布的公式可以这样推导:假设我们按顺序从N个物件中抽取n个物件。

首先选择k个成功物件的方式有C(K,k)种,再从剩下的N-K个失败物件中选择(n-k)个物件的方式有C(N-K,n-k)种。

因此,成功事件发生k次的总的方式就是C(K,k) * C(N-K,n-k)。

对于每一种方式,成功事件发生k次的概率为成功事件的组合数除以总的组合数。

因此,超几何分布的概率质量函数为:P(X=k) = (C(K,k) * C(N-K,n-k)) / C(N,n)拓展:除了上述推导的超几何分布公式,还有其他与超几何分布相关的公式和性质。

以下是一些拓展内容:1.期望与方差:超几何分布的期望值为E(X) = n * (K/N),其中K/N表示成功物件占总物件数量的比例。

超几何分布的方差为Var(X) = n * (K/N) * (1 - K/N) * (N-n)/(N-1)。

2.超几何分布的模型应用:超几何分布常用于处理不放回地从有限总体中进行抽样的情况,例如人口抽样调查、质检抽样检验等。

3.超几何分布的连续近似:当总体数量很大(N很大)且成功物件数量很小(K很小),可以用超几何分布的连续近似来估计概率。

通过使用二项分布来逼近超几何分布,其中二项分布的参数是成功物件的概率p=K/N,样本容量为n,可以获得连续近似的结果。

总而言之,超几何分布是描述不放回进行抽样的成功事件发生次数的分布,通过组合数和总体比例的概念建立了它的概率质量函数。

费希尔精确概率检验

费希尔精确概率检验

费希尔精确概率检验
费希尔精确概率检验(Fisher'sexacttest)是一种用于小样本
数据的统计检验方法。

它适用于类别变量,比如两个不同的种群之间的频数比较。

该方法的特殊之处在于,它可以在样本数极少的情况下,对假设进行显著性检验。

费希尔精确概率检验最初是由英国统计学家罗纳德·费希尔在1920年提出的。

该方法的基本思想是,对于一个给定的样本,计算
出所有可能的样本,以及在这些样本中达到或超过观察到的值的概率。

这些概率的总和即为该假设的p值。

由于该方法是基于所有可能的样本计算,因此它被称为“精确”概率检验。

费希尔精确概率检验常用于小样本数据的比较分析,比如用于评估两组病人的治疗效果是否有显著差异。

此外,该方法还可以应用于遗传学研究中的等位基因频率比较、生物信息学中的基因表达量分析等领域。

- 1 -。

四格表资料的Fisher确切概率法培训课件

四格表资料的Fisher确切概率法培训课件
根据资料的具体情况,可选用: 1. 直接计算概率法 2. 正态近似法
1. 直接计算概率法
样本率与总体率的比较
应用条件:π0偏离0.5较远,且阳性数X 较小 作单侧检验时。
例1 根据以往长期的实践,证明某常用药的 治愈率为80%。现在某种新药的临床试验中, 随机观察了10名用该新药的患者,治愈9人。 问该新药的疗效是否比传统的常用药好?
=1 =2
=3
=4
=6
2 分布曲线
卡方检验基本思想
2 分布的概念
2 分布
(=10,20,30,50)
=10 =20
=30
=50
2 分布特点
卡方检验基本思想
2 分布的概念
2 分布的形状依赖于自由度ν 的大小: ① 当自由度ν≤2时, 曲2 线呈“L”型; ② 随着ν 的增加, 2曲线逐渐趋于对称; ③ 当自由度ν →∞时, 曲2 线逼近于正态曲线。
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
☆二项分布的应用☆
1. 估计总体率的可信区间 (1)查表法 (n50,特别是p远离0.5时) (2)正态近似法 (n>50 且 np5 和n(1-p) 5 ) 2. 样本率与已知总体率比较的假设检验 (1)直接计算概率法( π0偏离0.5较远, X 较小, 单侧检验 )
(goodness of fit)中也发现了这一相同的 2 分
布,可用于检验资料的实际频数和理论频数 是否相符等问题。
2 分布的密度函数
f
(
2)
1
2(
)
(
2
2
1 2
)2 e 2

四格表资料的Fisher确切概率法资料讲解

四格表资料的Fisher确切概率法资料讲解
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
9
二、两样本率比较
目的:推断两个样本各自代表的两总体率是否相等 应用条件:当两个样本率均满足正态近似条件时,
可用u检验。
up1p2 sp1p2
p1p2
pc(1pc)(n11
1) n2
pc
x1 n1
x2 n2
10
两样本率比较
例5 为研究高血压病的遗传度, 某医师进行了高血 压子代患病率调查。其中父母双亲有一方患高血压 者调查了205人,其中高血压患者101人;父母双亲 均患高血压者调查了153人,其中高血压患者112人。 问双亲中只有一方患高血压与双亲均患高血压的子 代中,高血压患病率是否相同? 本例 p1=101/205=0.49268
H0(=0=50) 成立时,1小时内该装置发出的质点数的概率分布 19
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万,在该省某 地抽查10万人,进行三年死亡回顾调查,得肺 癌死亡数为82人。已知该地人口年龄别构成与 全省基本相同。问该地肺癌死亡率与全省有无 差别?
本例π0=0.80,1-π0=0.20,n=10, 根据题意需求最少治愈9人的概率。
5
样本率与总体率的比较----直接计算概率法
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0成立时, 400名新生儿中染色体异常例数的概率分布
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
12

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。

这类资料在医学研究中较为多见。

例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下:有效无效有效率(%)试验组12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。

fisher确切概率法的适用条件 -回复

fisher确切概率法的适用条件 -回复

fisher确切概率法的适用条件-回复适用条件是指在什么情况下可以使用fisher确切概率法。

fisher确切概率法(Fisher's exact test)是一种用于数据分析的统计学方法,用于评估两个或多个变量之间的关联性。

它得名于英国统计学家Ronald Fisher,该方法可以显著验证小样本数据中的相关性。

fisher确切概率法适用于以下情况:1. 小样本数据:fisher确切概率法主要适用于小样本数据。

当样本数据较大时,通常使用卡方检验来评估变量之间的关联性。

相比之下,fisher 确切概率法在小样本数据中提供了更准确的分析结果。

2. 二项分布:fisher确切概率法用于评估二项分布数据。

二项分布指具有两个可能结果的离散概率分布。

例如,投掷一枚硬币的结果只能是正面或反面,这是一个二项分布。

3. 独立性检验:fisher确切概率法主要用于独立性检验。

独立性检验是用于确定两个或多个变量之间是否存在相关性的统计方法。

例如,研究人员可能想要知道吸烟与肺癌之间是否存在相关性,fisher确切概率法可以用于评估这种关联性。

4. 两个分类型变量:fisher确切概率法适用于两个分类型变量之间的关联性研究。

例如,研究人员可能想要确定两种不同的药物治疗是否对疾病的治疗效果有关,fisher确切概率法可以帮助他们确定这种关联性。

使用fisher确切概率法进行数据分析通常涉及以下步骤:1. 建立研究假设:在进行数据分析之前,研究人员需要明确研究假设。

例如,研究人员可能假设两个变量之间没有相关性。

2. 采集数据:研究人员需要收集与研究假设相关的数据。

数据应该是小样本数据,并且是二项分布的。

例如,研究人员可以收集关于两种不同治疗方法下病人治愈与否的数据。

3. 构建列联表:研究人员需要根据收集到的数据构建一个列联表。

列联表用于展示不同条件下的观察频数。

例如,研究人员可以根据收集到的病人治愈与否数据,构建一个2x2的列联表,其中行表示两种不同的药物治疗,列表示病人治愈与否。

概率论fisher定理

概率论fisher定理

概率论fisher定理概率论:Fisher定理的解读概率论是数学中一个重要的分支,它研究的是随机现象的规律性。

在这个领域中,有一条被广泛应用于各种学科的定理,即Fisher定理。

本文将对Fisher定理进行解读,探讨它的由来、应用以及对科学研究的意义。

Fisher定理是由英国统计学家罗纳德·艾尔默·费歇尔(Ronald Aylmer Fisher)于20世纪提出的。

它主要用于在给定数据样本条件下,计算统计量的分布概率。

Fisher定理的核心思想是基于样本数据得到关于总体参数的统计量,从而推断总体参数的分布情况。

Fisher定理的应用非常广泛,尤其在实验和观察研究中。

例如,在医学领域中,科学家们常常根据患者的数据样本来推断某种疾病的发病率,并基于此制定治疗方案。

同样,在生态学和环境科学领域中,研究人员根据野外观察的样本数据来推断物种多样性或者环境变化的趋势。

在经济学中,研究人员利用Fisher定理来估计不同变量之间的关联性和影响力,以更好地理解市场的运行规律。

Fisher定理在科学研究中的意义是多方面的。

首先,它为科学家们提供了一种精确推断总体参数的方法。

通过样本数据,我们可以根据Fisher定理计算得到统计量的概率分布,并进一步推断总体参数的分布情况。

这为科学家们提供了更准确的研究结果,使研究成果更加可靠。

其次,Fisher定理促进了科学研究的进步。

在过去,科学研究往往依赖于个别的案例或者观察结果,缺乏统计学上的科学性。

而Fisher定理的应用,使得研究结果能够通过严格的统计方法得出,并得到普遍适用的结论。

这为不同学科的研究提供了框架和方法,并推动了学科的发展。

值得一提的是,Fisher定理也有其局限性。

首先,它基于一些假设条件,例如样本的随机性、总体的正态分布等。

如果这些假设条件不满足,Fisher定理的应用就可能出现偏差。

此外,样本数据的大小也会影响推断结果的准确性。

在样本较小时,推断结果的可靠性会降低。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

墨 如何讲好FISHER确切概率法 邵 丹 (南方医科大学公卫学院生物统计学系,广东广州510515) 摘 要:FISHER确切概率法是双总体的比率假设检验的 重要方法.也是数理统计教学的重要内容,但现有的课本对该 方法原理的介绍都过于简略,以致学生往往很难理解和掌握 该方法。本文针对这一实际情况.对FISHER确切概率法进行详 细系统的证明,并指出了讲解该方法的要点,同时结合MAT— LAB程序实现该方法.教师可以在课堂上演示。实践证明.这‘ 种深入剖析且可视化的讲解方法.大大提高了学生的学习兴 趣.收到了良好的教学效果 关键词:比率假设检验 FISHER确切概率法 MATLAB 程序算法 前言 双总体的比率假设检验是数理统计学科中比率假设检验 的一项重要内容,在大样本的情形下,根据中心极限定理.用 正态逼近法进行检验。20世纪英国统计学家FISHER提出了确 切概率法,该方法在大小样本的情形下都可以使用。相比较正 态逼近法,该方法适用范围广且比较精确,可以检验水平保证 不超过给定的 ;缺点是计算麻烦。所幸随着计算机的高速发 

觉得一直在门外徘徊。要解决这个问题,教师可以采取新的方 法,针对不同专业的需求,向学生传授数学知识,这样一方面 能够使学生体会到数学在自己专业的作用,另一方面能够使 学生比较全面系统地掌握一部分内容.尊重数学的逻辑性特 征。例如,经济类专业不需要空间向量,但对线性代数和概率 论与数理统计需要一定程度的了解和掌握。在安排教学内容 时我们就可以将线性代数和概率论部分作为侧重点:相对而 言,工程管理类专业虽然也采用经管类教材,但是作为文科中 的偏理专业,他们在实际工作当中对于空间向量就需要一定 程度的了解,在教学过程中这部分知识就需要我们向他们重 点讲授。如果数学更加精细分类,作为向社会输送应用型技能 人才的高职高专学院,教学中应充分考虑到其实用性,根据现 有条件向社会调查了解各专业所需要的数学知识。以微积分 为教学基础.有选择性地安排教学内容和教学深度。 (二)传统经管类教学方法的改进 数学教育是一种理性教育.可以训练人的抽象思维、逻 辑思维和辩证思维,它能赋予人们一种特殊的思维品质,可 以提高人的综合素质。经管类专业学生由于在学习过程中觉 得内容庞杂,从而感觉《高等数学》抽象枯燥,难以理解,在学 习过程中易产生“厌学”情绪。这种现象要求教师在教学中要 努力改变这种状态,使学生对数学产生兴趣而快乐地学习《高 等数学》。教师不能按照传统的“满堂灌”输数学公式的方法教 学,在教学中要注重数学思维思想的渗透,同时配以数学史, 在引出数学定义或符号时介绍各部分内容的产生背景.或者 所学数学知识在现实生活中的应用。使学生了解探索数学观 念的历程.引导学生领悟数学思维的特征并充分体会到数学 的实际用途。例如在微积分的引入教学中教师可给学生讲牛 顿一莱布尼茨的故事.在教学内容过程中要让学生注意对变 量数学思维,以及对变化规律、建立变化的数学模型的把握; 讲常微分方程时教师可应用现实的例子,如马尔萨斯如何将 人口模型用微分方程形式表示出来:讲授线性代数时教师可 讲解逻辑推理及数学本身的符号运算,同时介绍线性代数在 现代运筹学中的运用发展:讲概率论和数理统计时让学生注 意掌握不确定现象中的数学规律.如配人数学建模中的遗传 模型,学生不仅能够重温高中时学习生物遗传规律的感觉,而 且能够结合线性代数、数理统计和微积分建立模型并解决问 题,更能充分体会到数学中各类知识的融合应用的乐趣。日本 著名教育家米山国藏说:“我搞了多年的数学教育,发现学生 学习的数学知识离校不到一两年,便很快忘掉了。然而无论从 事什么工作,唯有深深铭刻于头脑中的数学精神、数学思维 方法、研究方法却随时地发生作用,使他们受益终生。”因此, 高职高专经管类《高等数学》教学要改变以往教师对数学知 识讲得过于面面俱到的教学模式.突出对解决问题的思维过 程的展示,揭示解决问题的思想和方法。在教学过程中教师 要引导学生用数学眼光观察五光十色的大千世界,对学校、 社会方方面面的问题进行数学解读.将数学思维用于解决未 来生活、工作中的难题。 (三)将现代教育技术融入教育中 随着计算机在教学中的渗透,传统的教学手段也需要更 新。学生通过板书可体会数学思想,但是毕竟在感官上体会有 限;通过计算机辅助教学,学生可以更加全方位地体会到数学 美所在。例如数学中的对称美,在函数教学中,教师通过 Matlab、Mathematica或几何画板等数学教学软件让学生欣赏 各种不同的对称曲线.如星形线、心形线、笛卡尔叶形线、蔓叶 线、三叶玫瑰线、四叶玫瑰线等,不仅能增强学生的数学体验, 而且能提高学生学习数学的兴趣 利用计算机在图像处理上 的优势,教师可以在概念讲解中利用数形结合帮助理解。例 如,在讲解函数f(x)在xo处的极限定义时,教师可让x从x 的左 

右两侧向Xo靠近,动态描述在x。的运动过程中,其对应函数值 的运动情形,从而得出函数在一点处极限的定义。借助计算机 制作数学课件,教师也可以使较为抽象的内容通过图形、动画 等演示更直观化,加深学生的理解。同时,在教学中可以逐步 利用Matlab、Mathematica等数学教学软件。当然,除了数学专 业软件,教师还可以应用更加常用的办公软件. ̄NExcel就具有 基本统计分析功能。在学习数理统计这部分内容时教师可以 结合统计调查、统计整理等统计理论,有针对性地让学生理解 计算机在数学应用中的作用。实践表明.在数学教学过程中教 师引入现代教育技术.不仅能够加深学生对所学知识的的理 解,而且能够增强他们对办公软件的使用能力.课后通过实验 进一步加强学生的实践动手能力,提高学习效率,这种教学方 式的应用效果比较令人满意。 三、结语 社会主义市场经济建设和社会的进一步发展使得社会越 来越需要基础扎实、能力强、综合素质高的复合型人才.良好 的数学素质有助于提高人们的综合素质。在大环境的要求下, 我们要对高职高专经管类《高等数学》课程进行完善。作为数 学教育工作者,我们必须时刻更新自己的教育思想与教学理 念.改进教学方式,使得学生更好地适应未来的发展。 

参考文献: [1]王树禾.数学思想史[M].北京:国防工业出版社,2003. [2]林夏水.数学哲学[M].上海:商务印书馆,2003. [3]冉苒.数学教育心理学[M].成都:四川科学技术出版 社.2002. 

57 展,计算已然不成问题.但仍存在难以理解其原理的问题。笔 者在教学过程中发现,现有的数理统计和医学统计教科书对 该方法的介绍都是点到即止,对原理剖析得不够透彻,增加了 理解难度,学生普遍反映难以理解该方法。因此笔者在此详细 探究FISHER确切概率法的证明过程.以补充教科书的不足; 根据学生反馈对难点进行重点讲解:并给出了MATLAB程序 实现该方法的的详细算法,教师可在课堂上演示,以加深学生 对该方法的理解,提高学生的学习兴趣。 1.FISHER确切概率法[ 1.1问题的提出 例:某公安局有两个刑侦组,在过去一年内第一组接手25 件人命案,结果侦破了23件,第二组接手35件人命案,结果侦 破了30件。问:两个组的侦破能力有无区别? 对该问题进行数学解释,设第一组侦破率为P., f 1表示第一组侦破成功,其概率为P 一【O表示第一组未能侦破成功,其概率为1-p. 即x服从均值为p 的伯努利分布,x ,…, 为来自总体x 的样本,n=25。 同理设第二组侦破率为P., f1表示第二组侦破成功,其概率为p, 一10表示第二组未能侦破成功,其概率为1-p, 即Y服从均值为p 的伯努利分布,Y ,…,Y 为来自总体Y 的样本,m=35。 两两总体X,Y独立, 一,x ,y 一,y 为对应的观察值, 原假设为H。:p,=p:,则本质为一个双总体的比例假设检验。显 然,该问题pl1= ∑xi=0.92,np11(1-pI1)=1.84<5;p22= ∑y. =O.857,mp,(1一p,2)=4.29<5不是大样本情形,不能用正态逼 近法来解决,只能用FISHER确切概率法来解决。FISHER确切 概率法也是假设检验方法的一种,回顾假设检验的步骤,现在 需要找出一个在原假设成立时已知概率分布的随机变量,然 后根据这次该随机变量值的出现是否是小概率事件来判断原 假设是否成立。 事实上,若H。成立, ̄t=Xxi+ y 固定时,则检验统计量s =∑X是一个服从超几何分布的随机变量[2j,该结论在教材上 都是直接指出,而没有详细的解释和证明,学生普遍反映不能 理解,下面将给出该结论的详细证明。 1.2检验统计量所服从的分布 统计量S =∑Xi在t=Ex;+∑y;固定情况下概率是一个条件 概率.由条件概率公式可以得出: P(Sl=ilSl+s:=t)=1P(S 1=i, Sl+S2 =t)。 而P(Sl=i,Si+S2=t) =P(S】=i,S2=t—i) =P(S =i)P(S,=t—i)(X,Y独立可得) :c ( .) c:,t-i1-p P(1-p, …(由伯努利分布的定义可得)一 pl( )c 2( 2) (由伯努利分布的定义司得)。 在原假设H。:p。=P 成立时,上式可以化简得到: P(Sl=i,Si+S2=t) i【-i t n+ⅡI-t =c c P1(1-p1) 。 原假设H。:p =p 成立时,根据伯努利分布有P(S。+S :t) t t m-t =c + Pl(1-p1)。 因此,P(S.=ilS,+S,=t) i t-i t n+m c c p1(1一P1) c (1一p。) 一cncm 一— ~。 CJ】+m 由超几何分布的概率函数可知,检验统计量服从超几 何分布。超几何随机变量是离散型的随机变量,它的值可列 的。显然,检验统计量S.的取值s1满足s1≥0,sl≥t—m,s1≤n, s.≤t,因此它的范围为[max(t—m,0),max(t—m,0)+1,…, min(n,t)]。 已知了检验统计量的分布,接下来的任务就是根据其分 布来确定该统计量的取值出于哪些范围是属于小概率事件, 而该范围就是拒绝域,即接下来的任务就是如何确定拒绝域。 因为这之前学生接触过的检验统计量一般为正态分布、t分 布、卡方分布等连续型的随机变量,很少接触这种离散型的检 验统计量,所以学生可能一时不知道该如何确定这种离散型 统计量的假设检验拒绝域,这时可以通过借鉴连续型统计量 的情形来引导学生推导。 1.3拒绝域的确定 借鉴连续型的情形,对于给定的检验水平0l,我们希望找 

到两个整数c1和c2,使得P(sI≤cllsl+s2:t)= ,P(s1≥c2ISl+s2= 上 

相关文档
最新文档