一类单边断型分布族参数的双侧经验Bayes检验问题
一类分布族参数的Bayes统计分析

,1 2 O年 6月 0
南昌大学学报 ( 理科版 ) Junl f ac agU i ri ( a rl c n e ora o nhn n esy N t a Si c ) N v t u e
Vo . 4 N . 13 o 3
J n2 0 u . 01
g A 0 g B)=1其 中 0为未知参数 。在熵损失 函数下 , 到 了参数 的 B ys ( )= , ( , 得 ae 估计 和可容许 估计 , 并讨 论了一类
( + ) 形式估计 的可容许性和不可容许性 。 c d
关键 词 :ae 估计 ; Bys 熵损失 函数 ; 可容许性 ; 共轭先验分 布 ; 伽玛分布
一
于n 个独立观察值 。 :… , 得到似然函数 : ,, £ ; ( ) = L x ,2 … , ; ( 】 , ) =
~
e
嘻 f l
(. ) 13
( )两 参 数 指 数 一 威 布 尔 分 布 :( = 1一 1 g ) e , 中 已知 ,c 其 0 >0, =0, =+ ∞ A B ( )刻度 B rX 型分布 :( =1一e‘ , 2 ur g ) 。 从 其
・
2 8・ 1
南 昌大学学报( 理科版 )
21 0 0拒
于是 “ ) ~G mm ( ,) 从 而 = ( a a 1 ,
一
空 间 的一 个 估 计 , 对 于 任 意 的 先 验 分 布 仃( )0 则 0 ,
^
∑ l (i : ∑ ( )是 具 有伽 玛分 布 n X) g 置
令 () 一n()t 一 l (i = l X ,= ∑ n X) () g g 则
大规模假设检验-贝叶斯之道

F1 增长的比 F0 快,所以曲线斜率越来越小(? ? ?解释好像不对) 。
18
大规模假设检验
2.3
经验贝叶斯估计
2.7 式中贝叶斯的两组模型涉及了 3 个变量,无效的先验概率为 π , 密度函数为 f0 (z ),有效密 度函数 f1 (z )。当然,f0 (z ) 是已知的,如果 2.1 式中原假设成立即 zi ∼N (0, 1), 那么 π0 就是已知 的。通常当 π0 对错误观察率影响较小时,π0 接近于 1。 (在应用中,把 π0 当做 1;第六章将讨论 原假设不成立情况下 π0 和 f0 (z ) 的估计值) 。现在只有 f1 (z ) 未知,对统计学家来说,不可能知道 f0 (z ) 的先验信息, 然而,可以使用经验贝叶斯方法对错误观察率进行估计,另 F (z ) 表示 N 个 z 值的经验分布, 即 F (z ) = ♯{zi ∈Z }/N 的一个较好的近似值。 F dr(z ) = ϕ(Z ) = π0 F0 (Z ) F (Z ) (2.21) (2.20) ¯ (z ) 接近 F (z ),F (z ) 是 F (z ) 用估计的错误观察率替换 2.13 式有:当 N 较大时,我们希望 F
f (z ) F(Z )
呢? 在应用中,z 通常是一个尾部区间,对于标准
的正太累积分布函数把 F (Z ) 写作 F ((−∞, z )) ϕ((−∞, z ))≡F dr(z ) = π0 F0 (z )/F (z ) 17 (2.16)
大规模假设检验
用分子 π0 F0 (z ) 和分母 F(z) 画图,表明 F dr(z ) 和 f dr(z ) 分别是正割值和正切值。正如图 2.2 所 示,当两者均较小时,通常表明:f dr(z ) > F dr(z )。 练习 2.3 假定 F1 (z ) = F0 (z ) (通常称为莱曼选择) 因此有: log{ 而且有: . f dr(z )=F dr(z ) 练习 2.3 解答: (2.19) f dr F dr 1 } = log{ } + log( ) 1 − f dr 1 − F dr γ (2.18)
Gamma分布族尺度参数的经验贝叶斯单边检验

经 验 贝叶斯 方法 是 在贝 叶斯 方法 的基 础上 发
数 的经验贝 叶斯检 验 问题 , 获 得 了 O( n 1 ) 的收敛
展起来 的, 其基本思想是 用样本所估计 的先验分 布代替真正的先验分布 , 然后做 出贝叶斯统计与 决策 , 是由文献E 1 - ] 首先提 出来 的, 随着此方法的
关键词 : Ga mma 分布 ; 经验贝叶斯检验 ; 渐 近最 优性 ; 收敛速度 中图分类号 : 0 2 1 2 . 8 文献标志码 : A 文章编 号 : 1 0 0 3 — 5 0 6 0 ( 2 0 1 3 ) 0 7 — 0 8 8 8 — 0 4
Em pi r i c a l Ba y e s o n e - s i de d t e s t s f o r s c a l e pa r a me t e r o f Ga mma d i s t r i b u t i o n f a mi l y
J OURNAL OF HEFE I UNI VERS I TY OF TECHNOLOGY
Vo 1 . 3 6 No . 7
J u 1 .2 0 1 3
Do i : 1 0 . 3 9 6 9 / j . i s s m 1 0 0 3 — 5 0 6 0 . 2 0 1 3 . 0 7 . 0 2 6
O( n - )i s a c h i e v e d i n a s u i t a b l e c o n d i t i o n .An e x a mp l e wh i c h s a t i s f i e s t h e c o n d i t i o n i s p r e s e n t e d .
提出, 在独 立 同分 布 情 形 下 的 经验 贝 叶斯 问题 引
如何正确选用单侧检验与双侧检验

如何正确选用单侧检验与双侧检验如何正确选用单侧检验与双侧检验单侧检验:判定等于关系:H0:μ1=μo H1:μ1≠μo双侧检验:判定大小关系:H0:μ1≤μo H1:μ1>μo或: H0:μ1≥μo H1:μ1<μo(一)双侧检验(two-sided test) 在显著性检验中,无效假设为H o:=,备择假设为H o:≠。
此时备择假设包括了>或<两种可能。
这个假设的目的在于判断与有无差异,而不考虑谁大谁小。
此时,在α水平上否定域为(-∞,-t a)和[t a,+∞],对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2,如下图所示。
这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,t a为双侧检验的临界t值。
双侧检验(显著性水平与拒绝域)(二)单侧检验(one-sided test) 但在有些情况下,双侧检验不一定符合实际情况。
如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。
若进行新技术与常规技术的比较试验,无效假设应为,即假设新技术的实施没有提高产蛋量,备择假设应为,即新配套技术的实施使产蛋量有所提高。
检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。
左侧检验(显著性水平与拒绝域)右侧检验(显著性水平与拒绝域)(三)单侧检验与双侧检验的关系单侧检验的tα=双侧检验的t2α若对同一资料进行双侧检验也进行单侧检验,那么在α水平上单侧检验显著,只相当于双侧检验在2α水平上显著。
所以,同一资料双侧检验与单侧检验所得的结论不一定相同。
双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。
在实际研究中何时用单侧检验何时用双侧检验,一定要根据研究目的所规定的问题的方向性来确定,绝不可以按照自己所希望出现的结果而随心所欲地选用。
从上图可以看出,显著性水平α=0.05不变,双侧检验比单侧检验的临界点更远(临界值右移),同时也使β错误将增大。
两两NQD序列下线性指数分布参数的经验Bayes双边检验

Emp i r i c a l Ba y e s t wo - s i d e d t e s t o f l i n e a r e x p o n e n t i a l d i s t r i b u t i v e
t e r wi t h NQD r a n d o m s e r i e s i n t w o s wa s d i s e u s s e d .B y u s i n g k e r n e l e s t i ma t i o n me t h o d o f p r o b a b i l i t y d e n —
摘要 :讨论 两两 NQD序列下线性指数分布参数 的经验 B a y e s ( E B ) 边检验 问题. 利用概率 密度 函数的核估 计方 法, 构造参数的 E B检验 函数, 在适 当的条 件下证 明 E B检验 函数是渐近最优 的, 并获得 它的收敛速度. 举 出一个满 足定理条件 的例子.
如文[ 2 ~6 ] , 但都是针对独立 同分布及 NA样本情 形的. 文E T l 讨论两两 N Q D序列下线性指数分布参 数的经验 B a y e s 的单边检验, 本文则在文[ 6 , 7 ] 的基 础上考虑肼岍 N Q D序列下线性指数分布参数的经
估计及 E B检验 问题研究颇多. 线性指数分布在检 验一种 新产 品 、 新 工艺 或 新方 法 的有 效 性 方 面起 着
重要 的作用 , 关 于其 参数 的 E B估 计及 E B检验 问题
称 随机 变 量 序列 { l =1 , 2 , …} 是两两 N QD 的 ,
利用bayes公式计算单基因遗传病再发风险的教学策略

利用bayes公式计算单基因遗传病再发风险的教学策略标题:利用Bayes公式计算单基因遗传病再发风险的教学策略在遗传学领域,利用Bayes公式计算单基因遗传病再发风险是一个非常重要的教学策略。
本文将就该主题展开全面评估,并深入探讨该策略的应用和实施,以期为读者提供有价值的知识内容。
一、概念介绍1.1 Bayes公式的基本概念让我们来了解一下Bayes公式的基本概念。
Bayes公式是一种用于更新概率估计的数学公式,它描述了在已知先验概率的情况下,根据新的证据来计算后验概率的方法。
在遗传学中,Bayes公式被广泛用于计算遗传疾病的再发风险,尤其是单基因遗传病的再发概率。
1.2 单基因遗传病的再发风险单基因遗传病是由单一基因突变导致的遗传疾病,如囊性纤维化、地中海贫血等。
对于携带相关致病基因的个体来说,其后代患病的概率取决于其伴侣是否也携带同样的致病基因。
计算单基因遗传病的再发风险对于遗传咨询和临床诊断至关重要。
二、教学策略2.1 从简到繁的教学方法在教学过程中,我们应该采用从简到繁、由浅入深的方式来教授利用Bayes公式计算单基因遗传病再发风险的方法。
学生需要理解Bayes 公式的基本公式和概念,然后逐步引入单基因遗传病的相关知识,并结合实际病例进行分析和计算。
2.2 教学内容的重点教学内容的重点应该包括先验概率的计算、致病基因检测和再发风险的推断。
学生需要掌握如何根据遗传病患者及其家族的遗传史和临床表现,计算其患病的先验概率;掌握基因检测技术和方法,了解如何确定个体是否携带致病基因;掌握如何利用Bayes公式计算单基因遗传病的再发风险,并进行风险评估和预测。
三、个人观点和理解在我看来,利用Bayes公式计算单基因遗传病再发风险是一项非常有挑战性但又十分重要的工作。
它不仅需要我们具备扎实的数学和统计知识,还需要我们对遗传学和临床医学有深刻的理解和实践经验。
只有通过不断的学习和实践,我们才能更好地运用Bayes公式,在遗传病诊断和风险评估中发挥作用。
如何正确选用单侧检验与双侧检验(修订版)
如何正确选用单侧检验与双侧检验单侧检验:判定等于关系:H0:μ1=μo H1:μ1≠μo双侧检验:判定大小关系:H0:μ1≤μo H1:μ1>μo或: H0:μ1≥μo H1:μ1<μo(一)双侧检验 (two-sided test)在显著性检验中,无效假设为H o:=,备择假设为H o:≠。
此时备择假设包括了>或<两种可能。
这个假设的目的在于判断与有无差异,而不考虑谁大谁小。
此时,在α水平上否定域为(-∞,-t a)和[t a,+∞],对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2,如下图所示。
这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,t a为双侧检验的临界t 值。
双侧检验(显著性水平与拒绝域)(二)单侧检验(one-sided test)但在有些情况下,双侧检验不一定符合实际情况。
如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。
若进行新技术与常规技术的比较试验,无效假设应为,即假设新技术的实施没有提高产蛋量,备择假设应为,即新配套技术的实施使产蛋量有所提高。
检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。
左侧检验(显著性水平与拒绝域)右侧检验(显著性水平与拒绝域)(三)单侧检验与双侧检验的关系单侧检验的tα=双侧检验的t2α若对同一资料进行双侧检验也进行单侧检验,那么在α水平上单侧检验显著,只相当于双侧检验在2α水平上显著。
所以,同一资料双侧检验与单侧检验所得的结论不一定相同。
双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。
在实际研究中何时用单侧检验何时用双侧检验,一定要根据研究目的所规定的问题的方向性来确定,绝不可以按照自己所希望出现的结果而随心所欲地选用。
从上图可以看出,显著性水平α=0.05不变,双侧检验比单侧检验的临界点更远(临界值右移),同时也使β错误将增大。
Bayes判别
§5.2Bayes 判别1. Bayes 判别的基本思想假设已知对象的先验概率和“先验条件概率”, 而后得到后验概率, 由后验概率作出判别.2. 两个总体的Bayes 判别 (1) 基本推导设概率密度为1()f x 和2()f x 的p 维总体12,G G 出现的先验概率为1122(),()p P G p P G ==(121p p +=)先验概率的取法: (i) 1212p p ==, (ii) 12121212,n n p p n n n n ==++,一个判别法 = 一个划分=12(,)R R =R1212,,p R R R R =⋃=⋂=∅R距离判别中112212{|(,)(,)}{|(,)(,)}R d G d G R d G d G =≤=>x x x x x x判别R 下的误判情况讨论21(2|1,)()d R P f =⎰R x x ,或12(1|2,)()d R P f =⎰R x x代价分别记为(2|1),(1|2),(1|1)0,(2|2)0c c c c ==, 在得新x 后, 后验概率为1111122()(|)()()p f P G p f p f =+x x x x2221122()(|)()()p f P G p f p f =+x x x x(i) 当(1|2)(2|1)c c c ==时, 最优划分是112212{:(|)(|)}{:(|)(|))}R P G P G R P G P G =≥⎧⎨=<⎩x x x x x x 两个总体的Bayes 的判别准则112212,(|)(|),(|)(|)G if P G P G G if P G P G ∈≥⎧⎨∈<⎩x x x x x x 此时, 有最小的误判概率*12(2|1,)(1|2,)p p P p P =+R R .因为21*1122()d ()d R R p p f p f =+⎰⎰x x x x111122(1()d )()d R R p f p f =-+⎰⎰x x x x()112211()()d R p p f p f =+-⎰x x x只有取12211{:()()}R p f p f =≤x x x 时, 才有最小. (ii) 当(1|2)(2|1)c c ≠时对1G 的误判平均损失: (1,)(2|1)(2|1,)l c P R =R , 对2G 的误判平均损失:(2,)(1|2)(1|2,)l c P R =R , 对整个误判的平均损失:12(1,)(2,)L p l p l =+R R12(2|1)(2|1,)(1|2)(1|2,)c p P R c p P R =⋅⋅+⋅⋅可证使L 最小的最优划分是1112221122{:(2|1)()(1|2)()}{:(2|1)()(1|2)()}R c p f c p f R c p f c p f =≥⎧⎨=<⎩x x x x x x 或112212{:(2|1)(|)(1|2)(|)}{:(2|1)(|)(1|2)(|))}R c P G c P G R c P G c P G =≥⎧⎨=<⎩x x x x x x 当12p p =时, 有112212{:(2|1)()(1|2)()}{:(2|1)()(1|2)()}R c f c f R c f c f =≥⎧⎨=<⎩x x x x x x 当12p p =, 且时(1|2)(2|1)c c c ==, 有 112212{:()()}{:()()}R f f R f f =≥⎧⎨=<⎩x x x x x x相当于经典统计学中的似然比准则判别. (2) 两个正态总体的Bayes 判别 1) 12==ΣΣΣ的判别112212,()(),()()G if W W G if W W ∈≥⎧⎨∈<⎩x x x x x x 其中111222(),()T TW b W b ++x a x x a x ,及 111111111,2ln TT T b p --+-a μΣμΣμ122122221,2ln T T T b p --+-a μΣμΣμ 实用中, 用样本均值和样本协方差阵代.替.当1212p p ==时, 与距离判别等价. 如用后验概率来判别(或其估计), 则有112212,(|)(|),(|)(|)G if P G P G G if P G P G ∈≥⎧⎨∈≥⎩x x x x x x .1) 12≠ΣΣ的判别与距离判别的区别为广义平方距离函数21111111()()()ln 2ln((2|1))T d c p -=--+-x x μΣx μΣ,21222222()()()ln 2ln((1|2))T d c p -=--+-x x μΣx μΣ推导过程略.当 “三同”时, 与距离判别一样.(3) 误判概率的计算在12==ΣΣΣ下, 作简要讨论. 用广义距离2221()()d d -x x 可导出划分12{:()}{:()}R W d R W d =≥⎧⎨=≥⎩x x x x (^_^) 其中112()()()T W -=--x μμΣx μ, 21(1|2)ln (2|1)c p d c p =, 两个总体1G 与2G 的马氏平方距离可记为11212()()T λ-=--μμΣμμ经导, 对(^_^)的划分, 其误判率为*121p p p ΦΦ⎛⎫=+- ⎪⎝⎭ 随λ大而小.实用中, 用(1)(2)1(1)(2)ˆ()()T λ-=--x x S x x 代λ.当121/2p p ==时, 有*2112211ˆ2n n p n n ⎛⎫=+ ⎪⎝⎭当12,p p 按容量比例选取时, 即12121212,n n p p n n n n ==++ 有 *122112ˆn n p n n +=+ 误判率的回代估计.例5.3 预报春旱. 两个预报因子的观察值12,X X , 假设误报损失相同, 先验概率按比例. 由下表数据进行两总体的Bayes 判别.解 16/140.4286p ==, 28/140.5714p ==. 调用proc discrim 得12ln || 1.8053,ln || 3.6783S S =-=- (1)(2)25.31622.025,2.416 1.187x x ⎡⎤⎡⎤==--⎢⎥⎢⎥⎣⎦⎣⎦ 122.2130.6570.2730.063,0.6570.2690.0630.106S S --⎡⎤⎡⎤==--⎢⎥⎢⎥⎣⎦⎣⎦ 广义平方距离为(1,2j =)2()1()()()()ln 2ln j T j j j j j d p -=--+-x x xS x x S 后验概率为222ˆˆ0.5()0.5()1ˆ(|)e e j k d d j k P G --==∑x x x ,(1,2j =).回代判别结果如下略,误判率=0;若用交叉确认法, 则应按下式计算2()1()()()()()()()()ln 2ln j j j T j j x x x x j d p -=--+-x x x S x x S 逐个剔除, 交叉判别.有一错(10号被判错), 交叉确认估计*ˆ1/140.0714c p ==3. 多个总体的Bayes 判别(1) 一般讨论设概率密度为1~()k f x 的p 维总体1~k G 出现的先验概率为1~1~()k k p P G =, (11kj j p ==∑)先验概率的取法:(i) 1~1k p k =, 或(ii) 1~1~12k k k n p n n n =++,一个判别法= 一个划分=12{(,,,)}k R R R =R 判别准则 1,,kp j i j j R R R i j ==⋃=⋂=∅≠R判别R 下的误判情况讨论(|,)()d ,j i R P j i f j i =≠⎰R x x ,(1~)j k = 代价记为一个损失矩阵()(|)k k c j i ⨯(约定(|)0,1~c i i i k ==)常取(|)1,c j i i j =≠. 来自i G 判为其他总体的概率是(|,)j iP j i ≠∑R 误判的概率*1(|,)ki i j i p p P j i =≠⎛⎫= ⎪⎝⎭∑∑R 使其最小, 得最优划分.当(|)c j i 不全相等时, 将来自i G 判为其他总体的平均损失率1(|,)(|)ki j l P j i c j i ==∑R误判的平均损失率111(|,)(|)kkk i i i i i j L p l p P j i c j i ===⎛⎫== ⎪⎝⎭∑∑∑R应使其最小的划分R .进一步的讨论1) 当(|)1,c j i i j =≠时,因1(|,)1kj P j i R ==∑, 故(|,)1(|,)j iP j i P i i ≠=-∑R R从而有()()*111(|,)1()d ik ki R i i p P i i f ===-=-∑∑⎰R x x11()d iki R i f ==-∑⎰x x当1{:()max ()},1~i i i j j j kp f p f i k ≤≤===R x x x 时,12(,,,)k R R R =R 是使*p 最小的最优划分.又由Bayes 公式, 当出现样品x 时, 总体i G 的后验概率1~()(|)()i i i j jj kp f P G p f ==∑x x x故最优划分为1{:(|)max (|)}i i j j kR P G P G ≤≤==x x x , (1~i k =)当有多个时, 任选一个.2) 当(|),c j i i j ≠不全相等时,111(|,)(|)kkk i i i i i j L p l p P j i c j i ===⎛⎫== ⎪⎝⎭∑∑∑R11(|)()d jkk i i j i p c j i f ==⎛⎫= ⎪⎝⎭∑∑⎰R x x11(|)()d jkki i j i p c j i f ==⎛⎫= ⎪⎝⎭∑∑⎰R x x11()(|)()()d jkj iiki j j h x p c j i f h ==⎛⎫ ⎪⎝⎭∑∑⎰R x x x 取划分为1{:()min ()},1~j j i i i kh p f j k ≤≤===R x x x可使L 达到最小. 若记1(|)(|)(|),1~kj i i H G c j i P G j k ===∑x x(当出现x 后,被判为来自j G 后验平均损失, 则有1{:(|)min (|)},1~j j i i kH G H G j k ≤≤===R x x x若有多个, 则任判一个. (2) 多个正态总体的Bayes 判别1) 对1,(|)0,i jc j i i j ≠⎧=⎨=⎩的情况(i) 当12k ====ΣΣΣΣ时,设~(,)j p j G N μΣ(1~)j k =线性判别函数为()T j j j W b +x a x ,其中111,2ln j T T T j j jj j b p --+-a μΣμΣμ 广义平方函数21()()()2ln T j j j j d p -=---x x μΣx μ,1~j k = 后验概率22ˆˆ0.5()0.5()1(|)ee jk kd d j k P G --==∑x x x这时最优划分1{:()max ()}j j i i kR W W ≤≤==x x x1{:(|)max (|)}j i i kP G P G ≤≤==x x x (1~j k =)实用中, 用样本均值和样本协方差阵代替.(ii) 1~k Σ不全相等时, 设~(,)j p j j G N μΣ(1~)j k = 则有21()()()ln 2ln T j j j j j j d p -=--+-x x μΣx μΣ后验概率22ˆˆ0.5()0.5()1(|)ee jk kd d j k P G --==∑x x x ,(1~)j k =这时最优划分1{:(|)max (|)}j j i i kR P G P G ≤≤==x x x (1~j k =)实用中, 用2ˆ()j d x ,ˆ(|)j P G x 代替. 2) 一般损失情况 计算(|),1~i P G j k =x 及1(|)(|)(|),1~kj i i H G c j i P G j k ===∑x x最优划分为1{:(|)min (|)},1~j j i i kH G H G j k ≤≤===R x x x例5.4 某学院招生时, 有两个参考指标1X : 平均学分指数; 2X 管理能力考试成绩;申请者分为3类: 1G 录取; 2G 不录取; 3G 待定. 近期有85位记录.(部分资料)假定1) 各总体~正态分布;2) 先验概率按比例;3) 误判损失相同讨论在(i) 协方差阵相同; (ii) 协方差不全相同时; Bayes判别分析, 并给出误判率的回判法和交叉确认法估计值.若有一新申请者的资料13.12x=和2497x=, 在两种情况下各被判入哪类?解(i) 调用proc discrim过程, 得(部分)和**ˆˆ7/850.0824,8/850.094r c p p ==== 关于新样本0(3.12,497)T x =的后验概率10(|)0.2401P G x =, 20(|)0.0004,P G x =30(|)0.7578P G x =,故应该待定.(ii) 协方差不全相等时, 有和**ˆˆ3/850.03534/850.0471r c p p ==== 关于新样本0(3.12,497)T x =的后验概率 10(|)0.5983P G x =, 20(|)0.0032,P G x =30(|)0.3985P G x =,G类(录取).当属1总结前述内容均利用了所给定的全部p个指标变量, 但并非指标变量越多, 判别效果就越好, 相反, 有时可能影响判别分析效果.因此,如回归分析一样,在判别分析中仍存在指标变量的选取问题,称为逐步判别法.限于本书特点,在此不再详述.有兴趣者可参见如[3]中第6章等.另外sA5系统的Proc stepdisc过程(参见[6])可用于逐步判别分析.。
第六章 bayes判别分析+ 举例
学 习 目 的
本章只介绍判别分析的几种最基本的方法: 贝 叶斯判别、距离判别及费歇判别.学习本章,要密 切联系实际, 着重理解判别分析的基本思想方法及 具体实现步骤,了解几种不同判别分析方法的优、 缺点及应用背景.
第六章
判 别 分 析
贝 贝 叶 叶 斯 斯 判 判 别 别
距 离 判 别 费 歇 判 别 费 歇 判 别
i =1
给定 R 的一个划分 R = ( R1 , R2 ,
Ri ∩ R j = φ (i ≠ j , i, j = 1,2,
, Rk ) , 即 ∪ Ri =R m ,
i =1
k
, k) , 由 R 规 定 的 判 别 准
空间 R m 的一个分划(有时也称为判别) 。即
R m = {R1 , R2 | R1 ∪ R2 = R m , R1 ∩ R2 = φ }
由 R 规定的判别准则如下: 如果 x 落在 R1 内,则判其来自总体 π 1 ; 如果 x 落在 R2 内,则判其来自总体 π 2 。 给定分划的损失函数及平均损失 设 C (1 | 2) 为样品 x 来自总体 π 2 而误判为总体 这 其 π 1 的损失, 一 误 判 的 概 率 记 为 P (1 | 2 , R ) , 中 R = ( R1 , R2 ) ; (2 | 1) 为样品 x 来自总体 π 1 而误判 C 于是有 为总体 π 2 的损失,误判的概率记为 P(2 | 1, R) 。
R m 的任一划分,即
(6-4)
* * 证明:设 R = ( R1 , R2 ) 由(6-4)给出, R * = ( R1 , R2 ) 为
* * * * R1 ∪ R2 = R m , R1 ∩ R2 = φ 。
g(R1 , R2 ) = q1C(2 | 1) P(2 | 1, R) + q2 C(1 | 2) P(1 | 2, R)
如何正确选用单侧检验与双侧检验
如何正确选用单侧检验与双侧检验单侧检验:判定等于关系:H o :卩1=卩o双侧检验:判定大小关系 :H o : 3 i <3 o H i :^ i >3 o 或:H o :^ i 》3 o H i :^ i < 3。
S 6-2 :£态抽样分布上心二山帖 拒绝屋草(阴影部分7的三种不同位置 (一)双侧检验(two-sided test)在显著性检验中,无效假设为 H : ‘5 ,备择假设为 H : 一工…」。
此时备择假设包括了"- >/'-或< "两种可能。
这个假设的目的在于判断与有无差异,而 不考虑谁大谁小。
此时,在a 水平上否定域为 (-8, -t a )和[t a , +8],对称地分配在t 分布曲线的 两侧尾部,每侧的概率为a /2,如下图所示。
这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验,t a 为双侧检验的临界t 值。
双侧检验(显著性水平与拒绝域)(二)单侧检验(one-sided test ) 但在有些情况下,双侧检验不一定符合实际情况。
如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。
若进行新技术与常规技术的 lotrO.W曲双豪Ib 右圜 -1^5 li戏左側I k StK a 亠珈:_L 旦比较试验,无效假设应为 7T . -1- ■■ ,即假设新技术的实施没有提高产蛋量,备择假设 应为’:L:■'|':,即新配套技术的实施使产蛋量有所提高。
检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在左侧检验(显著性水平与拒绝域)右侧检验(显著性水平与拒绝域)单侧检验的t a = 双侧检验的t 2a若对同一资料进行双侧检验也进行单侧检验,那么在a 水平上单侧检验显著, 于双侧检验在2a 水平上显著。
所以,同一资料双侧检验与单侧检验所得的结论不一定相同。
双侧检验显著, 验一定显著;反之,单侧检验显著,双侧检验未必显著。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( ) ( )x+C l8 z 口 z d G
() 4
其中
口 ) I( 00d ) I ,1)( Od () ( = L ( ,0 一L ( d )厂 0 l )C 0
C G= l lL ( , 1l z l ) G Od 10 d ) ( Od ( )x 厂
夸
8 3): P( 受 H0 X = z) (; 7 接
为一 随机化判 决 函数 , 当先 验 分布 函数为 G( ) , (7 则 0 时 8 3)的 B y s 险 为 ; ae风
R(( , ) I{00d) ( ) L ( ,1( 一 )f l )G Od ) G =l L ( ,0占 X + 10d)1 ( ) }( d ( ) O x
, 『 )= h ) 0 , < < , ( 0 ( ( ) ( )0∈ [ ,。 0 o) 断型分 布族 , 如平 移指数 分 布族 , z l )= e ( 0
G( )= 1 0 > 0 一确定 常数 。 0 , 为 本文考 虑下 述检验 问题 : H0 : ≤ 0≤ 2 H1 0< “ 或 0> “ l ¨ : l 2 这 里 l “ 和 为 已知常 数 , 记
“1+
“0 — 一
() 1
其 中 h( ) ( ,。 z 在 0 o)上非 负可积 , 且单 诵下 降。 见()式 中包含 了许 多重 要的一 维单边 截 易 1 )z > 0 0∈ [ ,。 , > 0为 常数 。 , , 0 o)
() 2 () 3 本 文 中设 参数 0的先验 分布 函数 G( ) 8 满足 条件
维普资讯
1 9卷
2
工
程
数
学
学
报
Vl9 。 。1N 2
。 。
2。 年。 月 。2 5
J OURNAL OF NGI E NEE NG RI MATHE ATI S M C
文 章 编 号 :0 53 8 ( 0 2 0 -0 10 1 0 .0 5 2 0 )20 8 —5
2 x叭 ) 丽() 一 h
2( 肌 h x)
其中
肌 +毗 ) )
,
< ≤ 口
1 )_
叭
z
)+
砌
B( )= f x) (7 1( ) ( M ,)+ 3 2 M (7 ,)= e “~】一 c “ 2 “0 ( 0一 ,) 1 2 一 7 胁 )=
“2
,“
“2 一
—
“1
取 损 失 函 数 为 Ln x损 失 函数 ie
1 一 ”0 『 0 “
L ( , 0 00 d )
1 .
,
1 一 UO I 0 > ”
收 稿 日期 :0 00 .5 作 者 简 开 : 会 光 ( 94年 2月 生 ) 男 . 士 . 究 方 向 : 用 概 率 统 计 、 2 0 92 康 16 硕 研 应 可 靠性分析 .
明 它具 有 渐 近 最优 性 , 且 获 得 了收 敛 速 度 。 并
关键 词 截 断型 分布旗 ; 经验 I e 检验 ; Mys 收敛速度
(0 0 2 1 6 G 9 分 类号 AMS 20 )630 ̄2 9
中围分类号 : 2 2 I O 1
文献标识码 : A
1 引 言
关 于单 参数经 验 B ys 验 ( B 问题 , ae 检 E T) 文献 中 已有 不 少讨 论 _ 。但 关 于双 侧 E T 1 B
问题 的研 究很 少 , 尤其 在 Ln x损 失 函数 下 的讨 论 尚未 见 到 , 文 将在 Ln x损 失 函数 下 , ie 本 ie 讨论 一类单边 截 断型分 布族参数 的双侧 E T问题 。 B 本 文考虑 下列 一类单 边 截断 型分 布族
法 的 基 本 原 理 , , , , 和 ( , ) 互 相 独 立 的 , X1 X2 … , 和 X 具 有 共 同 的边 XlX2 … X X 0 是 且 , , x
缘 分布
lz 厂 )= lf l ) C( ): l ( ) ( )G( ) ( ( d 0 O z ≠ od 0 h
维普资讯
工 程 数 学 学 报
第 1 9卷
L c . = ,
{ 。 。 一 ::: : 一“ :。 x “ ‘ ’ : p一 一 . 善
此处 c为正 常数 , = { 0d1 为行 动空间 , 0表示接受 H0 d 表 示 否定 HD D d, 1 d ,l 。
类单边截断型分布族参 数 的双侧经验 B ys ae 检验 问题
一
康会 光 一, 师 义 民 许 ,
勇
(- 北工 业 大学应 用数 学 系 , 1 西 西安 7 0 7 1 2 安阳师 范学 院数学 系 , 阳 4 5 0 10 2 ; - 安 5 0 0)
摘 要 讨论一类单边截 断型 分布旗参数 的双倒经验 B y ̄g ) 验问题 , ae( B 检 构造 了参数 的 E B判决函数 , 证
由( ) , 4 式 易见最 优 的 B y s 断 函数( ae 解 ) ae 判 Bys  ̄ 为
:
其 ] ys 险为 ] e风 a RG= R( G): it 8 0) G)= R( G X , n R( (2 , d ( ) G) () 5 在E B方法 中 , 我们 称 X1X2 … , 为历史 样本 , , , X 而称 X + .: X 为 当前样 本 , E 按 B方
记
L0d =e l “ 一 )一 (0 ) 1 () (,)( ) () (, ) x 0 口} c“一口一 , x =l 0 , 0 G 口 pc ( B L d l a
B( , ) 0< ≤ “ 1 “ 1< z “ 2
2 ( B( x) h “ )一 B( ) 1 z ,