数理统计课件 2.3最小方差无偏估计和有效估计

数理统计课件 2.3最小方差无偏估计和有效估计
数理统计课件 2.3最小方差无偏估计和有效估计

茆诗松《概率论与数理统计教程》(第2版)(课后习题 方差分析与回归分析)【圣才出品】

第8章 方差分析与回归分析 一、方差分析 1.在一个单因子试验中,因子A有三个水平,每个水平下各重复4次,具体数据如下: 表8-1 试计算误差平方和s e、因子A的平方和S A与总平方和S T,并指出它们各自的自由度.解:此处因子水平数r=3,每个水平下的重复次数m=4,总试验次数为 n=mr=12.首先,算出每个水平下的数据和以及总数据和: T1=8+5+7+4=24. T2=6+10+12+9=37. T3=0+1+5+2=8. T=T l+T2+T3=24+37+8=69. 误差平方和S e由三个平方和组成: 于是

而 2.在一个单因子试验中,因子A有4个水平,每个水平下重复次数分别为 5,7,6,8.那么误差平方和、A的平方和及总平方和的自由度各是多少? 解:此处因子水平数r=4,总试验的次数n=5+7+6+8=26,因而有 误差平方和的自由度 因子A的平方和的自由度 总平方和的自由度 3.在单因子试验中,因子A有4个水平,每个水平下各重复3次试验,现已求得每个水平下试验结果的样本标准差分别为1.5,2.0,1.6,1.2,则其误差平方和为多少?误差的方差σ2的估计值是多少? 解:此处因子水平数r=4,每个水平下的试验次数m=3,误差平方和S e由四个平方组成,它们分别为 于是 其自由度为,误差方差σ2的估计值为

4.在单因子方差分析中,因子A有三个水平,每个水平各做4次重复试验.请完成下列方差分析表,并在显著性水平α=0.05下对因子A是否显著作出检验. 表8-2 方差分析表 解:补充的方差分析表如下所示: 表8-3 方差分析表 对于给定的显著性水平,查表知,故拒绝域为 ,由于 ,因而认为因子A是显著的.此处检验的p值为 5.用4种安眠药在兔子身上进行试验,特选24只健康的兔子,随机把它们均分为4组,每组各服一种安眠药,安眠时间如下所示. 表8-4 安眠药试验数据

3.1-3.2.1-估计量的性质、最小方差无偏估计

第三章估计理论 什么是“估计”? 通俗解释:对事物做大致的判断 专业解释:通过一定的技术手段获得关于被估计事件、参数、过程的相关信息,再对这些信 息进行加工、处理获得结果的过程。

3.1引言 3.1 引言 根据研究对象的不同估计分为二种 参量估计:被估计的对象是随机变量或非随机的未知量 波形估计:被估计的对象是随机过程或非随机的未知过程 信号参量估计理论 与信号参量估计相关的理论 最佳估计 一定准则下的“最好”估计 应用领域 通信系统、雷达系统、语音、图像处理、自动控制

3.1.2 估计量的性质质 假设得到N 个观测样本数据为: 为待估计参量,[][]0,1,,1 x n w n n N θ=+=?…式中,是观测噪声。 θ[]w n 估计的任务就是利用观测样本数据构造估计量,获得估计量后,通常需要对的质量进行评价,这就需要研[]x n θ θ θ究估计量的主要性质。 估计量也是一个随机变量,具有均值和方差等统计特征,可以利用其统计特征对估计量的性质进行评价。评价 θ 指标包括:无偏性、一致性、充分性和有效性。

1、无偏性 非随机参量随机参量??θθ 无偏估计 渐进无偏估计()E θθ=()()E E θ=?lim ()N E θθ→∞=?lim ()()N E E θ θ→∞=如果上式不满足,则是一个有偏估计 θ 定义 为估计量的偏估计量的无偏性保证估计量分布在参量真值附近,是衡量()()b E θθθ=?估计量性能优劣的重要指标。然而,一个估计量是无偏的不能确保就是好的估计量,它仅能保证估值的均值近似真值。

2、一致性 可以通过增加观测样本数据来减少估计量的估计误差,具有这种性质的估计称为一致估计。 简单一致性: ?lim (||)1N P θθδ→∞?<=均方一致性:2?lim [()]0N E θ θ→∞ ?= ?定义估计误差,对无偏估计,误差的方差为 222?εθθ=?在同时满足无偏性、均方一致性的条件下,随着观测样本()()()() Var E b E εεθε==数的增加,估计误差的方差将减小并趋于零。

数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

教学单元案例: 参数估计与假设检验 北京化工大学 李志强 教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用 (1)理解总体、样本和统计量等基本概念;了解常用的抽样分布; (2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法; (6)了解求区间估计、假设检验和方差分析的MA TLAB 命令 。 教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟 教学对象:大一各专业皆可用 一、统计问题 引例 例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为: 775,816,834,836,858,863,873,877,885,901 问:新产品亩产是否超过了800斤? 例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2 σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii) 求2 σ的95%置信区间。 例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X . (1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.

应用数理统计-方差分析

第四章 方差分析 方差分析是通过实验数据对影响产品的质量、产量的多个可控因素做统计分析,分清因素的主次及水平组合形式,求最优组合,以提高产品质量、产量的一种数值分析方法. 1、单因素方差分析 设影响指标的因素仅有一个,设为A 因素,该因素有a 个水平(状态)A 1,A 2,…,A a ,在第n 个水平下,分别作n i 次实验,i =1,2,…,a ,其样本值X ij ~N (μ,2 σ),i =1,2,…,a ,或X ij =μi +εij ,εij ~N (0,2 σ). (1)方差分析主要解决 1°H 0:μ1=μ2=…=μa (各水平下的均值相等) H 1:至少有一对均值不相等,μi ≠μj ,i ≠j , i ,j =1,2,…, a . 其方法是若组间(各水平)平方和大,组内(随机误差)平方和小,即F 值大,可拒绝H 0,否则接受H 0,表明A 因素影响不显著. 2°估计μ1,μ2,…μa 及方差2 σ. (2)1°对样本值x ij , i =1,2,…,a , j =1~n i , 1 a i i n =∑=n , 共有n 个样本值,总体均值x =1x n (x =1 1 i n a ij i j x ==∑ ∑,即所有试验数 据之和),2 x = 2 2 1x n ,又i x =1 i n ij j x =∑表示第i 个水平下的样本值之

和,i =1,2,…,a .i x ? = 1 1 n ij i x n =∑= 1i i x n 表示第i 水平下的样本 均值,则 2 i x = 22 1i i x n 或n i 2i x = 2 1i i x n . 2°平方和 ①称S T =() 2 1 1 i n a ij i j x x ==-∑ ∑为总的离差平方和,则 S T =()1 1i n a ij ij i j x x x ==-?∑ ∑-()1 1 i n a ij i j x x x ==-?∑ ∑ =2 1 1i n a ij i j x ==∑ ∑ -1 1 i n a ij i j x x ==∑ ∑-()x nx nx - =2 1 1 i n a ij i j x ==∑ ∑ -2 nx =21 1 i n a ij i j x ==∑ ∑ - 2 1x n . ②称S A =()2 1 1 i n a i i j x x ==-∑ ∑ 为因素A 的组间平方和, S A =()1 1 i n a i i i j x x x ==-?∑ ∑ -()1 1 i n a i i j x x x ==-?∑ ∑ =2 1 1 i n a i i j x ==∑ ∑ -1a i i i x n x =∑ -1a i i i x n x nx =??- ??? ∑ =2 1 a i i i n x =∑ -1 a i i x x =∑ -1 1 i n a ij i j x x nx ==?? - ??? ∑ ∑ =2 1 1a i i i x n =∑ -2nx =21 1a i i i x n =∑ - 2 1x n .

概率论与数理统计 浙大四版 习题解 第 章 方差分析

概率论与数理统计(浙大四版)习题解 第9章 方差分析 约定:以下各个习题所涉及的方差分析问题均满足方差分析模型所要求的条件。 【习题9.1】今有某种型号的电池三批,它们分别是C B A ,,三个工厂所生产的。为评比其质量,各随机抽取5只电池为样品,经试验得其寿命(小时)如下表。 三批电池样品的寿命检测结果 A B C 40 42 26 28 39 50 48 45 34 32 40 50 38 30 43 (1)试在显著性水平0.05下检验电池的平均寿命有无显著的差异。 (2)若差异显著,试求B A μμ-、C A μμ-及C B μμ-的置信水平为0.95的置信区间。 〖解(1)〗 设,,A B C μμμ分别表C B A ,,三厂所产电池的寿命均值,则问题(1)归结为检验下面的假设(单因素方差分析) 01::,,不全相等 A B C A B C H H μμμμμμ== 设A 表因素(工厂),设,,,T R A CR 分别表样本和、样本平方和、因素A 计算数、矫正数,其值的计算过程和结果如下表。 样本数据预处理表 A B C 预处理结果 40 42 26 28 39 50 n=15 48 45 34 32 40 50 a=3 38 30 43 CR=22815 j T 213 150 222 T=585 2j j T n 9073.8 4500 9856.8 A=23430.6 2ij x ∑ 9137 4540 9970 R=23647 11 22 2 112 11585 58522815 1523647 23430.6 j j j n a ij j i n a ij j i n a ij j j i T x T CR n R x A x n =============??== ? ??? ∑∑∑∑∑∑

数理统计第4章答案

数理统计第四章习题答案 1、 为了对一元方差分析表作简化计算,对测定值ij x 作变换()ij ij y b x c =-,其中b 、c 是 常数,且0b ≠。试用ij y 表示组内离差和组间离差,并用它们表示F 的值。 1 1 11112 21 1 22 2 1 1 11 ()() 1()() 1 1011 ()()111 ()() i i i i n n i ij ij i j j i i n n r r ij ij i j i j i i r r A i i i i i i r r i i i i i i y b x c bx bc b X c n n b y b x c x bc b X c n n X c y X c y b b b S n X X n c y c y b b n y y n y y b b b =========== -=-=-=-=-=-∴=+ =+ ≠=-=+ --=-=-∑∑∑∑∑∑∑∑∑∑ 令2 21 () r A i i A i S n y y b S ='=-=∑ 2222 2 1111 22 22 1111 111 11 ()()11 ()()r r r r A A A A A A n n r r E ij i ij i i j i j n n r r ij i ij i i j i j S b S S b S r r S S b S x X c y c y b b y y y y b b ========''===--'∴==-=+--=-=-∑∑∑∑∑∑∑∑ 令2211 ()r n r E ij i E i j S y y b S =='=-=∑∑

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案详解

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7.137=-=A T e S S S 当 0H 成立时, ()()()r n r F r n S r S F e A --- -= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下: 查表得 ()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3)i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 3.对于各组之间的均值进行检验。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

数理统计方差分析

方差分析 一、单因素试验 在入户推销上有五种方法,某大公司想比较这五种方法的效果有无显著差异,设计了一项实验:从应聘的且无推销经验的人员中随机挑选一部分人,将他们随机的分为5个组,每组用一种推销方法进行培训,培训相同时间后观察他们在1个月内的推销额,数据如下表。(单位:千元) 表 1 该试验中,我们所关心的指标,即推销人员的推销额,称为试验指标或响应值;影响推销额(响应值)的指标是推销方法,称为因素;推销方法(因素的状态)称为因素的水平或简称水平。本题中有1个因素,5个水平,故为单因素试验。为比较这5中方法的平均推销额有无显著差异,拟作方差分析。 二、 问题假设 本题中有一因素(推销方法,记为A ),五个不同水平(分别记为 54321,,,,A A A A A )。在每一个水平下考察的指标视为一个总体,并且假定: (1)每个总体均为正态总体,记为2(,)i j N μδ,1,2,3,4,5;j = (2)各个总体的方差相同,即12345;δδδδδ==== (3)从每个总体中抽取的样本相互独立。 三、 符号说明

四、 模型建立 4.1 数学模型 由于),(~2σμj ij N x ,所以假定ij x 具有下述数据结构式: 1,2,3,4,5,6,7;1,2,3,4,5x i j ij j ij με=+==, 其中),0(~2σεN ij 且相互独立。 为了方便起见,把参数的形式改变,有: 1 1k j j k μμ==∑ 1,1,2,...,7,0 k j j j j a j μμα==-==∑其中 在这样的改变下,单因子方差分析的模型可以表示为: 7121,2,...,5;1,2,...,70(0,)ij j ij j j ij x a i j a N μεεσ=?=++==?? =????∑各相互独立切均服从分布 (3.1) 4.2 统计分析 对模型(3.1),检验假设 0123451125:;:,,...,H H μμμμμμμμ====不全相等 等价于对模型(3.1),检验假设 01251125:...0,:,,...,H a a a H a a a ====不全为零

概率论与数理统计方差分析

第10章 方差分析 在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。 要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。 §10.1 单因素方差分析 仅考虑一个因素A 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,在水平i A 下进行i n 次试验,称为单因素试验,试验结果观测数据ij x 列于下表: 并设在水平i A 下的数据i in i i x x x ,,21来自总体),(~2σμi i N X ,),,2,1(r i =。 检验如下假设: r H μμμ=== 210:, r H μμμ,,,:211 不全相等 检验统计量为 ),1(~) /() 1/(r n r F r n S r S F e A ----= 其中2 1 2 11)()(x x n x x S i r i i r i n j i A i -=-= ∑∑∑===,称为组间差平方和。 211 )(i r i n j ij e x x S i -= ∑∑==,称为组内差平方和。

这里 ∑==r i i n n 1 ,∑== i n j ij i i x n x 1 1 ,∑∑===r i n j ij i x n x 111。 对于给定的显著性水平)05.001.0(或=αα,如果),1(r n r F F -->α,则拒绝0H ,即认为因素A 对试验指标有显著影响。 实际计算时,可事先对原始数据作如下处理: b a x x ij ij -= ' 再进行计算,不会影响F 值的大小。 为了计算方便,通常采用下面的简便计算方式。记 ),,2,1(1 r i x T i n j ij i ==∑=, ∑∑===r i n j ij i x T 11 则有 n T n T S r i i i A 212- =∑= , ∑∑∑===-=r i i i r i n j ij e n T x S i 12112 例1 试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著? 解:30,11,9,10,3321=====n n n n r 184,80,65,39321====T T T T 43.70=A S , 74.137=e S 49.5)27,2(90.601.0=>=F F ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。

相关文档
最新文档