第58讲 两个正态总体参数假设检验(比较两个正态总体均值的检验)

第58讲  两个正态总体参数假设检验(比较两个正态总体均值的检验)
第58讲  两个正态总体参数假设检验(比较两个正态总体均值的检验)

参数估计与假设检验的区别和联系

参数估计与假设检验的区别和联系 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。 点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数。 在区间统计中置信度越高,置信区间越大。置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05,0.1 置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。 一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等 (1)来自正态分布的样本均值,不论抽取的是大样本还是小样本,均服从正态分布 (2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布 (3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理 (4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近 (5)样本均数服从的正态分布为N(u a^2/n)远远小于原变量离散程度N (u a^2) 2. 假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。 假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它<2>统计学中假设检验的基本步骤:(1)建立假设,确定检验水准α--假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法 这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。 (3)确定P值并作出统计结论 u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t 界值,则P<0.05。相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。 3.参数估计与假设检验之间的联系与区别: (1)主要联系:a.都是根据样本信息推断总体参数;b.都以抽样分布为理论依据,建立在概率论基础之上的推断;c.二者可相互转换,形成对偶性。 (2)主要区别:a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;b.区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c.区间估计立足于大概率,假设检验立足于小概率。

spss_数据正态分布检验方法及意义

spss 数据正态分布检验方法及意义判读 要观察某一属性的一组数据是否符合正态分布,可以有两种方法(目前我知道这两种,并且这两种方法只是直观观察,不是定量的正态分布检验): 1:在spss里的基本统计分析功能里的频数统计功能里有对某个变量各个观测值的频数直方图中可以选择绘制正态曲线。具体如下:Analyze-----Descriptive S tatistics-----Frequencies,打开频数统计对话框,在Statistics里可以选择获得各种描述性的统计量,如:均值、方差、分位数、峰度、标准差等各种描述性统计量。在Charts里可以选择显示的图形类型,其中Histograms选项为柱状图也就是我们说的直方图,同时可以选择是否绘制该组数据的正态曲线(With nor ma curve),这样我们可以直观观察该组数据是否大致符合正态分布。如下图: 从上图中可以看出,该组数据基本符合正态分布。 2:正态分布的Q-Q图:在spss里的基本统计分析功能里的探索性分析里面可以通过观察数据的q-q图来判断数据是否服从正态分布。 具体步骤如下:Analyze-----Descriptive Statistics-----Explore打开对话框,选择Plots选项,选择Normality plots with tests选项,可以绘制该组数据的q-q 图。图的横坐标为改变量的观测值,纵坐标为分位数。若该组数据服从正态分布,则图中的点应该靠近图中直线。 纵坐标为分位数,是根据分布函数公式F(x)=i/n+1得出的.i为把一组数从小到大排序后第i个数据的位置,n为样本容量。若该数组服从正态分布则其q-q图应该与理论的q-q图(也就是图中的直线)基本符合。对于理论的标准正态分布,其q-q图为y=x直线。非标准正态分布的斜率为样本标准差,截距为样本均值。 如下图:

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 0.05,α=26,n = 0:1600H μ=, 即,以95%的把握认为这批产品的指标 的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数 的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n =由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n =由检验统计量0.9733 Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的.

单个正态总体参数的假设检验

16.3 单个正态总体参数的假设检验 设,,,12n X X X 是来自正态总体()2,N μσ的样本,考虑如下三种关于μ的检 验问题 (1) 00:H μμ≤ vs 10:H μμ> 单侧检验 (2) 00:H μμ≥ vs 10:H μμ< 单侧检验 (3) 00: H μμ= vs 10:H μμ≠ 双侧检验 ********************************************************** (1) 00: H μμ≤ vs 10:H μμ> 单侧检验 (3) 00:H μμ= vs 10:H μμ≠ 双侧检验

********************************************************** 下面给出σ已知时,上述三种检验情况的具体实现。 σ已知时的,对于单侧检验问题(1) 00:H μμ≤ vs 10:H μμ>, 2 ~, X N n σμ?? ?? ? ,故选用服从标准正态分布的检验统计量X u =, 通常称此检验为u 检验。 拒绝域选为()()?? ? ???????≥σμ-==c x n u x x W n 01:,, ,c 为临界值,简记为{}c u ≥。若显著性水平要求为α,则可确定α-=1u c 。 同理对 问题(2),00: H μμ≥ vs 10:H μμ<,水平为α的检验的拒绝域为 ()()?? ? ???????≤σμ-==αu x n u x x W n 01:,, 。 问题(3),00: H μμ= vs 10:H μμ≠,水平为α的检验的拒绝域为 ()()?? ? ???? ? ??≤σμ-= =α2-101u x n u x x W n :,, 。 ********************************************************** 例16.3.1 设某工厂生产一种产品,其质量指标服从正态分布()2 2,μN ,μ为 平均质量指标,其值越大则质量越好,10=μ是达到优级的标准。进货商店从一批产品抽取样本,, ,12n X X X ,16=n ,取显著性水平为050.=α,如何检 验这一批产品是否达到优秀。 分析: 根据工厂产品社会声誉可能的不同,分以下两种情况讨论。 情形一,按照过去长时间的记录,商店的检验人员相信该厂的产品质量很好。

正态总体参数的假设检验matlab处理

正态总体参数的检验 1 总体标准差已知时的单个正态总体均值的U检验 某切割机正常工作时,切割的金属棒的长度服从正态分布N(100,4)。从该切割机切割的一批金属棒中随机抽取15根,测得长度为: 97 102 105 112 99 103 102 94 100 95 105 98 102 100 103 假设总体的方差不变,试检验该切割机工作是否正常,即检验总体均值是否等于100?,取显著性水平a=0.05。 分析: 这是总体标准差已知时的单个正态总体均值的检验,根据题目要求可写出如下假设: H0:u=u0=100,H1=u /=u0(u不等于u0) H0称为原假设,H1称为被择假设(或对立假设) MATLAB统计工具箱中的ztest函数用来做总体标准差已知时的单个正态总体均值的检验 调用格式ztest [h,p,muci,zval]=ztest(x,mu0,Sigma,Alpha,Tail) x:是输入的观测向量 mu0:假设的均值 Sigma:总体标准差 Alpha:显著性水平,默认0.05

Tail:尾部类型变量,‘both’双侧检验(默认),u不等于uo;‘right’右侧检验,u>u0; ‘left’左侧检验,uAlpha时,接受原假设H0;p<=Alpha 时,拒绝原假设H0. muci:总体均值u的置信水平为1-Alpha的置信区间 zval:检验统计量的观测值 %定义样本观测值向量 x=[97 102 105 112 99 103 102 94 100 95 105 98 102 100 103]; mu0=100; %原假设中的mu0 sigma=2; %总体标准差 Alpha=0.05; %显著性水平 %调用ztest函数做总体均值的双侧检验(默认), %返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值zval [h,p,muci,zval]=ztest(x,mu0,sigma,Alpha) h = 1 p =

第六章参数估计和假设检验(精)

第六章参数估计和假设检验 教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。 本章重点与难点:区间估计的计算与总体均值的假设检验方法。 计划课时:授课6课时;技能训练2课时。 授课特点:案例教学 第一节点估计和区间估计 一、总体参数估计概述 ?1、总体参数估计定义 ?就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。 ?2、参数估计应满足的两个条件 二、参数的点估计 ?用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。 再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计 三、参数的区间估计 (一)参数的区间估计的含义 ?区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

(二)有关区间估计的几个概念 置信水平 1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2. 表示为 (1 - α% ) α 为是总体参数未在区间内的比例 3. 常用的置信水平值有 99%, 95%, 90% 相应的显著性水平α 为0.01,0.05,0.10 置信区间 1. 由样本统计量所构造的总体参数的估计区间称为置信区间 2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值, 5. 样本均值的标准差为 由此可知样本均值落在总体均值μ的两侧各为一个抽样标准差范围内的概率为0。6873 落在总体均值两个抽样标准差范围内的概率为0。9545 落在总体均值三个抽样标准差范围内的概率为0。9973 影响区间宽度的因素 1.总体数据的离散程度,用 σ 来测度 2.样本均值标准差 3.置信水平 (1 - α),影响 z 的大小 评价估计量的标准 x n x σ σ=

参数估计与假设检验的辨析

参数估计与假设检验的辨析 1、参数估计 参数估计是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数。参数估计的方法有点估计和区间估计两种。 1. 点估计 点估计就是用样本统计量的某个取值直接作为总体参数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估 计总体矩,如用样本均值估计总体均值。②最大似然估计 法。于1912年由英国统计学家R.A.费希尔提出,利用样本分 布密度构造似然函数来求出参数的最大似然估计。③最小二 乘法。主要用于线性统计模型中的参数估计问题。 虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计 值很可能不等于总体真值,所以必须给出点估计值的可靠 性,点估计值的可靠性由抽样标准误差来衡量。 2. 区间估计 区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。在进行区间估计时,根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。一般的,如果将构造置信区间的步骤重复多 次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称置信度或置信系数。 求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。 3. 评价估计量的标准 1) 无偏性。指估计量抽样分布的数学期望等于被估计的总体 参数。 2) 有效性。指对同一总体参数的两个无偏估计量,有更小标 准差的估计量更有效。 3) 一致性。指随着样本量的增大,点估计量的值越来越接近 被估总体的参数。 2、假设检验 假设检验是用来判断样本与总体的差异是由抽样误差引起还是

统计学第六章 参数估计和假设检验习题

第六章参数估计和假设检验 一、填空题 1、总体参数估计是指 2、 称为置信水平,表示为 3、落在总体均值两个抽样标准差范围内的概率为 4、影响样本的单位数目的因素有 5、是研究者想收集证据予以反对的假设。 答案:1、就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。 2、将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,(1 - 3、0.9545 4、总体变量的变异程度σ、允许的误差范围△、抽样的可靠程度1-α 5、纯随机抽样、等距抽样(机械抽样)、类型抽样(分层抽样)和整群抽样 二、单项选择题 1、估计量的含义是指(A) A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2、一个95%的置信区间是指( C ) A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

3、抽取一个容量为100的随机样本,其均值为x =81,标准着s=12。总体均值μ的99%的置信区间为( C ) 81±1.97 81±2.35 81±3.10 81±3.52 4.成数与成数方差的关系是(C ) A.成数的数值越接近0,成数的方差越大 B.成数的数值越接近0.3,成数的方差越大 C.成数的数值越接近0.5,成数的方差越大 D.成数的数值越接近l ,成数的方差越大 5.纯随机重复抽样的条件下,若其他条件不变,要使抽样平均误差缩小为原来的1/3,则样本单位数必须( B ) A.增大到原来的3倍 B.增大到原来的9倍 C.增大到原来的6倍 D.也是原来的1/3 6、对于非正态总体,使用统计量 x z =估计总体均值的条件是(D ) A .小样本 B .总体方差已知 C .总体方差未知 D .大样本 7、在假设检验中,原假设和备选假设( C ) A. 都有可能成立 B. 都有可能不成立 C. 只有一个成立而且必有一个成立 D. 原假设一定成立,备选假设不一定成立 8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( A ) A .0:5H μ=,1:5H μ≠

参数估计与假设检验练习题

第5章 参数估计与假设检验练习题 1、设随机变量 X 的数学期望为 μ ,方差为 σ2 ,(X 1 ,X 2 ,···,X n )为X 的一个样本, 试比较 ))(1(12 ∑=-n i i X n E μ 与 ))(1(1 2∑=-n i i X X n E 的大小。 ( 前者大于后者 ) 2、设随机变量 X 与Y 相互独立,已知 EX = 3,EY = 4,DX = DY = σ2 ,试问:k 取何值时,Z = k ( X 2 - Y 2 ) + Y 2 是 σ2 的无偏估计 。 ( 16 / 7 ) 3、设正态总体 X ~ N ( μ , σ2 ) ,参数 μ ,σ2 均未知,( X 1 ,X 2 ,… ,X n )( n ≥ 2 ) 为简单随机样本,试确定 C ,使得 ∑-=+-=1 1212 )(?n i i i X X C σ 为 σ2 的无偏估计。 ( ) 1(21 -n ) 4、假设总体 X 的数学期望为 μ ,方差为 σ 2 ,),...,,(21n X X X 为来自总体 X 的一个样本, X 、S 2 分别为样本均值和样本方差,试确定常数 c ,使得 22cS X - 为 μ 2 的无偏估计量. ( 1 / n ) 5、设 X 1 ,X 2 是取自总体 N ( μ , σ2 ) ( μ 未知)的一个样本,试说明下列三个统计量 2114341?X X +=μ ,2122121?X X +=μ ,2132 1 31?X X +=μ 中哪个最有效。 ( 2?μ )

6、设某总体 X 的密度函数为:??? ??><=其它 03),(3 2θθθx x x f ,( X 1 ,X 2 ,… ,X n )为该 总体的样本, Y n = max ( X 1 , X 2 , … , X n ) ,试比较未知参数 θ 的估计量 X 34 与 n Y n n 313+ 哪个更有效? ( n > 1 时,n Y n n 31 3+ 更有效 ) 7、从某正态总体取出容量为10的样本,计算出 15010 1 =∑=i i x ,272010 1 2=∑=i i x 。求总体期望与 方差的矩估计 μ ? 和 2?σ 。 ( 15 ;47 ) 8、设总体 X 具有密度 ?? ? ??≤>=+-C x C x x C x f 01);()1 1(1???? ,其中参数 0 < ? < 1,C 为已知常数,且C > 0,从中抽得一样本 X 1 ,X 2 ,… ,X n ,求参数 ? 的矩估计量。 ( 1 - C /?X ,其中 ∑==n i i X n X 1 1 ) 9、设总体 X 服从( 0,? )上的均匀分布,其中 ? > 0 是未知参数,( X 1 ,X 2 ,… , X n )为简单随机样本,求出 ? 的矩估计量 ? ? ,并判断 ?? 是否为 ? 的无偏估计量。 ( 2?X ,其中 ∑==n i i X n X 1 1 ;是 ) 10、设( X 1 ,X 2 ,… ,X n )为总体 X 的一组样本,总体 X 密度函数为:

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,取0.05,α=26,n = 0.0250.9752 1.96z z z α===, 由检验统计量 1.25 1.96Z = ==<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为根,各台布机断头数的标准差为根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为根,标准差为根。问,新工艺上浆率能否推广(α= 解: 012112:, :,H H μμμμ≥< ( 3.某电器零件的平均电阻一直保持在Ω,改变加工工艺后,测得100个零件的平均电阻为Ω,如改变工艺前后电阻的标准差保持在Ω,问新工艺对此零件的电阻有无显著影响(α= 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n = 由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤是否成立(α= 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n = 由检验统计量0.9733Z = ==<,接受H 0:p ≤. 即, 以95%的把握认为p ≤是成立的. 5.某产品的次品率为,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α= 解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n = ^ 0.950.05, 1.65z α=-=-,由检验统计量 400 1.5973i x np Z -= = =-∑>, 接受0:0.17H p ≥, 即, 以95%的把握认为此项新工艺没有显著地提高产品的质量. 6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)

参数估计和 假设检验区别联系

参数估计、假设检验及它们之间的关系(相同点、联系与区别) 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计和区间估计两种。 点估计就是直接以样本统计量直接作为相应总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间是由样本统计量加减允许误差(极限误差)得到的。在区间估计中,由样本统计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。在其它条件相同的条件下,区间估计中置信度越高,置信区间越大。置信水平为1-a, a(显著性水平)为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05,0.1。置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。 一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等。 (1)来自正态分布的样本均值,总体方差已知,不论抽取的是大样本还是小样本,均服从正态分布。 (2)总体不是正态分布,总体方差已知或未知,大样本的样本均值服从正态分布,小样本的不能进行参数估计。 (3)来自正态分布的样本均值,如果总体方差未知,原则上都按t 分布来处理(但在大样本的情况下,可近似按正态分布处理)。 2.假设检验假是根据样本统计量来检验对总体参数的先验假设是否成立,是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

参数估计和假设检验.doc

参数估计和假设检验 一. 参数估计 估计的原理: 在前面我们已经得到样本统计量的如下分布: (1)X :2 (,)n σμ (2) 2 2(1)2 n n s χσ-?: (3)μp (, )pq p n : (4)2 2 12 12121 2 ()(, )X X n n σσμμ--+ : (5)μ ?1122 121212 ()(,)p q p q p p p p n n --+: (6) 2 12 12 12222 (1,1)s F n n s σσ--: (7)当总体的方差2σ (1)n x t -: 对于事先确定的置信概率,我们可以构造一个不等式区间,利用这一不等式区间来进行估计,例如已知样本容量和样本均值以及总体的方差,要求以95%的置信概率来估计总体的均值,利用统计量 X :2 (, )n σμ,则我们知道X 落入μ± 这一区间的概率是95%, 也就是X μμ-≤≤+这一不等式成立的概率是95%,由 于在这一不等式中σ、X 、n 为以知,故可得出:

X X μ-≤≤+ 则估计完毕。 同样在知道样本容量及样本方差的情况下可以利用2 2(1) 2 n n s χσ-?:来对总体的方差进行估计 在知道样本容量和样本比例的情况下利用μp (,)pq p n :来对总体比例进行估计 利用2 212 12121 2 ()(, )X X n n σσμμ--+ :来估计12μμ- 利用μ ?1122 121212 ()(,)p q p q p p p p n n --+:来估计12p p - 利用 2 12 12 12222 (1,1)s F n n s σσ--:来估计2 122 σσ 在总体的方差2σ (1)n x t -:来估计μ 利用匹配样本来估计两个总体均值的差:见书P194页 样本容量的确定: 在估计总体的均值、比例和两个总体的均值之差和比例之差时,估计的误差E ,主要由置信概率所决定的区间长度确定的,例如在利用样本均值来估计总体均值时,假设置信概率为95%,则 利用这一等式,显然在E 、σ确定时,也就可以计算出n 。

MATLAB参数估计与假设检验

MATLAB参数估计与假设检验 课型:新授课 教具:多媒体教学设备,matlab教学软件 一、目标与要求 掌握matlab统计工具箱中的基本统计命令及其应用。 二、教学重点与难点 本堂课教学的重点在于引导学生在编写matlab程序时能够熟练运用基本统计量的相关命令实现相应的功能。 三、教学方法 本课程主要通过讲授法、演示法、练习法等相结合的方法来引导学生掌控本堂课的学习容。 四、教学容 上机容回顾 一、基本的统计量命令 二、常见概率分布函数 新授课 统计推断:通过对样本的处理和分析,得出与总参数相关的结论。 统计推断包括参数估计和假设检验两部分容。 示例:吸烟对血压有影响吗? 对吸烟和不吸烟两组人群进行24小时动态监测,吸烟 组66人,不吸烟组62人,分别测量24小时收缩压(24hSBP)和舒压(24hDBP),白天(6Am-10Pm)收缩压(dSBP)和舒压(dDBP ),夜间(10Pm-6Am)收缩压(nSBP)和舒压(nDBP)。然后分别计算每类的样本均值和标准差

问题: 1)任何一个考察的时段,吸烟和不吸烟群体的血压的真值分别是多少?(参数估计)2)吸烟和不吸烟群体的血压的真值是否有区别?(假设检验) 概念: 第一部分: 一:点估计 1 矩估计法 2 似然函数法 二、评价估计优劣的标准 1 无偏性 2 有效性 3一致性 三、区间估计 参数估计的MATLAB实现:

例题: 50名17岁城市男性学生身高(单位:cm): 170.1 179.0 171.5 173.1 174.1 177.2 170.3 176.2 163.7 175.4 163.3 179.0 176.5 178.4 165.1 179.4 176.3 179.0 173.9 173.7 173.2 172.3 169.3 172.8 176.4 163.7 177.0 165.9 166.6 167.4 174.0 174.3 184.5 171.9 181.4 164.6 176.4 172.4 180.3 160.5 166.2 173.5 171.7 167.9 168.7 175.6 179.6 171.6 168.1 172.2 运行结果 标准差区间估计(4.4863,6.6926) 标准差点估计5.3707 均值区间估计(171.1777, 174.2303) 均值点估计172.7040 第二部分 假设检验 总体均值的假设检验 ?总体方差的假设检验 ?两总体的假设检验 ?0-1分布总体均值的假设检验 ?总体分布正态性检验 ?假设检验的MATLAB实现

第5章参数估计与假设检验练习题(精)教学提纲

第5章 参数估计与假设检验练习题 1、设随机变量 X 的数学期望为 μ ,方差为 σ2 ,(X 1 ,X 2 ,···,X n )为X 的一个样本, 试比较 ))(1(12 ∑=-n i i X n E μ 与 ))(1(1 2∑=-n i i X X n E 的大小。 ( 前者大于后者 ) 2、设随机变量 X 与Y 相互独立,已知 EX = 3,EY = 4,DX = DY = σ2 ,试问:k 取何值时,Z = k ( X 2 - Y 2 ) + Y 2 是 σ2 的无偏估计 。 ( 16 / 7 ) 3、设正态总体 X ~ N ( μ , σ2 ) ,参数 μ ,σ2 均未知,( X 1 ,X 2 ,… ,X n )( n ≥ 2 ) 为简单随机样本,试确定 C ,使得 ∑-=+-=1 1212 )(?n i i i X X C σ 为 σ2 的无偏估计。 ( ) 1(21 -n ) 4、假设总体 X 的数学期望为 μ ,方差为 σ 2 ,),...,,(21n X X X 为来自总体 X 的一个样本, X 、S 2 分别为样本均值和样本方差,试确定常数 c ,使得 22cS X - 为 μ 2 的无偏估计量. ( 1 / n ) 5、设 X 1 ,X 2 是取自总体 N ( μ , σ2 ) ( μ 未知)的一个样本,试说明下列三个统计量 2114341?X X +=μ ,2122121?X X +=μ ,2132 1 31?X X +=μ 中哪个最有效。 ( 2?μ )

6、设某总体 X 的密度函数为:??? ??><=其它 03),(3 2θθθx x x f ,( X 1 ,X 2 ,… ,X n )为该 总体的样本, Y n = max ( X 1 , X 2 , … , X n ) ,试比较未知参数 θ 的估计量 X 34 与 n Y n n 31 3+ 哪个更有效? ( n > 1 时,n Y n n 31 3+ 更有效 ) 7、从某正态总体取出容量为10的样本,计算出 15010 1 =∑=i i x ,272010 1 2=∑=i i x 。求总体期望与 方差的矩估计 μ ? 和 2?σ 。 ( 15 ;47 ) 8、设总体 X 具有密度 ?? ? ??≤>=+-C x C x x C x f 01);()1 1(1???? ,其中参数 0 < ? < 1,C 为已知常数,且C > 0,从中抽得一样本 X 1 ,X 2 ,… ,X n ,求参数 ? 的矩估计量。 ( 1 - C /?X ,其中 ∑==n i i X n X 1 1 ) 9、设总体 X 服从( 0,? )上的均匀分布,其中 ? > 0 是未知参数,( X 1 ,X 2 ,… , X n )为简单随机样本,求出 ? 的矩估计量 ? ? ,并判断 ?? 是否为 ? 的无偏估计量。 ( 2?X ,其中 ∑==n i i X n X 1 1 ;是 ) 10、设( X 1 ,X 2 ,… ,X n )为总体 X 的一组样本,总体 X 密度函数为:

相关文档
最新文档