指数分布参数的区间估计和假设检验

指数分布参数的区间估计和假设检验
指数分布参数的区间估计和假设检验

统计学习题区间估计与假设检验..

第五章抽样与参数估计 一、单项选择题 1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( B ) A、样本容量为10 B、抽样误差为2 C、样本平均每袋重量是估计量 D、498是估计值 2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( D ) A、N(100,25) B、N(100,5/n) C、N(100/n,25) D、N(100,25/n) 3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( C ) A、一半 B、一倍 C、三倍 D、四倍 4、在其他条件不变时,置信度(1–α)越大,则区间估计的( A ) A、误差范围越大 B、精确度越高 C、置信区间越小 D、可靠程度越低 5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加( C ) A、1/4 B、4倍 C、7/9 D、3倍 6、在整群抽样中,影响抽样平均误差的一个重要因素是( C ) A、总方差 B、群内方差 C、群间方差 D、各群方差平均数 7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( B )尽可能小 A、总体层数 B、层内方差 C、层间方差 D、总体方差 8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( D ) A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样 9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( A ) A、分层抽样 B、简单随机抽样 C、等距(系统)抽样 D、整群抽样 10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选( A ) A、85% B、87.7% C、88% D、90% 二、多项选择题 1、影响抽样误差大小的因素有( ADE ) A、总体各单位标志值的差异程度 B、调查人员的素质

参数估计与假设检验的区别和联系

参数估计与假设检验的区别和联系 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。 点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数。 在区间统计中置信度越高,置信区间越大。置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05,0.1 置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。 一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等 (1)来自正态分布的样本均值,不论抽取的是大样本还是小样本,均服从正态分布 (2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布 (3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理 (4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近 (5)样本均数服从的正态分布为N(u a^2/n)远远小于原变量离散程度N (u a^2) 2. 假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。 假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它<2>统计学中假设检验的基本步骤:(1)建立假设,确定检验水准α--假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法 这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。 (3)确定P值并作出统计结论 u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t 界值,则P<0.05。相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。 3.参数估计与假设检验之间的联系与区别: (1)主要联系:a.都是根据样本信息推断总体参数;b.都以抽样分布为理论依据,建立在概率论基础之上的推断;c.二者可相互转换,形成对偶性。 (2)主要区别:a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;b.区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c.区间估计立足于大概率,假设检验立足于小概率。

统计学习题 第十章 双样本假设检验及区间估计

第十章 双样本假设检验及区间估计 第一节 两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节 两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节 配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论 第四节 双样本区间估计 σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互( )地抽取的。 2.如果从N (μ1,σ12)和N (μ2,σ22 )两个总体中分别抽取容量为n 1和n 2的独立随机样本,那么两个样本的均值差(1X ―2X )的抽样分布就是N ( )。 3.两个成数的差可以被看作两个( )差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作( )样本,也称关联样本。 5.配对样本均值差的区间估计实质上是( )的单样本区间估计 6.当n 1和n 2逐渐变大时,(1X ―2X )的抽样分布将接近( )分布。 7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择

1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2,121n σ―2 22n σ) B N (μ1―μ2,121n σ+22 2n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+22 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( ) A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2 χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体,它 们的点估计值是( ) A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ 1 2和σ 2 2未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( ) A 2 212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n + C 2 12 1n n n n +σ D 2 22 1 2 1n n σσ+ 三、多项选择 1.两个成数之差的假设检验所使用的测量尺度包括( )。 A 定类尺度 B 定序尺度 C 定距尺度 D 定比尺度 2.在单一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法包括( )。

例题解答(区间估计与假设检验)

[例题]:在一项关于软塑料管的实用研究中,工程师们想估计软管所承受的平均压力。他们随机抽取了9个压力读数,样本均值和标准差分别为3.62kg 和0.45。假定压力读数近视服从正态分布,试求总体平均压力的置信度为0.99时的置信区间。 解: 因为, )1(~--n t n S X μ , 所以,αμαα-=?? ? ? ??????????-≤-≤--1)1()1(22n t n S X n t P 于是,总体平均压力μ的α-1置信区间为, ?? ????-+-- )1(),1(22n t n s x n t n s x αα 由题意知,9=n ,62.3=x ,45.01=-n s ,99.01=-α 3554.3)8()1(005.02 ==-t n t α, 代入上式,得总体平均压力μ的99%置信区间为 ?? ?????+?-3554.3945.062.3,3554.3945.062.3 =[3.12, 4.12]

[例题]:一个银行负责人想知道储户存入两家银行的钱数,他从两家银行各抽取了一个由25个储户组成的随机样本。样本均值如下:第一家4500;第二家3250元。根据以往资料数据可知两个总体服从方差分别为2500和3600的正态分布。试求总体均值之差的置信度为0.95时的置信区间。 解: 因为, )1,0(~) ()(2 22 1 21 2121N n n X X σ σ μμ+ ---, 所以,ασσμμαα-=??? ? ? ?????????≤+---≤-1)()(22 2 212121212 z n n X X z P 于是,21μμ-的α-1置信区间为, ()()??? ?????++-+--222 121221222121221,n n z x x n n z x x σσσσαα 由题意知, 25 21==n n , 4500 1=x , 3250 2=x , 250021=σ,36002 2=σ,95.01=-α 96.1025.02 ==z z α,代入上式,得21μμ-的95%置信区间为 [1219.4, 1280.6]

实验 5区间估计与假设检验

实验5 区间估计与假设检验 利用样本对总体进行统计推断,主要有两类问题:一类是估计问题,另一类是检验问题。参数估计是根据样本的统计量来对总体的参数进行估计,假设检验则是利用样本的统计量来检验事先对总体参数或分布特性所作的假设是否正确。 利用SAS软件中的INSIGHT模块和“分析家”功能以及编程的方法,均可以在不同的置信水平下求出总体参数的置信区间,在不同的检验(显著)水平下对总体的参数和分布特性进行检验。 5.1 实验目的 掌握使用SAS对总体参数进行区间估计与假设检验方法。 5.2 实验内容 一、用INSIGHT对总体参数进行区间估计与假设检验 二、用“分析家”对总体参数进行区间估计与假设检验 三、编程对总体参数进行区间估计与假设检验 5.3 实验指导 一、用INSIGHT对总体参数进行区间估计与假设检验 【实验5-1】已知某种灯泡的寿命服从正态分布,现从一批灯泡中抽取Array 16只,测得其寿命如表5-1(sy5_1.xls)所示: 表5-1 某种灯泡的寿命(单位:小时) 图5-1 数据集 Mylib.sy5_1 1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470

求该灯泡平均使用寿命90%、95%及99%的置信区间,并指出置信区间长度与置信水平的关泡寿命。 (1) y (2) 选择菜单“Analyze (分析)”→“Distribu on(Y)”对话框中选定分析变量:sm ,如图5-2左所示。 (3) 单击“Output ”按钮,在打开的对话框(基本置信区间)”复选框,如图5-2右。两次单击“OK ”系。 假设上述数据已存放于数据集Mylib.sy5_1中,如图5-1所示,变量sm 表示灯实验步骤如下: 启动INSIGHT 模块,并打开数据集M lib.sy5_1。 tion(Y)(分布)”。在打开的“Distributi 中选中“Basic Confidence interval 按钮,得到结果,如图5-3所示。 图5-2 区间估计的设置 (Std Dev )、方(信下限(LCL )和置信上限(UCL )。样样本,灯泡平均使用寿命的置信水平为间为(1476.8034,1503.1966)。 (4) 选择菜单间)”→“Others (其他)”,在打开的“Basic Confiden 5-4所示。 结果包括一个名为“95%Confidence Intervals (95% 置信区间)”的列表,表中给出了均值(Mean ) 、标准差 图5-3 95%置信区间 差(Variance )的估计值Estimate )、置 结果表明,根据抽 95%的置信区 “Tables (表)”→“Basic Confidence Interval (基本置信区ce Interval ”对话框中修改置信水平,如图 水平的提高,置信区间的长度在增加。 脉搏数如表5-2(sy5_2.xls )所示: 图5-4 90%、97.5%置信区间 可以看到,由于置信【实验5-2】正常人的脉搏平均每分钟72次,某医生测得10例“四乙基铅中毒”患者的

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 0.05,α=26,n = 0:1600H μ=, 即,以95%的把握认为这批产品的指标 的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数 的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n =由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n =由检验统计量0.9733 Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的.

实验四区间估计及假设检验

实验4 区间估计与假设检验 利用样本对总体进行统计推断,主要有两类问题:一类是估计问题,另一类是检验问题。参数估计是根据样本的统计量来对总体的参数进行估计,假设检验则是利用样本的统计量来检验事先对总体参数或分布特性所作的假设是否正确。 利用SAS软件中的INSIGHT模块和“分析家”功能以及编程的方法,均可以在不同的置信水平下求出总体参数的置信区间,在不同的检验(显著)水平下对总体的参数和分布特性进行检验。 在对总体参数作区间估计和假设检验之前,常常需要判断总体分布是否为正态分布。检验数据是否来自正态分布总体,应用中常用分布拟合图、QQ图、分布检验等方法。 4.1 实验目的 掌握使用SAS对总体参数进行区间估计与假设检验方法,掌握使用SAS对总体分布情况进行判断以及正态性检验的方法。 4.2 实验内容 一、用INSIGHT对总体参数进行区间估计与假设检验 二、用“分析家”对总体参数进行区间估计与假设检验 三、编程对总体参数进行区间估计与假设检验 四、在INSIGHT和“分析家”模块中研究分布并使用UNIV ARIATE过程对总体分布进行正态性检验 4.3 实验指导 一、用INSIGHT对总体参数进行区间估计与假设检验 【实验4-1】已知某种灯泡的寿命服从正态分布,现从一批灯 图4-1 数据集Mylib.sy4_1 泡中抽取16只,测得其寿命如表4-1(sy4_1.xls)所示: 表5-1 某种灯泡的寿命(单位:小时) 系。 假设上述数据已存放于数据集Mylib.sy4_1中,如图4-1所示,变量sm表示灯泡寿命。 实验步骤如下: (1) 启动INSIGHT模块,并打开数据集Mylib.sy4_1。 (2) 选择菜单“Analyze(分析)”→“Distribution(Y)(分布)”。在打开的“Distribution(Y)”对话框中选定分析变量:sm,如图4-2左所示。 (3) 单击“Output”按钮,在打开的对话框中选中“Basic Confidence interval(基本置信

第5章参数估计与假设检验练习题(精)

第5章 参数估计与假设检验练习题 1、设随机变量 X 的数学期望为 μ ,方差为 σ2 ,(X 1 ,X 2 ,···,X n )为X 的一个样本, 试比较 ))(1(1 2 ∑=-n i i X n E μ 与 ))(1(12∑=-n i i X X n E 的大小。 ( 前者大于后者 ) 2、设随机变量 X 与Y 相互独立,已知 EX = 3,EY = 4,DX = DY = σ2 ,试问:k 取何值时,Z = k ( X 2 - Y 2 ) + Y 2 是 σ2 的无偏估计 。 ( 16 / 7 ) 3、设正态总体 X ~ N ( μ , σ2 ) ,参数 μ ,σ2 均未知,( X 1 ,X 2 ,… ,X n )( n ≥ 2 ) 为简单随机样本,试确定 C ,使得 ∑-=+-=1 1212 )(?n i i i X X C σ 为 σ2 的无偏估计。 ( ) 1(21 -n ) 4、假设总体 X 的数学期望为 μ ,方差为 σ 2 ,),...,,(21n X X X 为来自总体 X 的一个样本, X 、S 2 分别为样本均值和样本方差,试确定常数 c ,使得 22cS X - 为 μ 2 的无偏估计量. ( 1 / n ) 5、设 X 1 ,X 2 是取自总体 N ( μ , σ2 ) ( μ 未知)的一个样本,试说明下列三个统计量 2114341?X X +=μ ,2122121?X X +=μ ,2132 1 31?X X +=μ 中哪个最有效。 ( 2?μ )

6、设某总体 X 的密度函数为:??? ??><=其它 03),(3 2θθθx x x f ,( X 1 ,X 2 ,… ,X n )为该 总体的样本, Y n = max ( X 1 , X 2 , … , X n ) ,试比较未知参数 θ 的估计量 X 3 4 与 n Y n n 31 3+ 哪个更有效? ( n > 1 时,n Y n n 31 3+ 更有效 ) 7、从某正态总体取出容量为10的样本,计算出 15010 1 =∑=i i x ,272010 1 2=∑=i i x 。求总体期望与 方差的矩估计 μ ? 和 2?σ 。 ( 15 ;47 ) 8、设总体 X 具有密度 ?? ? ??≤>=+-C x C x x C x f 01);()1 1(1???? ,其中参数 0 < ? < 1,C 为已知常数,且C > 0,从中抽得一样本 X 1 ,X 2 ,… ,X n ,求参数 ? 的矩估计量。 ( 1 - C /?X ,其中 ∑==n i i X n X 1 1 ) 9、设总体 X 服从( 0,? )上的均匀分布,其中 ? > 0 是未知参数,( X 1 ,X 2 ,… , X n )为简单随机样本,求出 ? 的矩估计量 ? ? ,并判断 ?? 是否为 ? 的无偏估计量。 ( 2?X ,其中 ∑==n i i X n X 1 1 ;是 ) 10、设( X 1 ,X 2 ,… ,X n )为总体 X 的一组样本,总体 X 密度函数为:

区间估计与假设检验的分类总结

关于区间估计与假设检验以参数为分类标准的分类 区间估计部分 一、 关于总体均值μ的区间估计 1. 小样本、2σ已知情况下,总体均值μ的区间估计 X ~N (μ, n 2 σ);n X σμ -~N (0,1) 总体均值μ的区间:[X -n z σ α 2 ,X +n z σ α 2 ] 2. 小样本、2σ未知情况下,总体均值μ的区间估计 n S X μ -~t(n-1) 总体均值μ的置信区间:[X -n s t 2 α ,X +n s t 2 α ] 3.大样本情况下,总体均值μ的区间估计 X ~N (μ, n 2 σ);在大样本情况下:n X σμ-与n S X μ -都服 从N (0,1),所以可以用S 替换σ. 总体均值μ的区间:[X -n z σ α 2 ,X +n z σ α 2 ](可用样本方差S 替σ) 二、 关于二总体均值差21μμ-的区间估计 1. 大样本情况下,二总体均值差区间估计

(21X X -)~N (21μμ-, 2 22 1 2 1n n σσ+ );2 2 2 1 21 2121) ()(n n X X σσμμ+ ---~N (0,1) 均值差的置信区间为:[ ) (21X X -- 2 2 2 1 2 12 n n z σσα + , )(21X X -2 22 1 2 12 n n z σσα + +] 三、 关于总体成数p 的区间估计 1. 大样本情况下总体成数p 的区间估计 n P i n i ξ ∑=∧ = 1 ~N (n pq p ,);n pq p P -∧ ~N(0,1); 总体p 的置信区间为[∧ P -,2 n pq z α ∧ P +n pq z 2 α] 四、关于二总体成数差21p p -区间估计 ∧ ∧ -2 1P P ~N ),(2 221 1121n q p n q p p p +-;2 2 21111121)()(n q p n q p p p P P +---∧ ∧~N (0,1) 二总体成数差21p p -的置信区间是: [∧ ∧-21P P -,2 221112 n q p n q p z +α ∧ ∧-21P P +2 2 21112n q p n q p z +α] 五、 关于总体方差2σ的区间估计 1. 正态总体N (μ,2σ)以下统计量满足自由度为k=n-1 的2χ分布: 22 ) 1(s n σ-~2χ(n-1)

实验六 参数估计与假设检验

实验六参数估计与假设检验 一、实验目的: 学习利用spss对数据进行参数估计与假设检验(参数估计,单样本、独立样本、配对样本T 检验)。 二、实验内容: 某助眠药物临床实验征集了20位被试,试验后得数据表包含被试的性别、身高、体重、用药前睡眠时长及用药后睡眠时长。试就该数据估计性别对未使用药物时睡眠时长的影响、检验被试总体身高与165差距是否显著、对不同性别的被试的身高和体重变量进行独立样本T 检验、并检验药物是否对被试有用。 三、实验步骤: 参数估计 1、定义变量并输入数据 2、选择菜单“分析→描述统计→探索”弹出“探索”对话框,将对话框左侧的变量框中“用药前睡眠时长”添加到因变量列表,“性别”添加到自变量列表 3、点击“统计量”,弹出“探索:统计量”对话框,勾选描述性并设置均值置信区间为95%,单击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 单样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→单样本T检验”,弹出“单样本T检验”对话框,将对话框左侧的变量框中的“身高”添加到右侧的“检验变量”框中,将检验值设为165; 3、点击“选项”,弹出“选项”对话框,将置信区间百分比设为95%,点击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 独立样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→独立样本T检验”,弹出“独立样本T检验”对话框,在对话框左侧的变量列表中选变量“身高”“体重”进入检验变量框,选变量“性别”进入控制列表框 3、点击定义组,在组1(1)中填写1,组2(2)中填写2,点击继续, 4、点击“确定”按钮,得到输出结果。对结果进行分析解释。 配对样本T检验 1.打开一份可用数据。 2.选择分析→比较平均值→配对样本T检验,选择一对配对样本“用药前睡眠时长”和“用 药后睡眠时长”,将“用药前睡眠时长”拖至“variable1”,“用药后睡眠时长”拖至“variable2”,单击“选项”设置置信区间为95%,点击“确定”查看自定义结果。

假设检验与区间估计

一个例子 甲、乙两人做游戏,由甲掷一枚硬币。两人约定,出现正面向上则甲胜,否则乙胜。若连续5次均正面向上,这时乙一定会认为甲做了假。分析一下,开始乙认为游戏是公平的,即有这样的看法:P(正面向上)=1/2。于是P(连续5次出现正面向上)= 5 。这是小概率事件,居然在1次试验中发生了。因(1/2)0.03 而乙否定了原来的看法(假定),认为P(正面向上)=1/2不成立,甲就是做假了。 再看一个例子 某餐厅每天营业额服从正态分布,以往老菜单其均值为8000元,标准差为640元。一个新菜单挂出后,九天中平均营业额为8300元,经理很想知道这个差别是否是由于新菜单而引起的。 建立假设,为了评估新菜单的好坏,先建立一个命题:“新老菜单的平均营业额之间无差异”。这个命题为原假设,记为 H。假设检验就是要确定这个原假 设是真还是假。 如果能确定原假设为假时就拒绝它,那么我们将面临如下三个命题的选择:命题1:新菜单的平均营业额比老菜单高 命题2:新菜单的平均营业额不如老菜单 命题3:新老菜单的平均营业额之间有显著差异 小概率原则:小概率事件在一次观察中基本不发生。 假设检验有两个特点 第一,假设检验用了反证法。为了检验一个假设是否成立,人们首先假设它是真的,观其会产生什么后果,如果导致了一个不合理的现象出现,则认为假设是不合理的,拒绝假设。反之,如果没有导致不合理的现象出现,则认为假设是合理的,接受假设。 第二,假设检验采用的反证法区别于一般的反证法。假设检验中所采用的反证法是带有概率性质的反证法。所谓假设的不合理,不是绝对的矛盾,而是基于

人们在实践中广泛采用的小概率事件的几乎不可能原则。 区间估计与假设检验的异同 ★区间估计与假设检验均为根据样本信息推断总体的参数问题。 ★区间估计是根据样本资料估计总体参数的真值,而假设检验是根据样本资料检验总体参数的先验假设是否成立。 ★区间估计通常求以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验也有单侧检验。 ★区间估计立足于大概率,即置信度,而假设检验立足于小概率,即显著性水平。 区间估计与假设检验的异同(续) 两者都是根据样本信息对总体参数进行推断,都以抽样分布为理论依据,都建立在概率论基础上,推断结果都有一定的可信程度或风险,对同一实际问题的参数进行推断,使用同一样本、同一统计量、同一分布。所以,两者可以相互转换。这种相互转换形成了区间估计与假设检验的对偶性。 例如 可见,区间估计中的置信间对于假设检验接受域,置信区间之外的区域就是拒绝域。 评价区间估计的两个标准 (1)估计的可靠度。置信度1α-反映了区间估计的可靠度。如置信水平 1α-=0.95,说明估计区间(12 ??,θθ)以95%的概率包含总体的参数θ。或者说,100个这样的估计区间中,平均有95个包含了总体参数θ。 220~(0,1) )1()(),,,X X X X X Z N Z P Z X X X Z Z Z ααααααασσμσαα α μαμσσμσμμ=-=≤=->=≤-≤-≤≤+=≤2X 222 若总体方差已值,则有 在一定置信水平(1-)下,有 P(Z Z 当总体均值未值,则在(1-)下的置信区间为 -Z Z Z Z 若事先假设可求出统计量当时,不属于小概率事件, 应接受原假设。反之,拒绝原假设。

双样本假设检验与区间估计练习题

第十章双样本假设检验及区间估计第一节两总体大样本假设检验 两总体大样本均值差的检验·两总体大样本成数差的检验 第二节两总体小样本假设检验 两总体小样本均值差的检验·两总体小样本方差比的检验 第三节配对样本的假设检验 单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相 关检验的评论 第四节双样本区间估计 σ 2和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均1 值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计 一、填空 1.所谓独立样本,是指双样本是在两个总体中相互()地抽取的。 2.如果从N(μ1,σ12)和N(μ2,σ22)两个总体中分别抽取容量为n1和n2的独立随机样本,那么两个样本的均值差(1X―2X)的抽样分布就是N()。 3.两个成数的差可以被看作两个()差的特例来处理。 4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作()样本,也称关联样本。 5.配对样本均值差的区间估计实质上是()的单样本区间估计 6.当n1和n2逐渐变大时,(1X―2X)的抽样分布将接近()分布。

7.使用配对样本相当于减小了( )的样本容量。 8. 在配对过程中,最好用( )的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。 9. 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于( )。 10. 方差比检验,无论是单侧检验还是双侧检验,F 的临界值都只在( )侧。 二、单项选择 1.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。 A N (μ1―μ2,121n σ―222n σ) B N (μ1―μ2,121n σ+22 2n σ) C N (μ1+μ2,121n σ―2 22n σ) D N (μ1+μ2,121n σ+22 2n σ) 2.两个大样本成数之差的分布是( )。 A N (∧ 1p -∧ 2p ,111n q p ―222n q p ) B N (∧1p -∧2p ,111n q p +2 22n q p ) C N (∧ 1p +∧ 2p ,111n q p ―222n q p ) D N (∧1p +∧2p ,111n q p +2 22n q p ) 3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。 A F 分布 B Z 分布 C t 分布 D 2 χ分布 4.配对小样本的均值d 的抽样分布是( )。 A Z 分布 B 自由度为n 的t 分布 C 自由度为(n —1)的t 分布 D 自由度为(n —1)的2χ分布 5.若零假设中两总体成数的关系为p 1=p 2,这时两总体可看作成数p 相同的总体, 它们的点估计值是( )。 A p 1 + p 2 B p 1p 2 C p 1 -p 2 D 2 12 211n n p n p n ++∧ ∧ 6.在σ1 2 和σ2 2未知,但可假定它们相等的情况下,σ的无偏估计量∧ S 是( )。 A 2212 2 211-++n n nS S n B 2212 2211-++n n nS S n ?2 12 1n n n n +

参数估计和假设检验案例(精)

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的 800个观测值组成。这些数据的样本标准差为 0.21;因为有如此多的样本数据,因此,总体标准差被假设为 0.21。然后,该公司建议:持续不断地定期抽取容量为 30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为 12,该公司建议采用如下形式的假设检验。 H 0 :12 H 1 :12 只要 H 0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

μ=μ≠ 问题: 1、对每个样本在 0.01的显著性水平下进行假设检验,并且确定,如果需要

Z0.005=2.58 2、 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统, 每位学生观看教学录像, 然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材, 而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中, 所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。μ= 在整个教程的自我训练过程中,由计算机指导学生独立操作。 为了比较建议的和当前的教学方法, 刚入学的 122名学生被随机地安排到这两种教学系统中。 61名学生使用当前程式化教材, 而另外 61名学生使用建议的计算机辅助方法。记录每位学生的学习时间(小时 ,如表所示。

第五章参数估计和假设检验Stata实现

第五章参数估计和假设检验的Stata实现本章用到的Stata命令有 例5-1 随机抽取某地25名正常成年男子,测得其血红蛋白含量如下: 146 7 125 142 7 128 140 1 7 144 151 117 118 该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。 数据格式为

计算95%可信区间的Stata命令为: 结果为 该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71) 例5-2 某市2005年120名7岁男童的身高X=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。 在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。 结果为: 该市7岁男童总体均数90%的可信区间(122.90~124.34)。 例5-3 为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40 g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准

差为13.34。试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。 本题也可以应用Stata的即时命令: 结果: 差值为4.86,差值的可信区间为0.81~8.90。 例5-4 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。 Stata即时命令为 结果为 肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。 例5-5 某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。 Stata即时命令为

参数估计和假设检验案例

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。 μ=μ≠ H0 :12 H1 :12 只要H0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

问题: 1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要 Z0.005=2.58 2、 μ= 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。

参数估计和假设检验

攀 枝 花 学 院 实 验 报 告 实验课程:数学实验及模型 实验项目:参数估计和假设检验 实验日期:2010.12.30 系:计算机 班级: 姓名: 学号: 同组人: 指导教师: 成绩: 【实验目的】: 1 理解参数估计的基本概念、原理和方法; 2 理解正态总体的均值、方差的区间估计的方法; 3 了解假设检验的基本概念、原理和方法; 4 掌握用Matlab 进行参数估计; 5 掌握用Matlab 进行假设检验. 【实验内容:】 1 参数估计的基本概念、原理和方法; 2 假设检验的基本概念、原理和方法; 3 利用Matlab 进行参数估计和假设检验. 【实验原理:】 1 参数估计:参数估计包括点估计和区间估计 (1)点估计:点估计法主要包括矩估计和最大似然估计. 点估计的常用公式如下: ?x μ =,22?s σ= (2)区间估计:区间估计就是根据样本来估计其分布函数中未知参数的范围区间,并使区 间包含未知参数的概率≥1a -,1a -称为置信水平,估计区间称为置信区间. 总体均值μ、标准差σ的区间估计(置信水平1α-)的常用公式如下: ① σ已知时,μ 的置信区间为:2 x z α ± σ未知时,μ 的置信区间为:()2 1x n α± - ② 2σ的置信区间为: ()()()()2 222 12211,11n S n S n n ααχχ- ??-- ? ?-- ??? 其中,2 z α、()2 1t n α-、()2 2 1n αχ-分别为()0,1N 、()1t n -、()21n χ-分布的上 2 α分位点. (3)Matlab ,常见分布函数中参数估计的点估计和区间估计函数见表3-4.

参数估计和假设检验

第五章参数估计和假设检验 本章重点 1、抽样误差的概率表述; 2、区间估计的基本原理; 3、小样本下的总体参数估计方法; 4、样本容量的确定方法; 本章难点 1、一般正态分布 标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。 统计推断:利用样本统计量对总体某些性质或数量特征进行推断。 两类问题:参数估计和假设检验 基本特点:(1)以随机样本为基础; (2)以分布理论为依据; (3)推断的只是一种可能的结果; (4)是归纳推理和演绎推理的结合。本章主要内容:阐述常用的几种参数估计方法。 第一节参数估计 一、参数估计的基本原理 两种估计方法

点估计 区间估计 1.点估计:以样本指标直接估计总体参数。 点估计优良性评价准则 (1)无偏性。估计量 的数学期望等于总体参数,即 , 该估计量称为无偏估计。 (2)有效性。当 为 的无偏估计时, 方差 越小, 无偏估计越有效。 (3)一致性。对于无限总体,如果对任意 ,有 ,则称 是 的一致估计。 (4)充分性。一个估计量如能完全地包含未知参数信息,即为 充分估计量。 2.点估计的缺点:不能反映估计的误差和精确程度 区间估计:利用样本统计量和抽样分布估计总体参数的可能区间 【例1】CJW 公司是一家专营体育设备和附件的公司,为了监控公司的服务质量, CJW 公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。 抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。 抽样误差 = (实际未知) 要进行区间估计,关键是将抽样误差E 求解。若 E 已知,则区间可表示为: 区间估计:估计未知参数所在的可能的区间。 区间估计优良性评价要求 θ θ??θ?θθ=?E θ?0> εθ?2)?(θθ-E 0)|?(|=≥-∞ →εθθn n P Lim n θ?θθαθθθ-=1)??(U L P <<[]E x x +-,E

相关文档
最新文档