【第五章统计估计和假设检验】

合集下载

第5章 统计假设检验(新)

第5章 统计假设检验(新)
样本误差x - μ0=380-360=20,落在( -19.6 , 19.6 )之外、 ( -25.8 , 25.8 )之内,所 以可在5%的差异显著水平上否定H0, 两品种差异达显著水平,新品种显著高于老品 种。得到这一结论的可靠度为95%。
方法3:根据u值直接判断——简化方法。
当 u ≥ 1.96 时,样本误差x - μ一定落在(-1.96σx,1.96σx) 之外, 且P(u) ≤ 0.05,可在5%的差异显著水平上否定H0。 当 u ≥ 2.58 时,样本误差x - μ一定落在 (-2.58σx,2.58σx) 之外, 且P(u) ≤ 0.01,可在1%的差异显著水平上否定H0。 13
4
举例:
1.某地一般小麦品种产量为360kg/mu
引进品种在10个田块种植,平均产量为380kg/mu
问:新品种与原品种在产量上有无本质差异。
2.在同一田块种植小麦,重复5次:
肥料A ,产量500kg/mu 肥料B ,产量520kg/mu
问:肥料B的效果是否比A好?
统计假设:
1.对单个样本平均数与原总体相比较的假设: H0 : μ= μ0 = 360 ; H A : μ ≠μ 0
有一批菠菜,抽16个样品,测得其平均含量378mg/kg 问:这批菠菜是否合格?
分析: 采用左尾检验来检验例1. 采用右尾检验来检验例2.
15
例1: 某氮肥品种的含N量≥为360g/kg为合格产品,标准差σ=40g/kg

有一批产品,抽16个样品,测得其平均含量343g/kg 问:这批产品是否合格?
2.对两个样本平均数相比较的假设: H0 : μ1= μ 2 ; H A : μ 1 ≠μ 2
5
二、差异显著或不显著

计量经济学第5章假设检验

计量经济学第5章假设检验
5-15
假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值

南京大学统计学 ch5参数估计与假设检验1课件

南京大学统计学 ch5参数估计与假设检验1课件
1 7 1 .8 2 6 1 7 1 .8 26
17 .10 417 .836
南京大学统计学 ch5参数估计与假设检验1
7
•这就表示在95%的置信水平下,
北京男性市民的平均身高是在
170.14与173.86公分之间,其
抽样误差为
公分。
1.86
南京大学统计学 ch5参数估计与假设检验1
8
• 99%置信区间
• 置信区间为,即72.16%~87.84%
南京大学统计学 ch5参数估计与假设检验1
12
•区间估计的逻辑是以概率抽
样方法自母体抽取一个样本,
计算其平均数(点估计x
值) ,依照所要求的置信
水平,加减 Z 个 到的区间。
所s 得N
南京大学统计学 ch5参数估计与假设检验1
13
•95% 和 99%就是 “置信水平”
2.45
南京大学统计学 ch5参数估计与假设检验1
10
•例:美国某家医院随机抽样1024 个案例,其平均医疗费用为$810, 样本标准差为$64
•建构90%的置信区间
•建构95%的置信区间
•建构99%的置信区间
南京大学统计学 ch5参数估计与假设检验1
11
• 例:从选民中随机抽取100名进行调查,结果显示对候选人的支 持率为80%,求在95%的置信度下,候选人支持率的置信区间。

就是抽样极限
•误 置差信z(水s 平N愈)高,置信区间也
就愈宽 ,但太宽的置信区
间会失去实际的效用
南京大学统计学 ch5参数估计与假设检验1
14
• 值:代表“不包含”母体特
性的概率,也就是结论是错 误的概率。又称为显著程度 (significance level)

田间试验与统计方法 第五章假设检验

田间试验与统计方法  第五章假设检验

u
x1 x2
12
n1

2 2
n2
上式的分母称为平均数差的标准误差,记为 5、相应于2中各备择假设之H0的拒绝域
x x
1
2

① u > uα ② u <-uα ③ |u| > uα/2 6、得出结论并给予生物学解释
例 调查两个不同渔场的马面鲀体长,每一渔场调查20
条 。 平 均 体 长 分 别 为 : x= 1 9 . 8 cm, x2 =18.5cm。 1 σ1=σ2=7.2cm。问在α=0.05水平上,第一号渔场的马面 鲀是否显著高于第二号渔场的马面鲀体长?
例已知豌豆籽粒重量服从正态分布N(377.2,3.32)在 改善栽培条件后,随机抽取9粒,其籽粒平均重为 379.2,若标准差仍为3.3,问改善栽培条件是否显著 提高了豌豆籽粒重量?
解 ① 已知豌豆的重量服从正态分布,σ已知 ② 假设: H0: μ= 377.2 HA: μ > 377.2 ③ 显著性水平: α=0.05 ④ σ已知,使用u检验
假设测验基本程序
• 1、对样本所属的总体提出一个假设,H0或 者HA • 2、规定测验的显著水平α值
• 3、在Ho为正确的假设下,根据平均数或其 它统计数的抽样分布,计算统计数的概率。 或根据已规定的概率,划出两个否定区域。
• 4.将规定的α值和算得的概率相比较,或 者将试验结果和否定区域相比较,从而作 出接受或否定的假设
例 已知某玉米种群的平均穗重μ0=300g。喷药后,随机抽取
解 ① σ未知 ② 假设:H0: μ=300 HA: μ ≠300 药物浓度适合时可促进生长,浓度过高反而会抑制生长,所 以喷药的效果未知,需采用双侧检验。 ③ 显著性水平: α=0.05 ④ σ未知应使用t 检验,已计算出 x=308,s =9.62 x 0 308 300

统计学导论 科学出版社 第五章 假设检验

统计学导论  科学出版社 第五章 假设检验

右侧检验

H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值

☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体

假设检验

假设检验

第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。

通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。

第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。

假设检验与区间估计结合起来,构成完整的统计推断内容。

假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。

本章分别讨论这两类检验方法。

进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。

这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。

反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。

其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。

比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。

所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。

这种事件称为“实际不可能事件”。

小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。

所以,统计检验又称显著性检验。

下面通过一个具体例子说明假设检验是怎样进行的。

【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。

第五章假设检验与统计推断

Tests involving a single population parameter are called one-sample tests; tests involving two populations are called two-sample tests.
5-9
Types of Hypothesis Tests
5-8
1.Hypothesis Formulation
Null hypothesis, H0 – a statement that is accepted as correct
Alternative hypothesis, H1 – a proposition that must be true if H0 is false
Example: To seek evidence that technical support calls average less than 30 minutes
(Customer Support Survey file), the correct
hypotheses are:
H0: Mean response time ≥ 30 minutes H1: Mean response time < 30 minutes
Chapter 5: Hypothesis Testing and Statistical Inference
5-1
一、假设检验的概念与思想
什么是假设(hypothesis)?
对总体参数的的数值所作 的一种陈述
总体参数包括总体均值、比 例、方差等
分析之前必需陈述
其动机主要是企图利用人们 掌握的反映现实的数据来找 出假设与现实之间的矛盾, 从而否定这个假设

SPSS统计分析参数估计与假设检验


(四)某商品的零售商要求总代理增加广告费支 出,认为如此每星期平均销售量可达20000箱。 总代理增加广告费三个月后想了解平均销售情 况,随机抽取16家零售店调查,发现每星期平 均销售量只有15000箱,标准差为6000箱。假设 销售量服从正态分布,试问平均销售量的下降 是否因偶然因素所致(α=0.01)?
2020/3/2
6
(二)以[04-7]的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋 白平均值是否与另一地区的平均值相等。
1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。) 按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
s
2 1

s
2 2
n1 n2
2020/3/2
13
两个总体均值之差的检验 (s12、 s22 未知,大样本)
• 检验统计量为
2020/3/2
10
第二节 独立样本T检验
一、 简介
用于检验对于两组来自独立总体的样本,
其独立总体的均值或中心位置是否一样。如果 两组样本彼此不独立,应使用配对T检验 (Paired -Sample T Test )。如果分组不止一 个,应使用One-Way ANOVA 过程进行单变量 方差分析。如果想比较的变量是分类变量,应 使用Crosstabs功能。
(一) [05-1] 某校在对一项教学改革措施的评价 中,随机抽取了60位学生进行态度调查,他们的 10项态度7级量表的态度反应资料见下表:

[经管营销]第五章假设检验


假设检验中的P值

例如:右侧检验,利用样本信息计算出 检验统计量Z=2.2。



给定显著性水平等于0.025, Z 1.96 拒绝原假设。 给定显著性水平等于0.01,Z 2.33 接受原假设。
的最小显著性水平。显著性水平 比P 值稍小点就会接受原假设。
P( Z 2.2) 0.014 为P值,拒绝原假设
总体方差未知
小样本,正态总体下 x 0 检验统计量 t s / n ~ t (n 1) 例题1:见书182页例7 课堂练习1:某机器制造出的肥皂厚度为 5厘米,今欲了解机器性能是否良好, 随机抽取10块肥皂为样本,测得平均厚 度为5.3厘米,标准差为0.3厘米,试以 0.05的显著性水平检验机器性能良好的 假设。
总体方差的假设检验


2 s ~ N ( , / 2n) 大样本下,样本标准差
小样本下,正态总体,统计量
2
(n 1) s 2

2
~ 2 (n 1)

例题:见书187页例9
第三节 两个总体参数的假设检验
1、两个总体均值差的检验 2、两个总体比率差的检验 3、两个总体方差比的检验
两个正态总体 的假设检验
1 2
2 2 , 两个总体方差 1 2 均为已知 H 0 : 1 2 a, H1 : 1 2 a
检验统计量

z
x1 x2 a
12
n1

2 2
n2
两个总体方差 12 , 22 均未知,只要样本容 量都很大 检验统计量 z x x a

例题:消协接到消费者投诉,指控某品 牌纸包装饮料存在容量不足,有欺骗消 费者之嫌。包装上标明的容量为250毫 升。消协从市场上随机抽取50盒该饮料, 测试发现平均含量为248毫升,小于 250ml。这是生产中正常波动,还是厂 商的有意行为?消协能否根据该样本数 据,判定该饮料厂商欺骗了消费者呢?

第五章假设检验与统计推断1

PHStat: One Sample Test – Z-test for the Proportion
Excel z-test: Two-Sample for Means PHStat: Two Sample Tests – Z-Test for Differences in Two Means
Excel t-test: Two-Sample Assuming Unequal Variances
我认为该地区新生婴儿 的平均体重为3190克!
什么是假设检验(hypothesis testing)?
1. 事先对总体参数或分布形式作出某种假设 ,然后利用样本信息来判断原假设是否成 立
2. 有参数假设检验和非参数假设检验 3. 采用逻辑上的反证法,依据统计上的小概
率原理
假设检验的基本思想
抽样分布
5-8
1.Hypothesis Formulation
Null hypothesis, H0 – a statement that is accepted as correct
Alternative hypothesis, H1 – a proposition that must be true if H0 is false
3. The null hypothesis is actually true, but the hypothesis test incorrectly rejects it (Type I error).
4. The null hypothesis is actually false, but the hypothesis test incorrectly fails to reject it (Type II error).
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【第五章统计估计和假设检验】第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。

统计推断包括两大部分:一是统计估计,二是假设检验。

统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。

参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。

假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。

假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。

非参数检验将在第六章进行讨论,本章着重讨论参数检验。

第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。

若未知的总体参数为,这时是一个未知的常数。

我们根据抽样样本的观察值构造一个统计量()来估计总体参数。

由于抽样的随机性,统计量是一个随机变量。

点估计就是将的具体值作为的估计值。

显然,这样做必然会有误差产生。

这种误差就称为抽样误差。

极大似然法是一种对参数点估计的重要方法之一。

我们先用一个例子说明其原理。

例5-1。

设有一批产品,质量上分为正品与次品。

产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。

现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。

抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:P(A)= 其中:是这批产品的次品率。

若次品率=0.1,则P(A)=×0.1=0.0229 若次品率=0.4,则P(A)=×0.4=0.0003。

现在事件A 既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。

由于0.02290.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。

把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。

设是取自密度函数为f(x, )的总体的一组样本。

其中:x和都为参数,待估计。

的极大似然估计的基本思路是,若记A =“一次观察中,所得一组样本的样本值为( )”。

现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。

此时的又称为的极大似然估计值。

由于相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:同时发生的概率,也就是P(A)=,记为L()=L(), 于是有:L()= L()称为的似然函数。

求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。

因为ln L()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。

在我们上述例子中,f(1, )=,f(0,)=1-,于是得到似然函数:L()=令=0,舍去=1,得的最大似然估计值=0.067。

实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。

例5-2。

从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。

解:构造似然函数为了求和,使ln的极大,令解上述方程得到:所以得到和的极大似然估计量为:二、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。

但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。

那么,什么样的估计量是好的估计量呢。

这就有一个如何对估计进行评价的问题。

请看下面一个例子。

例5-3。

假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。

现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。

由于随机原因,每次抽取样本的测量结果是不同的。

如果样本容量为3,抽取4组样本,测得结果如表5-1所示。

表5-1 一组抽样样本的观察值样本值样本顺序均值 1 900 999 1011 970 2 995 1050 1105 1065 3 1010 941 890 947 4 950 910 1140 1000 为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。

我们要求利用样本信息来推断总体指标,并使其误差最小。

第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。

于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?评价点估计的结果通常有无偏性、有效性和一致性等标准。

1. 无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。

一般地,无偏性的定义为:设为被估计参数,若有估计量( ),对一切n,有=,则称为的无偏估计量。

若-=b,则称b为估计量的偏差。

若b≠0,则称为的有偏估计量。

如果,则称为的渐近无偏估计量。

不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即,但样本方差并不是总体方差的无偏估计量。

这是因为如果我们把定义为=,则:产生偏差的原因是总体方差的无偏估计应该是,但抽样时由于μ是未知的,因而用估计量来代替。

根据最小平方原理,变量X距样本均值的离差平方和为最小,因此就小于,从而用代替μ计算的方差就低估了,为了得到的无偏估计,令这时,由于,就是的无偏估计了。

样本方差与之差称为偏差。

但当n很大时,所以它是渐近无偏差估计。

当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。

但如样本容量较小时偏差就比较大了。

图5-1 估计的无偏性和有效性2. 有效性即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。

为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。

一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。

有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。

但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()1,则称比有效。

例如,对正态总体,利用样本均值及样本中位数M来估计总体的均值时,均为无偏估计,那末哪一个更有效呢?均值的抽样分布为,统计上可以证明中位数的分布为,由于。

这就说明比有效,即用样本均值来估计总体的均值比用中位数来估计总体的均值效率高。

换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。

如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。

设用均值估计的样本为,中位数估计的样本为,设其估计效率相等,即方差相等,则,由此得到=1.57,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。

3. 一致性这就是要使统计量随样本容量n的增加,不断趋近于总体指标。

在n→∞(有限总体n→N)时,估计值与总体参数完全一致。

一般地,点估计的一致性定义如下:设( )为未知参数的估计量,若依概率收敛于,则为的一致估计量。

现在来看样本均值这一统计量是否符合一致性的要求。

根据切比雪夫等式:令当时一致性是从极限意义上来说明统计量与总体参数关系的。

这种性质只有当样本容量很大时才起作用。

另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。

事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。

而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。

第二节区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。

因为估计量来自于一个随机抽取的样本,结果也就带有随机性。

样本估计量刚好等于所估计的总体参数的可能性极小。

但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。

这种方法就是区间估计法。

在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683,落在总体均值范围内的概率是0.955,落在总体均值范围内的概率是0.997等等。

由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。

我们把这种对总体均值的估计称作区间估计。

从上述说明可以看到:1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。

2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。

一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置信区间。

分别为置信区间的下限和上限。

称为置信度或置信概率,表示区间估计的可靠度。

称为置信度水平。

常用的置信度有0.80,0.90,0.950.99等。

一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。

置信度反过来也表示可能犯错误的概率。

如置信度为95%,则犯错误的概率就为1-95%=5%。

这一概率也就是置信度水平,也可理解为风险率或风险水平。

图5-2 根据不同样本所得到的置信度为95.5%的置信区间需要指出的是,P()=不应理解为落在某一固定区间的概率。

因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。

即每一个样本都可产生一个估计区间[],因此,上述概率可以理解为随机区间[]中包括参数的概率。

图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。

从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。

二、单个总体参数的区间估计(一)正态总体,方差已知,总体均值的区间估计根据第四章关于样本均值分布的结果,有~N(0,1) 在给定了估计置信度为时,我们有我们可以根据这一原理用样本均值来推断总体均值的区间估计值。

若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是这一置信区间的估计可以用图5-3来表示。

相关文档
最新文档