71点估计
社会统计学_参数估计

总体参数的点估计公式
1.样本均值 2.样本方差 3.样本成数
x
1 n
x
s2 1 (x x)2 n 1
p
1 n
x
m n
即用样本的 X,S 2,P 作为总体的参 数的点估计值。
例1. 根据抽样调查,以下是8名同学“社 会统计学”考试得分
学生
A B C D E F G H
[x 1.96 , x 1.96 ]
n
n
当置信度为1-=0.99时,置信区间为
[x–2.58 n
,x+2.58 n ]
区间估计原理 0.6827
落在 x SE 范围内的概率 为68.27%
区间估计原理 0.9545
落在 x 2SE 范围内的概率 为95.45%
参数估计是先看样本的情况,再问总体的 情况。
假设检验则是先假设总体的情况,再以一 个随机样本的统计值来检验这个假设是否 正确。即要先构思总体情况,才进行抽样 和分析样本的资料。
第四章 参数估计
参数估计有两种做法
一 是 点 值 估 计 ( 或 称 点 估 计:point estimation)
成绩
70 71 72 74 74 76 77 78
求:总体的均值、方差、标准差的点估计值。
解:
根据抽样调查,可以求出样本
x
1 n
x
1 8
592
74
s2 1 (x x)2 1 58 8.29
n 1
7
第七章-参数估计

X 0
• 2.有效性
• 当总体参数的无偏估计不止一个统计量时,无偏
估计变异小者有效性高,变异大者有效性低,即 方差越小越好。
9 0.286 9 0.286 2 23.6 1.73
0.11 2 1.49
• 【例7-7】
• n=31,sn-1=5问的0.95置信区间?
• 解:先求方差的置信区间,当df=30,查χ2表,
2 0.025 47
2 0.975 16.8
2 30 52 30 5 2 47 16.8
正态分布,即Z0.05/2=1.96。
5 0.635 2 31
• 0.95的置信区间为:
5 1.96 0.635 5 1.96 0.635
3.76 6.24
• 二、方差的区间估计
• 根据χ2分布:
2
X X
2
2
2 2 n 1 sn ns 1
第七章 参数估计
思 考
• 例8-1:从某市随机抽取小学三年级学生50名,测 得平均身高为 140cm ,标准差 4 。试问该市小学 三年级学生的平均身高大约是多少?
例8-2:某教师用韦氏成人智力量表测80 名高三学生,M=105。试估计该校高三 学生智商平均数大约为多少?
什么是参数估计
当在研究中从样本获得一组数据后,如何通过 这组数据信息,对总体特征进行估计,也就是 如何从局部结果推论总体的情况,称为总体参 数估计。 • 参数估计: 样本 统计量
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
点估计中两种方法的分析和比较

点估计中两种常用方法的比较与分析楚尚坤河南理工大学数学与信息科学学院信息与计算科学专业2005级3班摘要:本文首先介绍矩估计法和极大似然估计法,然后对于同一分布和同一参数,用这两种不同的方法求出矩估计量和极大似然估计量,利用估计量的三条评选标准:无偏性、有效性和一致性来判断哪个估计量在这种情况下与该参数的真实值更相近,从而选择相应的点估计法。
关键词:矩估计极大似然估计无偏性有效性一致性§ 1引言当我们碰到这样的问题:假设总体分布函数的形式已知(它可由理论分析和过去经验得到,或者从抽样数据的直方图和概率纸描点初步估计出),但它的一个或多个参数未知,借助于总体的一个样本值,构造适当的样本函数来估计总体未知参数的问题,我们称之为点估计问题。
点估计是数理统计学中内容很丰富的一个分支,其中两种最常用的构造的估计量的方法是矩估计法和极大似然估计法。
当对于同一分布和同一参数时,先用矩估计法和极大似然估计法分别求得矩估计量和极大似然估计量,然后用无偏性、有效性和一致性对这两个估计量进行衡量,当样本容量足够大时,从而选出一个估计量使得这个估计量既在未知参数的真实值附近,又与未知参数真实值的偏离程度很小,而且随着样本容量n的增大估计量与被估计参数的偏差越来越小,进而选择相应的点估计法。
§ 2相关概念2.1参数估计所谓参数估计,是指从样本(X l,X2,…,X n)中提取有关总体X的信息,即构造样本的函数一一统计量g(X l,X2,…,X n),然后用样本值代入,求出统计量的观测值g(X l, X2」I ( , X n),用该值来作为相应待估参数的值。
此时,把统计量g(X1,X2,…,XQ称为参数的估计量,把9(人也凡)称为参数的估计值。
2.2参数估计的类型参数估计问题常有两类:点估计和区间估计。
(1)点估计:指对总体分布中的参数r ,根据样本(X「X2,…,X n)及样本值(X1,X2,…,X n),构造一统计量g(X i,X2,…,X n),将9(旨公2,…儿)作为二的估计值,则称g (X「X2,…,X n)为二的点估计量,简称点估计,记为A"g(X1,X2, ,X n)。
u71

设总体X的期望 的期望E(X)=和方差 和方差D(X)=σ2都是有限 注1 设总体 的期望 的,令
1 n E( X ) = ∑ X i = X n i =1
1 n 2 E( X 2 ) = ∑ X i = X 2 n i =1
ቤተ መጻሕፍቲ ባይዱ
= X 解之可得与σ2的矩估计 即得 ∧ σ 2 + 2 = X 2 = X ∧2 1 n * σ = X 2 ( X ) 2 = ∑ ( X i X ) 2 = Sn2 n i =1
大似然估计量,统称为θ 的极大似然估计。 的极大似然估计。 大似然估计量,
注1 若总体分布中含有两个以上的未知参数 θ1,θ2,…,θr 时,则θi 的极大似然估计 θ 满足 …
i
L( x 1 , x 2 , , x n ; θ 1 , θ 2 , , θ r ) =
(θ 1 ,θ 2 ,...,θ r )∈Θ
解: ) (1
因为X ~ N ( , σ 2 ),E ( X ) = ,D( X ) = σ 2
∧ * σ = Sn2 ∧ 2
故有 = X,
( 2)
X ~ Z (α ),E ( X ) = 1 故 = X,即 α = α X 1
∧
1
α
(b a)2 a+b ( 3 ) X ~ U ( a , b ), E ( X ) = , D( X ) = 2 12
x
θ
∞ < x < +∞ , θ > 0
试求 θ 的矩估计量 θ。 解:虽然 f ( x ;θ )中仅含一个未知参数 θ,但因
1 θ E( X ) = ∫ x e dx = 0 ∞ 2θ 不能由此解出, 不含 θ,不能由此解出,故需 继续求出总体二阶原点 矩: x x +∞ +∞ 1 θ 1 θ E( X 2 ) = ∫ x 2 e dx = ∫ x 2 e dx 0 ∞ 2θ θ ( 指数分布密度函数 ) = θ 2+ θ 2 = 2θ 2
概率论与数理统计浙江大学第四版盛骤概率论部分

浙江大学 盛骤
2019/3/16
1
概率论与数理统计是研究随机现象 数量规律的一门学科。
2
第一章
• • • • • • 1.1 1.2 1.3 1.4 1.5 1.6
概率论的基本概念
随机试验 样本空间 概率和频率 等可能概型(古典概型) 条件概率 独立性
第二章
• • • • • 2.1 2.2 2.3 2.4 2.5
第九章 方差分析及回归分析
• • • • 9.1 9.2 9.3 9.4 单因素试验的方差分析 双因素试验的方差分析 一元线性回归 多元线性回归
5
第十章 随机过程及其统计描述
• 10.1 随机过程的概念 • 10.2 随机过程的统计描述 • 10.3 泊松过程及维纳过程
第十一章 马尔可夫链
15
§3 频率与概率
(一)频率 n A; f ( A ) 定义:记 n n 其中 nA—A发生的次数(频数);n—总试验次 数。称fn ( A)为A在这n次试验中发生的频率。 例:
中国国家足球队,“冲击亚洲”共进行了n次,其中成功了
1 n; 一次,则在这n次试验中“冲击亚洲”这事件发生的频率为
nH
251 249 256 253 251 246 244 258 262 247
fn(H)
0.502 0.498 0.512 0.506 0.502 0.492 0.488 0.516 0.524 0.494
表 2
实验者
德·摩根 蒲丰
K·皮尔逊 K·皮尔逊
n
nH
fn(H)
2048 4040
12000 24000
关键词: 样本空间 随机事件 频率和概率 条件概率 事件的独立性
统计学习题第五章_抽样与抽样估计答案

第五章抽样与抽样估计复习题一、填空题1、在实际工作中,人们通常把n≥30 的样本称为大样本,而把n<30 的样本称为小样本。
2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。
3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。
4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。
5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。
二、选择题单选题:1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须((2))(1)增加到原来的3倍(2)增加到原来的9倍(3)增加到原来的6倍(4)也是原来的1/32、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用((3))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1小时的全部产进行检验,这种方式是((4))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2))(1)提高(2)降低(3)不变(4)不一定降低5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2))(1)(2)(3)(4)6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小多选题:1、降低抽样误差,可以通过下列那些途径((2)(4)(5))(1)降低总体方差(2)增加样本容量。
(3)减少样本容量(4)改重复抽样为不重复抽样(5)改简单随机抽样为类型抽样2、抽样推断中的抽样误差((1)(5))(1)是不可避免要产生的(2)是可以通过改进调查方法来消除的(3)只有调查后才能计算(4)即不能减少,也不能消除(5)其大小是可以控制的3、抽样极限误差((1)(2)(4))(1)是所有可能的样本指标与总体指标之间的误差范围(2)也叫允许误差 (3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5) ) (1)总体方差(2)所要求的概率保证程度 (3)抽样方法(4)抽样的组织形式(5)允许误差法范围的大小 5、不重复抽样的抽样平均误差( (2)(4) )(1)总是大于重复抽样的抽样平均误差 (2)总是小于重复抽样的抽样平均误差(3)有时大于,有时小于重复抽样的平均误差(4)在Nn很小时,几乎等于重复抽样的抽样平均误差 6、从3000名职工中随机抽取400名调查收入水平,共抽了( (1) (3) (5) ) (1)一个样本 (2)400个样本(3)一个样本总体 (4)400各样本总体 (5)400个样本单位 7、简单随机抽样一般适合于( (1)(3) (5) )(1)具有某种标志的单位均匀分布的总体 (2)具有某种标志的单位存在不同类型的总体 (3)现象的标志变异程度较小的总体 (4)不能形成抽样框的单位 (5)总体单位可以编号的总体三、简答题1、 什么是抽样平均误差影响抽样平均误差的因素有哪些答:抽样平均误差是所有可能的样本指标与被估计的总体参数之间的平均离差,即样本指标的标准差。
7第7章--参数估计(点估计与区间估计)---复习思想

解:已知n=36, 1- = 90%,z/2=1.645。根据样本数 据计算得:x39.5,s7.77 总体均值在1- 置信水平下的置信区间为
x z 2
s 39.51.6457.77
n
36
39.5 2.13
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
2021/2/4
相应的 为0.01,0.05,0.10
2021/2/4
19
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个具体的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
7第7章--参数估计(点估计与区间估计)--复习思想
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 两个总体参数的区间估计方法 6. 样本容量的确定方法
2021/2/4
2
参数估计在统计方法中的地位
统计方法
描述统计
3. 2. 根据样本统计量的抽样分布能够对样本统计量与 总体参数的接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
2021/2/4
置信下限
置信上限
16
举例:总体均值的区间估计
(方差已知或大样本)
1. 假定条件
总体服从正态分布,且方差(2) 已知
概率论与数理统计 71 点估计与最大似然估计 优质课件

10
解方程组即得
1 = 1 ( X1 , X2 ,
k = k ( X1 , X2 ,
, Xn), , Xn),
这就是1 ,2 , ,k 的矩估计量 .
11
例1: 设总体 X 在[a , b]上服从均匀分布, a , b 未知 . X1 , X2 , … , Xn 是来自 X 的样本, 求a , b的矩估计量.
5
一、点估计的概念:
1、定义7.1:
设总体 X 的分布函数为 F( x , θ ), 其中θ 为 未知参数 . 从总体 X 中抽取样本 X1 , X2 ,
… , Xn , 其观测值为 x1 , x2 , … , xn .
构造一个统计量 ( X1 , X2 , , Xn ), 用它的 观测值 ( x1 , x2 , , xn ) 来估计参数 , 称
设总体分布已知, 但含有k个未知数1,2 , ,k ,
若总体 X 的前 k 阶矩均存在 , 则可令
E( X rX
r i
,r =1,2,
,k ,
再利用总体 X 分布已知, 具体求出 E( X r ),
当然它是未知参数 1 ,2 , ,k 的函数, 这样
就得到含 k 个未知数和 k 个方程的方程组 ,
1 n
n i 1
Xi =A1称为一阶样本原点矩,
4
,1 n
n i 1
Xik =Ak称为k阶样本原点矩,
样本k阶中心矩:
Sn2 =
1 n
n
(Xi -X )2=B2称为样本二阶中心矩,
i 1
Snk =
1 n
n i 1
(Xi -X )k =
Bk 称为样本k阶中心矩,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 n 2 2 E[ ( X X ) ] . i n 1 i 1
即:样本均值 X 是总体X期望的无偏估计量,样本 方差S2是总体方差2的无偏估计量.
例1 设总体X的k阶矩k=EXk存在,又设 X1, X2 , …, Xn 是X的一个样本. 试证明:不论总体X服从什么分布,k阶样本
解 : E(a X 1 b X 2 ) aE( X 1 ) bE( X 2 ) E( X )
故对任意实数a>0,b>0,a+b=1,统计量a X 1 b X 2 都是E(X)的无偏估计
iid
^
^
由:
例6. 设总体X的概率密度为
解:
x E( X ) e 2
2 2
| x|
X1,… ,Xn为样本,求参数的矩估计.
1 f ( x) e 2
x
dx 0
x E( X ) e 2 2 xe
0
2
| x|
dx
1
x e
例2 设总体X的概率密度为
P
1- p
p
0 x1 其它
其中 为未知参数,且 >0,试求 的矩估计.
x 1 f ( x , ) 0
1
解 1 EX xf ( x )dx 0 x x
ˆ ˆ 1 X
1
dx 1
ˆ
1 n 则 1 (1 , 2 , , k ) X i n i 1 1 n 2 ( , , , ) X 2 1 2 k i n i 1 1 n k ( , , , ) X k k 1 2 i n i 1
ˆ 的取值不一定等于所要估计的参数 因此,
但从平均意义上讲,应该等于所估计的参数
ˆ ˆ( X ,L , X ) 统计量满足 E ˆ ˆ , 称 定义 n 1 n n n 为 的无偏估计(UE.)
已证结论:
1 n 1 n E ( X ) E ( X i ) EX i E ( X ), n i 1 n i 1
1 n M k ( X i X )k n i 1
n
m1 X n1 2 M2 S n S 2 ( n较大)
性质 如果总体X的期望为,方差为2,则 D( X ) 2 (1) E ( X ) E ( X ) (2) D( X ) n n 2 2 (3) E( S ) D( X ) n 1 n 1 1 n 证(1) E ( X ) E ( X i ) E ( X i ) EX i n i 1 n i 1 n i 1 1 n n n n 独立1 n 1 1 (2) D( X ) D( X i ) 2 D( X i ) 2 DX i n n i 1 n i 1 i 1 2 1 2 2 n n n
我们根据样本来估计这些参数,也就是从总 体中取出一个样本,构造适当的样本函数,即统计 量,对未知参数作出估计. 1 n 例如,统计量 X X i 作为总体均值 E ( X ) n i 1 1 n 的估计量,自然地用统计量的值 x xi 作为 总体均值的估计值.
n
i 1
பைடு நூலகம்
用估计量的值作为参数的估计值 ,这种做法 称为点估计.有时要求估计参数在一个多大的范 围内 , 并指出该参数以多大的概率 ( 信度 ) 被置于 此范围内,这是参数的区间估计问题。 对于一个被估参数,可构造不同统计量作为 其估计量. 孰好孰差,这是估计量的评选问题. 这一章我们研究的就是参数的各种估计法 以及如何评选问题。
(3) n n 1 1 2 2 2 ES E ( X X ) E ( X X ) i i n 1 i 1 n 1 i 1
n n n n 1 1 2 2 2 2 E X i 2 X X i X E ( X i 2 XX i X ) n 1 i 1 n 1 i 1 i 1 i 1
解:
ab 1 E( X ) D( X ) (b a )2 2 12 a E ( X ) 3 D( X ) b E ( X ) 3 D( X ) 1 n E( X ) X D( X ) ( X i X )2 n i 1
3 n 2 a X ( X X ) i n i 1 3 n 2 b X ( X X ) i n i 1
1 2 2 EX i nE ( X ) n 1 i 1
n
EX i2 ( EX i )2 DX i 2 2
2
X 1 , X 2 , , X n ~ N ( , ) , 则
2
i . i .d
(1)
X
n
~ N 0,1
2 0 x
x
dx x de
2 x 0
x
x
dx 2 xde
0
n
2 e
0
n
dx 2
2
1 ˆ X i2 n i 1
ME
X
i 1
2 i
2n
二、估计量的评选标准
1.无偏性
未知参数 的估计量 ˆ 是样本( X 1 , X 2 ,....X n ) 的函数,对于不同的观察值, ˆ 求得的值不同,
该题结果表明:总体均值与方差的矩估计的表达式 不因不同的总体分布而异; 两个未知参数的矩估计 (以样本矩代替相应的总体矩)可以用样本均值估计 总体期望,用样本二阶中心矩估计总体方差. 例4. P133例7-4
例5. 设X1 ,, X n ~ U (a, b), a b, 试求 a ME 和 b ME .
ME
X 1 X
例3:总体X的均值及方差2都存在, , 2均未知, X1,X2,…,Xn是总体的一个样本,试求 , 2的矩估计. 解: 1 EX ,
2 EX
2 2
2
ˆ =X ˆ ME X n n 2 2 1 n 2 1 1 2 2 2 2 X ˆ ME X i X ( X i X ) i n i 1 n i 1 n i 1
n 1 EX k X ik n i 1
ˆ ˆ ( X ,, X ) i 1 n i
即为参数 的矩估 ˆ 计,记为 ME
该方程组的解
注1.用样本矩作为总体同阶矩的估计,即 注2.约定:若 是未知参数的矩估计,则g()的矩估 计为g( ).
例1:设X1,… ,Xn为取自总体B(1,p),的样本,其中 0 1 0<p<1未知,求p的矩估计。 X 解: E(X)=p p ME X 为参数p的矩估计
一、矩估计法(简称“矩法”ME)
矩估计是1900年英国统计学家K. Pearson 提 出的一种统计方法.其基本思想是:以样本矩代替 相应的总体矩. T ( , , , ) 设总体X的分布函数为F(x, ), 为 1 2 k k维未知参数,并设随机变量X的k阶矩存在,其为 i 的函数,记作 i E( X ) i (1 ,2 ,,k ), i 1, 2, , k
常数,且满足 a1 a2 an 1.
证明 因为 E ( X i ) E ( X ) ,
n
n
i 1,2, , n
n
ˆ ) E ( ai X i ) E (a i X i ) ai EX i E (
i 1
i 1
i 1
2.有效性
2 1
(2)T
X S n
~ t ( n 1)
(3)
( X Y ) ( 1 2 )
2 2
1 1 ( n 1) S ( m 1) S n m n m 2 X ~ N ( , 2 ), Y ~ N ( , 2 ) 1 2
~ t ( n m 2)
注:F(x;)也可用分布律或密度函数代替. ˆ g( x ,, x ) 若x1,…, xn是样本的一个观测值, 1 n
称估计量与估计值为估计,并都简记为 ˆ
由于g(X1,… ,Xn) 是实数域上的一个点,现用它 来估计,故称这种估计为点估计. 点估计的经典方 法是矩估计法(ME)与极大似然估计法(MLE).
7.1 点估计
定义 设X1,… ,Xn是总体X的一个样本, X的分布函数 为F(x; ),。其中为未知参数, 为参数空间, 若统计量g(X1,… ,Xn)可作为的一个估计,则称其为 ˆ g( X ,, X ). 的一个估计量,记为 ˆ , 即
1 n
称为参数的估计值.在不致混淆的情况下统
(4)
( n 1) S
2 1 2 2
2
S (5) ~ F ( n 1, m 1) S X ~ N ( 1 , 12 ), Y ~ N ( 2 , 22 )
2 1 2 2
2
~ ( n 1)
2
P X u u为标准正态分布的上分位数.
P | X | u
1 n k 矩 mk n X i i 1
是k阶总体矩的无偏估计.
证明
1 n k ˆ k X i mk n i 1
1 n k E (mk ) E[ X i ] k n i 1