管理统计学-第3章 抽样分布与参数估计
第三章 参数估计

第三章参数估计重点:1.总体参数与统计量2.样本均值与样本比例及其标准误差难点:1.区间估计2.样本量确实定知识点一:总体分布与总体参数统计分析数据的方法包括:描绘统计和推断统计〔第一章〕推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。
总体分布是总体中所有观测值所形成的分布。
总体参数是对总体特征的某个概括性的度量。
通常有总体平均数〔μ〕总体方差〔σ2〕总体比例〔π〕知识点二:统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断。
统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。
统计量是样本的函数,如样本均值〔〕、样本方差〔 s2〕、样本比例〔p〕等。
构成统计量的函数中不能包括未知因素。
由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。
统计量的取值是根据样本而变化的,不同的样本可以计算出不同的统计量值。
[例题·单项选择题]以下为总体参数的是( )a.样本均值b.样本方差c.样本比例d.总体均值答案:d解析:总体参数是对总体特征的某个概括性的度量。
通常有总体平均数、总体方差、总体比例题·判断题:统计量是样本的函数。
答案:正确解析:统计量是样本的函数,如样本均值〔〕、样本方差〔〕、样本比例〔p〕等。
构成统计量的函数中不能包括未知因素。
[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。
答案:错误解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。
〔一〕样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n n种抽法,即可以组成n n不同的样本,在不重复抽样时,共有个可能的样本。
每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。
统计学第3章-概率、概率分布与抽样分布

互斥事件及其概率
(例题分析)
解:由于每一枚硬币出现正面或出现反面的概率 都是1/2,当抛掷的次数逐渐增大时,上面的4个 简单事件中每一事件发生的相对频数 (概率)将近 似等于 1/4 。因为仅当 H1T2 或 T1H2 发生时,才会 恰好有一枚硬币朝上的事件发生,而事件 H1T2 或 T1H2 又为互斥事件,两个事件中一个事件发 生或者另一个事件发生的概率便是 1/2(1/4+1/4) 。 因此,抛掷两枚硬币,恰好有一枚出现正面的概 率等于 H1T2 或 T1H2 发生的概率,也就是两种事 件中每个事件发生的概率之和
解:设 A = 某住户订阅了日报 B = 某个订阅了日报的住户订阅了晚报
依题意有:P(A)=0.75;P(B|A)=0.50
P(AB)=P(A)·P(B|A)=0.75×0.5=0.375
3-31
独立事件与乘法公式
(例题分析)
【例】从一个装有3个红球2个白球的盒子里摸球 (摸出后球不放回),求连续两次摸中红球的概率
3-17
互斥事件的加法规则
(例题分析)
【例】抛掷一颗骰子,并考察其结果。求出其点 数为1点或2点或3点或4点或5点或6点的概率
解:掷一颗骰子出现的点数(1,2,3,4,5,6)共有
6个互斥事件,而且每个事件出现的概率都为1/6 根据互斥事件的加法规则,得
P(1或2或3或4或5或6) P(1) P(2) P(3) P(4) P(5) P(6) 1 1 1 1 1 1 1 6 6 6 6 6 6
合计
从这200个配件中任取一个进行检查,求 (1) 取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率 (3) 取出一个为供应商甲的正品的概率 (4) 已知取出一个为供应商甲的配件,它是正品的概率
统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差
•
有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体
•
称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。
统计学教程(含spss)四参数估计

从一批灌装产品中,随机抽取20灌,得样本方差为0.0025。试以95%的置 信度,估计总体方差的存在区间。
n 1 s2 2 n 1 s2
2 2
2 1 2
n 1 s2
2 0.025
2
n 1 s2
2 0.975
19 0.0025 2 19 0.0025
32.8523
8.90655
自正态总体抽样时,总体均值与总体中位数相同,而中位数的 标准误差大约比均值的标准误差大25%。因此,样本均值更有效。
x 的抽样分布
M e的抽样分布
____
X
有效性
一致性
如果 lim
P
1(为任意小数,n
为样本容量)
n
则称 为的满足一致性标准的点估计量
ˆ1的抽样分布 ˆ2的抽样分布
x s 2 p 均为一致性估计量
X~N, 2
x__
~
N
, 2 n
__
Z x ~N 0,1
n
P Z
Z Z
1
2
2
P Z
2
__
x n
Z
1
2
显著性水平
22
2
Z 2
置信度
1
0
P_x_ Z
2
n
__
x Z 2
1
n
2
Z 2
显著性水平α下,μ在1- α置信水平下的置信区间:
__
x
Z
2
__
n , x Z 2
f x
x
n
x 2
f x
1
e 2 2 x
2
x
抽样分布
E(x)
统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
《统计学》第10讲 参数估计(复习+习题)

(二)方差的区间估计
1.总体方差的区间估计
对于来自正态总体的容量为n的简单随机样本,统 计量 n 1s 2 / 2 服从自由度为 n 1 的卡方分布。
n 1 s 2
2
~ 2 n 1
总体方差在1- 置信水平下的置信区间为
2 n 1 s
2
2 2 2 2 s1 s2 s1 s2 , F 2 F1 2
F分布两个自由度
24
(三)总体比率区间估计
1.单样本比率的区间估计
当样本容量充分大时,样本比率p近似服从以总体比
率P为数学期望,以P(1-P)/n为方差的正态分布。
1. 样本比率的数学期望
E (p) P
2. 样本比率的方差
P (1 P ) n
n1 n2
18
( n1 3 0, n 2 3 0 )
大样本,方差已知(两个总体分布没有要求)
1. 两个样本均值之差 x 1 x 2 的抽样分布服从正态
分布,其数学期望为两个总体均值之差
E (x1 x 2 ) 1
2
2. 方差为各自的方差之和
2 x1 x 2
12 22 n1 n2
•
分别从两个独立的随机总体中抽取容量为n1和n2的 独立样本,当两个样本都为大样本时,两个样本比 率之差的抽样分布可用正态分布来近似。 数学期望为
• •
E ( p 1 p 2 ) P1 P 2
方差为各自的方差之和
27
2 p1 p 2
P1 (1 P1 ) P2 (1 P2 ) n1 n2
2
2 2 x n
抽样与参数估计

第四章抽样与参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行推断。
从数据得到对现实世界的结论的过程就叫做统计推断(statistical inference)。
这个调查例子是估计总体参数(某种意见的比例)的一个过程。
估计(estimation) 是统计推断的重要内容之一。
统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesis testing) 。
因此本节内容就是由样本数据对总体参数进行估计,即:学习目标:了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样与抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。
总体(Population):调查研究的事物或现象的全体参数个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Sample size):样本中所含个体的数量一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。
一、抽样方法及抽样分布1、抽样方法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)被抽中。
注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,又可分为重复抽样与不重复抽样。
而且,根据抽样中是否排序,所能抽到的样本个数往往不同。
②、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样③、整群抽样:将一组被调查者(群)作为一个抽样单位④、等距抽样:在样本框中每隔一定距离抽选一个被调查者(2)非概率抽样:不是完全按随机原则选取样本①、非随机抽样:由调查人员自由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择一群特定数目、满足特定条件的被调查者2、抽样分布一般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(sampling distribution)。
管理统计学:第三章:样本数据特征

• 式中,Xi为样本观察值。
第3.4节 样本数据的离散特征
• 描述数据集合的离散特征的两种方法: • 一、点状描述,如明确样本数据集合中的最小 值和最大值等; • 二、区间描述(基于差值的描述),如样本数 据集合中的最大值与最小值之差。
3.4.1 对样本数据离散特征的点状描述: 极值、四分点与百分位点
• 1.极大值(Maximum)与极小值 (Minimum)
• 极大值与极小值,从一定视角反映了样本 数据集合中样本的离散情况。 • 问:极大值、极小值适用于什么测度? • 另一个位与数的问题:
• 2.下四分点(Lower quartile)与上四分点 (Upper quartile) • 1)上、下四分点的概念 • 下四分点使由小到大排序后的数据集合的左 边部分,包含25%的样本总个数,右边部分 包含75%的样本总个数。 • 上四分点使由小到大排序后的数据集合的左 边部分,包含75%的样本总个数,右边部分 包含25%的样本总个数。 • 上、下四分点在一定意义上反映了样本数据 的离散情况。
• 基于排序,能够简单统计频次:
• 价格(元)9.93 9.94 9.95 9.96 9.97 9.98 9.99 10.00 • 次数: 1 0 1 1 2 3 4 4 • 频率% 3.33 0 3.33 3.33 6.67 10.00 13.33 13.33 • 价格(元)10.01 10.02 10.03 10.04 10.05 10.06 • 次数: 4 2 3 2 2 1 • 频率% 13.33 6.67 10.0 6.67 6.67 3.33
第 3章 样本数据特征的初步 分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X ~ N ( ,
2
n
)
第三章
抽样分布与参数估计
• 例:某高校在研究生入学体检后对所有结果进 行统计分析,得出其中某一项指标的均值是7, 标准差2.2。从这个总体中随机选取一个容量 为31的样本。 • (1)计算样本均值大于7.5的概率, • (2)计算样本均值小于7.2的概率, • (3)计算样本均值在7.2和7.5之间的概率。
10 5
8
7 10
{8,10} 9 {7,10} 8.5 {10,10} 10
{8,5} 6.5 {7,5} 6 {10,5} 7.5
{8,8} 8 {7,8} 7.5 {10,8} 9
{8,7} 7.5 {7,7} 7 {10,7} 8.5
{8,10} 9 {7,10} 8.5 {10,10} 10
第三章
抽样分布与参数估计
x
的分
• 样本容量大于30,由中心极限定理可知,样本均值 布近似均值为
2.2 7, 标准差 X= = =0.39的正态分布 n 31
即
X ~ N (7,0.39 )
2
第三章
• (1)
抽样分布与参数估计
X 7 7.5 7 X 7 ) P( 1.28) 0.1 0.39 0.39 0.39
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
总体分布与样本抽样分布的关系
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
样本均值的抽样分布
• 一个总体10,5,8,7,10 ,
直方图 3 2 1 0 5 7 9 11 其他 接收 150.00% 100.00% 50.00% 0.00%
总体庞大,难以对总 体的全部元素进行 研究
抽 样 原 因
检查具有破坏性
炮弹、灯管、砖等
第三章
抽样分布与参数估计
统计学基本概念
• 总体 (全体) Population • 所有感兴趣的对象 • 样本Sample • 总体的一部分 • 总体参数Parameter • 关于总体的概括性度量 • 统计量Statistic • 关于样本的概括性度量 • 抽样 • 从所研究的对象中随机取出一部分进行观察,由此获 得有关总体的信息。
P( X 7.5) P(
X 7 7.2 7 X 7 • (2) P( X 7.2) P( 0.39 0.39 ) P( 0.39 0.51) 0.69
• (3)
P(7.2 X 7.5) P( 7.2 7 X 7 7.5 7 ) P(0.51 Z 1.28) 0.21 0.39 0.39 0.39
样本方差
从100个样本中推断总体的净重均值为343.76g,方差为17.053
描述统计模块
• Analyze→Descriptive Statistics→Descriptives→Options
均值 标准差 方差
N 净重 100 100 Descriptive Statistics
Mean 343.76
• 样本统计量是一个随机分布量。
第三章
• • • •
抽样分布与参数估计
设由四个同学组成的总体, 样本总体N=4。 随机变量X表示某个学生的年龄 X的所在取值为18,20,22,24。 21 2.236
• 总体均值和总体方差各为多少?
• 总体概率分布?
第三章
抽样分布与参数估计
• 所有样本容量为2的样本
设置指定的百分点
最小值 标准差 方差 最大值与最小值之差 最大值 均值标准差 数据分布的斜度 数据分布的峰度
频次分析模块(续)
Statistics 净 重 N 样本均值 Mean Std. Deviation Variance Valid Missing 100 0 343.76 4.130 17.053
n
1 ln L 2 ( xi ) 0 i1 n 1 n 2 ln L ( x ) 0 i 2 2 2 2 2( ) 2( ) i1 ( )
1 n ˆ mle xi x n i 1 n 2 mle 1 ( x x ) 2 i n i 1
抽样分布与参数估计
正态分布 总体分布
指数分布
均匀分布
样本均值 分布(n=2)
样本均值 分布(n=10)
样本均值 分布(n=30)
第三章 抽样分布与参数估计 中心极限定理的作用
• 建立起 Z 值与样本均值之间的数值关系. • 不论该总体服从何种分布,只要当样本容量足够大 ( n 30 ),样本均值的分布都大致服从正态分布。
3.2.2 点估计的优良性标准
• 无偏性
ˆ) ˆ ,如果E ( – 设总体的参数为 ,其估计量为 ˆ 的数学期望等于被估计的总体参数, 即估计量 ˆ 我们称估计量 是参数 的无偏估计量 – 样本平均数是总体平均数的无偏估计量 – 无偏性是对估计量的一个常见而重要的要求
点估计的优良标准(续)
矩估计法
• 借助样本矩去估计总体的矩
– 用样本的一阶原点矩来估计总体的均值 – 用样本的二阶中心矩来估计总体的方差
例3.1 矩法估计例题
X 1 , X 2 ,, X n 为总体的样本, • 设总体 X ~ N , 2 , 求, 的矩法估计量。 2
– 解:
ˆ 2矩
ˆ矩 X
• 一致性
ˆ( X ,..., X ) 是参数 估计量,若对于任意的 , –设 1 n ˆ( X ,..., X ) 依概率收敛于 ,则称 ˆ 为 当 n 时 1 n 的一致估计量 ˆ | ) 0 – 对任意 0 有,lim P(| n
频率 累积 %
频率
第三章
抽样分布与参数估计
• 有放回(with replacement)抽样
{X i , X j }
X
10 {10,10} 10 {5,10} 7.5
5 {10,5 } 7.5 {5,5} 5
8 {10,8} 9 {5,8} 6.5
7 {10,7} 8.5 {5,7} 6
10 {10,10} 10 {5,10} 7.5
第三章
抽样分布
抽样分布与参数估计
• 从一个总体中随机抽出容量相同的各种样本,从这些 样本计算出的某统计量所有可能值的概率分布,称为 这个统计量的抽样分布。 • 从一个给定的总体中抽取(不论是否有放回)容量 (或大小)为n的所有可能的样本,对于每一个样本, 计算出某个统计量(如样本均值或标准差)的值,不 同的样本得到的该统计量的值是不一样的,由此得到 这个统计量的分布,称之为抽样分布。
– 解:
10 1 ˆ ) x x 1147(h) E( X i 10 i 1
ˆ ) 2 7578.889 D( X
极大似然估计法
• 求极大似然估计的一般步骤
– – – – 写出似然函数 对似然函数取对数,并整理 求导数 解似然方程
例3.4 极大似然估计例题
2 • 设总体X服从N(, ),是X 的样本值,求, 2 的极大似然估计
n
• 有效性
ˆ ˆ ( X ,..., X )都是参数的无偏 ˆ ˆ ( X ,..., X )和 –设 2 2 1 n 1 1 1 n ˆ ) D( ˆ ) ,且至少对于 估计量,若对任意 , D( 1 2 ˆ 较 ˆ 有效 某个 上式中的不等号成立,则称 1 2
– 解: L( x1 , x2 ,, xn ; , 2 )
n
,
i 1
1 e 2
( xi ) 2 2 2
1 (2 ) ( )
n 2 n 2 2
e
i 1
n
( xi ) 2 2 2
• 似然方程为:
n
( xi )2 n n 2 ln L ln( 2 ) ln( ) 2 i 1 2 2 2
第三章
抽样分布与参数估计
• 例:在北京一居室的房租平均为每月1500元, 房租的分布并不服从正态分布,随机抽取容量 为50的样本,样本的标准差是200元,请问样 本均值至少为1600元的概率是多少?
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
N1 P N
第三章
抽样分布与参数估计
• 样本平均数
• 样本方差 • 样本标准差
x
X
i 1
n
i
2 ( X x ) i i 1 n
n
s2
s
n 1
• 样本比率(样本成数)
n1 p n
第三章
抽样分布与参数估计
• 样本统计量经常被用作估计总体参数。 • 点估计就是运用样本数据值计算出一个样本统计量的 值,将其作为总体参数的估计值。 • 如用 x 50 去估计 • 问题是不同的样本提供不同的估计值 • 样本越大,估计的性质越好,但成本也越高 • 了解估计的性质有多好 • 解决办法:以样本的抽样分布作为理论基础。
第三章
抽样分布与参数估计
第三章
抽样分布与参数估计
• 例:已知某高校女生比例为46%,现对全体学 生做两次随机抽样, n=200和n=1000 ,求这 两次抽样中女生的比例在50%以上的概率。
第三章
抽样分布与参数估计
3.2 点估计
第三章
抽样分布与参数估计