第5章 抽样分布与参数估计

合集下载

抽样分布与参数估计

抽样分布与参数估计

抽样分布与参数估计首先,我们来了解什么是抽样分布。

在统计学中,抽样分布是指从总体中多次抽样得到的样本统计量的分布。

假设我们的总体是指所有感兴趣的个体的集合,而样本是从总体中选取的一部分个体。

抽样分布的形状和性质取决于总体的分布和样本的大小。

通过分析抽样分布,可以得到有关总体参数的有用信息。

例如,我们想要知道一些城市成年人的平均年收入。

在实际情况下,我们无法调查每个人的收入情况,因此我们需要从总体中随机抽取一部分个体作为样本,并计算他们的平均年收入。

如果我们多次从总体中抽取样本并计算平均年收入,然后绘制这些平均值的分布图,我们就可以得到平均年收入的抽样分布。

这个抽样分布将给我们提供有关总体平均年收入的估计和推断。

接下来,我们将讨论参数估计。

参数估计是指使用样本数据来估计总体参数的过程。

总体参数是用于描述总体特征的数值,如总体平均值、总体标准差等。

通过从总体中抽取样本,并计算样本统计量,我们可以利用样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是指用单个数值来估计总体参数,例如用样本均值来估计总体均值。

点估计给出了一个单一的值,但不能提供关于估计的精度的信息。

因此,我们常常使用区间估计。

区间估计是指给出一个区间,这个区间内有一定的置信水平使得总体参数落在这个区间内的概率最高。

区间估计能够向我们提供关于估计的精确程度的信息。

区间估计依赖于抽样分布的性质。

中心极限定理是制定抽样分布理论的一个重要原则。

根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将近似于正态分布。

这使得我们可以使用正态分布的性质来计算置信区间。

构建置信区间的一种常用方法是使用样本均值的标准误差。

标准误差是样本均值的标准差,它用来衡量样本均值和总体均值之间的误差。

根据正态分布的性质,当样本容量足够大时,样本均值与总体均值之间的误差可以用标准误差来估计。

通过计算标准误差并结合正态分布的性质,我们可以得到样本均值的置信区间。

曾五一《统计学导论》(第2版)配套题库【课后习题】第五章 抽样分布与参数估计 【圣才出品】

曾五一《统计学导论》(第2版)配套题库【课后习题】第五章 抽样分布与参数估计 【圣才出品】

A.是不可避免要产生的 B.是可以通过改进调查方法消除的
C.是可以事先计算的
D.只有调查结束之后才能计算
【答案】AC
【解析】抽样误差是由于抽样的随机性引起的样本结果与总体之间的误差。抽样误差是
一种随机性误差,只存在概率抽样中,在概率抽样中,抽样误差是不可避免的。但是,用大
数定律的数学公式,是可以事先计算的。
构造的统计量
X S
服从 t n
1
,则置信区间为:
X
t /2
n
1
S n
n
样本均值
X
=12.09,样本标准差
S2 n 1
S
2 15
=0.005,
S15
=0.0707
SX =
S =0.0707/ n
16 =0.0177, t0.025
15
2.131
△= t /2 n 1
S n
=0.0177 2.131=0.038
5.某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区已购买 了微波炉的 2200 个居民户中用简单随机不还原抽样方法以户为单位抽取了 30 户,询问每 户一个月中使用微波炉的时间。调查结果依次为(单位:分钟)
【答案】A
【解析】 E z 2
,根据公式可知,如果极限误差缩小为原来的二分之一,则在其
n
他条件不变的情况下,样本容量扩大为原来的 4 倍。
4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于 1,称为抽 样估计的( )。
A.无偏性 B.一致性 C.有效性 D.充分性 【答案】B 【解析】一致性是指随着样本容量不断增大,样本统计量接近总体参数的可能性就越来 越大,或者,对于任意给定的偏差控制水平,两者间偏差高于此控制水平的可能性越来越小, 接近于 0。用公式表示就是

第5章--抽样分布与参数估计教案资料

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。

抽样分布与参数估计

抽样分布与参数估计

三、t分布曲线下的面积分布规律
自由度为 的t分布曲线
t 分布曲线下 的整个面积为1, t 分布曲线下从a到b 的面积为t值分布 在此范围内的百分 比,即t值落在此 范围内的概率P。
双侧:由于t分布以0为中心对称,即 P(t≤- t, )= P(t≥ t, )= /2 于是有P(- t, ≤t≤ t, )=1-
sx
u X
X
t X =n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数, 即自由度 ,与标准差的自由度一致。
• 2. t分布曲线以0为中心,左右对称; 越小, t变量值的离散程度越大,曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些(高 峰低些,两尾部翘得高些), 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若 =,则t分布曲线和标准正态曲线完全吻 合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计:用样本统计量来估计总体参数。
点值估计:不计抽样误差,直接用样本均数来 估计μ。
区间估计:根据抽样误差的规律,按一定的概 率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节 均数的抽样误差 第二节 t分布 第三节 总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分 观察单位构成样本,用样本信息去 推断总体特征的研究方法。
统计推断的过程
总体

样本统计量

例如:样本均
值、比例
二、抽样误差:在抽样研究中,因抽样造 成的样本统计量与样本统计量、样本统计 量与总体参数的差值。

抽样分布、参数估计和假设检验

抽样分布、参数估计和假设检验

抽样分布一、抽样分布的理论及定理 (一) 抽样分布抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n 的若干个样本,对每一样本可计算其k 统计量,而k 个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。

(二) 中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。

1.如果总体呈正态分布,则从总体中抽取容量为n 的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。

2.从总体中抽取容量为n 的一切可能样本时,所有样本均数的均数(X μ)等于总体均数(μ)即μμ=X3.从总体中抽取容量为n 的一切可能样本时,所有样本均数的标准差(X σ)等于总体标准差除以样本容量的算数平方根,即n X σσ=中心极限定理在统计学中是相当重要的。

因为许多问题都使用正态曲线的方法。

这个定理适于无限总体的抽样,同样也适于有限总体的抽样。

中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数X μ与样本标准差X σ)的计算方法。

(三)抽样分布中的几个重要概念1.随机样本。

统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample )。

所谓随机样本是指按照概率的规律抽取的样本,2.抽样误差。

从总体中抽取容量为n 的k 个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。

3.标准误。

样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE 或Xσ表示。

根据中心极限定理其标准差为n X σσ=正如标准差越小,数据分布越集中,平均数的代表性越好。

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

参数的假设检验抽样分布、参数估计、假设检验(回归分析)

z = -3.162 < 1.64 接受原假设
5% 1.64
假设检验的基本原理
2)相伴概率 P 检验统计量观察值以及所有所有比
它更为极端的可能值出现的概率之和 双侧检验:
P = P(Z < -3.162) + P(Z > 3.162) = 0.002
左侧检验:P = P(Z < -3.162) = 0.001
1
t分布两尾 概率分位点
P(x t / 2sx x t / 2sx ) 1
参数估计 - 区间估计
正态总体方差的区间估计
(n 1)s2
2
~
2 (n 1)
2分布上尾 概率分位点
P(12
2
(n 1)s2
2
2
2)
1
P(
(n 1)s2
12 2
2
(n 1)s
2 2
2
)
1
参数估计 - 区间估计
n
Z x ~ N(0,1) 2 n
中心极限定理
➢ 无论样本所来自的总体是否服从正态分布, 只要样本足够大,样本平均数就近似服从正 态分布,样本越大,近似程度越好。
➢所需的样本含量随原总体的分布而异,但只 要样本含量 30,无论原总体是何分布,都 足以满足近似的要求。
➢设原总体的期望为,方差为 2,则样本平 均数的期望为,方差为 2 /n。
统计推断概述
抽样分布 参数估计简介 假设检验的基本原理
抽样分布的概念
样本统计量的概率分布称为抽样分布(sampling distribution)
样本是通过对总体的随机抽样获得的 样本统计量是随机变量,有一定的概率分布
简单随机样本

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

12.样本均值的抽样标准差 x ,( ).
A.随着样本量的增大而变小 B.随着样本量的增大而变大
5 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

C.与样本量的大小无关
D.大于总体标准差
【答案】A
【解析】根据样本均值的抽样分布可知,样本均值抽样分布的标准差 x
D.服从 2 分布
【答案】B
【解析】当 n 比较大时,样本均值的抽样分布近似服从正态分布。题中 n 36 30 为
大样本,因此样本均值的抽样分布近似服从正态分布。
5.估计量的含义是指( )。 A.用来估计总体参数的统计量的名称
2 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

圣才电子书 十万种考研考证电子书、题库视频学习平台

第五章 抽样分布与参数估计
一、单项选择题 1.抽样分布是指( )。 A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布 【答案】C 【解析】统计量是样本的函数,它是一个随机变量。样本统计量的分布称为抽样分布。
2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布, 其分布的均值为( )。
A.
B. X C. 2
2 D.
n 【答案】A
【解析】根据中心极限定理,设从均值为 ,方差为 2 的任意一个总体中抽取样本量 为 n 的样本,当 n 充分大时,样本均值的抽样分布近似服从均值为 ,方差为 2 n 的正
n
,样本
量越大,样本均值的抽样标准差就越小。
13.在用正态分布进行置信区间估计时,临界值 1.645 所对应的置信水平是( )。 A.85% B.90% C.95% D.99% 【答案】B 【解析】置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在

第五章 参数估计

第五章 参数估计
(总体方差未知时,以样本方差代替)
1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:

分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:

一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计

利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:

当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1 5.5) 2 (2 5.5) 2 (10 5.5) 2 /10 2.87228
E(X) 5.5
x

n
2.87228 / 2 2.0310
5-22
【例】160 件电子元器件重量的均值为 5.02 克, 标准差为 0.30 克, 从中采用不放回方式随机抽取 64 件, 试求: (1)样本平均数的期望值与方差; (2)总重量在 4.96 克与 5.00 克之间的概率。 解: (1) E(X) 5.02克 ;
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
统计学
毛春元主讲
第五章 抽样分布与参数估计

第一节 抽样的基本概念与数学原理


第二节 抽样分布
第三节 参数估计
第四节 样本容量的确定
第五节 EXCEL在参数估计中的应用
5-20
中心极限定理


正态分布的再生定理 :相互独立的两个正态 随机变量相加之和仍服从正态分布。 中心极限定理:
2 X ~ N , n

大样本的平均数近似服从正态分布。
5-21
【例】计算例 5-2 中 10 名推销员平均的任职年限及其 标准差, 并与例 5-2 求得的样本平均数的期望值与方差作比 较。 解: (1 2+3+4+5+6+7+8+9+10)/10=5.5
N1 p x N
n1 P n
E ( P) p

P也是一个随机变量,利用样本平均数的分布性质结论,即有:
p 1 p p 1 p P n n n
5-17
不放回抽样分布

样本均值的分布性质:
E( X )
(X ) X

2 N n
X
n
E ( X ) X Xf 42(元) f
( X X )2 f 16(元2 ) (X ) f
2
5-15
放回抽样分布--样本平均数的分布

由概率论知,如果总体是正态分布的,则样 本平均数的抽样分布是如下正态分布
N ( ,


2
n
)
这是一个非常重要的结论,有广泛的应用。 (请参见中心极限定理。)
样本平 均数 X 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本 46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
样本平 均数 X 40 42 44 46 48 42 44 46 48 50
5-14
放回抽样分布--样本平均数的分布
样本平均数 X 34 36 38 40 42 44 46 48 50 合计 频数 1 2 3 4 5 4 3 2 1 25

验证了以下两个结论:
E( X )
2 2( X )
n

抽样平均数的标准差反 映所有的样本平均数与 总体平均数的平均误差, 称为抽样平均误差,用 表示。 X

放回抽样分布--样本平均数的分布


某班组5个工人的日工 资为34、38、42、46、 50元。 = 42 2 = 32 现用放回抽样的方法从 5人中随机抽2个构成样 本。共有52=25个样本。 如右图。
样本 34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
n N 1
样本成数的分布性质
E ( P) p
P
p 1 p N n n N 1
5-18
抽样分布总结
样本平均数的分布 样本成数的分布
放回抽 样
E( X )
X )
n
E ( P) p
p 1 p P n

(5.19)
式中被 1 和 2 框定的区间叫做置信区间。 i = 叫做抽
样极限误差,它可以反映抽样估计误差的最大范围。
5-28
X p P 2 s 2
X X
n 1
2
5-29

(三)估计量的优良标准
ˆ 1.无偏性。 的数学期望值等于θ 。即有: E (5.17)
2. 有效性。又称最小方差性。
5-30
3. 一致性,一致性是指随着样本容量不断增大,样本统计 量接近总体参数的可能性就越来越大,或者,对于任意给定的偏 差控制水平,两者间偏差高于此控制水平的可能性越来越小,接 近于 0。用公式表示就是:
5-6
总体
样本

参数

统计量 平均数 标准差、方差
X
、2
P
N
S、 S2
成数
单位数
P
n
( x x )2 s2 n 1 ( x x )2 f s2 f 1
5-7

(三)概率抽样及其组织形式 所谓概率抽样,就是要求对总体的 每一次观察(每一次抽取)都是一次随 机试验,并且有和总体相同的分布。按 这样的要求对总体观测(抽取)n次, 可得到容量为n的样本。
Nn 。 样本可能的个数是
5-11
2.不放回抽样。 特点: 第一,n 个单位的样本由 n 次试验结果构成。 第二,每次试验结果不是独立的,上次中选情况影 响下次抽选结果。 第三,每个单位在多次(轮)试验中中选的机会是不 等的。 N! 如果考虑顺序,其样本可能个数为 ; ( N n)! 如果不考虑顺序,其样本可能个数为
320 80% 400
(1 ) N n p
n N 1
P (1 P ) n 1 N N
80% 20% 400 1 1.932 400 6000
5-25
第三节 参数估计
一、参数估计概述 二、总体均值的估计 三、总体比例的估计 四、总体方差的估计
x
N n
2
0.3 ( 160-64) 0.02914克 = n N 1 64 (160-1)
5-23
(2) 该问题可化为求样本平均数的观测值在 4.96 克 -5.0 克之间的概率。 因为 X ~ N (5.02, 0.3 ) ,所以, 可先 将其进行标准变换,并利用上一章介绍的标准正态分布 求解概率。即有:
N! 。 ( N n)! n!
5-12
二、抽样分布


抽样分布的概念:由样本统计量的全部可能 取值和与之相应的概率(频率)组成的分配 数列。(主要求出样本平均数的期望与方差) 包括以下内容

放回抽样分布

样本平均数的分布 样本成数的分布 样本平均数的分布 样本成数的分布
5-13

不放回抽样分布
5-2
第一节 抽样的基本概念与数学原理

一、有关抽样的基本概念 二、大数定理与中心极限定理
5-3
一、有关抽样的基本概念

(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分 单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。 一般地,样本单位数大于30个的样本称 为大样本,不超过30个的样本称为小样本。 2.样本个数。样本个数又称样本可能数目, 它是指从一个总体中可能抽取多少个样本。
5-27

(二)点估计 点估计,主要有矩估计法和最大似然估计法。 矩估计法是用样本矩去估计总体矩(或是用样 本矩的函数去估计总体矩的相应函数)的一种估计 方法,由此获得的估计量称作矩估计量; 最大似然估计法是把待估计的总体参数看作一个 可以取不同数值的变量,计算当总体参数取上述不 同数值的时候,发生我们当前所得到的样本观测值 的不同概率,总体参数取哪一个数值的时候这种概 率最大,便把这个数值作为对总体参数的估计结果。
5-8
【例 5-1】 有 10 个同样的球,分别标 有从 1 至 10 的号码。 (1)从中有目的地抽出 5 号球; (2)从中随便地取一个球; (3)把 10 个球放在袋中,充分混匀,从中抽出一个 球,抽取时,要求袋中各个球有相等的被抽 中的概率。上述抽样方式是否属于概率抽 样?
5-9
显然, (1)和(2)的抽取行为都不是随机试验。因而不属于概 率抽样。只有(3)的抽取行为是随机试验。总体的分布可用表 5-1 的 分布列来描述,而(3)的随机试验中所观测的随机变量也有与表 5-1 有相同的分布。所以, (3)的抽取行为是概率抽样。
当样本容量n 充分大时,可以用 样本平均估计总体平均。
m lim p p 1 n n
当试验次数n充分大时,可以用 频率代替概率。
大数定理的意义:个别现象受偶然因素影响,但是,对 总体的大量观察后进行平均,就能使偶然因素的影响相 互抵消,从而使总体平均数稳定下来,反映出事物变化 的一般规律,这就是大数定理的意义。
5-16
放回抽样分布--样本成数的分布

总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平 均数,设总体单位总数目是N,总体中有该特征的单位数是N1。设x是0、 1变量(总体单位有该特征,则x取1,否则取0),则有:

现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成 数是:
E( X )
相关文档
最新文档