管理统计学-第3章抽样分布与参数估计

合集下载

第三章 参数估计

第三章   参数估计

第三章参数估计重点:1.总体参数与统计量2.样本均值与样本比例及其标准误差难点:1.区间估计2.样本量确实定知识点一:总体分布与总体参数统计分析数据的方法包括:描绘统计和推断统计〔第一章〕推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。

总体分布是总体中所有观测值所形成的分布。

总体参数是对总体特征的某个概括性的度量。

通常有总体平均数〔μ〕总体方差〔σ2〕总体比例〔π〕知识点二:统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断。

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。

统计量是样本的函数,如样本均值〔〕、样本方差〔 s2〕、样本比例〔p〕等。

构成统计量的函数中不能包括未知因素。

由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。

统计量的取值是根据样本而变化的,不同的样本可以计算出不同的统计量值。

[例题·单项选择题]以下为总体参数的是( )a.样本均值b.样本方差c.样本比例d.总体均值答案:d解析:总体参数是对总体特征的某个概括性的度量。

通常有总体平均数、总体方差、总体比例题·判断题:统计量是样本的函数。

答案:正确解析:统计量是样本的函数,如样本均值〔〕、样本方差〔〕、样本比例〔p〕等。

构成统计量的函数中不能包括未知因素。

[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。

答案:错误解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。

〔一〕样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n n种抽法,即可以组成n n不同的样本,在不重复抽样时,共有个可能的样本。

每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。

统计学第3章-概率、概率分布与抽样分布

统计学第3章-概率、概率分布与抽样分布
3-15
互斥事件及其概率
(例题分析)

解:由于每一枚硬币出现正面或出现反面的概率 都是1/2,当抛掷的次数逐渐增大时,上面的4个 简单事件中每一事件发生的相对频数 (概率)将近 似等于 1/4 。因为仅当 H1T2 或 T1H2 发生时,才会 恰好有一枚硬币朝上的事件发生,而事件 H1T2 或 T1H2 又为互斥事件,两个事件中一个事件发 生或者另一个事件发生的概率便是 1/2(1/4+1/4) 。 因此,抛掷两枚硬币,恰好有一枚出现正面的概 率等于 H1T2 或 T1H2 发生的概率,也就是两种事 件中每个事件发生的概率之和
解:设 A = 某住户订阅了日报 B = 某个订阅了日报的住户订阅了晚报
依题意有:P(A)=0.75;P(B|A)=0.50
P(AB)=P(A)·P(B|A)=0.75×0.5=0.375
3-31
独立事件与乘法公式
(例题分析)
【例】从一个装有3个红球2个白球的盒子里摸球 (摸出后球不放回),求连续两次摸中红球的概率
3-17
互斥事件的加法规则
(例题分析)
【例】抛掷一颗骰子,并考察其结果。求出其点 数为1点或2点或3点或4点或5点或6点的概率
解:掷一颗骰子出现的点数(1,2,3,4,5,6)共有
6个互斥事件,而且每个事件出现的概率都为1/6 根据互斥事件的加法规则,得
P(1或2或3或4或5或6) P(1) P(2) P(3) P(4) P(5) P(6) 1 1 1 1 1 1 1 6 6 6 6 6 6


合计
从这200个配件中任取一个进行检查,求 (1) 取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率 (3) 取出一个为供应商甲的正品的概率 (4) 已知取出一个为供应商甲的配件,它是正品的概率

第三讲 抽样分布和估计

第三讲 抽样分布和估计
Stat_istic
x
Proportion p
p
Variance Difference
2
-
12
s2
__ x -x
12
30
联合食品公司的案例
针对“联合食品公司”的案例(P.44 案例2-1), 我们假设调查的100个客户组成一个简单随机样 本。尝试回答下面的问题: 1)所有客户一次购买金额的平均值是多少?
第三讲
抽样分布和估计
1
概率论与统计学之间的关系
一个概率论的问题:
假定有一个大盒子中有 10,000个球,分布如下: 70%的黑球和 30%的白球
随机抽取100个球,得到60个黑球和40个白球的 概率是多少?
---- 给定一个总体(盒子中的所有小球)的已知 特征(70% 和30%),研究一个试验(抽取小球) 的可能的结果 (例如 60-40) 。
2
一个统计学的问题:
假定一个大盒子中有 10,000个小球(黑和白)。 随机抽取100个小球,发现其中有60个黑球和40个
白球。那么黑球在盒子中所占的比例是多少?
---- 观察到一个试验(抽取小球)的结果 (60-40), 推断出这个总体(盒子中的所有小球)的特征 (比例)
3
总体-样本理论 统计推断采用一个(有代表性的)子总体 (样本)来对总体的某些特征进行科学的 推断。
10 2 55 7.42
x 10.33 s 2 56.78 s 7.54
抽样分布
样本不同, x 值也不同。那么 x 取不同 值的可能性分别是什么? x 的概率分布称作它的抽样分布。 抽样分布在统计推断中的中心地位。 抽样分布取决于总体的分布(模型)以 及抽样的方式。
抽样方式 总体分布===== 抽样分布

抽样分布与参数估计

抽样分布与参数估计

三、t分布曲线下的面积分布规律
自由度为 的t分布曲线
t 分布曲线下 的整个面积为1, t 分布曲线下从a到b 的面积为t值分布 在此范围内的百分 比,即t值落在此 范围内的概率P。
双侧:由于t分布以0为中心对称,即 P(t≤- t, )= P(t≥ t, )= /2 于是有P(- t, ≤t≤ t, )=1-
sx
u X
X
t X =n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数, 即自由度 ,与标准差的自由度一致。
• 2. t分布曲线以0为中心,左右对称; 越小, t变量值的离散程度越大,曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些(高 峰低些,两尾部翘得高些), 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若 =,则t分布曲线和标准正态曲线完全吻 合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计:用样本统计量来估计总体参数。
点值估计:不计抽样误差,直接用样本均数来 估计μ。
区间估计:根据抽样误差的规律,按一定的概 率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节 均数的抽样误差 第二节 t分布 第三节 总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分 观察单位构成样本,用样本信息去 推断总体特征的研究方法。
统计推断的过程
总体

样本统计量

例如:样本均
值、比例
二、抽样误差:在抽样研究中,因抽样造 成的样本统计量与样本统计量、样本统计 量与总体参数的差值。

统计学之抽样与抽样分布

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。

抽样分布与参数估计

抽样分布与参数估计
思考题:收视率估计
▪ 某电视台欲在95%的置信度水平下,对电
视节目的收视率作为有效的估计,试考 虑样本量应当为多少?
▪ 问题:若确定估计绝对误差为5%,则样
本为385户,是否可行?
▪ 若考虑估计相对误差为10%,则样本量应
当为多少?
统计学原理
其他样本量估计的情况
▪ 估计样本比例时样本量的确定 ▪ 估计两个总体均值之差时样本量的确定 ▪ 估计两个总体比例之差时样本量的确定 ▪ 以上问题,均可通过参数估计的公式进行
o 比例估计时,方差为:p(1-p) o 可知,p(1-p)的最大值为0.25。
统计学原理
比例估计时的样本量推算
在校园内估计学生拥有手机的比例,希 望在95%的置信水平下,估计的绝对误 差不超过5个百分点(5%),求样本量
n
1.962
0.052
2
, 取
2
Max
0.25
则有n 385
统计学原理
助记方法
统计学原理
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差已知;
o 或非正态总体,大样本,方差已知。
z x ~ N (0,1) X n
置信区间:
(
x
za
2
X
n
,
x
za
2
X
n
)
注意:Z取a/2的原因在于此时置信 区间是最小的。
统计学原理
一个总体参数—总体均值
▪ 正态总体,方差未知
统计学原理
计算结果
▪ 计算样本平均数:X=39.5 ▪ 计算样本标准差:s=7.7736 ▪ 令:总体标准差=样本标准差,计算抽样误差为
1.2956

抽样分布、参数估计和假设检验

抽样分布、参数估计和假设检验

抽样分布一、抽样分布的理论及定理 (一) 抽样分布抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n 的若干个样本,对每一样本可计算其k 统计量,而k 个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。

(二) 中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。

1.如果总体呈正态分布,则从总体中抽取容量为n 的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。

2.从总体中抽取容量为n 的一切可能样本时,所有样本均数的均数(X μ)等于总体均数(μ)即μμ=X3.从总体中抽取容量为n 的一切可能样本时,所有样本均数的标准差(X σ)等于总体标准差除以样本容量的算数平方根,即n X σσ=中心极限定理在统计学中是相当重要的。

因为许多问题都使用正态曲线的方法。

这个定理适于无限总体的抽样,同样也适于有限总体的抽样。

中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数X μ与样本标准差X σ)的计算方法。

(三)抽样分布中的几个重要概念1.随机样本。

统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample )。

所谓随机样本是指按照概率的规律抽取的样本,2.抽样误差。

从总体中抽取容量为n 的k 个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。

3.标准误。

样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE 或Xσ表示。

根据中心极限定理其标准差为n X σσ=正如标准差越小,数据分布越集中,平均数的代表性越好。

统计学 第三章抽样与抽样分布

统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 从一个给定的总体中抽取(不论是否有放回)容量 (或大小)为n的所有可能的样本,对于每一个样本, 计算出某个统计量(如样本均值或标准差)的值,不 同的样本得到的该统计量的值是不一样的,由此得到 这个统计量的分布,称之为抽样分布。
• 样本统计量是一个随机分布量。
第三章 抽样分布与参数估计
• 设由四个同学组成的总体, • 样本总体N=4。 • 随机变量X表示某个学生的年龄 • X的所在取值为18,20,22,24。
• (3)
P ( 7 . 2 X 7 . 5 ) P ( 7 . 2 7 X 7 7 . 5 7 ) P ( 0 . 5 Z 1 1 . 2 ) 0 8 . 2 0 . 39 0 . 39 0 . 39
第三章 抽样分布与参数估计
• 例:在北京一居室的房租平均为每月1500元, 房租的分布并不服从正态分布,随机抽取容量 为50的样本,样本的标准差是200元,请问样 本均值至少为1600元的概率是多少?
值,将其作为总体参数的估计值。
• 如用 x5去0估计
• 问题是不同的样本提供不同的估计值 • 样本越大,估计的性质越好,但成本也越高 • 了解估计的性质有多好
• 解决办法:以样本的抽样分布作为理论基础。
第三章 抽样分布与参数估计
抽样分布
• 从一个总体中随机抽出容量相同的各种样本,从这些 样本计算出的某统计量所有可能值的概率分布,称为 这个统计量的抽样分布。
• 总体均值和总体方差各为多少? 21 2.236
• 总体概率分布?
第三章 抽样分布与参数估计
• 所有样本容量为2的样本
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
总体分布与样本抽样分布的关系
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
50.00%
0
0.00%
6
7
8
9
10 其他
频率
累积
%
频率
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
第三章 抽样分布与参数估计
总体分布
正态分布
样本均值 分布(n=2)
样本均值 分布(n=10)
样本均值 分布(n=30)
指数分布
均匀分布
第三章 抽样分布与参数估计 中心极限定理的作用
第三章 抽样分布 与参数估计
第三章 抽样分布与参数估计
• 3.1 抽样分布 • 3.2 点估计 • 3.3 区间估计
第三章 抽样分布与参数估计
3.1 抽样分布
为什么要抽样? 为了收集必要的资料,对所研究对象(总体)的
全部元素逐一进行观测,往往不很现实。
元素多,搜集数据费
抽 样
时、费用大,不及时而 使所得的数据无意义
第三章 抽样分布与参数估计
• (1) P ( X 7 .5 ) P (X 7 7 .5 7 ) P (X 7 1 .2 ) 8 0 .1 0 .39 0 .390 .39

(2)
P (X 7 .2 ) P (X 7 7 .2 7 ) P (X 7 0 .5 ) 1 0 .6 0 .39 0 .390 .39
I 1 N
N
(XI X )2
2 I 1
N
• 总体比率(总体成数)
P N1 N
第三章 抽样分布与参数估计
• 样本平均数 • 样本方差 • 样本标准差
n
Xi
x i1 n
n
(Xi x)2
s2 i1 n 1
s
• 样本比率(样本成数)
p n1 n
第三章 抽样分布与参数估计
• 样本统计量经常被用作估计总体参数。 • 点估计就是运用样本数据值计算出一个样本统计量的
• 抽样 • 从所研究的对象中随机取出一部分进行观察,由此获 得有关总体的信息。
第三章 抽样分布与参数估计
• 抽样分为概率抽样与非概率抽样 • 其中概率抽样分为:
纯随机抽样、等距抽样、分层抽样、整群抽样
第三章 抽样分布与参数估计 常用的总体参数
• 总体平均数 • 总体方差 • 总体标准差
N
XI
• (1)计算样本均值大于7.5的概率, • (2)计算样本均值小于7.2的概率, • (3)计算样本均值在7.2和7.5之间的概率。
第三章 抽样分布与参数估计
• 样本容量大于30,由中心极限定理可知,样本均值 x的分
布近似均值为
7,标准 X = 差 n=23 .2= 10.39的正态分

X~N(7,0.392)
• 建立起 Z 值与样本均值之间的数值关系.
• 不论该总体服从何种分布,只要当样本容量足够大
( n 3)0 ,样本均值的分布都大致服从正态分布。
X ~ N(,2 )
n
第三章 抽样分布与参数估计
• 例:某高校在研究生入学体检后对所有结果进 行统计分析,得出其中某一项指标的均值是7, 标准差2.2。从这个总体中随机选取一个容量 为31的样本。
X
10
5
8
7
10
10
5
8
7
10
{10,10} 10
{5,10} 7.5
{8,10} 9
{7,10} 8.5
{10,10} 10
{10,5 } 7.5
{5,5} 5
{8,5} 6.5
{7,5} 6
{10,5} 7.5
{10,8} 9
{5,8} 6.5
{8,8} 8
{7,8} 7.5
{10,8} 9
{10,7} 8.5
总体庞大,难以对总 体的全部元素进行 研究


检查具有破坏性
炮弹、灯管、砖等
第三章 抽样分布与参数估计
统计学基本概念
• 总体 (全体) Population • 所有感兴趣的对象
• 样本Sample • 总体的一部分
• 总体参数Pa• 关于样本的概括性度量
{5,7} 6
{8,7} 7.5
{7,7} 7
{10,7} 8.5
{10,10} 10
{5,10} 7.5
{8,10} 9
{7,10} 8.5
{10,10} 10
第三章 抽样分布与参数估计
• 一个样本统计量的概率分布被称为该统计量的抽样分 布
样本均值抽样分布 直方图
10
150.00%
100.00% 5
第三章 抽样分布与参数估计 样本均值的抽样分布
• 一个总体10,5,8,7,10 ,
频率
3 2 1 0
5
直方图
150.00% 100.00% 50.00% 0.00% 7 9 11 其他 接收
频率 累积 %
第三章 抽样分布与参数估计
• 有放回(with replacement)抽样
{Xi, X j}
相关文档
最新文档