应用统计学第六章抽样与参数估计-学生版

合集下载

统计学第六章抽样推断

统计学第六章抽样推断

尖山一委…
尖山二委
居民一组
居民二


第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断

统计学 第 6 章 抽样与参数估计

统计学  第 6 章   抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。

4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

第六章 统计量及其抽样分布

第六章 统计量及其抽样分布

样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下

第 一
16个样本的均值(x)

第二个观察值
观 察值1 2
3
4
11
1.
20.

52. 0.
5
21
2.
25.

03. 5.
0
23
2.
30.

53. 0.
5
24
3.
35.

04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)

统计学第六章抽样和抽样分布

统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布

《抽样与参数估计》PPT课件

《抽样与参数估计》PPT课件
13
系统抽样〔等距抽样〕:先将总体各单位 按某种顺序排列,并按某种规那么确定一 个随机起点,然后每隔一定的间隔抽取一 个单位,直至抽取n个形成一个样本。
······ · · · · · ·
优点:具有简单随机抽样的特征,能比 较均匀地抽到总体中各个局部的单位, 简单易行。
14
非概率抽样
根据研究人员的主观判断来抽取样本, 研究人员有意识地选取样本单位,样本 单位的抽取不是随机的。
样本均值的抽样分布
30

n



xi M 1x i 1 .0 1 .5 1 2 6 4 .0 2 .5

n

(xi x)2
值 和
2 i1 x
M
方 差
(1.02.5)2 (4.02.5)2
0.6
2
25
16
n
式中:M为样本数目,n 为样本容量 比较及结论:1. 样本均值的均值〔数学期望〕等于总体均值
26
【例】设一个总体,含有4个元素〔个体〕,即总体单 位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、 X4=4 。总体的均值、方差?
均值和方差
N
Xi
i1 2.5
N
N
(Xi )2
2 i1
N
1.25
27
现从总体中抽取n=2的简单随机样本,在重复
抽样条件下,所有样本的均值如何分布?
4.1.1 概率抽样方法 4.1.2 抽样分布
20
三种不同性质的分布
总体分布 样本分布
频数分布表、图等
抽样分布:样本统计量的概率分布。结 果来自容量一样的所有可能样本。
21
某生产车间50名工人日加工零件数如下(单位:个)

应用统计学第6章参数估计(置信区间)ppt课件

应用统计学第6章参数估计(置信区间)ppt课件
从中解得
P{(n1)S2 2(n1)S2 }1
22(n1)
(n1) 2
p1 p t精选版2
20
于是 所求置信区间为:
(n1)S2 (n1)S2
[2
, 2(n1)
2 1
] 2(n 的 95% 置
信解区:间由。例1,S2 =196.52,n =10,
(1)实用中应在保证足够可靠的前提 下,尽量使得区间的长度短一些 .
(2)增大样本容量n,可在保证足够可 靠的前提下,提高估计的精度.
n
n
L 2 z /2
n
ppt精选版
31
估计均值μ时的样本容量n确定
1.指定估计的精度:
dX dL2z/2
n
2.指定估计的可靠度1-α;
3.确定σ:
(1)由历史资料确定;
对给定的置信水平1,
查正态分布表得 z 2 ,
使 P{|Xn|z2}1
ppt精选版
6
从中解得:
P{X nz2
Xnz2}
1
于是所求的 置信区间为
[X nz2, X nz2]
也可简记为
X n z 2
ppt精选版
7
求置信区间的一般步骤(1-2):
给定置信水平1:
1. 寻找参数的一个良好的点估计
T (X1,X2,…Xn)
实用中应在保证足够可靠的前提下,尽
量使得区间的长度短一些 .
ppt精选版
28
置信度与置信区间长度的关系
考虑单个正态总体μ的置信区间: 当σ已知时,
Z X n
~N(0, 1)
例如,由 P(-1.96≤U≤1.96)=0.95
我们得到 均值 的置信水平为 1 的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 -6
经济类管理类
基础课程
需要知道Mean 的抽样分布!
x_
- 2.58x
-1.65 x
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本 95% 的样本
何为? 为何?
99% 的样本
z z P 1 - 7
2
x
x
2
1
x
经济类管理类
基础课程
统计推断的过程
总体
基础课程
2004年,珠海地区的移动通信市场已近饱和,移动电话 普及率已经超过100%。为保有存量市场的占有率, 要求运营商通过提供新的服务产品捆绑客户,提高客 户忠诚度。
珠海地区的通信市场除了存量市场激烈竞争外,也依然存 在广阔的增量市场前景。珠海市毗邻港澳,地理位置 优越;通过工业西进、大学园区、科技创新、旅游文 化的城市发展定位,造就了珠海通信市场高、新、快 的发展新特点。目前6000多家大型企业融入了珠海工 业园区的建设大潮、17所知名学府在珠海办学,被评 为全国旅游40佳之一。这些属性都是珠海公司推出创 新服务手段的依据所在,也是珠海移动在本地信息化 建设扮演重要角色的关键所在。
间估计 5. 掌握运用总体均值、总体比例和总体方差
的区间估计方法解决实际问题
1 - 10
经济类管理类
基础课程
第一节 参数估计基本方法
一. 点估计 二. 点估计的优良性准则 ‫ג‬- 区间估计
1 - 11
经济类管理类
基础课程
估计方法
点估计
区间估计
1 - 12
经济类管理类
基础课程
1 - 13
P
2
1 2
1 -5
经济类管理类
基础课程
对珠海地区的移动通信市场开展调查,内容包括 消费者的个人信息、移动业务消费状况、移 动数据业务的消费意愿等。
对个人客户运用标准问卷电话调查了500位固定 电话用户,共获取有效问卷330份。其中获 得用户月移动话费支出数据如下。
根据调查数据,珠海的手机用户ARPU值为多少 ?
1 - 15
经济类管理类
基础课程
1. 用于估计总体某一参数的随机变量
如样本均值,样本比例、样本中位数等
例如: 样本均值就是总体均值的一个估计量
如果样本均值 x = 3 ,则 3 就是 的估计值
2. 理论基础是抽样分布
1 - 16
经济类管理类
基础课程
无偏性:估计量的数学期望等于被估计的总体 参数
P( X )
无偏
有偏
A
C
X
1 - 17
经济类管理类
基础课程
有效性:一个方差较小的无偏估计量称为一个更
有效的估计量。如,与其他估计量相比
,样本均值是一个更有效的估计量
P(X )
均值的抽样分布
B
A
中位数的抽样分布
1 - 18
X
经济类管理类
基础课程
一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数
1 -3
经济类管理类
基础课程
N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n ,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其 中最大编号是50,那么坦克总数的一个估计是( 1+1/10)50=55。此处我们认为坦克的实际数略大于最大编 号。
从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦
1 - 21
置信上限
经济类管理类
基础课程
在区间估计中,寻找两个统计量 1 和 2
分别估计总体参数 的下限和上限,使总
体参数
包括在区间 内的 ,
1
2
概率 P 1
1
2
即有100(1- )%的把握断定的真值在区
间 内 ,
1
2
1 - 22
克的真实值。记录仍然表明统计估计比通常通过其他情报方
式作出估计要大大接近于真实数目。统计学家们做得比间谍
们更漂亮!
资 料 来 源 : GUDMUND R.IVERSEN 和 MARY GERGRN著,吴喜之等译:《统计学—基本概念和 方法》,高等教育出版社,施普林格出版社,2000。
1 -4
经济类管理类
P1 P2
2 1
2 2
x pˆ
s2 x1 x2 pˆ1 pˆ2 s12 s22
经济类管理类
基础课程
点估计
1 - 14
经济类管理类
基础课程
1. 从总体中抽取一个样本,根据该样本 的统计量对总体的未知参数作出一个 数值点的估计
▪ 例如: 用样本均值作为总体未知均值的 估计值就是一个点估计
2. 点估计没有给出估计值接近总体未知 参数程度的信息

样本统计量

例如:样本均
值、比例、方

1 -8
经济类管理类
基础课程
第六章
抽样与参数估计
第一节 参数估计基本方法 第二节 总体均值和总体比例的区间估计 第三节 两个总体均值及两个总体比例之差的估计 第四节 正态总体方差及两正态总体方差比的区间估计
1 -9
经济类管理类
基础课程
1. 了解抽样和抽样分布的基本概念 2. 理解抽样分布与总体分布的关系 3. 了解点估计的概念和估计量的优良标准 4. 掌握总体均值、总体比例和总体方差的区
较大的样本容量
P(X )
B
较小的样本容量
A
1 - 19
X
经济类管理类
基础课程
区间估计
1 - 20
经济类管理类
基础课程
1. 根据一个样本的观察值给出总体参数的估计范围
2. 给出总体参数落在这一区间的概率
3. 例如: 总体均值落在50~70之间,置信度为 95%
置信区间
样本统计量 (点估计)
置信下限
经济类管理类
基础课程
第六章 抽样与参数估计
1 -1
经济类管理类 参数估计在统计方法统计
推断统计
参数估计
假设检验
1 -2
经济类管理类
基础课程
开篇案例:二战中的点估计 ——德军有多少辆坦克?
二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国 人在制造坦克时是墨守成规的,他们把坦克从1开始进行 了连续编号。在战争过程中,盟军缴获了一些敌军坦克, 并记录了它们的生产编号。那么怎样利用这些号码来估计 坦克总数呢?在这个问题中,总体参数是未知的坦克总数 N,而缴获坦克的编号则是样本。
假设我们是盟军手下负责解决这个问题的统计人员。制造出来 的坦克总数肯定大于等于记录的最大编号。为了找到它比 最大编号大多少,我们先找到被缴获坦克编号的平均值, 并认为这个值是全部编号的中点。因此样本均值乘以2就 是总数的一个估计;当然要特别假设缴获的坦克代表了所 有坦克的一个随机样本。这种估计N的公式的缺点是:不 能保证均值的2倍一定大于记录中的最大编号。
相关文档
最新文档