_《统计学》第9章抽样与抽样估计

合集下载

统计学填空题

统计学填空题

第一章思考题及练习题1、统计工作与统计资料的关系是过程和成果的关系。

2、统计工作与统计学的关系是实践和理论的关系。

3、统计活动具有、、、和的职能。

4、统计指标反映的是现象总体的数量特征,数量标志反映的是个体的数量特征。

5、在人口总体中,个体是“个人”,“文化程度”是品质标志。

6、统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法、统计分组法、综合指标法、统计模型法和统计推断法等。

7、统计标志是总体中各个体所共同具有的属性或特征的名称。

它分为指标名称和指标数值两种。

8、要了解一个企业的产品质量情况,总体是企业的所有产品、个体是单个产品。

9、性别是品质标志,标志表现则具体为不变标志或可变标志两种结果。

10、一件商品的价格在标志分类上属于数量标志。

11、一项完整的统计指标应该由指标名称、具体数据、计量单位、计算方法、时间限制和空间限制等构成。

12、统计指标按所反映的数量特点不同,可以分为和。

13、反映社会经济现象相对水平或工作质量的指标称为指标。

14、统计活动过程通常被划分为统计调查、统计整理和统计分析三个阶段。

15、经过 300 余年的发展,形成了今天的统计学。

16、古典统计学时期有两大学派,它们分别是国势学派和政治算术学派。

17、《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。

18、提出了着名的误差理论和“平均人”思想。

19、统计研究的数量性是指通过数来反映事物的量的、量的、量的和量的。

20、统计学包括和两部分内容。

21、总体中所包含的个体数量的多少称为总体容量;样本中所包含的个体数量的多少称为样本容量。

22、总体中的一个组或类,可被称为一个研究域或。

23、从总体中随机抽取的一部分个体所组成的集合称为样本。

24、统计理论与方法,事实上就是关于样本的理论和方法。

25、总体的三大特征是大量性、同质性和差异性。

26、总体的差异性要求体现在至少具有一个用以说明个体特征的差异27、企业性质标志适用的测定尺度是定性变量,产品质量等级标志适用的测定尺度是定性变量,企业利润标志适用的测定尺度是定量变量,企业产量标志适用的测定尺度是定量变量。

第二节 抽样估计的基本方法

第二节  抽样估计的基本方法

面向21世纪 课程教材
第四章
抽样与抽样估计
第二节

(四)影响抽ห้องสมุดไป่ตู้误差的因素
1、总体各单位的差异程度(即标准差 的大小) : 越大,抽样误差越大; 2、样本单位数的多少n : 越大,抽样 误差越小; 3、抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 4、抽样组织方式:简单随机抽样的误 差最大。
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节

(三)估计量优劣的标准 评价估计量的优劣常用下列三个标准。 1.无偏性 2.有效性 3.一致性 点估计的优点是简单、具体明确。但由于样本 的随机性,从一个样本得到的估计值往往不会 恰好等于实际值,总有一定的抽样误差。而点 估计本身无法说明抽样误差的大小,也无法说 明估计结果有多大的把握程度。
xf
336 812 2160 2852 2688 2376 816 560 12600
x x f
2
588 700 648 92 84 648 600 784 4144

面向21世纪 课程教材
第四章
抽样与抽样估计
第二节

解:
xf 12600 126件 x 100 f x x f 4144 6.47件 s 99 f 1
126 1.203 X 126 1.203
,
1000126 1.203 N X 1000126 1.203
即该企业工人人均产量在124.797至 127.203件之间,其日总产量在124797至 127203件之间,估计的可靠程度为95﹪。
面向21世纪 课程教材
但对于某一项调查来说,根据客观要求,一般应 有一个允许的误差限,也就是说若抽样误差在这 个限度之内,就认为是可允许的,这一允许的误 差限度就称为极限误差。

统计学第9章抽样与抽样估计

统计学第9章抽样与抽样估计
第九章 抽样与抽样估计
整理ppt
1
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(Population) 研究对象的全体称为总体
样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体
中抽取个体的行为称为抽样。而从总体中抽样所得的一部分 个体叫样本 总体参数(Population parameter)
整理ppt
10
抽样平均误差和抽样极限误差
抽样平均误差:所有可能的样本指标与总体指标间的平均 差异程度。
x (xm X)2, p (p m P )2
整理ppt
11
抽样极限误差
样本指标与总体指标之间允许的误差范围叫抽样极限误 差。也称抽样允许误差。
它是样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
X
X 2.5
X2
1.250.625 2
整理ppt
18
大数定律及中心极限定理
不重复抽样:
(1)总体是正态分布,样本必然是正态分布 (2)样本平均数的平均数等于总体平均数 (3)样本平均数的方差等于总体方差除以样本
容量n
x2
2
n
Nn N1
(4)n越大,样本平均数越趋近于正态分布
整理ppt
19
抽样平均误差 (1)均值 重复抽样:
整理ppt
22
例、从某校1000名学生中简单随机抽取50名学生,称得平均体重为50千克, 若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误 差。
解:重复抽样条件下,
V ( x ) 2 10 2 2 n 50
x
n
2 1.41
不重复抽样条件下,

9.1.1 简单随机抽样(课件)2022-2023学年高一数学同步备课(人教A版2019 必修第二册

9.1.1 简单随机抽样(课件)2022-2023学年高一数学同步备课(人教A版2019 必修第二册
(多选)下面的抽样方法是简单随机抽样的是( BD )
A、从无数个个体中抽取50个个体作为样本; B、某车间工人加工一种零件100个,为了解这100个零件的直 径,从中不放回地依次抽取5个进行测量; C、从100名运动员中挑选10名优秀的运动员参赛; D、一彩民选号,从装有36个大小、形状都相同的号签的盒子 中不放回地逐个抽出7个号签.
注:若生成的随机数有重复,则需剔除重复的编号并重新新产生 随机数,直到产生的不同编号个数等于样本所需要的人数.
随机数法的特点:方便快捷,取到相同编号时要剔除. 随机数法一般适用于总体容量较大,但样本量不大的情形.
1.3简单随机抽样的方法——②随机数法
产生随机数的方法: 1.用随机试验产生随机数: 准备10个大小、质地一样的小球,小球上分别写上数字0,1,2 ,…,9, 把它们放入一个不透明的袋中. 从袋中有放回摸取3次 , 每次摸前充分 搅拌 , 并把第一、二、三次摸到的数字分别作为百、十、个位数,这 样就生成了一个三位随机数 . 若这个三位数在1~712范围内,就代表 对应编号的学生被抽中,否则舍弃编号. 注:这样产生的随机数可能会有重复.
2.总体均值和样本均值
上面我们通过简单随机抽样得到部分学生的平均身高,并把样本 平均身高作为树人中学高一年级所有学生平均身高的估计值.
概念
总体均值(总体平均数)
样本均值(样本平均数)
条件 总体中有N个个体,它们的变量 从总体中抽取一个容量为n的样本,
【问题1】树人中学高一年级有712名学生,通过简单随机抽样的方 法调查高一年级学生的平均身高. 1.编号:先给712名学生编号,例如1~712进行编号; 2.获取样本号码:用随机数工具产生1~712范围内的整数随机数, 把产生的随机数作为抽中的编号,使与编号对应的学生进入样本; 3.按所得号码抽取样本:重复上述过程,直到抽足样本所需要的人数.

抽样估计

抽样估计

假如从中抽取30名,得到样本的平均数、标准差和成数是 x 1554420 x 51814 .00 n 30 2 30名中层干部。 则,样本:抽取到的 ( x x ) s 325009260 / 293347 .72 统计量:根据样本分布计算的综合指标,是样本变量的 n1 函数。 p 19 / 30 0 .63 另注意区分样本容量和样本个数: 样本容量是指一个样本所包含的单位数。 样本个数是指样本的可能数目。
2、样本平均数的标准差(Standard Deviation of x )
设 = 样 本 均 值 分 布 的 标 准 差 ; = 总 体 标 准 差 x


n=样本容量; N=总体单位个数 则,样本均值标准差随总体抽样方法和是否有限有所不同:
2 xΒιβλιοθήκη 不重置抽样时 N n 重置抽样时 ( 无限总体 ) ( 有限总体 ) ( )
0 .3 相 对 0 .2 频 数 0 .1
图4.1 500个 x 的相对频数分布 显然,不同的样本对应着不同的样本统计量,而由于样本 抽取的随机性,样本统计量即为一种随机变量。 一般地,样本统计量的可能取值及其取值概率,形成其概 率分布,统计上称为抽样分布(sampling distribution)。 ▲正是抽样分布及其特征使得用样本统计量估计总体参数 的“精确程度”能够给予概率上的描述。
2 p ~ N ( 0 . 6 ,0 . 089 )
四、正态分布
1、正态分布的密度函数
f( x )
式中 x 为正态分布的平均数, 是它的标准差。这两个 ( x, 2 ) 参数决定正态分布密度函数的形状。也可简记为N 正态分布密度函数有如下特性: (1)对称性。 (2)非负性。 (3)当x处于中心位置是, 密度函数值最大。 (4)在处为密度函数的拐点,越大图形越扁平。 (5)当x ±∞时,密度函数f(x) 0,即曲线向两边下垂, 伸向无穷远处。

统计学各章练习——抽样推断

统计学各章练习——抽样推断

第九章抽样推断一、名词1、抽样推断:即由样本指标来推断总体指标的统计方法。

2、抽样误差:是指抽样指标和全及指标之间的绝对离差。

3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。

4、点估计:就是直接用样本指标代表总体指标的估计方法。

5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。

6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。

二、填空题1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。

2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。

3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。

4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。

5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。

6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。

7.抽样估计的方法有(点估计)和(区间估计)两种。

8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。

9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。

10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。

11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。

12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。

统计学原理 抽样估计


(三)样本容量和样本个数
n
N样本代表性高
(四)抽样方法
1、重复抽样(回置抽样)
n
抽一个单位——登记结果——重新放回——样本需要单位
特点:N 不变,每一个单位有均等抽中的机会。
如,设总体有A、B、C、D4个商店,重复抽样随机抽取
2个商店组成样本。则共有 4 4 =16 样本
AA AB AC AD N N N N… = Nn
设:Q —— 表示不具有某种属性的单位数所占的比重。
P——表示总体中具有某种属性标志的单位数在总体
中所占的比重。
产品产量
N = N1 + N0
不具有某种属性
具有某种属性 合格产品 N1
不合格产品
N Q= 0 N 成数方差 = P Q =P(1-P)
P =
N P + Q = 1 Q = 1- P
例如: 某厂生产的电子元件 1000件中有50件不合格,则
DA DB DC
三、抽样误差
(一)抽样误差 (随机误差) P121 x - X
调查误差——调查过程中由于观察、登记、测量、计算上 系统偏差 引起的。 预防、杜绝 登记误差 抽样误差——样本结构与总体结构发生差异引起的误差, 加以控制。 影响抽样误差的因素 P121
标志值的变异程度
样本的单位数
抽样的方法 抽样调查的组织方式
4、抽样推断的误差可以事先计算并加以控制
二、抽样推断中常用概念 (一)全及总体和样本 P12
1、全及总体(母体、总体) N 一次性调查中全及总体唯一确定的 2、样本(子样) n
n1
n3
一次性调查中样本不是唯一的,可变的。 n2

例: 研究某市工业企业的生产经营情况,则该市所有 工业企业 1000家就构成全及总体(母体、总体),若以 1%抽样调查,那么抽选的 10 家工业企业则称为抽样总体 (样本、子样)

统计学:抽样估计习题与答案

一、单选题1、从某生产线上每隔55分钟抽取5分钟的产品进行检验,这种抽样方式属于( )。

A.等距抽样B.分层抽样C.整群抽样D.简单随机抽样正确答案:A2、若总体平均数X̅=50,在一次抽样调查中测得x̅=50,则以下说法正确的是( )。

A.抽样极限误差为2B.抽样平均误差为2C.抽样实际误差为2D.以上都不对正确答案:C3、重复抽样条件下,成数的抽样标准误计算公式是( )。

A.√P2(1−P2)/nB.√P(1−P)/nC.√D. P(1−P)/√n正确答案:B4、在其它条件不变情况下,采用重复抽样方式,将允许误差扩大为原来的3倍,则样本容量( )。

A.扩大为原来的9倍B.扩大为原来的3倍C.缩小为原来的1/9倍D.缩小为原来的1/3倍正确答案:C5、如果随着样本容量的增大,估计量的值会越来越靠近总体参数的真值,符合这一要求的估计量被称为( )。

A.无偏估计量B.有效估计量C.一致估计量D.充分估计量正确答案:C6、下列关于抽样标准误的叙述哪个是错误的。

( )A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小正确答案:C7、简单重复随机抽样条件下,欲使误差范围缩小一半,其他要求不变,则样本容量须( )。

A.增加2倍B.增加3倍C.减少2倍D.减少3倍正确答案:B8、调查某市电话网100次通话,得知通话平均时间为4分钟,标准差为2分钟,在95.45%的置信水平下,估计通话的平均时间为( )。

A.[3.9,5.1]B.[3.8,4.2]C.[3.7,4.3]D.[3.6,4.4]正确答案:D9、从2000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样标准误为( )。

A.0.24%B.4.85%C.4.97%D.以上都不对正确答案:B10、重复抽样条件下,平均数的抽样标准误计算公式是()。

《统计学》第9章 抽样与抽样分布


二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi

x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计最全版(抽样检验)抽样与参数估计抽样和参数估计推断统计:利⽤样本统计量对总体某些性质或数量特征进⾏推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。

这个调查例⼦是估计总体参数(某种意见的⽐例)的壹个过程。

估计(estimation)是统计推断的重要内容之壹。

统计推断的另壹个主要内容是本章第⼆节要介绍的假设检验(hypothesistesting)。

因此本节内容就是由样本数据对总体参数进⾏估计,即:学习⽬标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体⽐例和总体⽅差的区间估计第⼀节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进⾏调查,且根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三⼗个的样本称为⼤样本,样本单位数不到三⼗个的样本称为⼩样本。

壹、抽样⽅法及抽样分布1、抽样⽅法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,⼜可分为重复抽样和不重复抽样。

⽽且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进⾏抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)⾮概率抽样:不是完全按随机原则选取样本①、⾮随机抽样:由调查⼈员⾃由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数⽬、满⾜特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分层抽样:也称分类抽样或类型抽样,它是按某个 主要标志对总体各单位进行分类,然后从各层中按 随机原则分别抽取一定数目的单位构成样本。
整群抽样:也称丛聚抽样或集团抽样。它是将总体 分为若干部分(每一部分称为一个群),然后按随机 原则从中一群一群地抽选,对抽中群内的所有单位 进行全面调查。
系统抽样也称机械抽样。它是先将总体单位按一定 顺序排队,计算出抽样间隔(或抽样距离),然后 按固定的顺序和间隔抽取样本单位。
p
P(1 P) n
0.95 0.05 100
=0.0218
Δp=zα/2 p =1.96×0.0218=0.0359或3.59% 95%-3.59%=91.41%,95%+3.59%=98.59% 故该批产品合格率的置信区间为(91.41%,98.59%)
在重复抽样下,
x
z / 2
n
所以,必要抽样单位数
(2)总体方差σ2。其他条件不变的情况下,总体方差σ2愈大, 总体单位的差异程度愈大,则样本单位数应愈多;反之,样本 单位数可愈少。
(3)抽样估计的可靠程度1-α。当其他条件不变时,抽样估 计的可靠程度愈高,zα/2数值愈大,抽样数目就必须愈多;反 之,抽样估计的可靠程度愈低,抽样数目就可以愈少。
置信下限为58-1.96=57.04,
置信上限为58+1.96=59.96
故所求置信区间为(57.04,59.96)千克。
由于 T x ~t(n-1),对于给定的置信度1-α,有
s/ n
P
{t / 2
x
s/ n
t / 2} 1
P {x t / 2
s n
x t / 2
s } 1
抽样分布反映样本统计量的分布特征,根据抽 样分布的规律,可揭示样本统计量与总体参数 之间的关系,计算抽样误差,并说明抽样推断 的可靠程度。
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
重置抽样(重复抽样)(Sampling with replacement)
要从总体N个单位中随机抽取一个容量为n的样本,每 次从总体中抽取一个单位,把顺序号登记下来之后, 重新放回参加下一次抽选,连续反复抽取n次组成所 要求容量的样本。
不重置抽样(不重复抽样)(Sampling without replacement)
容量n
2 x
2
n
N N
n 1
(4)n越大,样本平均数越趋近于正态分布
抽样平均误差 (1)均值 重复抽样:
x
2
nn
不重复抽样:
x
2 N n
n N 1 n
N n N 1
抽样平均误差 (1)比例 重复抽样:
p
p(1 p) n
不重复抽样:
p
p(1 p) N n n N 1
P{ z 2
x / n
z } 1 2

P x
z / 2
1
n
可见,极限误差的计算公式为
x
z / 2
n
z / 2 x
则总体均值的置信区间为
(x , x )
x
x
解:已知 x =58,σ=10,zα/2=1.96,n=100
x
n=10/10=1(千克)
x
z / 2=x1.96×1=1.96(千克)
重复抽样:
(1)总体是正态分布,样本必然是正态分布
(2)样本平均数的平均数等于总体平均数
(3)样本平均数的方差等于总体方差除以样本
容量n
2 x
2
n
(4)n越大,样本平均数越趋近于正态分布
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。 总体的均值、方差及分布如下
n z2 / 2 2 1.962 1102 46( 5 户)
2
10 2
x
解:
n (z 2 )2 2 (1.96)2 20002
E2
400 2
96.04 97
(1)允许误差范围Δ。当其它条件不变时,允许误差愈小, 必要的抽样单位数就需要愈多;反之,允许误差愈大,抽样单 位数就可以愈少。
系统性误差是指由于非随机因素引起的样 本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
误差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。
总体分布
.3
.2
.1 0
1
234
均值和方差
N
Xi
X i1 2.5 N
N
(Xi X )2
2 i1
1.25
N
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
16个样本的均值
n
置信下限
x t /2 (n 1)
s置信上限
n
x t /2 (n 1)
s n
在大样本下,总体均值的置信区间为
s
s
(x t /2 (n 1)
n , x t /2 (n 1)
) n
解:
x x 407 /10 40.( 7 岁)
n
s (x x)2 634.1/ 9 8.3939( 7 岁) n 1
(x X )2
m
, p
( p P)2 m
抽样极限误差
样本指标与总体指标之间允许的误差范围叫抽样极限误 差。也称抽样允许误差。
它是样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
即:
X x
pP p
X
x- 3 x- 2 x-
x X+ X+2 X+ 3
68.27%的样本
95.45% 的样本 99.73% 的样本
估计。
样本均值是总体均值的点估计量,样本方差s2是总体方差σ2的 点估计量,样本比例p是总体比例P的点估计量。
优良估计量的标准: 无偏性 有效性 一致性
区间估计就是根据样本求出总体未知参数的估计区间,并使其可 靠程度达到预定要求。
(1) 总体方差σ2已知时
由于 有
z x N (0,1) ,所以对于给定的置信度1-α, / n
总体(Population) 研究对象的全体称为总体
样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体
中抽取个体的行为称为抽样。而从总体中抽样所得的一部分 个体叫样本 总体参数(Population parameter)
描述总体分布特征的数值 样本统计量(Sample statistic)
➢ 抽样的方法。
在其他条件不变的情况下,重复抽样的抽样误差大于不重 复抽样。
➢ 抽样的组织形式。
例、从某校1000名学生中简单随机抽取50名学生,称得平均体重为50千克, 若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误 差。
解:重复抽样条件下,
V (x) 2 102 2
n 50
登记性误差:存在于一切调查中 代表性误差:仅产生于抽样调查,不可避免。
代表性误差
系统性误差:不随样本量增减而变化 随机误差(抽样误差):随样本量增大而减小
抽样误差在实际一次调查中是调查不出来的,但其平均值是 可以推算的
抽样平均误差:所有可能的样本指标与总体指标间的平均 差异程度。
x
s 8.39382 2.6544(岁)
x
n
10
当置信度为95%时, x
t / 2 x
=2.2622
2.6544=6.00(岁)
因为40.7-6.00=34.7 40.7+6.00=46.7
所以该保险公司投保人的平均年龄的置信区间为(34.7,46.7)岁。
在大样本条件下,若np>5,n(1-p)> 5,则样本比例趋 近于正态分布。
(4)抽样方法。相同条件下,由于采用重复抽样比不重复抽 样的误差大,所以,前者应比后者多抽一些样本单位。
除上述因素之外,抽样组织方式也是影响抽样单位数的一个 原因 。
1. 总体分布、样本分布、抽样分布 2. 单总体参数推断时样本统计量的分布 3. 参数估计的一般问题 4. 一个总体参数的区间估计 5. 样本容量的确定
x
n
2 1.41
不重复抽样条件下,
2
V(x)
N
n
102
1000 50
1.9
n N 1 50 1000 1
x 1.9 1.38
在样本量相同的情况下,不重复抽样的平均误差要小于重复抽样的平 均误差。
抽样估计必须包括三要素:
1)估计值 2)估计值的误差范围 3)概率保证程度(置信度)
一、点估计(Point estimate) 点估计也称定值估计,常用点估计方法有矩估计,极大似然
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( X ) 抽样分布
相关文档
最新文档