5章抽样估计

合集下载

第5章--抽样分布与参数估计教案资料

第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。

第5章__抽样推断

第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x

x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2

统计学习题第五章_抽样与抽样估计答案

统计学习题第五章_抽样与抽样估计答案

第五章抽样与抽样估计复习题一、填空题1、在实际工作中,人们通常把n≥30 的样本称为大样本,而把n<30 的样本称为小样本。

2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。

3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。

4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。

5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。

二、选择题单选题:1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须((2))(1)增加到原来的3倍(2)增加到原来的9倍(3)增加到原来的6倍(4)也是原来的1/32、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用((3))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1小时的全部产进行检验,这种方式是((4))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2))(1)提高(2)降低(3)不变(4)不一定降低5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2))(1)(2)(3)(4)6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小多选题:1、降低抽样误差,可以通过下列那些途径((2)(4)(5))(1)降低总体方差(2)增加样本容量。

(3)减少样本容量(4)改重复抽样为不重复抽样(5)改简单随机抽样为类型抽样2、抽样推断中的抽样误差((1)(5))(1)是不可避免要产生的(2)是可以通过改进调查方法来消除的(3)只有调查后才能计算(4)即不能减少,也不能消除(5)其大小是可以控制的3、抽样极限误差((1)(2)(4))(1)是所有可能的样本指标与总体指标之间的误差范围(2)也叫允许误差 (3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5) ) (1)总体方差(2)所要求的概率保证程度 (3)抽样方法(4)抽样的组织形式(5)允许误差法范围的大小 5、不重复抽样的抽样平均误差( (2)(4) )(1)总是大于重复抽样的抽样平均误差 (2)总是小于重复抽样的抽样平均误差(3)有时大于,有时小于重复抽样的平均误差(4)在Nn很小时,几乎等于重复抽样的抽样平均误差 6、从3000名职工中随机抽取400名调查收入水平,共抽了( (1) (3) (5) ) (1)一个样本 (2)400个样本(3)一个样本总体 (4)400各样本总体 (5)400个样本单位 7、简单随机抽样一般适合于( (1)(3) (5) )(1)具有某种标志的单位均匀分布的总体 (2)具有某种标志的单位存在不同类型的总体 (3)现象的标志变异程度较小的总体 (4)不能形成抽样框的单位 (5)总体单位可以编号的总体三、简答题1、 什么是抽样平均误差影响抽样平均误差的因素有哪些答:抽样平均误差是所有可能的样本指标与被估计的总体参数之间的平均离差,即样本指标的标准差。

第5章 抽样推断

第5章 抽样推断

名称
符号
总体容量
N
总体平均数
X
总体方差
2
总体标准差
总体成数
P
样本统计量
名称
符号
n 样本容量
样本平均数 x
样本方差
s2
样本标准差 s
样本成数 p
第一节 抽样推断
★ 一、抽样推断的意义和一般步骤 ★ 二、总体参数与样本统计量 ★ 三、抽样框与样本数
四、概率抽样与非概率抽样
三、抽样框与样本数
㈠ 抽样框 ㈡ 抽样方法 ㈢ 抽样组织方式 ㈣ 样本数和样本容量
⒈ 总体平均数(总体i
X i1 N
或X
i 1 m
Fi
i 1
⒉ 总体标准差:
1 N
N i 1
Xi X
2或
1m
2
m
X i X Fi
Fi i1
i 1
⒊ 总体方差:
2 1
N
N i 1
Xi X
2或 2
1
m
Fi
m i 1
2
X i X Fi
为 2的无偏估计
m i1
1m fi 1 i1
2
xi x fi
⒋ 样本成数:
p n1 , q n0 1 p
n
n
⒌ 样本单位是非标志的标准差:
为 P 的
无偏估计
sp
n p1 p
n 1
n pq n 1
⒍ 样本单位是非标志的方差:
sp2
n n 1
p1
p
n n 1
pq

2 P

无偏估计
总体参数
居民一组 居民二组…
在某个住宅小区

第五章 抽样估计学习指导

第五章 抽样估计学习指导

第五章 抽样估计学习指导一、判断题×√1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( )3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( )4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( )5.抽样成数的特点是,样本成数越大,则成数方差越大.( )6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σμ=7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( )9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( )10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( )12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( )二.单项选择题1.抽样调查的主要目的是( ).A.用样本指标来推算总体指标B.对调查单位做深入研究C.计算和控制抽样误差D.广泛运用数学方法2.抽样调查所必须遵循的基本原则是( ).A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( ).A.2倍B.3倍C.4倍 D1/4倍4.按随机原则直接从总体N 个单位中抽取n 个单位作为样本,这种抽样组织形式是( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.抽样误差是指( ).A.在调查过程中由于观察.测量等差错所引起的误差B.在调查中违反随机原则出现的系统误差C.随机抽样而产生的代表性误差D.人为原因所造成的误差6.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样7.在一定的抽样平均误差条件下( ). p p xx Z Z μμ=∆=∆A.扩大极限误差范围,可以提高推断的可靠程度B. 扩大极限误差范围,会降低推断的可靠程度C. 缩小极限误差范围,可以提高推断的可靠程度D. 缩小极限误差范围,不改变推断的可靠程度8.反映样本指标与总体指标之间的平均误差程度的指标是( ).A.抽样误差系数B.概率度C.抽样平均误差D.抽样极限误差9. 抽样平均误差是( ).A.全极总体的标准差B.样本的标准差C.抽样指标的标准差D.抽样误差的平均差10.当成数等于( )时,成数的方差最大. A.1 B.0 C.0.5 D.-111.对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%.当概率为95.45%时,该行业职工收入在800元以下所占比重是( ). p p ∆-p p P ∆+≤≤A.等于78%B.大于84% p p Z μ=∆C.在76%--84%之间D.小于76%12.假定一个拥有一亿人口的大国和百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄抽样平均误差( ). 212121,n n N N ≥≥=σσ n x σμ=A.不能确定B.两者相等C.前者比后者大D. 前者比后者小13.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( ).A 随之扩大 B.随之缩小 C.保持不变 D.无法确定14.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( ).A. 简单随机抽样B.类型抽样C.等距抽样D.整群抽样15.对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( ). )1(2Nn n x -=σμ A.甲厂比乙厂大 B. 乙厂比甲厂大C.两个工厂一样大D.无法确定16.按地理区域划片进行的区域抽样,其抽样方法属于( ).A. 简单随机抽样 D.类型抽样B.等距抽样C.整群抽样三.多项选择题1.抽样估计的特点是( ).A.由部分认识总体的一种认识方法B.建立在随机取样的基础上C.对总体参数进行估计采用的是确定的数学分析方法D.可以计算出抽样误差,但是不能对其进行控制E.既能够计算出抽样误差,又能够对其进行控制2.抽样估计中的抽样误差( ).A.是一种系统性误差B. 是一种代表性误差C.属于一种登记误差D.属于一种偶然性误差E.是违反了随机原则而产生的误差3.影响抽样误差大小的因素有( ). n x σμ= )1(2Nn n x -=σμA.抽样调查的组织形式B.抽取样本单位的方法C.总体被研究标志的变异程度D.抽取样本单位数的多少E.总体被研究标志的属性4.在抽样估计中( ).A.抽样指标的数值不是唯一的B.总体指标是一个随机变量C.可能抽取许多个样本D.统计量是样本变量的函数E.全及指标又称为统计量5.从全及总体抽取样本单位的方法有( ).A.简单随机抽样B.重复抽样C.不重复抽样D.概率抽样E.非概率抽样6.在抽样估计中,样本单位数的多少取决于( ). 222x Z n ∆=σA.总体标准差的大小B.允许误差的大小C.抽样估计的把握程度D.总体参数的大小E.抽样方法7. 总体参数区间估计必须具备的三个要素是( ). x x ∆-≤X ≤x x ∆+, p p ∆-p p P ∆+≤≤A.样本单位数B.样本指标C.全及指标D.抽样误差范围E.抽样估计的置信度8.采用类型抽样的组织形式( ).A.需要对总体各单位进行分组B.适用于总体各单位标志值差异较大的总体C.随机抽选其中的某一类型,并对其所有单位进行调查D.抽样误差较小E.最符合随机原则9.简单随机抽样( ).A. 适用于总体各单位呈均匀分布的总体B. 适用于总体各单位标志值差异较大的总体C.在抽样之前要求对总体各单位加以编号D. 最符合随机原则E.是各种抽样组织形式中最基本最简单的一种形式10.在抽样平均误差一定的条件下( ).A. 扩大极限误差范围,可以提高推断的可靠程度B. 缩小极限误差范围,可以提高推断的可靠程度C. 扩大极限误差范围,只能降低推断的可靠程度D. 缩小极限误差范围,只能降低推断的可靠程度E.扩大或缩小极限误差范围与推断的可靠程度无关五.计算题(主要是思路和方法提示)1.(1)进行简单随机重复抽样,假定抽样单位增加3倍,则抽样平均误差μ将发生如何变化?(2)如果要求抽样误差范围Δ减少20%,其样本单位数n 应如何调整?2.某企业生产一批日光灯管,随机重复抽取400只作使用寿命试验.测试结果,平均寿命为5000小时,样本标准差为300小时,400只中发现10不合格.求平均数的抽样平均误差和成数的抽样平均误差. p x μμ和3.某机械厂生产一批零件10000个,检验员甲用简单随机重复抽样方法抽取300个,发现有9个不合格.检验员乙用简单随机不重复抽样方法抽取200个, 发现有5个不合格.试求两种不同抽样方法下合格品率的抽样平均误差.4.某企业生产某产品10000袋,为检验其包装重量是否达到标准,检验员甲按简单随机重复抽样方法抽取200袋进行检查, 检验员乙用简单随机不重复抽样方法抽取200袋进行检验.样本标准差均为2克.试求两种不同抽样方法下包装平均重量的抽样平均误差。

第五章抽样与抽样估计

第五章抽样与抽样估计
第五章 抽样与抽样估计
❖ 本章内容:抽样与抽样估计是推 断统计学中最基本的内容。学习本 章了解抽样调查中的基本概念;掌 握样本平均数、样本比例的抽样分 布;掌握抽样估计的基本方法;了 解其他抽样组织方式及其特点。重 点是总体均值、总体比例的区间估 计方法。
2021/3/3
第五章抽样与抽样估计
1
第五章 抽样与抽样估计
2021/3/3
第五章抽样与抽样估计
8
二、常用的抽样方法
❖ 1、简单随机抽样
❖ 其中又可以分为重复抽样和不重复抽样。
❖ (1)重复抽样:又称重置抽样,是指从总 体中抽出一个样本单位,记录其标志值后, 又将其放回总体中继续参加下一轮单位的抽 取。特点是:第一,n个单位的样本是由n次 试验的结果构成的。第二,每次试验是独立 的,即其试验的结果与前次、后次的结果无 关。
2021/3/3
第五章抽样与抽样估计
3
1总体与总体参数
构成总体的个别事物(基本单元)就是总 体单位,也称个体。总体单位的总数称为 总体容量,记作N。
❖ (2)总体参数:抽ห้องสมุดไป่ตู้估计中用来反映总体数量特 征的指标。研究目的确定后,总体确定,总体参 数存在但未知,需要估计。
❖ A、变量总体中各单位可以直接用数量表示,设 各单位变量值为:X1, X2,… XN,则总体参数 有均值,标准差或方差以及总体标志总量,即
各单位不能用数量之间表示,但可以计
算计算总体成数,如前面所学P=N1/ N, Q=N0/N,P+Q=1,则总体参数有均值, 标准差或方差以及具有某一属性的单位
总数,即:
__
X P
P(1P),NP
2021/3/3
第五章抽样与抽样估计

统计学第5章抽样推断

就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

统计学课件05第5章抽样与参数估计


反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。

第5章抽样调查及参数估计(练习题)

第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。

2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。

3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。

4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。

5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。

6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。

7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。

8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。

三、选择题1.抽样调查需要遵守的基本原则是( B )。

A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。

A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。

A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。

A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。

第五章抽样分布

第四章抽样与抽样分布例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:1)随机抽取一人,收入超过18430元的概率?2)抽取一个10人样本,平均收入超过18430元的概率?例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?例4:一架电梯极限负重1000公斤,一般可容纳13人。

假定电梯的所有乘客平均体重70公斤,标准差12公斤。

那么一个13个人的随机样本总重量超过极限负重的概率是多少?例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。

设生育态度X:赞成为1,否则为0。

求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、1、0、1、1、1,求样本均值、样本中赞成比例。

解:1)计算见下表2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7例6:学校选人大代表,结果有60%的选民投了我院院长而当选。

假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。

那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。

例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少?四、样本方差的抽样分布设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布:2χ=2222312()()().....()i x x x x μμμμσσσσ----++++=2211()kii x μσ=-∑分子分母同乘n-1,进一步整理得2χ=22(1)n s σ-~2χ(n-1)练习题:1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为?2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为?3、某企业声明企业人均收入为5500元,标准差为550元。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

15.81 2
三、抽样极限误差:是抽样指标和总体指标之间抽样误差的可
能范围。
x x X p p P 将上式等价转换为下列不等式: X x x X x P p p P p 因为,总体指标是未知,上述不等式应该转换为: x x X x x p p P p p
(二)、总体参数和样本统计量
常用的总体参数有总体平均数,总体成数和总体 方差。 常用的样本统计量包括样本平均数,样本成数和 样本方差。
样本指标: xf f x 或 x f f xi x f s f
2
总体指标: XF F X 或 X F F

(四)、重复抽样和不重复抽样
样本的可能数目既和样本的容量有关,也和抽 样的方法有关。 根据取样方式的不同,抽样方法有重复抽样和不重 复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量 为n的样本,每次抽出一个单位后,再将其放回总体 中参加下一次抽取,这样连续抽n次即得到一个样本。 2、不重复抽样:是指抽中单位不再放回总体中,下一 个样本单位只能从余下的总体单位中抽取。
组中值(x) 875 925 975 1025 1075 1125 1175 1225 —
件数(f) 1 2 6 35 43 9 3 1 100
解:第一步,计算抽样平均数和标准差:
xf 105550 x 1055 .5(小时) 100 f ( x x) f 51.91 (小时) f
60
45 50 60
0
-15 -10 0
0
225 100 0
8 (B、D)
9 (C、A) 10 (C、B) 11 (C、C)
50、80
70、40 70、50 70、70
65
55 60 70
5
-5 0 10
25
25 0 100
12 (C、D)
13 (D、A) 14 (D、B) 15 (D、C)
70、80
序号 1(A、A) 2 (A、B) 3 (A、C) 样本变量(x) 40、40 40、50 40、70 样本平均数 40 45 55
xi
平均数离差 -20 -15 -5
离差平方 400 225 25
4 (A、D)
5 (B、A) 6 (B、B) 7 (B、C)
40、80
50、40 50、50 50、70
误 差
系统性误差是指由于违反抽样调查随机原 则,有意抽选较好或较差的单位进行调查, 使样本估计量的值系统偏低或偏高。。
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。
四、举例说明总体参数的两种区间估计方法: (一)根据已经给定的抽样误差范围,求概率保证程度。 例8、对某型号的电子元件进行耐用性能的检查,抽样资料 分组列表如下,要求耐用时数的允许误差范围
x
数。
=10.5小时,试估计该批电子元件的平均耐用时
耐用时数(小时) 900以下 900—950 950—1000 1000—1050 1050—1100 1100—1150 1150—1200 1200以上 合计
抽样推断的误差可以事先计算,并加以 控制。
二、抽样推断的内容:
(一)参数估计 (二)假设检验
三、有关抽样的基本概念
(一)、随机抽样与非随机抽样 随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定的概率 被抽选为样本单位,每个总体单位能否选入样本是随机的。
随机抽样:是指按照随机原则从总体中抽取样本单位, 保证每单位都有相同的中选机会,或中选的概率是已 知的。 非随机抽样:是指从研究目的出发,根据调查者的经 验或判断,从总体中有意识地抽取若干单位构成样本。 重点调查、典型调查等属于非随机抽样。(其缺点 在于难以排除主观因素的影响,事先无法控制抽样误 差,不能保证推断结果的可信度。)
二、总体参数区间估计 (一)抽样估计的精度
x 误差率= x 估计精度= 1 -误差率
(二)抽样估计的置信度 抽样估计置信度就是表明抽样指标和总体指标的误差不 超过一定范围的概率保证程度。根据概率度,依靠正态 分布概率表求得。
三、总体参数区间估计方法 (一)总体参数区间估计应具备的三要素: 一是:估计值; 二是:估计值的误差范围;——决定估计的准确性。 三是:概率保证程度。——决定估计的可靠性。 (二)总体参数的两种区间估计方法 区间估计的基本特点:根据估计可靠程度的要求,选定概率度, 以及极限误差,再利用抽样调查取得的抽样平均数,定出估计 的上、下限。区间称为置信区间,估计可靠程度称为置信度。
例9、仍按例8资料,设该厂的产品质量检验标准规定,元 件耐用时数达到1000小时以上为合格品,要求合格率估计 的误差范围不超过5%,试估计该批电子元件的合格率。
第一步,计算样本合格 率和方差: n1 91 91% n 100 2 p p (1 p ) 0.91* 0.09 0.0819 p p (1 p ) 0.0819 2.86% n 100 第二步,根据给定极限 误差 p 5%, 求得总体合格率的上下 限:
Xi X F
2
n1 xp p n sp ( p 1 p)
F N1 XP P N
P P 1 P
(三)、样本容量和样本个数
样本容量:样本所包含的总体单位个数称为样 本容量,一般用n表示。在实际工作中,人们 通常把n≥30的样本称为大样本,而把 n﹤30 的样本称为小样本。 样本个数:是指从一个总体可能抽取的样本个 数。
2
x

51.91 5.191 (小时) n 100
第二步,根据给定的 x 10.5小时,计算 总体平均数的上下限: 下限 x x 1055 .5 10.5 1045 (小时) 上限 x x 1055 .5 10.5 1066 (小时) 第三步,根据 Z x / x 10.5 / 5.191 2, 查概率表得置信度 F ( Z ) 0.9545 . 我们可以作如下估计, 即可以概率95.45% 的保证程度,估计该批 电子元件的耐用时数 在1045 1066 小时之间。
1000 12 9.13 (元) 总体平均数 : X 总体标准差 : X 240 60 (元) N 4 X X N
2


1000 15.81(元) 4
重复抽样: 15.81 11.18(元) n 2 不重复抽样:


2 2
n 1 n N 2 1 9.13(元) 4
80、40 80、50 80、70
75
60 65 75
15
0 5 15
225
0 25 225
16 (D、D)
合计
80、80

பைடு நூலகம்
80
960
20

400
2000
样本平均数的平均数 : x 样本可能数目 960 60 (元) 16 抽样平均误差 : Ex


xi X
2
样本可能数目
不重复抽样:
x p

2
n


n
x p
2
n 1 n N
( p 1 p) n
( p 1 p) n 1 n N
当N 很大时,重复抽样与不重复抽样的差别不大!
举例说明抽样平均误差的意义:设有4个工人,各人的工资水平分别是40、50、70、80元, X (40 50 70 80) 4 60(元) 现采用重复抽样方法随机从中抽取2人。
四、抽样误差的概率度 基于理论上的要求,抽样极限误差通常需要以抽样平 均误差为标准单位来衡量,把极限误差除以抽样平均误 差,得出相对数 Z,表示极限误差范围为抽样平均误差的 若干倍。 Z 称为概率度。这一变换称为概率的标准 化过程。
Z Z
x
x
p
p
§3、抽样估计的方法 一、总体参数的点估计 (一)参数点估计的概念 点估计:也称定值估计,即以实际抽样资料得到的抽样指标值 作为总体指标的估计值。 (二)优良估计标准 1、无偏性:用抽样指标估计总体指标要求抽样指标的平均数 等于被估计的总体指标。 2、一致性:随着样本的单位数n的无限增大,抽样指标和未 知的总体指标之间的绝对离差为任意小的可能性也趋于必然性。 3、有效性:用抽样指标估计总体指标要求作为优良估计量的 方差应该比其它估计量的方差小。
60
45 50 60
0
-15 -10 0
0
225 100 0
8 (B、D)
9 (C、A) 10 (C、B) 11 (C、C)
50、80
70、40 70、50 70、70
65
55 60 70
5
-5 0 10
25
25 0 100
12 (C、D)
13 (D、A) 14 (D、B) 15 (D、C)
70、80
80、40 80、50 80、70
75
60 65 75
15
0 5 15
225
0 25 225
16 (D、D)
合计
80、80

80
960
20

400
2000
样本平均数的平均数 : x 样本可能数目 720 60 (元) 12 抽样平均误差 : Ex

相关文档
最新文档