统计基础第七章抽样推断

合集下载

统计学原理第七章 抽样调查

统计学原理第七章 抽样调查
29


x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;

第七章 抽样调查

第七章  抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x

2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x

n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍

则:
1 x 0.8165 1.5n 1.5

即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

统计学原理形成性考核册及答案作业(三)

统计学原理形成性考核册及答案作业(三)

《统计学原理》作业(三)(第五~第七章)一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。

(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。

(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。

(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。

(√)6、在一定条件,施肥量与收获率是正相关关系。

(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )。

8、利用一个回归方程,两个变量可以互相推算(×)。

二、单项选择题1、在一定的抽样平均误差条件下( A )。

A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。

A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是( C )。

A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大。

A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。

A、等于78%B、大于84%c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A )。

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。

调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。

例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。

由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。

同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。

为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。

调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。

例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。

同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。

(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。

例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。

(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。

调查项⽬确定的正确与否直接关系到调查的质量。

因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。

应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。

例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。

调查项⽬有⼀般项⽬和重点项⽬之分。

⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。

统计基础试题——参数估计和假设检验

统计基础试题——参数估计和假设检验

第七章参数估计和假设检验一、填空题1.在抽样推断中,常用的总体指标有、和。

2.在抽样推断中,按随机原则从总体中抽取的部分单位叫,这部分单位的数量叫。

3.整群抽样是对总体中群内的进行的抽样组织形式。

4.若总体单位的标志值不呈正态分布,只要,全部可能样本指标也会接近于正态分布。

5.抽样估计的方法有和两种。

6.扩大误差范围,可以推断的可靠程度,缩小误差范围则会推断的可靠程度。

7.对总体的指标提出的假设可以分为和。

8.如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为。

二、单项选择题1.所谓大样本是指样本单位数在()及以上。

A.50个B.30个C.80个D.100个2.总体平均数和样本平均数的关系是()。

A.总体平均数是确定值,样本平均数是随机变量B.总体平均数是随机变量,样本平均数是确定值C.总体平均数和样本平均数都是随机变量D.总体平均数和样本平均数都是随机变量3.先对总体按某一标志分组,然后再在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。

A.简单随机抽样B.机械抽样C.类型抽样D.整群抽样4.用样本指标对总体指标作点估计时,应满足4点要求,其中无偏性是指()。

A.样本平均数等于总体平均数B.样本成数等于总体成数C.样本指标的平均数等于总体的平均数 D.样本指标等于总体指标5.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将()。

A.保持不变B.随之扩大C.随之缩小D.无法确定6.在抽样估计中,样本容量()。

A.越小越好B.越大越好C.有统一的抽样比例D.取决于抽样估计的可靠性要求。

7.假设检验中的临界区域是指()。

A.接受域B.拒绝域C.检验域D.置信区间三、多项选择题1.在抽样推断中,抽取样本单位的具体方法有()。

A.重复抽样B.不重复抽样C.分类抽样D.等距抽样E.多阶段抽样2.在抽样推断中,抽取样本的组织形式有()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x
x
则该市居民家庭年人均旅游消费支出额:
下限 x x 350 9.80 340.2( 0 元)
• 由以上计算结果,估计该批产品的合格率在94.05%~99.95% 之间,有91.46%的概率保证程度。
• 2.给定概率保证程度,求抽样极限误差并 对总体指标做出区间估计。
• 【例7—4】对我国某城市进行居民家庭人 均旅游消费支出调查,随机抽取400户居民 家庭,调查得知居民家庭人均年旅游消费 支出为350元,标准差为100元,要求以95 %的概率保证程度,估计该市人均年旅游 消费支出额。

③根据
t

x


10 5

2,查概率表得F(t)=95.45%
• 由以上计算结x 果,有95.45%的概率保证程度估计该批产品
的平均耐用时间在990~1010小时之间。
• 求(2)的计算步骤: • ①求样本指标:p=97%
p2=p(1-p)=0.97 0.03=0.0291


p
p(1-p)= n
• 2.样本指标,是反映样本数量特征的综合指标,又称 样本统计量。样本指标有样本平均数及样本标准差、样 本成数及样本成数标准差。由于从一个全及总体可以抽 取多个样本,样本不同,样本的数值就不同,所以样本 指标的数值不是惟一确定的,它是一个随机变量。全及 指标和样本指标的相关公式见表7—1。
•(三)重复抽样和不重复抽样
二、抽样平均误差
• (一)抽样平均数的抽样平均误差 • 在重复抽样条件下:
2
x
n
n
• 在不重复抽样条件下:


2

N

n)
x
n N 1
(二)抽样成数的抽样平均误差
• 如用表示抽样成数的抽样平均误差,其公 式为:
• 在重复抽样条件下:


p
P(1-P) n
• 在不重意义 • 基本特点: • (一)按照随机原则抽取样本单位 • (二)抽样调查的目的在于推断总体 • (三)抽样误差可以事先计算并加以控制 • 二、抽样调查的作用
三、抽样推断的几个基本概念
• (一)全及总体和样本总体
• 1.全及总体,也叫母体,简称总体,它是具有某 种共同性质或特征的许多单位的集合体,也就是 我们所要调查研究的现象的全体。全及总体的单 位数通常用N来表示。
• 解:第一步,根据抽样资料得: • 样本每户年人均消费支出=350(元) • 样本标准差σ =100(元)
100 5(元)
x
100
400
• 第二步,根据给定的概率保证程度F(t) =95%,查得正态分布概率表得t=1.96。
• 第三步,计算
, t 1.96 5 9.8( 0 元)
• 2.样本总体,又叫子样或抽样总体,简称样本。 它是从全及总体中随机抽取出来的那部分单位的 集合体。样本总体的单位数称为样本容量,通常 用n表示。一般来说,当时,称为大样本;当时, 称为小样本。社会经济现象的抽样调查多取大样 本。
(二)全及指标和样本指标
• 1.全及指标,是反映总体数量特征的综合指标,又叫 总体指标或母体参数。在一个总体中,总体指标是唯一 确定的量,而且是一个未知量,需要通过样本资料进行 推算。常用的全及指标有总体平均数及总体标准差、总 体成数及总体成熟的标准差。
第二节 抽样误差
• 一、抽样误差的意义 • (一)抽样误差的概念 • 抽样误差是指抽样调查所获得的数据与调
查总体真实结果之间的差异。 • 1.登记性误差 • 2. 代表性误差
(二)影响抽样误差大小的因素
• 1.样本单位数的多少。 • 2. 总体被研究标志的变异程度。 • 3.抽样方法。 • 4.抽样调查的组织形式。
p=
P(1-P) (1 n )
n
N
三、抽样极限误差
• (一)抽样极限误差的概念
• 抽样极限误差又称置信区间和抽样允许误
差范围,是指在一定的把握程度(P)下保
证样本指标与总体指标之间的抽样误差不
超过某一给定的最大可能范围,记作Δ 。
• 设△x、△p分别表示抽样平均数极限误 差和抽样成数的极限误差,则有:
• 1.重复抽样,也称重置抽样或有放回抽样。它是 指从总体中随机抽取一个样本单位,把结果登记 下来后,重新放回,再从全及总体中抽取下一个 样本单位。在这种抽样方式中,同一单位有多次 重复中选可能。
• 2.不重复抽样,也称不重置抽样或无放回抽样。 它是指从总体中随机抽取一个样本单位后不再放 回去,下一次则从剩下的总体单位中继续进行抽 取。在这种抽样方式中,每个总体单位只能被抽 中一次,不会被重复抽中。

x X x

pP p
(二)抽样极限误差的计算公式

t x x
t p
p
t
x
x
t
p
p
第三节 抽样估计的方法
• 一、点估计 • 二、区间估计 • (一)区间估计的思想 • 区间估计的计算公式如下:
x x X x x pp P pp
0.0291=1.71% 100
• ②根据给定的Δp=2.95%,求总体合格率的上、下限:
• 下限 p p=97%-2.95%=94.05%
• 上限 p+ p=97%+2.95%=99.95% • ③根据t=Δp /μp=2.95%/1.71%=1.725,
• 查概率表得F(t)=91.46%
(二)区间估计的模式
• 1.根据已给定的抽样误差范围,求概率保证程度。 • 【例7—3】某企业对某批电子元件进行检验,随
机抽取100只,测得平均耐用时间为1000小时,标 准差为50小时,合格率为97%,求: • (估计1)该以批耐产用品时平间均的耐允用许时误间差的范区围间Δ及x=其1概0小率时保,证 程度。 • (2)以合格率估计的误差范围不超过2.95%,估 计该批产品合格率的区间及其概率保证程度。
• 解:求(1)的计算步骤:
• ①求样本指标: x=1000小时
=5( 0 小时)
= = 50 =( 5 小时)
x
n
100
• ②根据给定的 x 10 小时,计算总体平均数的上、下限:
• 下限 x =1000-10=990(小时) x
• 上限 x+ =1000+10=1010(小时) x
相关文档
最新文档