统计学第七章抽样推断syong
合集下载
抽样推断syong专业知识讲座

计算出各样本旳均值,如下表。
样本平均数
概率
11.52
2.533.54
1/162/163/164/163/162/161/16
样本平均数旳均值或
抽样平均误差是全部样本指标与总体指标离差旳平均水平,所以有下列计算
0.7906件旳含义是,对于16个样本,不论抽到哪个样本平均来说误差为0.7906件。
二、抽样推断旳特点 1、抽样推断是非全方面调查。能够节省人力物力和财力,取得事半功倍旳效果。 2、抽样推断是按随机原则抽选调查单位。 3、抽样推断是用样本旳指标数值去推算总体旳指标数值。 4、抽样推断利用旳是概率原理。 5、抽样推断中产生旳误差能够事先计算并加以控制。
2.抽样平均误差旳计算
27
(2)样本成数旳抽样平均误差
抽样平均误差
【例】从10000名学生中抽查200名测得平均身高为1.65m,已知学生身高旳总体原则差σ=0.28。其中女生占全部学生旳比重30%。求学生平均身高和女生比重旳抽样平均误差。
抽样平均误差(举例)
解:已知N=10000,n=200, x =1.65m,σ = 0.28,p = 30%
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产旳一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量旳分布服从正态分布,且总体原则差为10克。试估计该批产品平均重量旳置信区间,置信水平为95%
§7.4 参数估计旳一般问题
估计量与估计值评价估计量旳原则点估计与区间估计
估计量:用于估计总体参数旳随机变量如样本均值,样本百分比、样本方差等例如: 样本均值就是总体均值 旳一种估计量参数用 表达,估计量用 表达估计值:估计参数时计算出来旳统计量旳详细值假如样本均值 x =80,则80就是旳估计值
第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章 抽样推断

D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标
样本均值:
未分组 分 组
x x2 xn x 1 n
x
i 1
n
i
样本比例:
x f x f
i i
n
i
样本方差:
n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调
统计学(本科)教学课件第七章抽样推断

样本容量是指一个样本所包含的单位数。 通常将样本单位数不少于30个的样本称为 大样本,不及30个的称为小样本。
样本个数又称样本可能数目。指从一个总 体中可能抽取的样本个数。
四、常用的抽样方法
(一)重复抽样与不重复抽样 重复抽样也叫重置抽样,是从一个总体中
抽出一个单位后,又放回总体,使总体始 终保持总体最先的单位数。
二、简单随机抽样条件下必要抽样数 目的计算
1.重复抽样条件下必要样本单位数目的 计算;
2.不重复抽样条件下必要样本单位数目 的计算;
三、计算必要样本单位数目应注意的问题
第一,上述计算公式的样本单位数目是最低的,也 是最必要的样本容量。
第二,用上述公式计算样本容量时,一般情况下, 总体方差是未知的,处理方法与“抽样平均计算公 式”相同。
不重复抽样也叫不重置抽样,其方法是, 从总体N个单位中要抽取一个样本容量为n 的子样,每次从总体中抽取一个,连续进 行n次抽选构成一个样本。但每次抽选一 个单位就不放回参加下一次的抽选。
五、抽样误差
(一)概念 抽样调查的意义是用样本指标来推断相应的总体
指标。这两者之间必然存在着差距,这个差距就 叫做抽样误差。 (二)分类 按产生的原因,抽样误差大体上可以归纳为以下 两类: 调查误差,也叫登记性误差, 抽样误差也叫代表性误差,它是抽样调查本身所 固有的一种误差,
等距抽样,是在各单位大小顺序排队基础上,再 按某种规则依一定间隔取样,这样保证所取到的 样本单位均匀地分布在总体地各个部分,有较高 的代表性。
(三)分类
等距抽样按照排列顺序时所依据的标志不同, 可分为按无关标志排序和按有关标志排序。
所谓按无关标志排序,是指用来排序的标志 与调查研究的标志无关。例如,研究工人的 平均收入水平时,将工人按照姓氏笔画顺序 排列。
样本个数又称样本可能数目。指从一个总 体中可能抽取的样本个数。
四、常用的抽样方法
(一)重复抽样与不重复抽样 重复抽样也叫重置抽样,是从一个总体中
抽出一个单位后,又放回总体,使总体始 终保持总体最先的单位数。
二、简单随机抽样条件下必要抽样数 目的计算
1.重复抽样条件下必要样本单位数目的 计算;
2.不重复抽样条件下必要样本单位数目 的计算;
三、计算必要样本单位数目应注意的问题
第一,上述计算公式的样本单位数目是最低的,也 是最必要的样本容量。
第二,用上述公式计算样本容量时,一般情况下, 总体方差是未知的,处理方法与“抽样平均计算公 式”相同。
不重复抽样也叫不重置抽样,其方法是, 从总体N个单位中要抽取一个样本容量为n 的子样,每次从总体中抽取一个,连续进 行n次抽选构成一个样本。但每次抽选一 个单位就不放回参加下一次的抽选。
五、抽样误差
(一)概念 抽样调查的意义是用样本指标来推断相应的总体
指标。这两者之间必然存在着差距,这个差距就 叫做抽样误差。 (二)分类 按产生的原因,抽样误差大体上可以归纳为以下 两类: 调查误差,也叫登记性误差, 抽样误差也叫代表性误差,它是抽样调查本身所 固有的一种误差,
等距抽样,是在各单位大小顺序排队基础上,再 按某种规则依一定间隔取样,这样保证所取到的 样本单位均匀地分布在总体地各个部分,有较高 的代表性。
(三)分类
等距抽样按照排列顺序时所依据的标志不同, 可分为按无关标志排序和按有关标志排序。
所谓按无关标志排序,是指用来排序的标志 与调查研究的标志无关。例如,研究工人的 平均收入水平时,将工人按照姓氏笔画顺序 排列。
统计学(第7章)

s2 p(1 p)
2020/1/18
第七章 推断统计
13
统计学
三、抽样的组织方式
(一)简单随机抽样(纯随机抽样)
1、重复抽样
也称回置抽样,它是指每次抽取一个样本登记后再将 它放回总体中参加下一次抽取。
重复抽样的特点是:每次抽取样本是在完全相同的条 件下进行的,总体中每个单位中选的机会在各次都完 全相等。
第七章 推断统计
6
(二)总体参数
是唯一的、 确定的。
统计学
1、总体的平均数与方差
总体平均数
对未整理资料:
X X N
对经过整理的资料: X Xf f
2020/1/18
第七章 推断统计
7
统计学
无法直接求得
总体的方差(或标准差):
对未整理资料:
σ 2 ( X X )2
假设检验:依据样本观察资料对总体综合 指标的某种假设检验,来判断这种假设的 真伪。
2020/1/18
第七章 推断统计
5
统计学
第二节 有关抽样的基本概念
一、总体的相关概念
(一)总体 (母体、全及总体)
一般用 N 表示总体的单位数。 一个总体的指标数值是确定的、唯一的,
所以称为参数。
2020/1/18
取第 a 个,则第二组起分别为:2k-a,2k+a, 4k-a,4k+a,6k-a,6k+a,……
2020/1/18
第七章 推断统计
18
统计学
(三)类型抽样(又称分层抽样)
类型抽样:是将总体各单位按主要标志进行分 组,然后再从各组中按随机原则抽取一定比例 的单位构成样本。
统计学原理第七章 抽样推断

11
§7.2 抽样误差
1. 抽样误差 样本指标与被估计的总体指标之间,总是存在着某种程度的离差,
这种离差就是抽样误差 2.抽样平均误差
又叫抽样标准误差,是反映抽样误差一般水平的指标,也可以说 是样本指标的标准差
12
§7.2 抽样误差
一、影响抽样误差的因素 1 样本容量 2 总体各单位标志值的差异程度 3 抽样方法 4 抽样组织形式
0.18 1.9% 500
p
p(1 p) (1 n )
n
NLeabharlann 0.18 (1 500 ) 1.84% 500 10000
因此,重复抽样下,手机持有率的抽样平均误差为1.9%;不重复 抽样下,手机持有率的抽样平均误差为1.84%。
20
§7.3 抽样估计
一、 抽样估计 根据样本平均数或成数估计总体平均数或成数。
3
§7.1 抽样推断的基础理论 抽样推断过程:
全及总体 样本
总体指标
样本统计量
4
§7.1 抽样推断的基础理论
概念 抽样推断是按随机原则从全部研究对象中抽取一部分单位进行调查, 并以调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计 与推断,从而认识现象总体的一种统计方法。
特点 1.按随机原则抽选调查单位 2.非全面调查 3.抽样误差是可以事先计算并控制
1
x x xf
n f
2
s2 (x x)2 (x x)2 f
n
f
3 4
s (x x)2 (x x)2 f
n
f
p n1 n
5
s2 p(1 p)
9
§7.1 抽样推断的基础理论
第七章 抽样推断 (《统计学》PPT课件)

接作为相应全及指标的估计值。
2.定义:设x_
表示总体平均数
__
X
的估计值,p^ 表示
总体成数P的估计值,则有:
__ _
X x
或
^
Pp
27
第四节 抽样估计
二、总体参数的点估计
3. 性质:
用抽样指标估计总体指标时,要求抽样指标
的平均数等于被估计的总体指标;E(
_
x)
__
X
_
E( p) P
用抽样指标估计总体指标时,要求当样本容 量n充分大时抽样指标充分靠近总体指标;
6
第一节 抽样推断概述
二、有关抽样的基本范畴
2.指标
:根据全及总体各个单位的标志值或标 志特征计算的,用来反映全及总体某种属性的综合 指标;
:由样本总体各单位标志值或标志特征 计算出的综合指标。
注:对于一个确定的问题,全及指标是唯一的, 样本指标不是唯一确定的,即样本指标的随机变量。
7
抽样推断
2.种类:
根据抽样资料计算样本指标,并以此直接作 为相应全及指标的估计值;
根据给定的概率保证程度的要求,利用实 际抽样资料,求出总体被估计值的上限和下限,即给 出总体参数可能存在的区间范围,而不是直接给出总 体参数的估计值。
26
第四节 抽样估计
二、总体参数的点估计
根据抽样资料计算样本指标,并以此直
n
N
22
第三节 抽样误差
三、抽样极限误差
在抽样推断中可允许的误差范围,等于样本指 标可允许变动的上限或下限与总体指标之差的绝对值。
2.计算公式:
_ __
_
__ _
抽样平均数极限误差: 或
_ x- X
第七章 统计 抽样推断

与全面调查相比,抽样调查既节省了人力、 物力、财力和时间,又达到了认识总体数量特 征的目的。我国在1994年确立了以周期性普查 为基础,以经常性抽样调查为主体,同时辅之 以重点调查、科学核算等综合运用的统计调查 方法体系。
三、优点:
1、更科学
2、更经济 3、时效性强 4、应用广
四、抽样推断的应用
n AN N!/( N n)!
N
n
不考虑顺序的不重复抽样
不考虑顺序的重复抽样
C
n N
C
n N n1
第三节:点估计和抽样平均误差
人们每时每刻都在做估计。根据婴儿的哭 声估计其冷热和什么时候吃奶、根据望闻问切 来估计病人的病情、根据外表估计一个人的身 高体重、根据前几天的数据估计今天的股市行 情,根据营业数据等估计一个公司的业绩等等。 估计就是根据你拥有的信息来对现实世界进行 某种判断。统计中的估计也不例外,它是完全 根据数据做出的。
x 或p P
1、抽样误差是个概念,只能理解无法计算;
2、抽样误差是个变量,随着样本不同而不同。
问:抽样误差是个变量,那么抽样误差有多少个 变量值?
二、抽样平均误差
• 平均误差
(一)抽样平均误差的定义公式 1、平均数的抽样平均误差
x
(x )
2
所有可能的样本数目
2、成数的抽样平均误差
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断
样本总体指标:统
计量(已知量)
例1 对湖中鱼产量的估计。 欲了解某湖中鱼的总产量,如果湖中有N条鱼, 平均每条鱼的重量为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§7.2抽样推断的几个基本概念
一、全及总体和抽样(样本)总体
1、全及总体又称母体,简称总体,它是指所要认 识的,具有某种共同性质的许多单位的集合体。
组成全及总体的单位称为总体单位,全及总体的单 位数一般用N表示。
2、抽样总体又称子样,简称样本,是从全及总体 中随机抽取的那一部分单位所构成的集合体。
•
※它是抽样推断中不可避免不可消除的误差;
•
※抽样误差的大小反映了样本代表性的高低;
•
※它可以用数理统计方法进行计算和控制。
• 二、抽样平均误差
1.抽样平均误差的含义:
•
抽样平均误差从一般意义上说是所有样本指标与总体
指标差数的平均水平,它反映了抽样指标与总体指标的平
均离差程度。 实质就是所有可能出现的样本指标的标准差。
P N1 N
Q N0 N N1 1 P NN
iii. 总体标准差、总体方差
2 X X 2
N
2.样本指标(统计量)
i.
样本平均数
x x
ii. 样本成数
n
pˆ n1 n
q n0 n n1 1 pˆ nn
iii. 样本标准差、样本方差
s2 x x 2
n 1
• 四、重复抽样和不重复抽样
z
的大小
置信水平
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例称为置信水平
200
3.24%
➢ 在不重复抽样的条件下:
x
2 n
(1
n N
)
0.282(1 200 ) 0.0196
200 10000
p
P
(1P
n
)
(1
n N
)
0.3
(1 0.3) 200
(1
12000000)
3.21%
28
•
※在没有总体方差和标准差时怎么办?
•
(用样本的相关指标代替即可)
计算公式汇总:
抽样平均数 x
n
x
n
重复抽样 1 n 不重复抽样
N
抽样成数 p
p n
P(1 P) n
重复抽样
p
P(1 P) 1 n 不重复抽样
n
N
• 三、影响抽样(平均)误差的因素
•
1、抽样单位数目的多少;
•
2、总体被研究标志的变异程度;
•
3、抽样方法和组织形式的不同。
§7.4 参数估计的一般问题
一. 估计量与估计值 二. 评价估计量的标准 三. 点估计与区间估计
一全及总体可抽取的样本有多个 每个样本都可以计算出相应的样本指标(抽样平均数或
抽样成数指标) 样本指标和总体指标的抽样误差各不相同(随机变量)
为了测定样本(指标)的代表性程度的高低,单独用 某一次的抽样误差来衡量是不科学的,因此就需要采用一 定的方法(求标准差的方法)计算所有抽样误差的平均数, 这就是抽样平均误差。同时它在参数估计中也要用到。 •
•
以上都是考虑顺序的抽样!
§7.3 抽样误差
一、 抽样误差
1 抽样误差的概念
一般地说,抽样误差是指根据样本数据计算而得的样本 统计量值与被它估计的未知的总体参数真值之间的差值。
抽样误差
样本统计量值 总体参数真值 例 如
均值抽样误差
x
X
15
2、统计调查误差的种类 (1)登记性误差(工作误差)
调查过程中由于主客观原因在登记、汇总、计算、过录 中所产生的差错。
值之差的估计
• 2. 没有给出估计值接近总体参数程度 的信息
(二)区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
– 比如,某班级平均分数在75~85之间,置信水平是95%
0.7906 (件)
2 X
0.625
0.7906件的含义是,对于16个样本,无论抽到哪个样本 平均来说误差为0.7906件。
从以上计算中可以看出:
(1)抽样平均误差就是抽样指标的标准差, 所以也称为抽样标准误差或估计标准误。
(2)抽样平均误差(即抽样指标的标准差) 比总体标准差小的多,仅为总体标准差的 1 。
(2)代表性误差 用部分推算总体时产生的误差。 ①偏差(系统性误差):由于抽样调查没有遵循随机原
则而产生的误差。 ②随机误差 (偶然性误差):在没有登记性误差又遵循
了随机原则的情况下,所产生的样本指标与被它估计的总体相 应指标的差数。
•
• 3、抽样误差的进一步理解
•
※它就是指随机误差;
•
※它是一个随机变量;
200 名 测 得 平 均 身 高 为 1.65m , 已知学生身高的 总体标准差 σ=0.28 。 其 中 女 生占全部学生的 比 重 30% 。 求 学 生平均身高和女 生比重的抽样平 均误差。
➢ 在重复抽样的条件下:
0.28 0.0198 x n 200
p
P(1 P )
n
0.3 (1 0.3)
•
抽取样本有两种基本方法,不同的方法会影响抽样
的误差。
•
1、重复抽样(重置抽样、放回抽样)
•
基本的特点和做法
•
样本个数的计算:Nn(可重复排列数)
•
2、不重复抽样(不重置抽样、不放回抽样)
•
基本的特点和做法
•
样本个数的计算: (不重复排列数)
•
N(N-1)(N-2)......(N-n+1)=N!/(N-n)!
n
X
xi
i 1
M
1.0 1.5 16
4.0
2.5
或
X xi P(x) 11/16 1.5 2 /16 3.5 2 /16 41/16
2.5
抽样平均误差是所有样本指标与总体指标离差的平均水平
,所以有以下计算
M
X
(xi )2
i1
M
(1 2.5)2 (1.5 2.5)2 (4 2.5)2 16
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
X z 2 X
X
- 2.58x
X
-1.65 x
+1.65x + 2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
• 抽样极限误差(抽样允许误差、抽样边际误 差)
•
含义: 抽样极限误差是指抽样指标和总体指标
•
1、对无限总体全面情况的了解,必须采用抽
样推断。
• 2、对破坏性或消耗性检查,必须采用抽样调
查。
• 3、对某些可以但事实上不必或不可能进行全
面调查的现象总体,可以采用抽样推断获取相关
资料。
• 4、抽样调查可以对全面调查得来的资料进行
验证,并据以进行补充和修改。
• 5、抽样推断可以用于生产过程的质量控制。
(consistency)
• 一致性:随着样本容量的增大,估计量的
•
值越来越接近被估计的总体参数
P(ˆ) 较大的样本容量 B
较小的样本容量
A
ˆ
三、点估计与区间估计
参数估计的方法
估计方法
点估计
区间估计
(一)点估计
(point estimate)
1. 用样本的估计量直接作为总体参数的估计 值
▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用两个样本均值之差直接作为总体均
第七章 抽样推断
❖本章内容
第一节 抽样推断概述 第二节 抽样推断的几个基本概念 第三节 抽样误差 第四节 参数估计的一般问题 第五节 一个总体参数的区间估计 第六节 样本容量的确定——抽样方案设计
❖ 本章重点 ❖ 第三、五、六节内容 ❖ 本章难点 ❖ 第三、五节内容 ❖ 具体要求 ❖ 理解-抽样推断的含义、作用及基本概念 ❖ 掌握-抽样误差的计算、参数估计的方法等。
§7.1抽样推断概述
一、抽样推断的概念
“抽样推断、抽样调查和抽样估计”基本上 是相同的意思。『回顾第二节“抽样调查”的概 念』
抽样推断是按照随机原则从全部研究对象中 抽取一部分单位进行观察,并根据被抽取的那部 分单位的数量特征,运用一定的数理统计方法, 对总体的数量性作出具有一定可靠程度的估计和 判断。
二、评价估计量的标准
1. 无偏性(unbiasedness)
• 无偏性:估计量抽样分布的数学期望等于 被
•
估计的总体参数
P(ˆ)
无偏
有偏
A
B
ˆ
2.有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计量
,有更小标准差的估计量更有效
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
3.一致性
三、总体指标和样本指标
• 1.总体指标(参数)
i. 总体平均数 ii. 总体成数
X
N
• 当研究的是总体个单位的属性特征时,
只能用一定的术语来描述,所以就应该计算
比重结构指标,称为总体成数。用大写 P
表示,它说明了总体中具有某种标志的单位
数在总体中所占的比重。
• 设总体N个单位中,有N1个单位具有某 种属性,N0个不具有某种属性, N1 +N0=N, P为总体中具有某种属性的单位数所占的比 重,Q为布局有某种属性的单位所占的比重, 则总体成数为: