统计学第七章抽样推断

合集下载

抽样推断syong专业知识讲座

抽样推断syong专业知识讲座

计算出各样本旳均值,如下表。
样本平均数
概率
11.52
2.533.54
1/162/163/164/163/162/161/16
样本平均数旳均值或
抽样平均误差是全部样本指标与总体指标离差旳平均水平,所以有下列计算
0.7906件旳含义是,对于16个样本,不论抽到哪个样本平均来说误差为0.7906件。
二、抽样推断旳特点 1、抽样推断是非全方面调查。能够节省人力物力和财力,取得事半功倍旳效果。 2、抽样推断是按随机原则抽选调查单位。 3、抽样推断是用样本旳指标数值去推算总体旳指标数值。 4、抽样推断利用旳是概率原理。 5、抽样推断中产生旳误差能够事先计算并加以控制。
2.抽样平均误差旳计算
27
(2)样本成数旳抽样平均误差
抽样平均误差
【例】从10000名学生中抽查200名测得平均身高为1.65m,已知学生身高旳总体原则差σ=0.28。其中女生占全部学生旳比重30%。求学生平均身高和女生比重旳抽样平均误差。
抽样平均误差(举例)
解:已知N=10000,n=200, x =1.65m,σ = 0.28,p = 30%
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产旳一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量旳分布服从正态分布,且总体原则差为10克。试估计该批产品平均重量旳置信区间,置信水平为95%
§7.4 参数估计旳一般问题
估计量与估计值评价估计量旳原则点估计与区间估计
估计量:用于估计总体参数旳随机变量如样本均值,样本百分比、样本方差等例如: 样本均值就是总体均值 旳一种估计量参数用 表达,估计量用 表达估计值:估计参数时计算出来旳统计量旳详细值假如样本均值 x =80,则80就是旳估计值

教育统计学_第七、八章 抽样分布及总体平均数的推断

教育统计学_第七、八章 抽样分布及总体平均数的推断

20 1
20 1
P(57.14 68.86) 0.99
答:该地区这一年高考数学平均分95%和99%的 置 信 区 间 分 别 为 58.72 至 67.28 分 之 间 和 57.14 至 68.86分之间。
3.大样本的情况:
当样本容量比较大,自由度在逐渐增大,这时的t分布 已经非常接近正态分布。这时可把t分布转成标准正态 分布来作处理。然后再作区间估计。
n
n
P( X 1.96 X 1.96 ) 0.95
n
n
要在一定可靠度上求出总体参数的置信区间的 上下限,需要以下条件:
1.要知道与所要估计的参数相对应的样本统计量的 值,以及样本统计量的理论分布;
2.要求出该种统计量的标准误;
3.要确定在多大的可靠度上对总体参数作估计,再 通过查某种理论概率分布表,找出与某种可靠度相 对应的该分布横轴上记分的临界值,才能计算出总 体参数的置信区间上下限。
三、 σ未知条件下总体平均数的区间估计
1.σ未知条件下总体平均数区间估计的基本原理 (1)当总体σ未知,总体呈正态分布,大样本或小
样本时
(2)或当总体σ未知,总体虽不呈正态分布,大样 本容量较大(n>30)时,样本平均数可以转换成t 值。
总体平均数95%置信区间为:
P(t X t ) 0.95
E(X )
第一节 抽样分布
2、容量为n的平均数在抽样分布上的标准差,等 于总体标准差除以n的方根。
X
n
第一节 抽样分布
3、从正态总体中,随机抽取的容量为n的一切可能 样本平均数的分布也呈正态分布。
4、虽然总体不呈正态分布,如果样本容量较大, 反映总体μ和σ的样本平均数的抽样分布,也接近于 正态分布。

统计学原理第七章 抽样调查

统计学原理第七章 抽样调查
29


x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

统计学中的抽样与推断

统计学中的抽样与推断

统计学中的抽样与推断在统计学中,抽样与推断是非常重要的概念。

它们涉及到我们如何从一小部分样本中推断出整个总体的特征。

在这篇文章中,我们将讨论抽样的不同方法以及如何使用样本数据进行推断。

一、抽样方法在统计学中,我们通常使用以下三种抽样方法:1. 简单随机抽样这是最基本的抽样方法。

简单随机抽样意味着从总体中随机抽出样本,每个样本被抽样的概率相等。

这种方法可以确保样本的代表性。

例如,如果我们要调查一个城市的人口,我们可以从人口登记簿中随机抽取一定数量的人口作为样本。

2. 分层抽样分层抽样是把总体划分为若干个层次,然后从每个层次中随机抽取样本。

这个方法可以减小代表性偏差。

例如,如果我们要调查一个城市的人口,我们可以按照不同的年龄段对总体进行分层,然后从每个年龄段中随机抽取一定数量的人口作为样本。

3. 系统抽样这是从总体中按照一定的规则抽样。

例如,如果我们要调查一个工厂中的员工,我们可以按照员工的工号顺序每隔一定数量抽取一个员工作为样本。

二、样本统计量的计算在进行统计推断之前,我们需要先计算样本统计量。

样本统计量是样本数据的数量指标,可以代表总体的特征。

常见的样本统计量包括:1. 样本均值样本均值是样本数据的平均值。

它可以代表总体的平均值。

例如,我们可以从一个城市的人口中随机抽取一部分人口,计算他们的平均收入,这个平均收入就是样本均值。

2. 样本标准差样本标准差是样本数据的标准差。

它可以代表总体的方差。

例如,我们可以从一个工厂中随机抽取一部分产品,计算它们的重量,这个重量的标准差就是样本标准差。

三、参数估计我们通常使用抽样中的样本统计量来估计总体参数。

例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。

常见的参数估计方法包括:1. 点估计点估计是用样本统计量来估计总体参数的方法。

例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。

2. 区间估计区间估计是用一个区间来估计总体参数的方法。

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

第7章 抽样推断

第7章 抽样推断


D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标

样本均值:

未分组 分 组
x x2 xn x 1 n
x
i 1
n
i


样本比例:
x f x f
i i
n
i

样本方差:

n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(pP)2
(pp)2
样本的可能 数 样目 本的可能数目
由此可见,抽样平均误差就是样本平均数或样本成数的标准差。 在实际中,重复抽样的抽样平均误差为:
x
n2或p
PQ n
2020/9/24
• 不重复抽样的情况下,样本平均数或样本成数的标准差为:
x p
2 (N n) 2 (1 n )
n N 1
第二节 抽样推断中的几个基本概念
一、总体
(一)总体的概念 (二)分类 1、按照全及总体所包含总体单位个数的多少,可以分为有限总
体和无限总体 2、按照全及总体中各单位标志的性质不同,可以分为属性总体
和变量总体 3、按照样本单位的来源不同,可将总体分为目标总体和被抽样
总体
2020/9/24
(三)反映总体特征的主要指标 对于变量总体,反映总体集中分布趋势的算术平均数
• (二)样本成数的抽样分布定理
• 三、抽样误差与抽样平均误差
• (一)抽样误差
• 由抽样随机性所产生的样本指标与总体指标之间的离差叫做抽
样误差。如
x或pP
2020/9/24
(二)抽样平均误差
• 抽样平均误差可以表示为:
x 样本(x的 可 )2 能数 样目 本(x的 x)可 2 能数目
p
P 2 PQ PQ
二、样本 (一)样本的概念
样本容量n≥30为大样本,n≺30为小样本 (二)反映样本特征的主要指标 对于样本变量总体:
n
k
xi
xi fi
x i1
n
或x
i 1 k
fi
i 1
n
k
(xi x)2
(xi x)2 fi
s2 i1 n1
或s2 i1 k
fi 1
i1
2020/9/24
x x
pP p
1、在总体为正态分布,且总体方差已知
抽样平均数的允许误差为 抽样成数的允许误差
x z1x 2
p z1p 2
2020/9/24
• 2、在任意一个总体中抽样,总体方差已知,如果样本容量 n≥30时:
平均数的极限误差 成数的极限误差
x z1x 2
p z1p 2
3、在正态分布总体中抽样,样本容量n≺30,且总体方差未知的 情况下:
N
Xi
i1
N
K
X iFi
i1 K
Fi
i1
反映总体离中分布趋势的方差或标准差
N
(Xi )2
2 i1
N
K
( X i ) 2 Fi
2 i1 K
Fi
i 1
N
(Xi )2
i1
N
K
( X i )2 Fi
i1 K
Fi
i 1
2020/9/24
对于属性总体,其平均数和方差或标准差为:
二、特点: 1、样本单位是按随机原则抽取的 2、抽样推断是一种从数量上由部分推断总体的研究方法 3、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制 三、抽样推断的应用 (一)调查具有破坏性的场合 • (二)对无限总体或总体规模非常大的场合进行调查
2020/9/24
(三)不必要进行全面调查但又需要知道总体的全面情况时 (四)对全面调查的结果进行核查和修正 (五)对资料时效性要求很强的场合
2、在简单随机不重复抽样时
pE(p)P
p 2 P (1 n P ) N N 1 n 或 pP (1 n P ) N N 1 n
2020/9/24
二、抽样分布定理

(一)样本平均数的抽样分布定理
• 1、正态分布的再生定理 • (一)正态分布的再生定理.doc • 2、中心极限定 • (一)正态分布的再生定理.doc • 3、小样本条件下的t分布定理
n
N
PQ(N n) PQ(1 n )
n N 1
n
N
可见,影响抽样误差大小的因素有: 1、总体各单位的差异程度 2、样本容量的大小 3、抽样方法 4、抽样的组织形式
2020/9/24
• (三)抽样极限误差 • 抽样极限误差就是指样本指标与全及总体指标之间误差的最大
可能范围,通常用“△”表示:
平均数的极限误差 成数的极限误差
四、样本的可能数目
在讲顺序的重复抽样的条件下,样本的可能数目为 N n
在不讲顺序的不重复抽样下,样本的可能数目为:
C
n N
五、抽样调查的理论基础
(一)大数定律 大数定理是关于大量的随机先行的均值具有稳定性的定理。 1、贝奴里大数定理 2、契比雪夫大数定理
(二)中心极限定理 证明某一分布的极限分布为正态分布的定理为中心极限定理。 正态分布?
第七章 抽样推断
第一节 抽样推断的基本问题 第二节 抽样推断中的几个基本概念 第三节 抽样分布和抽样误差 第四节 抽样估计 第五节 抽样推断误差的控制
2020/9/24
第一节 抽样推断的基本问题
一、抽样推断的概念: 抽样包括抽样调查和抽样推断两部分。 抽样推断包括两个有联系但又具有一定差别的方面, 即估计和检验
平均数的极限误差 成数的极限误差
x t1ˆx 2
p t1ˆp 2
2020/9/24
第四节 抽样估计
总体参数的估计方法有两种:即点估计和区间估计。
一、点估计方法
点估计,就是将样本指标直接作为未知的总体指标的估计值 。
一个优良的估计量要求满足: (一)无偏性 (二)一致性 (三)有效性 点估计给出的只是总体指标的一个估计数值,既没有给出准确
n
(xi x)2
s i1
或பைடு நூலகம்
n1
对于属性样本总体
k
(xi x)2 fi
i1
k
fi 1
i1
xp
s2 n pq n 1
s n pq n 1
需指出:n-1称为变量的自由度,也就是变量自由取值的个数 。
三、抽样方式
抽样方式不 重重 复复 抽抽 样不 讲 样不 讲 讲 顺讲 顺 顺 序顺 序 序序
2020/9/24
度,也没有给出可靠程度。因此,在实际工作中不单独使用。
第七章
抽样推断
2020/9/24
• 教学目的:通过本章的学习使学生掌握 抽样推断的基本原理和方法,理解抽样 分布的理论和样本容量的确定方法。
• 教学重点:重点介绍抽样误差的概念、 抽样平均误差的计算、参数估计的基本 方法和必要样本容量的确定方法。
• 教学学时:本章将用9个学时介绍。
2020/9/24
2020/9/24
第三节:抽样分布和抽样误差
一、抽样分布
(一)样本平均数的抽样分布
1、在简单随机重复抽样时; 样本平均数的抽样分布.doc 2、在简单随机不重复抽样时: 样本平均数的抽样分布.doc (二)样本成数的抽样分布 1、 在重复抽样时,
pE(p)P
p 2P(1n P)或 p
P(1P) n
相关文档
最新文档