第五章 统计推断 统计学课件
合集下载
第五章统计推断课件(1)

2020/8/1
版权所有 BY 统计学课程组
28
一、假设检验的一般性问题(5)
上述的判断实际上体现着反证法的思想。判断的基础是样本
信息,判断的理论依据是小概率原理,即小概率事件在一次试验
(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况
下,那么一次试验(或抽样)中人们期望的结果出现的概率应该
2020/8/1
版权所有 BY 统计学课程组
11
二、区间估计(3)
5.区间估计时应考虑的一些具体问题 在对总体均值进行区间估计时,
常常需要考虑总体是否为正态总体、 总体方差是否已知、用于构造估计量 的样本是大样本(n≥30)还是小样本(n< 30)等几种情况。
2020/8/1
版权所有 BY 统计学课程组
2. 解决问题的统计思想 4. 单、双侧检验问题 6. 统计检验的显著性
二、几种常用、具体的参数检验方法
1. Z检验法 3. c 2 检验法
2. T检验法 4. F检验法
2020/8/1
版权所有 BY 统计学课程组
23
一、假设检验的一般性问题(1)
(一) 问题的提出
2020/8/1
版权所有 BY 统计学课程组
12
二、区间估计(4)--总体均值的区间估计
1.正态总体、总体方差已知;或非正态总体、大样本
2020/8/1
版权所有 BY 统计学课程组
13
二、区间估计(5)--总体均值的区间估计
2.正态总体、总体方差未知、小样本
2020/8/1
版权所有 BY 统计学课程组
14
二、区间估计(6)--总体成数的区间估计
第五章
统计推断
2020/8/1
第五章 统计推断 PPT课件

(点估计)
置信区间
置信下限 ˆ 1
置信上限 ˆ 2
一般地,如果将构造置信区间的步骤重复多次, 置信区间中包含总体参数真值的次数所占的比率, 称为置信水平(概率保证程度)。
即区间包含总体参数真实值的可信度.
通常用1- 表置信水平,其中称为显著性水平。 比较常用的置信水平:90%,95%和99%。
第五章 统计推断
第一节 总体参数估计 第二节 总体参数检验
统计推断在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
大学生每周上网花多少时间?
为了解学生每周上网花费的时间,某校4名 本科生对全校部分本科生做了问卷调查。调 查的对象为本校在校本科生,调查内容包括 上网时间、途径、支出、目的、关心的校园 网内容,以及学生对收费的态度,包括收费 方式、价格等。
例如,抽取了1000个样本,根据每一个样本均构 造了一个置信区间,这1000个置信区间中,有95% 的区间包含了总体参数的真值,而5%的置信区间则 没有包含。这里,95%这个值被称为置信水平(或置 信度)。
两个需要注意的问题
如果用某种方法构造的所有区间中有95%的 区间包含总体参数的真值,5%的区间不包含 总体参数的真值,那么,用该方法构造的区 间称为置信水平为95%的置信区间。
点估计完全正确的概率通常为0。因此, 我们更多的是考虑用样本统计量去估计总 体参数的范围 区间估计。
(一)总体参数的区间估计概述
1.基本概念
(1)区间估计:在点估计的基础上,给出总体参数 估计的一个范围,并给出区间估计成立的概率值。
p(1 2 ) 1 样本统计量
P(X )
均值的抽样分布
第五章 统计推断 《试验设计与统计分析》PPT课件

则( x1 x 2 ) ~ N ( ( x1 x2 ) , ......
2 ( x1 x 2 )
)。
统计推断
总体 ——从样本到总体
样本
通过一个或多个样本统计数推断总体相应参数
第一节 统计推断的含义和内容
一、统计推断的概念
按照一定的抽样方法,从所研究的总体中,随机抽 出一个样本或一系列样本,并研究样本的特征,然后根 据对样本特征的研究结果去推断总体的特征 。
拿 3棵 拿 4棵 拿 5棵
推断:一次就猜对5棵的概率是0.03125,概率很小, 亦即猜100次只有5次能把5棵麦苗属何品种全猜对, 在一次试验中几乎不可能发生,所以,他若能一次 就说对,不是凭猜的,是确有鉴别能力。
这里有一个概率标准的问题,这个概率标准
称为显著水平(a)一般为0.05或0.01。 我们是依据“小概率实际不可能性原理”进 行推断的。这个原理是说:概率很小的事件, 在一次试验中几乎不可能发生或可以认为不 可能发生。如果我们假设了一些条件,并在 假设的条件下能够准确地算出事件A出现的 概率很小,但在一次试验中,事件A竟出现 了,那么,我们就可以认为这个假设不正确, 从而否定这个假设。
四、统计假设检验的两类错误
1、第一类错误(first kind error)或I型错误(type I error)。––如果H0是真实的,我们通过检验却否定 了它,就犯了一个否定真实假设的错误。第一类错
误只有在否定H0时才会发生。由于规定显著水平为
a ,故H0为真而被否定的概率最多为a ;因而这类
实际上包括了 0 (或1 2 )和 0 (或1 2 )两种情况, 要在 a显著水平否定无效假设 H 0 : 0 (或1 2 ), 必须 否定区,分别位于 水平 a u ua 或u ua,因而这种检验有两个 表示的概率在曲线两尾
《统计学》课件 第五章统计推断

三、 样本容量的确定
p152
一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法 1. 估计总体均值时样本容量的确定
2. 估计总体比例时样本容量的确定
2014-1-1
版权所有 BY lazhenx
37
样本容量的确定
一、问题的提出
从推断来看,要达到估计所要求的精确程度,
对置信区间的理解注意:
②总体参数是固定的、未知的,而用样本构造的区间则是不 固定的。若抽取不同的样本,用该方法可以可到不同的区 间,从这个意义上说置信区间是随机区间,会因样本的不 同而不同,而且不是所有的区间都包含总体参数的真值。 ③在实际问题中,进行估计时往往只抽取一个样本,此时所 构造的是与该样本相联系的一定置信水平(比如95%)下的 置信区间。由于用该样本所构造的区间是一个特定的区间 ,而不再是随机区间,所以无法知道这个样本所产生的区 间是否包含总体参数的真值。我们只能希望这个区间是大 量包含总体参数真值的区间中的一个,但它也可能是少数 几个不包含参数真值的区间中的一个。
1.
ˆ P q1 #q
{
ˆ q2 = 1- a
}
置信区间
置信水平1-α
样本统计量 (点估计)
置信下限
置信上限
当总体服从正态分布N(μ,σ2)时,(σ2已知)来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n 即x~N(μ,σ2/n) 置信水
平
p(
x
原点矩存在,若不存在则无法估计;矩估计法不能充分地利 用估计时已掌握的有关总体分布形式的信息。
2.最大似然估计法
基本思想:当我们经一次抽样取得一些观测数据(样本值) 后,应给未知参数选取一些数值,使得所观测得到的样本值 出现的概率最大。
《chap5统计推断》PPT课件

6
假设检验
假设检验的定义
假定原假设正确,检验某个样本是否来自某个总体, 它可以使研究者把根据样本得出的结果推广到总体
反证法: 假定原假设正确,研究其发生的概率
根据样本进行的假设检验有两种结果
拒绝H0,因为发现其是错误的 不能拒绝H0,因为没有足够的证据使我们拒绝它
原假设和备择假设总是互斥,而且包括了所有的可能,
5
统计假设
原假设(null hypothesis, H0)通常为不变情况的假设。 备择假设(alternative hypothesis, HA)则通常声明一种改变的状态,如
两个群体间存在差异。 研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假
设和研究假设相同,因此,原假设与研究者的期望相反。
20
显著水平的选择
如果接受H0,则或者得出正确结论,或者犯概率为的第二类错误 如果结论为拒绝H0,则可能得出正确结论,也可能犯概率为 的第一类错误。 当假设检验结果为拒绝H0时,我们知道犯第一类错误的概率,因此我们进行
假设检验时,总是希望结论为拒绝H0 推荐的显著水平为0.05?为什么
21
<-无效假设H0: y=0 <-要分析的变量为y
45
结果
P=0.3434>0.05,接受H0,即抽测结果的平均数是否与总体平均数114天一致
46
第三节
两个样本平均数差异的假设检验
47
一、两独立样本
平均数差异的假设检验
48
前言
两样本独立指两样本 为分别独立地从两个总体抽取的,两个样本间相互独立 在动物科学中,利用完全随机设计(completely randomized design, CRD)
假设检验
假设检验的定义
假定原假设正确,检验某个样本是否来自某个总体, 它可以使研究者把根据样本得出的结果推广到总体
反证法: 假定原假设正确,研究其发生的概率
根据样本进行的假设检验有两种结果
拒绝H0,因为发现其是错误的 不能拒绝H0,因为没有足够的证据使我们拒绝它
原假设和备择假设总是互斥,而且包括了所有的可能,
5
统计假设
原假设(null hypothesis, H0)通常为不变情况的假设。 备择假设(alternative hypothesis, HA)则通常声明一种改变的状态,如
两个群体间存在差异。 研究假设可以为两种可能之一,即没有差异和有差异。通常情况下,备择假
设和研究假设相同,因此,原假设与研究者的期望相反。
20
显著水平的选择
如果接受H0,则或者得出正确结论,或者犯概率为的第二类错误 如果结论为拒绝H0,则可能得出正确结论,也可能犯概率为 的第一类错误。 当假设检验结果为拒绝H0时,我们知道犯第一类错误的概率,因此我们进行
假设检验时,总是希望结论为拒绝H0 推荐的显著水平为0.05?为什么
21
<-无效假设H0: y=0 <-要分析的变量为y
45
结果
P=0.3434>0.05,接受H0,即抽测结果的平均数是否与总体平均数114天一致
46
第三节
两个样本平均数差异的假设检验
47
一、两独立样本
平均数差异的假设检验
48
前言
两样本独立指两样本 为分别独立地从两个总体抽取的,两个样本间相互独立 在动物科学中,利用完全随机设计(completely randomized design, CRD)
统计学05第五章抽样推断

(2)
计算 p
p1 p
n
(3) 根据 F Z 查表 Z
(4) 计算 Z
(5) 写出:P : p , p
2020/11/17
第五章 抽样推断
44
2.3 区间估计
【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽 出 400 件产品进行检测,发现有32 件废品。在置信度为 90% 的要求下, 试给出该批产品的废品率的区间估 计。
总体参数和样本统 x计 量x-x2 n
总体参数和样本统计量的计算公式
总体参数
X X1 X2 XN N
样本统计量
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
2020/11/17
2020/11/17
第五章 抽样推断
35
2.3 区间估计
2. 给定 , 已知 X , 总体平均数的估计:
步骤
内
容
(1) 抽样,计算 x 区间的中心
(2) 计算抽样平均误差: X n
(3) 计算 Z 查表F Z
(4) 根据 x 和 : X : x ,x
2020/11/17
参数估计要求:
1. 精确性—适当的极限误差范围; 2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2020/11/17
第五章 抽样推断
16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。
常用的点估计量有:
22
第五章 统计推断 《统计学》 ppt课件

必要抽样数目愈多;值愈小,必要抽样数目愈少。 (2)允许误差(极限误差)Δ,即Δ的数值。Δ值大可以
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
少抽些样本单位,Δ值小则要多抽一些样本单位。Δ是调查 前规定的,是根据调查目的确定的。 (3)概率度t 。t值愈大,要求把握程度愈高,则要多抽 些单位;t值愈小,要求把握程度低,则可少抽些单位。把 握程度也是在抽样之前根据抽样的目的和要求来规定的。 (4)抽样方法。在同等条件下,重置抽样需要多抽一些单 位,不重置抽样可少抽一些样本单位。 (5)抽样的组织方式。简单随机抽样,类型随机抽样, 等距随机抽样,整群随机抽样,阶段随机抽样等都是抽样 的组织方式,由于采用的组织方式不同,必要抽样数目也 不相同。
二、统计推断的几个基本概念
1.总体和样本 在统计推断中存在全及总体和样本总体。
全及总体也叫母体,简称总体,是所要认识的研究对象的 全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。
全及总体按其各单位标志的性质不同可分为变量总体和 属性总体。
样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。
样本平均数的抽样分布是由样本平均数的可能取值和与 之相应的概率组成。
例5.3
在不重复抽样时,样本平均数的抽样分布有数学期望
E(x) a
即样本平均数的平均数等于总体平均数
X
在不重复简单随机抽样时,样本平均数的抽样分布有方 差,即
2 x
2
n
(
N N
n) 1
在不重复抽样条件下,用
x
表示抽样平均误差(也称抽样标准误差),则
(
方差σ2 )。
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则: P N1 N
f第五章 统计推断

1.82
n
10
PU 1.82 0.03437
P 0.05
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。 幻灯片 14 在假设 H0 正确的情况下,计算样本实际发生的概率 P,若 P>α,接受 H0 ;若 P<α,拒绝 H0 ,接受 HA 。在实际应用时,并不直接求出具体的概率值,而是建立在α水平上 H0 的拒 绝域和接受域。 幻灯片 15 拒绝域(rejection region):在上尾、或下尾、或双侧检验中,U > uα、或 U < -u α、或|U| > uα/2 的区域,称为在α水平上 H0 的拒绝域。 接受域(acceptance region):相应的 U < uα,或 U > -uα ,或-uα/2 < U < uα/2 的 区域,称为在α水平上 H0 的接受域。
则1. H0 : 0 (null hypothesis,零假设或无效假设,检验假设) 2. HA:备Hμ1择>:μ假0设,的或提0 (H出aAl是:tμe根r<n据μat具0iv体,e 情或hy况HpA而o:μt定h≠e的sμi。s0,备。择假设;或 research hypothesis,研究假设)
本平均数 y=10.23g。这批动物实际饲养的时间比根据以往经验所需饲养的时间长。问这批
动物能否用于实验。
解: H0: μ=10.00g HA: μ>10.00g 幻灯片 9 (二)统计假设检验原理——小概率原理 小概率的事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假 设条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设 的条件不正确,从而否定假设。 幻灯片 10 (二)小概率原理 小概率事件(P≤0.05 或 P≤0.01) ,在一次试验中几乎是不会发生的。若根据一定的假设 条件计算出来该事件发生的概率很小,而在一次试验中它竟然发生了,则可以认为假设的 条件不正确,从而否定假设。 若在 H0 成立的前提下,样本统计量对应的概率很小,如小于等于 0.05,则认为事件在某一 次试验中不会发生,此时拒绝 H0,有足够证据推断差异有统计学意义。 幻灯片 11 显著性检验(significance test):根据小概率原理建立起来的检验方法称为显著性检验。 显著性水平(significance level):拒绝零假设所使用的概率。 生物统计工作中, 通常 规定 5%或 1%以下为小概率, 5%或 1%或其它值称为显著性水平,记为“α”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• (A、A)(B、A)(C、A)(D、A) • (A、B)(B、B)(C、B)(D、B) • (A、C)(B、C)(C、C)(D、C) • (A、D)(B、D)(C、D)(D、D) • 故全部样本的可能个数共有4×4=42=16个。 • 样本平均数的抽样分布即是样本平均数的概率分布,它
是由样本平均数的可能取值和与之相应的概率组成。 • 例5.1 P186
2020/10/1
• 二、统计推断的几个基本概念 • 1.总体和样本 • 在统计推断中存在全及总体和样本总体。 • 全及总体也叫母体,简称总体,是所要认识的研究对象的
全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。 • 全及总体按其各单位标志的性质不同可分为变量总体 和属性总体。 • 样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。 • 样本总体的单位数称样本容量,用n表示。与全及总体 的单位数N相比,n则是个很小的数。 • 要注意的是,全及总体总是唯一确定的,而样本总体不 惟一,一个全及总体可以有很多样本总体。
2020/10/1
• 4.抽样误差与抽样平均误差 • 抽样误差是指在遵守随机原则的条件下,用抽
样总体的指标估计或推断全及指标所不可避免的 误差。它包括抽样平均数与总体平均数的差数、 抽样成数与总体成数的差数。 • 抽样误差是抽样调查自身所固有的、不可避免 的误差,虽然不能消除这种误差,但有办法进行 计算,并能对其加以控制。 • 抽样平均误差是指所有可能组成的样本的抽样 平均数或抽样成数与总体平均数或成数的平均误 差。简称平均误差。
本成数)的标准差。它反映抽样平均数(或抽样成数)与 总体平均数(或总体成数)的平均误差程度。
•
抽祥平均误差
x x
2
nn
例5.2
2020/10/1
• 在重复简单随机抽样时,样本成数的抽样 分布有数学期望值 E(p)=P
方差 P 2 P(1n P)
2020/10/1
在重复简单随机抽样时,样本平均数的抽样分布有数学期
望值E (x) a ( a 代表全及总体平均数,即 X
),即样本平均数的平均数等于总体平均数 X
在重复简单随机抽样时,样本平均数的抽样分布有方差
2 x
2
n
2020/10/1
x
• 抽样标准误也称抽样平均误差,就是样本平均数(或样
第五章 统计推断
学习目标:掌握统计推断的基本概念、了解抽样分布、 掌握点估计、掌区间估计、了解抽样组织的方式。
具体有以下几节: 第一节 统计推断的几个基本概念 第二节 抽样分布 第三节 点估计区间估计 第四节机械抽样估计、类型抽样估计、整群抽样估
计
2020/10/1
第一节 统计推断的几个基本概念
• 一、统计推断的意义 • 统计推断又称抽样推断,是一种非全面调查,
是按照随机原则,从总体中抽取一部分单位进行 调查,并以其结果对总体某一数量特征做出估计 和推断的一种统计方法,统计推断的基本要求是 严格按照随机原则抽取样本单位。 • 所谓随机原则,也称同等可能性原则,是指在抽 取样本单位时,总体中的每一个单位都有同等被 抽中的机会,样本单位的选取完全排除了人的主 观意识的作用。
•
2020/10/1
第二节 抽样分布
• 三、重复简单随机抽样与抽样分布 • 重复简单随机抽样又称重置抽样,是从具有N个单位的总
体中随机抽取n个单位为样本,每次从总体中抽取一个单 位登记其序号或标志值之后,又将它重新放回总体参加下 一次抽选,连续进行n次抽选便构成了一个容量为n的样本 。 • 该抽样方法的特点是: • 第一,总共可以构成Nn个可能的样本个数,每个样本 被抽取的概率都是相同的; • 第二,由于是重复抽样,因此在n次抽样中,总体中每 个单位在各次抽样中被抽取的概率都相同,n次抽样就是n 次相互独立的试验。 •
2020/10/1
Q2N N0XN N N XN211P 对于属性总体,可以有如下参数:全及总体成数P、全及总体标准差σP( )方。差σ2
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则:
P N1 N
QN0 NN1 1P NN
P为总体中具有某种属性的单位数占全部单位数的比重, Q为总体中不具有某种属性的单位数占全部单位数的比重 ,这两者都称为全及总体成数。
不具有某种属性,且n1十n0=n 。则:
p n1 n
qn0 nn1 1p nn
两者都称为样本总体成数。
样本标准差 s p1p
2020/10/1
• 3.样本容量与样本个数 • 样本容量是指一个样本所包含的单位数,用n来表示。
对比全及总体单位数N来说,n则是个很小的数,它可以 是N的几十分之一、几百分之一、几千分之一、几万分之 一。 • 一般地讲,样本单位数达到或超过30个的样本称为大样 本,而在30个以下称为小样本。 • 样本个数又称样本可能数目,是指从全及总体中可能抽 取的样本个数。
2020/10/1
• 例如,在总体中有A、B、C、D四个单位,要从总体中随 机抽取两个单位构成样本。先从4个单位中取1个,结果登 记后放回,然后再从相同的4个中抽取1个,这两个单位就 构成一个样本。第一次可以从A、B、C、D中任取一个, 共有4种抽法,第二次同样可以从A、B、C、D中任取一 个,也有4种抽法。所有可能的样本,排列如下:
2020/10/1
• 统计量即样本指标,是样本的数量特征,随着样本的不同 而变化,是个随机变量,它是根据样本总体各单位标志值 或标志特征计算的综合指标,是用来推断全及总体的。
• 和全及指标相对应的有下列样本指标,并以小写字母来表 示:
• 设样本总体有n个变量:x1,x2,x3,…,xn ,则:
样本平均数
x x
n
样本标准差sn=
n
2
(xi x)
i 1
n
2020/10/1
修正样本标准差sn-1=
n
2
i 1
(
x
i
x
)
n 1
样本方差 修正样本方差
x n
2
x
i
sn2 i1
n
x n
2
x
i
0/10/1
• 对于属性总体来说则有如下对应样本指标: • 设样本总体n个单位中有个单位具有某种属性,个单位
是由样本平均数的可能取值和与之相应的概率组成。 • 例5.1 P186
2020/10/1
• 二、统计推断的几个基本概念 • 1.总体和样本 • 在统计推断中存在全及总体和样本总体。 • 全及总体也叫母体,简称总体,是所要认识的研究对象的
全体,它由具有某种共同性质或特征的单位组成。全及总 体的单位数用N表示。 • 全及总体按其各单位标志的性质不同可分为变量总体 和属性总体。 • 样本总体又叫抽样总体、子样,简称样本,是从全及总 体中随机抽选出来的单位所组成的小总体。 • 样本总体的单位数称样本容量,用n表示。与全及总体 的单位数N相比,n则是个很小的数。 • 要注意的是,全及总体总是唯一确定的,而样本总体不 惟一,一个全及总体可以有很多样本总体。
2020/10/1
• 4.抽样误差与抽样平均误差 • 抽样误差是指在遵守随机原则的条件下,用抽
样总体的指标估计或推断全及指标所不可避免的 误差。它包括抽样平均数与总体平均数的差数、 抽样成数与总体成数的差数。 • 抽样误差是抽样调查自身所固有的、不可避免 的误差,虽然不能消除这种误差,但有办法进行 计算,并能对其加以控制。 • 抽样平均误差是指所有可能组成的样本的抽样 平均数或抽样成数与总体平均数或成数的平均误 差。简称平均误差。
本成数)的标准差。它反映抽样平均数(或抽样成数)与 总体平均数(或总体成数)的平均误差程度。
•
抽祥平均误差
x x
2
nn
例5.2
2020/10/1
• 在重复简单随机抽样时,样本成数的抽样 分布有数学期望值 E(p)=P
方差 P 2 P(1n P)
2020/10/1
在重复简单随机抽样时,样本平均数的抽样分布有数学期
望值E (x) a ( a 代表全及总体平均数,即 X
),即样本平均数的平均数等于总体平均数 X
在重复简单随机抽样时,样本平均数的抽样分布有方差
2 x
2
n
2020/10/1
x
• 抽样标准误也称抽样平均误差,就是样本平均数(或样
第五章 统计推断
学习目标:掌握统计推断的基本概念、了解抽样分布、 掌握点估计、掌区间估计、了解抽样组织的方式。
具体有以下几节: 第一节 统计推断的几个基本概念 第二节 抽样分布 第三节 点估计区间估计 第四节机械抽样估计、类型抽样估计、整群抽样估
计
2020/10/1
第一节 统计推断的几个基本概念
• 一、统计推断的意义 • 统计推断又称抽样推断,是一种非全面调查,
是按照随机原则,从总体中抽取一部分单位进行 调查,并以其结果对总体某一数量特征做出估计 和推断的一种统计方法,统计推断的基本要求是 严格按照随机原则抽取样本单位。 • 所谓随机原则,也称同等可能性原则,是指在抽 取样本单位时,总体中的每一个单位都有同等被 抽中的机会,样本单位的选取完全排除了人的主 观意识的作用。
•
2020/10/1
第二节 抽样分布
• 三、重复简单随机抽样与抽样分布 • 重复简单随机抽样又称重置抽样,是从具有N个单位的总
体中随机抽取n个单位为样本,每次从总体中抽取一个单 位登记其序号或标志值之后,又将它重新放回总体参加下 一次抽选,连续进行n次抽选便构成了一个容量为n的样本 。 • 该抽样方法的特点是: • 第一,总共可以构成Nn个可能的样本个数,每个样本 被抽取的概率都是相同的; • 第二,由于是重复抽样,因此在n次抽样中,总体中每 个单位在各次抽样中被抽取的概率都相同,n次抽样就是n 次相互独立的试验。 •
2020/10/1
Q2N N0XN N N XN211P 对于属性总体,可以有如下参数:全及总体成数P、全及总体标准差σP( )方。差σ2
设总体N个单位中,有N1个单位具有某种属性,N0个单 位不具有某种属性,且N1十N0=N ,则:
P N1 N
QN0 NN1 1P NN
P为总体中具有某种属性的单位数占全部单位数的比重, Q为总体中不具有某种属性的单位数占全部单位数的比重 ,这两者都称为全及总体成数。
不具有某种属性,且n1十n0=n 。则:
p n1 n
qn0 nn1 1p nn
两者都称为样本总体成数。
样本标准差 s p1p
2020/10/1
• 3.样本容量与样本个数 • 样本容量是指一个样本所包含的单位数,用n来表示。
对比全及总体单位数N来说,n则是个很小的数,它可以 是N的几十分之一、几百分之一、几千分之一、几万分之 一。 • 一般地讲,样本单位数达到或超过30个的样本称为大样 本,而在30个以下称为小样本。 • 样本个数又称样本可能数目,是指从全及总体中可能抽 取的样本个数。
2020/10/1
• 例如,在总体中有A、B、C、D四个单位,要从总体中随 机抽取两个单位构成样本。先从4个单位中取1个,结果登 记后放回,然后再从相同的4个中抽取1个,这两个单位就 构成一个样本。第一次可以从A、B、C、D中任取一个, 共有4种抽法,第二次同样可以从A、B、C、D中任取一 个,也有4种抽法。所有可能的样本,排列如下:
2020/10/1
• 统计量即样本指标,是样本的数量特征,随着样本的不同 而变化,是个随机变量,它是根据样本总体各单位标志值 或标志特征计算的综合指标,是用来推断全及总体的。
• 和全及指标相对应的有下列样本指标,并以小写字母来表 示:
• 设样本总体有n个变量:x1,x2,x3,…,xn ,则:
样本平均数
x x
n
样本标准差sn=
n
2
(xi x)
i 1
n
2020/10/1
修正样本标准差sn-1=
n
2
i 1
(
x
i
x
)
n 1
样本方差 修正样本方差
x n
2
x
i
sn2 i1
n
x n
2
x
i
0/10/1
• 对于属性总体来说则有如下对应样本指标: • 设样本总体n个单位中有个单位具有某种属性,个单位