第6章 抽样推断
统计学 第 6 章 抽样与参数估计

第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
统计学罗文宝主编 第六章抽样推断单选题多选题参考答案

第六章抽样推断二、单项选择题1.抽样平均误差是( A )。
A.抽样指标的标准差B.总体参数的标准差C.样本变量的函数D.总体变量的函数2.抽样调查所必须遵循的基本原则是( B )。
A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( C )。
A.2倍B.3倍C.4倍D.1/4倍4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( C ) 。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样6.在一定的抽样平均误差条件下( A )。
A.扩大极限误差范围,可以提高推断的可靠程度B.扩大极限误差范围,会降低推断的可靠程度C.缩小极限误差范围,可以提高推断的可靠程度D.缩小极限误差范围,不改变推断的可靠程度7.映样本指标与总体指标之间的平均误差程度的指标是( C )。
A,平均数离差 B,概率度C,抽样平均误差 D,抽样极限误差8 以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( A )。
A.无偏性B.一致性C.有效性D.准确性9.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B )。
A.随之扩大B.随之缩小C.保持不变D.无法确定10.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样三、多项选择题1.抽样推断的特点是(ABCE) 。
A.由推算认识总体的一种认识方法B.按随机原则抽取样板单位C.运用概率估计的方法D.可以计算,但不能控制抽样误差E.可以计算并控制抽样误差2. 抽样估计中的抽样误差(ACE) 。
统计学第六章 抽样法

第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
第6章--抽样推断PPT优秀课件

不考虑顺序
(N n 1)! n!(N 1)!
不重复抽样:又称不回置抽样。
考虑顺序 N !
( N n )!
可能组成的样本数目
不考虑ห้องสมุดไป่ตู้序
N! ( N n )! n!
7
标号为A、B、C、D的四个圆球从中随机抽取两个 可能样本个数
考虑顺序 N n
AA、AB、AC、AD BA 、BB、BC、BD
CA、CB、CC、CD
p
p1p0.9 8 0.0 20.8(0% 8 )
n
300
p p1np1N n 0.938 0 0.0021630000 00 0.80(6 %
计算结果表明:不重复抽样的平均误差小于重复抽样, 但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
24
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
例题二解 已知: N 20 ,n 040,0 x 0 48 ,0 3000
则:
x
n
3001(5小)时 400
x
2 1 n 3020140013.42(小时 )
n N 400 2000
计算结果表明:
根据部分产品推断全部产品的平均使用寿命时,采用
不重复抽样比重复抽样的平均误差要小。
21
抽样成数平均误差的计算公式
例题二:
某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
17
下面求 Y 的无偏估计 y 的方差 V ( y )
第6章抽样推断

第6章抽样推断统计试题习题一、单选题1.抽样调查的目的在于()。
A、了解总体的基本情况B、用样本指标推断总体指标C、对样本进行全面调查D、了解样本基本情况2.在抽样推断中,必须遵循()抽取样本。
A、随意原则B、随机原则C、可比原则D、对等原则3.某企业连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()。
A、整群抽样B、简单随机抽样C、类型抽样D、等距抽样4.置信区间的大小表达了区间估计的()。
A、可靠性B、准确性C、显著性D、及时性5.为提高类型抽样的效果,应当合理分组,尽可能做到()。
A、缩小组内和组间的差异B、扩大组内和组间的差异C、缩小组内差异,扩大组间差异D、扩大组内差异,缩小组间差异6.为提高整群抽样的效果,应当合理分群,尽可能使()。
A、群内和群间的差异扩大B、群内和群间的差异缩小C、群内差异缩小,群间差异扩大D、群内差异扩大,群间差异缩小7.在重复的简单随机抽样中,当概率保证度(置信度)从68.27%提高到95.45%时(其他条件不变),必要的样本容量将会()。
A、增加1倍B、增加2倍C、增加3倍D、减少一半8.在其他条件不变的情况下,抽样单位数目增加一半,则抽样平均误差()。
A、缩小为原来的81.6%B、缩小为原来的50%C、缩小为原来的25%D、扩大为原来的4倍9.当置信水平一定时,置信区间的宽度()。
A、随样本量的增大而减小B、随样本容量的增大而增大C、与样本量的大小无关D、与样本量的平方根成正比10.一个95%的置信区间是指()。
A、总体参数有95%的概率落在这一区间B、总体参数有5%的概率为落在这一区间内C、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数11.当正态总体的方差未知,且为小样本的条件下,估计总体均值使用的分布为()。
统计试题A、正态分布B、t分布C、2分布D、F分布12.当正态总体的方差未知,在大样本的条件下,估计总体均值使用的分布是()。
胡德华版统计学第六章

6.2.2 机械抽样
机械抽样又称等距抽样或系统抽样, 机械抽样又称等距抽样或系统抽样,就是将总体的各单位按某一标 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔, 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔,然后 按照相同的间隔等距抽取样本的一种抽样方式。 按照相同的间隔等距抽取样本的一种抽样方式。 根据总体单位排列方法,等距抽样可分为两类: 根据总体单位排列方法,等距抽样可分为两类:一是按有关标志排 二是按无关标志排队。 队;二是按无关标志排队。 所谓有关标志就是指与调查问题直接相关的标志。 所谓有关标志就是指与调查问题直接相关的标志。 采用等距抽样法,主要应解决以下两个问题: 采用等距抽样法,主要应解决以下两个问题: 一是要计算抽样间隔, 代表抽样间隔, 代表总体单位数 代表总体单位数, 代 一是要计算抽样间隔,若K代表抽样间隔,N代表总体单位数,n代 代表抽样间隔 表抽取的样本单位数, 表抽取的样本单位数,则K=N / n 。 二是要确定起点样本,即第一个样本。 二是要确定起点样本,即第一个样本。通常的方法可采取在第一组 1-K个样本单位中随机抽取的方法,也可以在第一组 个样本单位中随机抽取的方法, 个样本单位中随机抽取的方法 也可以在第一组1-K个样本单位中采 个样本单位中采 用取中间值的方法,然后,每隔K个单位抽取一个样本 个单位抽取一个样本, 用取中间值的方法,然后,每隔 个单位抽取一个样本,直到抽够样本 为止。 为止。 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 因而使样本具有更高的代表性,减少了抽样误差; 因而使样本具有更高的代表性,减少了抽样误差;采用机械顺序抽取样 简单易行,便于操作。但是,在应用等距抽样方法时, 本,简单易行,便于操作。但是,在应用等距抽样方法时,要注意抽样 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 等距随机抽样方法比较适合于同质性较高的总体。 等距随机抽样方法比较适合于同质性较高的总体。
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
第6章 抽样调查(1)
33
1、由于总体单位总数未 知,因此采用重复抽样 公式。又总体标 准差未知,采用过去资 料最大标准差作为估计 值。
x
n
0.12 0.0219 (升) 30
n1 30 2 2、合格率p 93.3% n 30 S P p(1 p) 93.3% (1 93.3%) 6.25%
根据质量标 准,使用寿 命800小时及 以上者为合 格品,计算 产品平均合 格率和标准 差。
14
全及指标
X XF X N F
P N1 N
X
2
( X X )2
N
( X X )2 F F
X
(X X )
N
2
(X X ) F F
2
P 2 P(1 P)
31
例 上题中,如果寿命低于9000小时的产品是不合格品,计 算不合格率(合格率)的抽样平均误差。
不合格率:
n1 90 x p 18% n 500
Sp
p(1 p)
Sp
0.18 (1 0.18) 38.4%
重复抽样下:
p
p
Sp n
0.384 1.7% n 500
3
特 点
遵循随机原则抽取部分单位 ;
用样本推断总体;
会产生抽样误差,但误差可以计算和控制。
4
随机原则的实现
统 计 学 概 论
是将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽 抽签法 选,签上的号码所对应的单位就是样本单 位。 将总体中每个单位编上号码,然后使 用随机数表,查出所要抽取的调查单 随机数表法 位。
第6章抽样推断19619
1
e dx
(
x )2 22
2
x t 2
1 et2dt 1
(3)一般正态分布的标准化
若 X N , , 2
对其进行“标准化”变换,即令
Z X
则 Z N 0,1
2 、中心极限定理
一般意义: 无论随机变量服从何种分布,只要样本容量足够
大,都可以近似地看作是服从正态分布。中心极限 定理说明,大量相互独立的随机变量和的概率分布 是以正态分布为极限的。由于正态分布在概率论中 占有的中心地位,中心极限定理因此而得名。
(四)样本容量——指一个样本所包括的单位数。
(五)抽样比例——抽样比例是指在抽取样本时,所抽取的样 本单位数与总体单位数之比。
(六)样本个数——指从总体中可能抽取的最多的样本数量。
1、重复抽样: (1)考虑顺序: M = N n (2)不考虑顺序: M = (N + n- 1)! n!(N - 1)!
(一) 全及总体和抽样总体(总体和样本)
全及总体:所要调查观察的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查观察的单位。
抽样总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
(二) 抽样方法 1、重复抽样: 1
N
2、不重复抽样: 1 、 1 、 1 ...... 1 N N 1 N 2 N n
重复抽样和不重复抽样会产生三个差别: 抽取的样本数目不同 抽样误差的计算公式不同 抽样误差的大小不同
(三) 参数和统计量
(全及指标和抽样指标、总体指标和样本指标)
全及指标:全及总体的那些指标。 抽样指标:抽样总体的那些指标。
参数
研究总体中 的数量标志
第六章抽样推断
第六章抽样推断一、单项选择题1. 抽样调查必须遵循的基本原则是()A. 灵活性原则B. 准确性原则C. 随机原则D. 可靠性原则2. 抽样误差是()A. 代表性误差B. 登记性误差c. 系统性误差 D. 随机误差3. 抽样平均误差和极限误差的关系是()A. 抽样平均误差小于极限误差B.抽样平均误差大于极限误差C. 抽样平均误差等于极限误差D. 抽样平均误差可能大于、等于或小于极限误差4. 在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A. 扩大为原来的4倍B. 每个大为原来的2倍C. 缩小为原来的1/4倍D. 缩小为原来的1/2倍5. 一般来说, 在抽样组织形式中,抽样误差较大的是()A. 简单抽样B. 分层抽样C. 整群抽样D. 等距抽样6. 根据抽样的资料, 一年级优秀生比重为10%, 二年级为20%,在人数相等时,优秀生比重的抽样误差()A. 一年级较大B. 二年级较大C.相同 D. 无法判断7. 根据重复抽样的资料, 甲单位工人工资方差为25,乙单位为100,乙单位人数比甲单位多3倍, 则抽样误差()A. 甲单位较大B. 无法判断C.乙单位较大 D. 相同8.一个全及总体()A. 只能抽取一个样本B. 可以抽取多个样本C. 只能计算一个指标 D.只能抽取一个单位9. 最符合随机原则地抽样组织形式是()A. 整群抽样B. 类型抽样C. 阶段抽样D. 简单随机抽样10.差错比率指标是用于()A. 点估计法B. 区间估计法C. 直接换算法 D.系数修正法二、多项选择题1.抽样估计的抽样平均误差()A. 是不可以避免的B.是可以改进调查方法消除的C. 是可以事先计算的D.只有调查结束之后才能计算E. 其大小是可以控制的2.影响样本客量的因素有()A. 推断的可靠程度 B.抽样方式C. 抽样方法D. 允许误差的大小E. 总体各单位标志变异程度3.抽样估计的特点是()A. A.运用归纳推理B. 运用演绎推理C. 运用数学分析法D. 运用概率分析法,E. 抽样误差和抽样估计的可靠程度有关4. 提高推断的可靠程度, 可以采取的办法是()A.扩大估计值的误差范围 B.缩小估计值的误差范围C. 增大概率度D. 降低概率度E. 增加样本容量5. 影响整群抽样的抽样误差的因素有()A. 总方差B. 组内方差C. 组间方差D. 总体群数E. 样本群数6. 抽样估计的优良标准是()A.无偏性B. 随机性C.一致性D. 有效性E.代表性7. 影响抽样平均误差的因素有()A. 总体标志变异程度 B.样本容量C. 抽样方法D. 抽样组织形式E. 样本指标值的大小8. 抽样调查遵循随机原则的原因是()A. 样本客量有限B. 保证总体中每个单位有同等机会被抽中C. 能确定抽样方法D. 能确定推断的可靠程度E. 能计算抽样误差9. 和重复抽样相比,不重复抽样的特点是()A. 总体单位数在抽选过程中逐渐减少B. 总体中每个单位都有被重复抽中的可能C.总体中每个单位没有被重复抽中的可能D. 样本可能数目要多些E. 样本可能数目要少些10.总体标准差未知时, 常用的替代办法有()A. 用过去调查的同类问题的经验数据B. 用样本的标准C.凭调查者经验确定D. 用总体方差E. 先组织试验性抽样,用试验样本的标准差11. 抽样调查的主要目的是()A. 对调查单位作深入研究B. 用样本指标推断总体的指标C. 计算和控制误差D. 广泛运用数学方法E.对总体进行科学的估计和判断12. 区间估计的基本要素是()A. 概率度B. 点估计C.误差范围 D.抽样数目E. 总体单位数三、填空题1.调查是用________推断________的一种调查方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 抽样推断
§1抽样推断有关概念与理论依据 §2抽样误差 §3抽样估计和推算 §4抽样推断的组织形式
第一节 抽样推断有关概念与理论依据
一、抽样推断的意义、内容
(一)概念
按照随机原则从总体中抽取一部分单位进行 观察,并根据被抽取的那部分单位的结果,对总 体作出具有一定可靠程度的推断 。
但对较小的n值,t分布与标准正态分布之间有较大
差异.且P{|T|≥t0}≥P{|X|≥t0},其中X ~N(0,1),即在t分 布的尾部比在标准正态分布的尾部有着更大的概率.
t 分布的数学期望与方差
设T~t
(n),则E(T)=0,D(T)=
n
n
2
.
(n 2)
设(X1,X2,…,Xn)为来自正态总体
假设检验 利用样本的实际资料来检验事先对 总体某些数量特征所作的假设是否可信的一 种统计分析方法。
二、抽样推断的作用
抽样调查方法是市场经济国家在调查方法
上的必然选择,和普查相比,它具有准确度高、 成本低、速度快、应用面广等优点。
建立起以周期性普查为基础、经常性抽样调 查为主体,必要的统计报表、重点调查、综合 分析等为补充的国家统计调查方法体系,是我 国统计方法制度改革的指导思想。
X1,X2,…,Xn的样本平均数x 服从数学期望为,方差
为 2 /的n 正态分布,即 ~ x
N
, 2 n
采用统计量Z,将非标准正态分布转化为标准正态分布,
Z x ~N(0,1) / n
对于给定的置信概率 1 a ,可以查正态分布表,
得出相应的临界值 Z / 2 (即概率度t)使得:
P Z / 2 Z Z / 2 1 a
40 10
25
-5
40 20
30
0
40 30
35
5
40 40
40
10
40 50
45
15
50 10
30
0
50 20
35
5
50 30
40
10
50 40
45
15
50 50
50
20
合计
-
-
2 xX 25 100 25 0 25 100 225 0 25 100 225 400 2 500
( x X )2
X~N( , 2)的样本,则统计量
T
X S
n
~
t(n 1)
(5.9)
证 由于 X 与S 2相互独立,且
U
X
n
~
N(0,1),
(n 1)S 2
2
~
2(n 1)
由定义5.4得
X
n
(n 1)S 2
2
(n 1)
X S
n
T
~
t(n 1)
设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分别是来自正态总体
(四)样本容量——指一个样本所包括的单位数。
(五)抽样比例——抽样比例是指在抽取样本时,所抽取的样 本单位数与总体单位数之比。
(六)样本个数——指从总体中可能抽取的最多的样本数量。
1、重复抽样: (1)考虑顺序: M = N n (2)不考虑顺序: M = (N + n- 1)! n!(N - 1)!
x
P
Z
/2
/
n
Z /2
1 a
P
x
Z
/
2
n
x Z /2
1
a
n
即在给定的显著性水平 a 下,总体均值
在 1 a 的置信概率下的置信区间为
x Za / 2
n
,x
Z
a
/
2
n
第二节 抽样误差
一、抽样误差的概念及种类
在抽样调查中,总体指标与样本指标不一致,两者 的偏差称为抽样误差。
抽取样本
30 40 30 50 40 10 40 20 40 30 40 40 40 50 50 10 50 20 50 30 50 40 50 50 合计
抽取样本
10 10 10 20 10 30 10 40 10 50 20 10 20 20 20 30 20 40 20 50 30 10 30 20 30 30
2、不重复抽样:
(1)考虑顺序: M = N ! (N - n)!
(2)不考虑顺序: M = N ! n!(N - n)!
可能样本数目的计算公式
不重复抽样
考虑 顺序
ANn
N! (N n)!
重复抽样
BNn N n
不考 虑顺 序
CNn
N! n!(N n)!
DNn
DNn
(N n 1)! n!(N 1)!
统计推断的过程
总体
样
样本统计量
本
例如:样本均
值、比例、方
差
(二)特点
1、按照随机原则抽取部分单位,抽样推断运 用概率估计的方法。
2、部分单位 总体。 3、抽样误差可以计算和控制。
(三)抽样推断的内容
参数估计 依据所获得的样本观察资料,对所 研究现象总体的水平、结构、规模等数量特 征进行估计。
(七) 置信度
置信度也称为可靠度,或置信水平、置信系数。 即 在抽样对总体参数作出估计时,由于样本的随机性, 其结论总是不确定的。因此,采用一种概率的陈述方 法,也就是数理统计中的区间估计法,即估计值与总 体参数在一定允许的误差范围以内,其相应的概率有 多大,这个相应的概率称作置信度。
四、抽样推断的理论依据
X np
b np
np(1 p) np(1 p) np(1 p)
( b np ) ( a np )
np(1 p)
np(1 p)
(二)小样本统计量的分布律 1、 t分布及小样本均值的分布律
设随机变量X~N(0,1),Y~ 2(n) ,
且X与Y相互独立,则称统计量
T
X Y
n
服从自由度为n的t分布或学生氏分布,记作T ~t(n).
∑XF X= ∑F
总体方差
σ2 =
Σ(X-X)2 N
σ2 =
Σ(X-X)F2 ΣF
总体成数 P = N1 N
成数方差 σ2 = P(1-P)
统计量
研究数量 标志
研究品质 标志
样本平均数
x
=
∑x n
x
=
∑xf ∑f
样本方差
s2
(x x)2
n
s2
(x x)2 f
f
样本成数
p
=
n n
成数方差 s2 p(1 p)
(一)大样本统计量分布的依据-中心极限定理
1、正态分布
(1)正态分布模型
如果连续型随机变量X的概率密度的函数为:
p x
1
e
x 2
2 2
2
x
其中σ>0,μ和σ均为常数,则称X服从参数为 μ和σ的正态分布,记作X~(μ,σ2)。
(2)正态分布的分布函数
FX
PX
x
X
pxdx
(x)dx
(1)独立同分布的中心极限定理
设随机变量X1,X2,…,Xn相互独立,服从同一分
布,且有有限的数学期望 和方差 2 ,则随机变量
n
Xi n
Y i1
n
的分布函数 Fn (x) 满足如下极限式
lim n
Fn
(
x)
lim
n
P
n i 1
Xi n n
x
x
1
t2
e 2 dt
2
定理的应用:对于独立的随机变量序列 X n ,不管
重复抽样和不重复抽样会产生三个差别: 抽取的样本数目不同 抽样误差的计算公式不同 抽样误差的大小不同
(三) 参数和统计量
(全及指标和抽样指标、总体指标和样本指标)
全及指标:全及总体的那些指标。 抽样指标:抽样总体的那些指标。
参数
研究总体中 的数量标志
研究总体中 的品质标志
总体平均数
∑X X= N
2. 说明样本指标和总体指标相差的一般范围。
二、抽样平均误差
(一)概念 抽样平均误差是所有可能出现的样本指标的标 准差。反映样本指标与总体指标之间误差的一般水 平。通常用μ表示。
即是由于抽样的随机性而产生的样本指标与总 体指标之间的平均离差。
(二)理论公式
( x X )2
x
M
( p P )2
N(1 ,2)和N(2 ,2)的样本,且它们相互独立,则统计量
T
X
Y Sn
(1 2)
1 n1
1 n2
~
t(n1 n2 2)
(5.10)
其中
Sn
(n1
1)S12 n1
(n2
n2 2
1)S22
,
S12、S22 分别为两总体的样本方差.
2 ——分布
定义 设总体 X ~ N 0,1 , X1, X 2,..., X n 是 X
2500 10(元)
x
M
25
(三)实际计算公式 (以纯随机抽样为例) 1.重复抽样
2
x
n
2.不重复抽样
p(1 p)
p
n
2
n
(1 )
x
n
N
p(1 p) n
(1 )
p
n
N
总体方差未知时解决方法:
1、用样本方差代替
用 s2代替2 用(1-)代替p(1-p)
2、用过去全面调查的资料,也可以用过去 抽样调查的资料代替。
lim P a