第7章:抽样推断
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
第七章 选择研究对象 –抽样

抽样是以概率论为理论基础。抽样的作用是为 了合理地减少研究对象,既可以节约人力、物 力、时间,又可使研究力量相对集中,使研究 工作深入、细致,从而提高研究的准确性和可 靠性。 一般来说,定性研究中抽取的样本很小,样本 有时仅仅是一个案例或一个个体,研究目的是 为了对所研究对象进行更深入的了解。而定量 研究的样本数较大,样本可以是一群个体,并 要考虑样本能否准确代表总体,能否对总体作 出推断。
4.合理的样本容量 4.合理的样本容量 样本容量又称样本大小,是指抽取样本的具体数量。样本数量的多少是研 究无法回避的问题,是研究设计中重要的一环,也是比较困难的一件事。 它既要符合研究目的、内容,满足教育统计的要求,又要考虑抽样的可能 性,并使误差减少到最低限度。一般来说,样本数越多,代表性越好,但 是增大样本,势必增加研究的人力、物力、财力,增加研究的难度,造成 不必要的浪费。如果样本数太小,则抽样误差较大,样本不能代表总体, 不利于统计分析,影响研究效果。样本数量究竟多少为宜,这是一个复杂 的问题。我们很难说出一个确定的数字,样本数量要从多个方面综合起来 考虑。一般来说,样本容量大小取决于以下一些因素: (1)研究的类型、范围 当研究是定量研究,研究范围较广,样本数量可适当大一些;反之,当研 究是定性研究,研究范围较狭窄,样本数量可适当少一些。 (2)研究分析的精确程度 当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可 多些;反之,则可少些。 (3)允许误差的大小 当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;反 之,则可小些。
下表示当总体趋于无限大时, 下表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样 本数量。 本数量。 允许误差和可信程度与样本容量关系表
(4)总体的同质性 当总体的变异性比较大,变量的相关程度比较低,研究的条 件控制不严格,样本数量可适当增加些;反之,当总体同质 性比较好,变量的相关程度较高,研究条件控制严格,则可 少些。如,人的血液同质性比较好,医院化验只需抽取一点 点血。学生的智力、能力变异性比较大,因此抽取样本相对 比较大。 (5)测量工具的可靠程度 当测量工具的可靠程度即测定指标信度比较低时,测量的误 差就比较大,这时需要增大样本数量;反之,则可减少样本 数量。一般说来,有关学习能力和成就的测量工具可靠性程 度好些,有关人格特质、自我概念、态度等方面的测量工具 可靠程度差些。 (6)研究的成本 研究的成本包括经费、时间、人力、物力,抽样数量总是要 控制在研究成本允许的范围内。因此,确定样本容量时,必 须仔细分析研究的条件,量体裁衣。 (7)分析的类别 当研究的关系复杂,分析的项目较多,那么样本数量可多些; 反之,则可少些。一般应保证每一分析小类的样本数量不少 于10。 10。
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第7章 《抽样推断》练习题

《第7章抽样推断》练习题一、单项选择题1、对某市居民生活状况作了一次抽样调查, 据样本资料计算, 平均每居民实际月生活费用76元, 抽样平均误差3元, 调查队推断市居民实际月生活费用在70—82之间, 这一推断的可靠程度为:A、68.27%B、95%C、95.45%D、99.73%2、在一定的抽样平均误差条件下,A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度3、按设计标准,某自动食品包装机所包装食品的平均每袋重量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验4、一所较大规模的大学教务部决定调整课程时间安排,以便提供足够的时间使大家可以为上课做好准备。
到目前为止,教务部认为课间安排20分钟的时间足够了。
表述零假设H0和备择假设H1A、H0:µ=20 H1:µ≠20B、H0:µ≥20 H1:µ<20C、H0:µ≤20 H1:µ>205、当我们根据样本资料对零假设作出接受或拒绝的决定时,可能出现的情况有:①当零假设为真时接受它;②当零假设为假时接受它;③当零假设为真时拒绝它;④当零假设为假时拒绝它.A、①B、②C、①②③D、①②③④6、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A、53.3B、1.65C、720D、13207、在其他条件不变的情况下,要使抽样误差减少1/3,则样本量必须增加多少倍?A、1/3B、1.25C、3D、9二、多项选择题1、推断统计学研究的主要问题是A、如何科学地确定总体B、如何科学地从总体中抽取样本C、怎样控制样本对总体地代表性误差D、怎样控制总体对样本地代表性误差E、由所抽取地样本去推断总体特征2、在抽样推断中,样本单位数的多少取决于A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法和组织形式3、抽样推断的概率度、可靠性和精确度的关系为()A、概率度增大,估计的可靠性也增大B、概率度增大,估计的精确度下降C、概率度减小,估计的精确度下降D、概率度减小,估计的可靠性增大E、估计的可靠性增大,估计的精确度也增大3、影响抽样平均误差大小的因素有A、样本各单位标志值的差异程度B、总体各单位标志值的差异程度C、样本单位数D总体单位数E、抽样方法4、在其他条件不变时,抽样估计的置信度(1-α)越大,则:A、允许误差范围越大B、允许误差范围越小C、抽样估计的精确度越高D、抽样估计的精确度越低E、抽样估计的可靠性越高5、在假设检验中,当我们作出拒绝原假设而接受备择假设的结论时,表示A、有充足的理由否定原假设B、原假设必定是错误的C、犯错误的概率不大于αD、犯错误的概率不大于βE、在原假设为真的假设下发生了小概率事件三、判断改错题1、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。
第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章抽样

随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;
经济统计学第7章抽样调查

目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
THANKS FOR WATCHING
感谢您的观看
准备辅助工具
根据调查需要,准备辅 助工具,如调查表格、 录音设备等。
调查过程的控制
培训调查人员
对调查人员进行培训,确保他们了解调查目 的、问卷内容、抽样方法等。
现场实施
按照抽样计划进行现场调查,确保每个样本 都得到有效的调查。
数据采集
对收集到的数据进行整理、分类和编码,确 保数据的准确性和完整性。
适用于总体内各单位之间存在明显的差异性。
系统抽样
定义
先将总体中的所有单位按一定的顺序排 列,然后按照固定的间隔或系统地抽取
样本单位的方法。
操作方法
首先确定一个合理的起始点,然后按 照固定的间隔依次抽取样本单位。
特点
每隔一个固定数量的单位抽取一个样 本单位,每个样本单位被抽中的概率 都相等。
适用范围
抽样调查的分类
按样本选取方式
随机抽样、分层抽样、系统抽样、整群抽样等。
按样本规模
大样本、中样本、小样本。
按调查目的
探索性调查、描述性调查、因果性调查。
抽样调查的应用场景
01
市场调研
了解市场需求、消费者行为、品牌 知名度等。
质量控制
产品检验、过程控制、质量评估等。
03
(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。
调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。
例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。
由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。
同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。
为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。
调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。
例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。
同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。
(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。
例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。
(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。
调查项⽬确定的正确与否直接关系到调查的质量。
因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。
应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。
例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。
调查项⽬有⼀般项⽬和重点项⽬之分。
⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
估计方法: 样本均值估计总体均值
样本成数估计总体成数 样本方差估计总体方差
衡量优良估计的三个基本指标:
1.无偏性:无偏性是指用样本指标估计总体指标时 ,要求样本指标的平均数等于被估计总体指标的平 均数。 2.有效性:有效性是指用样本指标估计总体指标时 ,要求样本指标的方差最小。
3.一致性:一致性是指用样本指标估计总体指标, 当样本容量增加时,样本指标越来越接近总体指标 ,则称样本指标为总体指标的一致估计量。
5/5 多阶段抽样和多重抽样
概念: 多阶段抽样是只把抽取样本单位的过程分为 两个或更多阶段来进行的抽样组织形式。多 重抽样是指根据对不同调查目标的不同要求, 从总体中已抽取的样本中再抽样的组织形式。 区别: 1)目的不同。总体范围较大,不便于直接抽取 最终调查单位时采用多阶段抽样;为适应不同 调查项目的不同要求,达到节省人力、物力的 目的时,采取多重抽样。 2)多阶段抽样的每个阶段,抽样单位的大小是 不同的;多重抽样每次抽取的单位大小是相同 的。
第五节 假设检验
概念:假设检验就是事先对总体参数或总体分布 形式做出一个假设,然后利用样本信息来 判断原假设是否合理,从而决定接受或拒 绝原假设。
5.1 假设检验一般问题
(一)假设检验的基本思想
(二)假设检验的步骤 1.提出原假设和备择假设。 2.选择适当的统计量,并确定其分布形式。 3.选择显著性水平α,确定临界值。 4.做出结论。 (三)假设检验的小概率原理
2/2 区间估计:
概念: 区间估计就是指总体参数的区间范围,并要 求给出区间估计成立的概率值。
定义: 设 θ 是未知参数, X1 , X2 , … , Xn 是来自总体 的样本,构造两个统计量θ1=T1( X1,X2,…, Xn )和θ2 =T2( X1,X2,…,Xn ),对于 给定的α( 0 < α < 1),若θ1、θ2满足: P﹛ θ1 ≤ θ ≤ θ2 ﹜=1- α 则称随机区间[θ1、θ2]是参数θ的置信水平为1α的置信区间,而1- α称为[θ1、θ2]的置信度, θ1、θ2称为置信区间的下限和上限。
主要内容:
第一节 抽样推断概述 第二节 抽样的组织形式 第三节 抽样误差 第四节 抽样估计 第五节 假设检验 本章小结 思考题 参考书目
第一节 抽样推断概述
1.1 抽样推断的概念、特点和作用
概念: 抽样推断是在抽样调查的基础上,利用 样本的实际资料计算出样本的数据,并 运用概率估计方法推断出总体相应数量 特征值的一种统计分析方法。
总体参数: 总体分布的数量特征就是总体参数,也 是抽样统计推断的对象。常见的总体参 数有总体的平均数指标、总体比重指标、 总体分布的方差、总体标准差,等等。
样本统计量: 与总体参数对应的是样本统计量。常见 的样本统计量有样本平均数指标、样本 比重指标、样本方差、样本标准差,等 等。
3/3 重复抽样与不重复抽样
第二节 抽样的组织形式
1.纯随机抽样 2.类型抽样 3.等距抽样
4.整群抽样
5.多阶段抽样和多重抽样
1/5 纯随机抽样
概念: 也叫简单随机抽样,是指按照随机原则直接 从总体 N 个单位中抽取 n 个单位作为样本,然 后对样本单位进行观测,计算出样本指数, 并据以推算总体相应数量指标的抽样组织形 式,适用于均匀分布的总体。
p(1 p) N n p Z ( ) n N 1 2
4.4 样本容量的确定
意义: 样本容量是指一个样本中包含单位数的个数。
样本容量取得比较大,收集的信息就比较多, 从而估计精度比较高,但进行观测所投入的费 用、人力及时间就比较多;样本容量取得比较 小,则投入的费用、人力及时间就比较少,但 收集的信息也比较少,从而估计精度比较低。 这说明精度和费用对样本容量的影响是矛盾的 ,不存在既使精度最高又使费用最省的样本容 量。一个常用的准则是在使精度得到保证的前 提下寻求使费用最省的样本容量。
重复抽样: 从总体 N单位中抽取一个容量为 n的样本, 每次从总体抽取一个,连续抽取n个,每 次抽出的一个单位将其结果登记后放回, 重新参加下一次抽选。
不重复抽样: 从总体 N单位中抽取一个容量为 n的样本, 每次从总体抽取一个,连续抽取n个,但 每次抽出的一个单位将其结果登记后, 不再放回参加下一次抽选。
3/5 等距抽样
概念: 等距抽样又叫机械抽样或系统抽样,是指将 总体各单位按某一标志排列,然后按固定的 顺序或间隔抽取调查单位的一种组织形式。 种类: 1)按有关标志排序等距抽样 2)按无关标识排序等距抽样
4/5 整群抽样
概念: 是指现将总体各单位划分为 R群,以群为单位, 从中随机抽取 r 群,然后对中选群的全部单位 进行全面调查,并据以推算总体相应指标的 抽样组织形式。 特点: 1)抽样组织方便、节约调查费用; 2)调查单位集中,误差较大; 3)直接抽取的不是总体单位而是群; 4)影响抽样误差的是群间方差; 5)一般不采用重复抽样。
第七章 抽样推断
学习目标
主要内容 本章小结
学习目标
掌握利用样本统计资料来推断总体相应数量 特征的原理及方法;
深刻理解抽样推断的概念及特点; 了解抽样误差产生的原因,并对抽样误差、 抽样平均误差、抽样的极限误差加以区别, 并掌握他们的计算方法; 掌握点估计和区间估计的方法和必要样本单 位数的确定方法。
4.2 抽样估计的理论基础
Var( X ) P{| X E ( X ) | } 2
P{| X E ( X ) | } 1
Var( X )
2
4.3 抽样估计的方法
点估计是以点带面的估计方法,其特点是 1/2 点估计: 根据总 体指标 的结构 形式设 计样本指标 (统计量)作为总体参数的估计两,并且 以样本指标的实际数值直接作为相应总体 参数的估计值。
第四节 抽样估计
4.1 抽样估计的特点
概念:又称为抽样推断,也称为参数估计。它是在抽 样调查的基础上所进行的数据推测,即用抽样 调查所得到的一部分单位的数量特征来估计和 推算总体的数量特征。
特点: 在逻辑上运用归纳推理,而不是演绎推理; 在方法上运用不确定的概率估计法而不是运 用确定的数学分析法; 估计的结论存在一定的抽样误差。
区间估计的类型1/2:
1)平均数的区间估计 情况A:正态总体且方差已知,或非正态总体、 方差未知、大样本情况下, 总体均值的区间估 计。在此情况下,样本均值的抽样分布呈正态 分布,其数学期望为总体均值 ,方差为 n 。 则 x Z 2 n 称为总体均值在置信水平 1 下的 置信区间。
所谓小概率原理,是指发生概率很小的随机事件在 一次实验中是几乎不可能发生的。根据这一原理,可 以做出是否接受原假设的决定。
5.2 总体的均值、比例的假设检验
1/2 总体方差已知时对正态总体均值的假设检验
设总体X~N (μ ,σ2 ),总体方差 σ 为已知 ,( x1,x2,…,xn )为总体的一个样本,样本平均 数为 x 。现在的问题是对总体均值μ 进行假设 检验,H0: μ=μ0 (或μ≤μ0 、μ≥μ0 )。
抽样平均误差的计算1/2
当总体为N,样本容量为n时,抽样平均误差的计算公 式如下: 1)平均数的抽样平均误差的计算公式 重复抽样的情况下:
x
2
n
不重复抽样的情况下:
抽样平均误差Байду номын сангаас计算2/2
当总体为N,样本容量为n时,抽样平均误差的计算公 式如下: 1)成数的抽样平均误差的计算公式 重复抽样的情况下:
抽样推断的特点:
1)按照随机原则,抽选调查单位,是抽样推断 的前提;
2)运用概率估计法是抽样推断的特有估计方法; 3)抽样推断的误差可以事先计算并加以控制;
抽样推断的作用:
1)对有些不可能或不必要进行全面调查,但有需 要了解其全面数量情况的社会经济现象,可以运用 抽样推断实现调查的目的; 2)抽样调查与全面调查同时进行,可以发挥互相 补充和检查调查质量的作用; 3)抽样推断可以用于工业企业生产过程的质量控 制; 4)利用抽样推断方法还可以对某种总体的假设进 行检验,判断其真伪,以作出正确的决策。
第三节 抽样误差
3.1 抽样误差
A.概念:抽样误差是指由于随机抽样的偶然因素使样 本各单位的结构的代表性存在差别,而引起 的抽样指标和总体指标之间的绝对离差。
甄别: 抽样误差是抽样所产生的误差; 调查误差是指在调研过程中,由于测量、登 记、计算上的差错所引起的误差; 系统偏误是指由于随机原则,有意地选择较 好或较差的单位进行调查,造成样本代表性不 足所引起的误差。
1.2 抽样的几个基本概念
1/3 样本容量与样本个数:
样本容量:样本是从总体中抽出的部分单位的集合, 这个集合的大小称为样本容量。一般用 n 表示,它表明一个样本中所包含的单位数。 样本个数:样本个数又称为样本可能数目,是指从一 个总体中可能抽取多少个样本。样本个数 的多少与抽样的方法有关。
2/3 总体参数与样本统计量
不重复抽样的情况下:
3.3 各种组织形式下抽样平均误差的计算
A 类型抽样(重复OR不重复)
B等距抽样(重复OR不重复)
C整群抽样(不重复)
3.4 抽样的极限误差
概念: 抽样平均误差说明了某一抽样方案的误 差情况,但在实际进行抽样调查时,只 抽取一个样本,那么这个样本的误差可 能大于或小于平均误差。对于该项抽样 调查,一定会要求有一个允许误差的范 围,这一允许误差的范围,就称作抽样 极限误差,又称抽样误差范围。
影响因素:
1、总体方差的大小。总体方差越大,为保证一定的准确度 ,需要抽取更多的样本;反之,总体方差越小,可以抽取 较少的样本。
2、允许误差范围的大小。允许误差范围越小,需要抽取更 多的样本;反之,允许误差范围越大,可以抽取较少的样 本。 3、概率保证程度。概率保证程度越高,需要抽取更多的样 本;反之,概率保证程度越低,可以抽取较少的样本。 4、抽样方法。在同样的准确度要求下,重复抽样的抽样单 位数多于不重复抽样。 5、抽样的组织方式。不同的组织方式,由于产生的误差不 同,所以,要抽取的样本容量也各有差别。