2016统计基础知识(高教版 娄庆松编)课件:第四章 抽样技术概述

合集下载

统计基础知识

统计基础知识
虽然所研究的问题属于不同领域,存在千差万别,但所根据 的统计理论和方法是相通的。因此,统计学的研究具有以下特点:
(一)数量性
人们说“统计的语言是数据”指的就是统计的数量性。而 统计数据来源于调查或试验,因此统计数据是客观存在的、具体 的、有时空条件的量。
(二)总体性
统计学是以客观现象总体的数量方面作为研究对象,就是说 统计的数量研究是对总体中各单位普遍存在的数量事实进行大量 观察与综合分析,得出反映总体的数量特征。
由于统计定量研究具有客观、精确和可检验的特点,所以统 计方法就成为实证研究的最重要方法。它广泛应用于自然、社会、 经济、科学技术等领域的统计研究。
例如,政府要治理国家、作出决策、执行计划、检查监督、 宏观调控等都需要精确可靠的统计资料为基础;企业要开发产品、 市场销售、生产管理、质量控制、资金运用、投资评估等都需要 统计资料和统计方法的支持;药剂师应用统计方法进行新医药疗 效的显著性检验;工程技术人员应用统计方法测定新工艺、新材 料的创新成果;天文学家以统计方法为基础预测星体未来的位置; 生物学应用统计方法安排转基因作物田间实验;生命学家用统计 方法研究基因工程等等。
例如,一个商店的销售额在时间上每日数额有差异,每个柜 台组之间数额有差异。因此,每日每组都要统计销售额。
三、社会经济统计工作过程和职能
(一)统计工作过程
一般可分为,统计设计、数据采集、数据整理、数据分析、 数据提供和管理。
(二)统计的职能
统计具有,信息、咨询和监督三大职能。
(三)信息系统
系统,是由一些相互联系、相互作用的若干要素,为实现某 一目标而组成的具有一定功能的有机整体。把信息与系统结合起 来就组成了信息系统。
例如,国民经济分为一产、二产、三产业;按行业分为工业、 农业、建筑业等;按核算方法分为货物与服务等等。

统计学课件4

统计学课件4
统计学
(多媒体教学课件)
第四章 抽样法
1
本章相关内容
本章教学内容 本章思考与练习题 本章学习目的 本章重点、难点 本章参考资料
2
本章教学内容(6学时)
第一节 抽样法的基本原理 第二节 抽样法的应用 第三节 抽样组织方式
3
第一节 抽样法的基本原理
一、抽样法的概念 二、抽样分布 三、抽样误差
4
一、抽样法的概念
359868.6 335528.9
362.6 243281.9 408322.3 176655.7
合计
500

463200


1524020
19
解:(总体标准差未知,可用样本标准差代替)
x xf 463200 926.( 4 小时)
f 500
s
( x x )2 f
f
1524020 500
即: P( x x X x x ) F( t )
P( p p P p p ) F( t )
31
抽样平均误差的计算公式
重复抽样
不重复抽样
变 量 总
μx
σ
n

μx
σ n
1
n N

性 总 体
μp
σP n
P(1 P) n
μp
P(1 n
P)
1
n N
抽样极限误差的计算公式
变量总体
重复抽样的公式。 (4)若抽样方法未说明,一般采用不重复抽样方法;
但若 n 1, 抽样平均误差采用重复抽样的公式。 N 1000
(5)若未明确说重复抽样,且N已知,n 1, N 1000
抽样平均误差采用不重复抽样的公式。

统计学--抽样与抽样分布 ppt课件

统计学--抽样与抽样分布  ppt课件


1 n
n i 1
xi ,
S2

1 n 1
n i 1
( xi

x )2

n
1
1

n i 1
xi 2

nx
2

,

S
1 n 1
n i 1
( xi

x)2 .
ppt课件
11
抽样方法
ppt课件
12
概率抽样
(pro概b率ab抽il样ity也s叫am随机pl抽in样g),是指按随机原则抽取样本。
ppt课件
14
简单随机抽样
(simple random sampling)
1. 从总体N个单位(元素)中随机地抽取n个单位作为 样本,使得总体中每一个元素都有相同的机会(概 率)被抽中
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
随机原则,就是排除主观意识的干扰,使总体每一个单位都有 一定的概率被抽选为样本单位,每个单位能否入选是随机的。
特点
能有效地避免主观选样带来的倾向性误差(系统偏差), 使样本资料能够用于估计和推断总体的数量特征,而且 这种估计和推断得以建立在概率论和数理统计的科学理 论之上
可以计算和控制抽样误差,说明估计的可靠程度。
(1) 样本均值 :
X

1 n
n i 1
Xi,
(2)
样本方差:
S2

1 n 1
n i 1
(Xi

X )2

1 n 1

第四章 抽样技术基础知识

第四章    抽样技术基础知识
第四章 抽样技术基础知识
抽样技术的完整概念包括对样本的调查和对总体参 数的估计两个方面。首先介绍抽样调查,然后介绍总体 参数估计方法。
第一节
抽样调查
一、抽样调查的概念 抽样调查是统计学的重要分支,它已经成为当今世 界上最重要的统计方法。它广泛应用于社会、经济、科 技和自然等各个领域,成为现代统计学中发展最快、最 活跃的一个分支。 (一)抽样调查 它是一种非全面调查,是根据随机原则从总体中抽 取部分单位进行调查。这部分单位称为样本。而这部分 单位数目的多少不是随心所欲确定的,是根据一定原则 和要求用科学的方法计算来确定。所谓随机原则,就是 可能性原则,是指在抽取样本单位时,完全排除人们的 主观愿望,使总体中的每个单位机会确定,抽中与否全 凭偶然。
(四)参数和统计量 1.参数 2 即总体平均数,用 表示,总体标准差用σ 表示,总体成数 X (比重)用P 表示,这些数据在抽样技术称为参数。由于总体是 唯一确定的,总体参数也是唯一确定的。 2.统计量 样本平均数用 x表示,样本标准差用s 表示,样本成数用p 表示,这些数据在抽样技术称为统计量。 成数指总体或样本中具有某种属性的单位数占全部单位数的 比重。如,一片森林中病株数的比重、一批产品中合格品比重、 一片农作物中缺苗断垄数比重、某市居民拥有计算机户比重、某 电视节目收视率等等。 本节小结: (一)样本是从总体中随机抽取的一部分单位。 (二)参数是总体数量特征,是用样本统计量估计出来的。 (三)统计量是由样本变量直接计算得到的。
2.区域抽样框,按自然地域划分并排列出总体所有单位。例 如,一片土地划分为若干地块并编号、一片森林划分为若干林区 并编号等。 3.时间表抽样框,按时间顺序排列总体单位。例如,流水线 生产的产品质量检验,把一天划分为若干时段并按顺序排列。 抽样框的编制是抽样调查的前提条件,要求不重不漏来保证 样本对总体的代表性。 (二)总体和样本 总体指所要研究现象的整体,用字母N 表示。如,从1万平 方米小麦中抽取500平方米进行产量调查,则N =10000平方米。 样本,指从总体中抽取的样本单位数,用字母n 表示。如, 上例中n =500平方米 (三)大样本和小样本 大样本和小样本是根据样本容量多少来划分的。n≥30时为 大样本,n <30时为小样本。

统计学抽样PPT课件

统计学抽样PPT课件
第25页/共31页
例2 根据经验,某高校历年入学新生 的平均数为167厘米,标准差为10厘米。 现从今年入学新生中随机抽查了30名学 生,测得其平均身高为169厘米,如果 标准差与往年一样,能否 第26页/共31页 在а=0.05的
例3、某公司引进一自动包装线包装大 米,合同规定设计规格为每袋大米10公 斤,标准差为0.6公斤,生产调试后随机 抽取100袋大米平均重量为9.8公斤。问
感谢您的观看!
第31页/共31页
1、点估计 点估计是直接用样本指标推断总体指标的一种方法。 点估计的特点是只考虑了样本指标,而没有考虑抽样误差。
第17页/共31页
2、区间估计
(1)理论准备
所谓区间估计就是在一定概率保证下, 确定总体参数值的可能范围。
所谓概率就是指在随机事件进行大量 实验中,某种事件出现的可能性的大小。
抽样估计的概率保证程度就是指抽样 第18页/共31页
第27页/共31页
例4、取8台新型发动机进行测试,其结 果是使用柴油每公升的运转时间分别为 28、27、31、29、30、27、30、27 分钟。根据设计要求,平均每公升运转 应在30分钟以上。问根据实验结果,在
第28页/共31页
例5、某产品的耐用时间为1000小时, 现随机抽取10件新工艺条件下的产品作 测试,测得平均耐用时间为1077小时, 标准差为51.97小时,能否认为新工艺 条件下产生的产品明显不同于老产品?
第15页/共31页
例2:随机抽取500名某国私人对外投资 者,发现对外投资额在5000万元以上的 人数有80人,求抽样误差。 例3:一批食品随机抽查50箱,发现一 箱不合格,求合格率的抽样误差。
第16页/共31页
三、点估计和区间估计

2016统计基础知识(高教版 娄庆松编)课件:第二章 数据的采集与整理

2016统计基础知识(高教版 娄庆松编)课件:第二章 数据的采集与整理

3.调查单位和调查表 调查提纲是指根据调查目的所列示出的调查项目,主要是标 志、指标和指标体系。将调查项目按一定顺序排列在表格中形成 调查表。 4.调查时间与期限 调查时间是指资料所属时间;调查期限是指完成调查工作所 需时间。 5.组织实施计划 指调查工作的行动部署与具体活动安排。主要包括领导机构 建立、调查步骤、参调单位与人员、人员培训与试点、汇总整理 办法、资料报送、经费开支和预算等等。 (四)试验 对客观现象的科学观察和科学实验统称为试验。 1.对照实验 设计一个实验来测试某被调查对象的数据,是在一次真实的 现场实验中逐步展开,在调查人员控制之下的活动过程,来获取 统计数据。
第一节
第一手数据
数 据
统计数据的采集
统计调查 科学试验
图2-1简明扼要地展示了数据的来源
第二手数据
来源于他人调查数据 来源于试验调查数据
图2-1 数据来源
一、统计数据的直接来源 (一)统计调查 统计调查的组织形式入图2-2所示:
调查 范围
全面调查
统 计 调 查 形 式
非全面调查
调查 时间 连续(经常性)调查 不连续调查 定期报表 组织 形式 专门调查
组织形式: (1)建立专门普查机构和普查人员,对普查单位逐一登记。 如表2-1所示。
表2-1 人口普查表 本户 省市 县 乡 村 住址_自治区_市_街道_居委会_居民小组(街巷
号)
姓 与户 性 年 民 常住人 文化 职 名 主关 别 龄 族 口户口 程度 业 业 系 登记状 况 1 2 3 4 5 6 7 8 9
统计基础知识
编 者 娄庆松
第二章
第一节 第二节 第三节
数据的采集与整理
统计数据的采集 统计数据的整理 统计数据的显示

抽样技术PPT教学课件

抽样技术PPT教学课件

(2)不重复抽样时 :
样本个数=4×3=12
• 若改变样本单位数,取n=3 ,
样本个数=4×3×2=24
18
必要样本容量的影响因素
STAT
允许误差范围的大小; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。
19
§4.2 随机抽样技术 STAT 一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
例:总体群数R=16
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本群数r=4
样本容量
n nd np nl nh
简单、方便,易于组织,能节省人力、物力、财力 和时间,但其限制了样本在总体中分配的均匀性。 40
特点
STAT
(1)总体和样本都是由“群”组成; (2)引起的抽样误差的方差是群间方差, 群内方差不影响抽样误差; (3)整群抽样均为不重复抽样,可提高样 本的代表性。
34
解:根据最低成本抽样法,则
n大

(50
5020000
20000) / 1508000
600 3005000

30
600
500
400
7家
n中

(150 8000) / 5020000 1508000
500 3005000

30
600
500
400
9家
ni
Ni i / (Ni i /
ci n ci )
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数
i 为第i层Biblioteka 标准差ci 为第i层每单位的调查费用

2016统计基础知识(高教版 娄庆松编)课件:第四章 抽样技术概述

2016统计基础知识(高教版 娄庆松编)课件:第四章 抽样技术概述
E,C 20,16 x =18 E,D 20,18 x =19 E,E 20,20 x =20
将表4-1整理成样本平均数变量分布数列表4-2和变量分布频 率图如图4-4。
表4-2 样本平均数变量分布数列 14 15 16 17 18 19 20 合计
均值 x
12
13
频数f
频率P(
x
1
2
3
4
5
4
3
2
图4-2
掷两颗骰子时的36种事件
二、抽取样本单位的方法和抽样误差 根据每次从总体中抽取一个样本单位进行调查登记后,是否 再把这个样本单位放回原总体中去,抽取样本单位方式有重复抽 样和不重复抽样两种方法。 (一)重复抽样 重复抽样也称回置抽样,它是从总体N个单位中随机抽取一 个容量为n的样本,每次从总体中随机抽到一个单位就看成一次 试验,连续进行n次试验组成一个样本。每次抽取并记录事件后 把被抽中的单位放回总体中重新参加下次抽取。这样,总体单位 数不变,已经被抽中的样本单位仍然有同等机会再被抽中。 1.样本平均数的变量分布和抽样平均误差 样本平均数的变量分布是由总体中全部可能样本平均数的取 值和与之相应的概率组成。 例如,某班组A、B、C、D、E五个工人的日基本工资分别为: 12、14、16、18、20元。下面计算出总体平均数和总体方差:
(四)与其他调查方式结合运用,互相补充与核对。 如,抽样技术与普查相结合可以检查核对普查数据的准确 性;与重点调查相结合,有利于掌握总体数量特征。 (五)进行假设检验,判断真伪。 如,某项新工艺、新配方或农业新品种在生产中的推广是否 具有显著价值,可通过抽样推断进行假设检验,决定是采用还是 放弃。 四、抽样技术中的几个基本概念 (一)抽样框 是指供抽样所使用的所有调查单位的详细名单。如,从5万 名职工中随机抽取300名职工组成一个样本,则5万职工的名册就 是抽样框。 抽样框有以下形式: 1.名单抽样框,即以名册或清单形式列出总体所有单位。如, 学生名册、企业名录、职工名单、住户名单、村庄名单、社区名 单等等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(四)与其他调查方式结合运用,互相补充与核对。 如,抽样技术与普查相结合可以检查核对普查数据的准确 性;与重点调查相结合,有利于掌握总体数量特征。 (五)进行假设检验,判断真伪。 如,某项新工艺、新配方或农业新品种在生产中的推广是否 具有显著价值,可通过抽样推断进行假设检验,决定是采用还是 放弃。 四、抽样技术中的几个基本概念 (一)抽样框 是指供抽样所使用的所有调查单位的详细名单。如,从5万 名职工中随机抽取300名职工组成一个样本,则5万职工的名册就 是抽样框。 抽样框有以下形式: 1.名单抽样框,即以名册或清单形式列出总体所有单位。如, 学生名册、企业名录、职工名单、住户名单、村庄名单、社区名 单等等。

查 理 总
总体指标
样本指标
(四)抽样设计 是指从研究总体中抽取样本之前,预先确定抽样方案。将调 查资料使用者、抽样专家、活动组织者和数据处理人员召集起来 协商探讨共同确定抽样方案。基本内容有:1.确定目的、任务和 要求;2.确定抽样框和样本单位;3.确定组织方式和抽取样本单 位的方法;4.确定估计精度要求;5.确定抽样数目和估计方法; 6.确定总体方案和工作程序。 二、抽样技术的特点 (一)在调查单位的抽取上,遵循随机原则。 随机原则使样本单位的抽取不受任何主观因素影响,使所抽 取的样本变量分布与总体变量分布相类似,从而保证样本的代表 性和估计的无偏性。 (二)在调查功能上,用样本数据估计总体数据。 抽样调查是非全面调查,它具有从部分到总体、由具体到一 般的推断功能。
总体工人日平均工资 X =(12+14+16+18+20)/5 =16(元) 总体工人日工资方差:
σ
2
X
= [(12-16) +(14-16) +(16-16) (18-16) +(20-16) ]/5 = 8(元)
2
2
2
2
2
用重复抽样的方法从五人中随机抽2人组成样本,即样本容 量a=2,调查记录后再放回总体中去重新参加下次抽取。那么,可 能会有几种组合形式的样本呢?根据排列组合法共有25个样本, 各样本的日平均工资可列表4-1显示,重复抽样过程见图4-3。
第一节
抽样技术概念
一、抽样技术的涵义 抽样技术是统计学的重要分支,它已经成为当今世界上最重 要的统计方法。它广泛应用于社会、经济、科技和自然等各个领 域,成为现代统计学中发展最快、最活跃的一个分支。 抽样技术的完整概念应包括对样本的调查和对总体数据的估 计两个方面。这里首先介绍抽样调查,然后介绍总体数据估计的 基本理论和方法。 (一)抽样调查 它是一种非全面调查,是根据随机原则从总体中抽取部分单 位进行调查。这部分单位称为样本。而这部分单位数目的多少不 是随心所欲确定的,是根据一定原则和要求用科学的方法计算来 确定。所谓随机原则,就是可能性原则,是指在抽取样本单位时, 完全排除人们的主观愿望,使总体中的每个单位机会均等,抽中 与否全凭偶然。
E,C 20,16 x =18 E,D 20,18 x =19 E,E 20,20 x =20
将表4-1整理成样本平均数变量分布数列表4-2和变量分布频 率图如图4-4。
表4-2 样本平均数变量分布数列 14 15 16 17 18 19 20 合计
均值 x
12
13
频数f
频率P(
x
1
2
3
4
5
4
3
2
统计基础知识
编 者 娄庆松
第四章
第一节 第二节 第三节
抽样技术概述
抽样技术概念 抽样调查和抽样误差 参数估计
第四章
抽样技术概述
学习要点
一、理解和掌握抽样调查的概念、特点和作用。 二、掌握抽样技术中常用的基本概念。 三、熟练掌握抽样平均误差的概念、影响因素和计算方法 四、熟练掌握极限抽样误差的概念和计算方法。 五、掌握必要抽样数目的意义和计算。 六、了解全及总体总量指标的推算和抽样调查组织方式。
(三)在推断手段上,以概率估计方法进行总体推断。 抽样估计是以概率论为基础的估计方法,用样本数据估计总 体数据时,其可靠性用一定概率保证程度来说明。例如,用城市 居民样本数据估计某电视节目的收视率、用居民样本数据估计全 市居民家庭收支情况等等。 (四)在推断理论上,用大数定律的中心极限定理为基础。 中心极限定理证明随着样本单位数的增加,样本变量分布趋 向正态分布,样本平均数接近总体平均数、样本标准差接近总体 标准差,从而为用样本数据估计总体相应数据提供了科学的理论 依据和方法。 (五)在推断效果上,抽样误差可以计算并加以控制。 用样本数据估计总体相应数据会存在一定误差,根据中心极 限定理和正态分布规律,抽样误差可以事先计算出来并可以控制, 从而使抽样估计具有一定的可靠程度。
第二节
抽样调查和抽样误差
一、随机事件与概率 (一)随机事件 在相同条件下,每次试验可能出现也可能不出现的状态称为 随机事件。 例如,掷一对骰子,两颗骰子落下时总共有多少种状态呢? 白色骰子能够以6种状态中任何一种状态落下:
譬如当白色骰子显示
时,黑色骰子仍有6种状态落下:
这里,骰子落下所呈现的每种状态称为随机事件。
(二)抽样估计 抽样估计是在抽样调查的基础上,利用样本数据根据概率论 来估计总体相应数据的统计分析方法。 (三)抽样技术 总体、总体指标、样本、样本指标、抽样误差、概率估计等 概念构成了抽样技术中的最基本范畴。它们的关系如图4-1。
图4-1 抽样技术关系图 随机取样

反 映


调 整 汇 概率估计
C,C 16,16 x =16 C,D 16,18 x =17 C,E 16,20 x =18
D,A 18,12 x =15 D,B 18,14 x =16
D,C 18,16 x =17 D,D 18,18 x =18 D,E 18,20 x =19
E,A 20,12 x =16 E,B 20,14 x =17
x x f
2
f
= n
X X 1
N
2
4(元)= 8/2(元)
x x f
2
f
1 = n
ቤተ መጻሕፍቲ ባይዱX X
N
2
2(元) = 4/2(元) 因此,统计学将样本均值与总体均值之间的平均离差的1/n 称为抽样平均误差简称抽样误差,以μ 表示。换言之,抽样误差 等于总体方差除以样本单位数之商的平方根,即:
1
25
) 0.04 0.08 0.12 0.16 0.20 0.16 0.12 0.08 0.04 1.00

f f
0.200.160.120.080.040 12
13 14 图4-4
15 16 17 18 19 变量分布频率图
20
x ( 元)
图4-4显示样本平均数变量数列呈现正态对称分布形态。 根据表4-2计算样本平均数的平均数和方差,见表4-3。
(二)概率
一个随机试验由许多可能的事件,我们不仅想知道它们有 那些可能的事件,而且还想知道某些事件出现的可能性的大小, 并希望将这一可能性用数值描述出来。为了定量地描述随机事件, 人们引入了一个描述随机事件发生可能性大小的统计数据——随 机事件的概率。某一随机事件发生的次数占所有随机事件发生次 数的比率就是该事件的概率。许多数学家、统计学家对概率及其 计算作出了巨大的贡献,提出了概率论的公理化体系。概率论, 就是研究随机事件规律性的科学。 图4-2中显示出两颗骰子出现的可能事件有6×6=36种。它们 都是等可能的,所以每一个事件都有36次中一次机会。
-1 0 1 2 3 4 —
1 0 1 4 9 16 —
4 0 4 12 18 16 100
下面计算:
样本均值的均值
xf x = f
= 400/25 = 16(元) = 100/25 = 4(元)
样本均值的方差
x x

f
2
f
2
样本均值标准差
x x f
f
100 = 25
图4-2
掷两颗骰子时的36种事件
二、抽取样本单位的方法和抽样误差 根据每次从总体中抽取一个样本单位进行调查登记后,是否 再把这个样本单位放回原总体中去,抽取样本单位方式有重复抽 样和不重复抽样两种方法。 (一)重复抽样 重复抽样也称回置抽样,它是从总体N个单位中随机抽取一 个容量为n的样本,每次从总体中随机抽到一个单位就看成一次 试验,连续进行n次试验组成一个样本。每次抽取并记录事件后 把被抽中的单位放回总体中重新参加下次抽取。这样,总体单位 数不变,已经被抽中的样本单位仍然有同等机会再被抽中。 1.样本平均数的变量分布和抽样平均误差 样本平均数的变量分布是由总体中全部可能样本平均数的取 值和与之相应的概率组成。 例如,某班组A、B、C、D、E五个工人的日基本工资分别为: 12、14、16、18、20元。下面计算出总体平均数和总体方差:
表4-3
x
重复抽样样本平均数的平均数和方差计算表
12 13 14
f 1 2 3
x
f ( x- x ) ( x - x ) 12 -4 16

2
( x - x ) •f 16 18 12
2
26 42
-3 -2
9 4
15 16 17 18 19 20 合计
4 5 4 3 2 1 25
60 80 68 54 38 20 400
三、抽样技术的作用 由于抽样技术具有费用低、时效强、准确度高、应用范围广 等优点,抽样技术广泛应用于众多领域。 (一)用于那些不能或难以采用全面调查的情况。 无限总体,如宇宙探测、大气监测或生态保护等的调查;动 态总体,如产品质量监测、物价管理等的调查;范围大,分布过 散的有限总体,如居民收支调查、水中鱼苗调查、森林木材蓄积 量等调查。 (二)用于不宜全面调查,而须了解总体数据的情况。 如,灯泡、轮胎等产品的耐用时间破坏性质量检验;饮料食 品等品尝性检验;人体血液等健康性检验等。 (三)用于采集灵敏度高、时效强、时间要求紧迫的资料。 如市场动态、商品交易额、股市行情、抢险救灾和战时物资 质量检验等。
相关文档
最新文档