第5章抽样调查与推断
社会调查研究方法教案第5章 抽样

第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(sampling unit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(sampling frame)又称做抽样X围,它指的是一次直接抽样时总体中所有抽样单位的。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
第五章 抽样调查

第二种方案:洛阳市所有小学的名单(第一抽样框), 从中抽取10所学校(抽样单位是学校);被抽中 学校的所有班级名单(第二抽样框),每个学校抽 10个班级,共抽取100个班级。(抽样单位是 班级);被抽中班级的所有学生名单(第三抽样 框),每个班级抽20名学生,共抽取2000名 学生,(抽样单位是学生).
18-30 31-50 50以上 小计 总计
200
缺点 虑其中的几种,不可能做出很细的分类
1. 分层不可能兼顾总体的众多属性,只能考 2. 总体分布变化的最新信息不容易得到,因
而配额的合理性很难保证
3. 主观性很大。如一个访问员会本能地避免 访问难以找到的受访者。
四、滚雪球抽样(Snowball Sampling)
(4)依据从随机数表中选出的数码,到抽样 框中寻找它所对应的元素。 练习: 试用简单随机抽样方法在洛阳师范学院抽取 2000名学生。 请思考:操作的难点是什么?
优点:概率抽样的理想类型,简单易行,误差小。 缺点: 1. 需要为总体每个要素编号,当总体所含个 体的数目太多时采用这种方法费时费力; 2. 总体内分类明显时,这种抽样无法按类别 特征自动分配样本数,若想保证样本的代表性,必 须增大样本量,使工作量增大。
院系——专业——班级——学生
抽样框 抽样单位 院系 专业 班级
第一抽样框:所有院系的名单 第二抽样框:抽中院系的所有专 业名单 第三抽样框:抽中专业的所有班 级名单
第四抽样框:抽中班级的所有学 生名单
学生
四、 抽样的原则
随机原则(random principle):在完全
排除主观上人为选择的前提下,使总体中 每一个单位有相同被抽中的机会。——概 率抽样
统计学 第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。
(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。
全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。
(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。
社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。
样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。
一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。
在样本容量确定之后,样本的可能数目便完全取决于抽样方法。
抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。
抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。
在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。
样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。
第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x
x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2
《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
统计学第5章抽样推断
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
统计学第五章课后题及答案解析
第五章一、单项选择题1.抽样推断的目的在于( )A.对样本进行全面调查 B.了解样本的基本情况C.了解总体的基本情况 D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于( )A.样本单位数 B.总体方差C.抽样比例 D.样本单位数和总体方差3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差( )A.一年级较大 B.二年级较大C.误差相同 D.无法判断4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将( )A.高估误差 B.低估误差C.恰好相等 D.高估或低估5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量( )A.扩大到原来的2倍 B.扩大到原来的4倍C.缩小到原来的1/4 D.缩小到原来的1/26.当总体单位不很多且差异较小时宜采用( )A.整群抽样 B.纯随机抽样C.分层抽样 D.等距抽样7.在分层抽样中影响抽样平均误差的方差是()A.层间方差 B.层内方差C.总方差 D.允许误差二、多项选择题1.抽样推断的特点有()A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题C.用样本指标来推断总体指标 D.抽样误差可以事先计算E.抽样误差可以事先控制2.影响抽样误差的因素有( )A.样本容量的大小 B.是有限总体还是无限总体C.总体单位的标志变动度 D.抽样方法E.抽样组织方式3.抽样方法根据取样的方式不同分为( )A.重复抽样 B.等距抽样 C.整群抽样D.分层抽样 E.不重复抽样4.抽样推断的优良标准是( )A.无偏性 B.同质性 C.一致性D.随机性 E.有效性5.影响必要样本容量的主要因素有( )A.总体方差的大小 B.抽样方法C.抽样组织方式 D.允许误差范围大小E.要求的概率保证程度6.参数估计的三项基本要素有()A.估计值 B.极限误差C.估计的优良标准 D.概率保证程度E.显著性水平7.分层抽样中分层的原则是( )A.尽量缩小层内方差 B.尽量扩大层内方差C.层量扩大层间方差 D.尽量缩小层间方差E.便于样本单位的抽取三、填空题1.抽样推断和全面调查结合运用,既实现了调查资料的_______性,又保证于调查资料的_______性。
第五章《用样本推断总体》复习讲义(解析版)
第五章 用样本推断总体(考点讲义)1.样本容量:样本中个体的数目叫做样本容量。
2.在用样本特性估计总体特性时,要注意一是样本要有代表性,二是样本容量要足够大。
3.求平均数的公式:123nx x x x x n++++=L【类型一】利用样本平均数估算总体数量【例1】为了创设全新的校园文化氛围,进一步组织学生开展课外阅读,让学生在丰富多彩的书海中,扩大知识源,亲近母语,提高文学素养.某校准备开展“与经典为友、与名著为伴”的阅读活动,活动前对本校学生进行了“你最喜欢的图书类型(只写一项)”的随机抽样调查,相关数据统计如下:请根据以上信息解答下列问题:(1)该校对_____名学生进行了抽样调查,m = _____n =_____(2)请将图1和图2补充完整,并求出扇形统计图中小说所对应的圆心角度数;(3)已知该校共有学生800人,利用样本数据估计全校学生中最喜欢科幻人数约为多少人?【解析】(1)用其它初一它的百分比即可;(2)用360∘乘以所占得百分比;(3)用样本估计总体.解:(1)20÷10%=200(名).由图1,得n=40,m=100-20-10-40=30答:该校对200名学生进行了抽样调查;m=30,n=40(2)如图:小说对应的圆心角度数为360∘×20%=72∘;(3)800×30%=240.答:全校学生中最喜欢小说的人数约为240名.【对应训练1】为了估计湖里有多少条鱼,小刚先从湖里捞出了100条鱼做上标记,然后放回湖里去.经过一段时间,带有标记的鱼完全混合于鱼群后,小刚又从湖里捞出200条鱼,如果其中15条有标记,那么估计湖里有鱼()A.1333条B.3000条C.300条D.1500条【答案】A【解析】在样本中“捕捞200条鱼,发现其中15条有标记”,即可求得有标记的所占比例,而这一比例也适用于整体,据此即可解答.【对应训练2】我国古代数学名著《九章算术》有“米谷粒分”.粮仓开仓收粮,有人送来谷米1608石,验得其中夹有谷粒.现从中抽取谷米一把,共数得256粒,其中夹有谷粒32粒,则这批谷米内夹有谷粒约是________石.【答案】201【解析】根据256粒内夹谷32粒,可得比例,再乘以1608石,即可得出答案.【解答】解:根据题意,得1608×32=201(石),256∴这批谷米内夹有谷粒约201石.【对应训练3】某山区中学280名学生参加植树节活动,要求每人植3至6棵,活动结束后随机抽查了若干名学生每人的植树量,并分为四种类型,A:3棵;B:4棵;C:5棵;D:6棵,将各类的人数绘制成扇形图(如图1)和条形图(如图2).回答下列问题:(1)这次调查一共抽查了________名学生的植树量;请将条形图补充完整;(2)被调查学生每人植树量的众数是________棵、中位数是________棵;(3)求被调查学生每人植树量的平均数,并估计这280名学生共植树多少棵?【解析】(1)由B类型的人数及其所占百分比可得总人数,总人数乘以D类型的对应的百分比即可求出其人数,据此可补全图形;(2)根据众数和中位数的概念可得答案;(3)先求出样本的平均数,再乘以总人数即可.【解答】(1)这次调查一共抽查植树的学生人数为8÷40%=20(人),D类人数=20×10%=2(人);条形图补充如图:(2)植树4棵的人数最多,则众数是4,共有20人植树,其中位数是第10、11人植树数量的平均数,则中位数是4,(3)x=4×48×562×7=5.3(棵),205.3×280=148(棵).答:估计这3280名学生共植树1484棵.【类型二】用样本估计总体【例2】为了提高学生的综合素养,某校开设了五门第二课堂活动课,按照类别分为:A“剪纸”、B“绘画”、C“雕刻”、D“泥塑”、E“插花”.为了了解学生对每种活动课的喜爱情况,随机抽取了部分同学进行调查,将调查结果绘制成如下两幅不完整的统计图.根据信息,回答下列问题:(1)本次调查的样本容量为________,统计图中的a=________,b=________;(2)通过计算补全条形统计图;(3)该校共有3000名学生,请你估计全校喜爱“雕刻”的学生人数.解:(1)样本容量为1815%=120,a=120×10%=12,b=120×30%=36.故答案为:120;12;36.(2)组频数:120―18―12―30―36=24(人),补全条形统计图如图所示:(3)3000×30120=750(人),答:该校喜爱“雕刻”约有750人.【跟踪训练1】在一个不透明的盒子中装有20个黄、白两种颜色的乒乓球,除颜色外其它都相同,小明进行了多次摸球试验,发现摸到白色乒乓球的频率稳定在0.2左右,由此可知盒子中黄色乒乓球约有…()A.2个B.4个C.18个D.16个【答案】D【跟踪训练2】质检部门从1000件电子元件中随机抽取100件进行检测,其中有2件是次品.试据此估计这批电子元件中大约有________件次品.【答案】20【解析】根据随机抽取100件进行检测,其中有2件是次品,可以计算出这批电子元件中大约有多少件次品.【跟踪训练3】书籍是人类进步的阶梯.为了解学生的课外阅读情况,某校随机抽查了部分学生本学期阅读课外书的册数,并绘制出如下统计图.(1)共抽查了多少名学生?(2)请补全条形统计图,并写出被抽查学生本学期阅读课外书册数的众数、中位数;(3)根据抽查结果,请估计该校1200名学生中本学期课外阅读5册书的学生人数.解:(1)12÷30%=40(名).(2)如图所示,由图知,众数为5,中位数为5.(3)∵抽查的样本中,课外阅读5册书的学生人数占14×100%=35%,40∴估计该校学生课外阅读5册书的学生人数约占35%,∴该校1200名学生中课外阅读5册书的学生人数约为1200×35%=420(人).【类型三】用样本频率估计总体频率【例3】中长跑(男生1000m,女生800m)是河南省某市中招体育考试的必考项目.甲、乙两校为了解本校九年级学生的训练情况,各随机抽取了20名九年级学生的中长跑模拟测试成绩(满分:30分),将成绩进行统计、整理与分析,过程如下:【收集数据】【整理数据】整理以上数据,得到模拟测试成绩x(分)的频数分布表.【分析数据】根据以上数据,得到以下统计量.根据以上信息,回答下列问题:(1)填空:a= ________,b=_________, m=________, n=________;(2)综合上表中的统计量,推断________校学生中长跑成绩更好,理由为________(写出一条即可)(3)若甲、乙两校各有800名学生,请估计两校中长跑模拟测试成绩不低于25分的学生一共有多少名?解:(1)由数据可得,a=7,b=8,m=24.75,n=23.4. 故答案为:7;8;24.75;23.4.(2)甲校学生成绩的平均数比乙校学生成绩的平均数高,且甲校学生成绩的方差比乙校学生成绩的方差小,成绩较稳定.(答案不唯一,合理即可)故答案为:甲.=720(名),(3)(800+800)×1082020答:估计两校中长跑模拟测试成绩不低于25分的学生一共有720名.【跟踪训练】今年是建党100周年,为了让全校学生牢固树立爱国爱党的崇高信念,某校开展了形式多样的党史学习教育活动,八、九年级(各有500名学生)举行了一次党史知识竞答(满分为100分),然后随机各抽取20名同学的成绩进行了收集、统计与分析,过程如下:【收集数据】两个年级抽取的20名同学的成绩如下表:八年级:7968878985598997898998938586899077898379九年级:8688979194625194877194789255979294948598【整理数据】将两个年级的抽样成绩进行分组整理:成绩x(分)50≤x<6060≤x<7070≤x<8080≤x<9090≤x<100八年级113114九年级2a b411【分析数据】抽样的平均数、众数、中位数、方差和优秀率(90分及以上为优秀)如下表:年级统计量平均数众数中位数方差优秀率八年级8589c80.420%九年级859491.5192d请根据以下信息,回答下列问题:(1)填空:a=________,b= ________,c=________,d=________;(2)请估计此次知识竞答中,八年级成绩优秀的学生人数;(3)小李同学认为九年级的整体成绩更好,请从至少两个方面分析其合理性.解:(1)由表中数据可知,九年级落在60≤x<70内的只有62,故a=1;九年级落在70≤x<80内的有71,78,故b=2;八年级成绩按照从小到大的顺序排列后,落在第10,11的数为87,89,∴中位数为88,故c=88;九年级90分及以上的学生有11人,∴九年级的优秀率为1120×100%=55%.故答案为:1;2;88;55%.(2)∵500×20%=100,∴估计此次知识竞答中,八年级成绩优秀的学生人数为100人.(3)九年级抽样成绩的众数,中位数和优秀率均高于八年级,说明九年级平均成绩更高,高分更多,因此九年级整体成绩更好.【类型四】用样本推断总体的实际应用【例4】某运动鞋经销商随机调查某校40名女生的运动鞋号码,结果如下表:鞋的号码35.53636.53737.5人数4616122现在该经销商要进200双上述五种运动鞋,你认为应该怎样进货比较合理?解析:先求出各鞋码所占比例,再乘200,即可得到所需进货数.解:由表中数据可知各鞋码的女生的比例,根据比例进货.需要进35.5码运动鞋:200×440=20(双),需要进36码运动鞋:200×640=30(双)需要进36.5码运动鞋:200×1640=80(双),需要进37码运动鞋:200×1240=60(双)需要进37.5码运动鞋:200×240=10(双)。
第5章 抽样调查
7/47
基本术语
1、总体
总体是指根据调查计划的目的所规定 的调查整体。市场调查者应在明确调 查整体后,再实施相应的市场调查活 动。定义总体是要解决:总体的范围、 性质和构成。
8/47
2、样本和样本单位 样本是由一定数量的样本单位组成, 能代表总体的子集。样本单位是按一 定的抽样方法从总体中抽取出来,是 调查中最基本的被调查对象。
22/47
抽样的分类:
抽样技术
随机抽样技术 简 系 分 分 多 单 统 层 群 阶 抽 样随 样随 样随 样随 段 样 机 机 机 机 随 抽 抽 抽 抽 机
非随机抽样技术
固 定 样 本 法 连 续 抽 样
任 意 抽 样
判 断 抽 样
配 额 抽 样
滚 雪 球 抽 样
23/47
• 随机抽样又称概率抽样,是指以概率论为基
28/47
二、随机抽样技术及应用 随机抽样方法可分为五种,即简单随 机抽样、系统或等距随机抽样、分层 随机抽样、分群随机抽样和多阶随机 抽样。
29/47
1、简单随机抽样
• 简单随机抽样就是总体中的第一个单位在抽 取时都有相同的被抽中机会。其概率公式为: • 抽样概率=样本单位数 /总体单位数 • 一般应用于调查总体中各个体之间差异程度 较小,或者调查总体数量不太多的情况。
经国务院批准,我国于2005年底开展了全国1%人口抽样调查工作。这次 调查以全国为总体,以各省、自治区、直辖市为次总体,采取分层、多阶 段、整群概率比例的抽样方法。最终样本单位为调查小区。这次调查的样 本量为1705万人,占全国总人口的1.31%。
截止2005年11月1日零时,全国总人口为130,628万人,与2000年11月1日零 时第五次全国人口普查的总人口126,583万人相比,增加了4,045万人,增 长3.2%;年平均增加809万人,年平均增长0.63%。根据调查数据推算, 2005年年末总人口为130756万人。 全国人口中,男性为67,309万人,占总 人口的51.53%;女性为63,319万人,占总人口的48.47%。性别比(以女性 为100,男性对女性的比例)为106.30,与第五次全国人口普查相比下降 0.44。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
尽管它们的数量仅占总数的0.2%,但是它们的用 电量却占总用电量的14.4%,对于其他层,建筑物 的数量是根据单位成个获得最大精度的基本条件来
决定的。
2020/8/5
13
仔细设计调查表,并且在正式调查之前做试验性 调查,采用个人采访法搜集资料。最后,搜集到 616个商业建筑物中的526个建筑物的资料, 85.4%的答复率是很不错的。目前,辛辛那提 电气公司正在用调查得到的结果,进行能源需求 的预测和改进对商业顾客的服务。
随机原则(同等可能性原则),就是总体中的 每个单位被抽中的机会均等,每个单位是否抽中 是随机的、客观的、偶然的。不是主观的。
抽样调查可以分为两类,即概率抽样和非概率抽样。 1、概率抽样 概率抽样是按照随机原则进行抽样,不加主观因素,组 成总体的每个单位都有被抽中的概率(非零概率),可以 避免样本出现偏差,样本对总体有很强的代表性。
调查需要搜集诸如楼面面积、雇员数量、能源最终使 用量、建筑物寿命、建筑材料类型及能源节约标准等有关 商业建筑物的大量资料。在准备调查期间,该公司的分析 家们发现,在该公司服务的范围内,有大约27000个商业 建筑物、根据调查可使用的经费和精度的要求.他们建议 选择16个商业建筑物作为一个凋查样本。
1984
里根(59%) 里(59.2%)
1988
布什(56%) 布(53.9%)
对人的评价比对物的评价要更困难
生活在调查中的现代人,调查无所不在 抽样调查是应用最广泛的调查方式
在国外,抽样调查几乎应用于所有领域 在国内,抽样调查应用发展迅速 如人口变动调查,劳动力调查,社会问题研究, 电视收视率调查,满意度调查,以及各种民意调 查等。
第五章
抽样推断
2020/8/5
1
[内容提要]
抽样推断是统计研究中的一种重要分析方法。学习本 章要求掌握能利用统计资料来推断总体数量特征的原 理及方法,其具体要求: 理解抽样推断的概念及特点 深刻理解抽样误差产生的原因 对抽样误差、抽样平均误差、抽样极限误差加以区 别 重点掌握简单随机抽样组织形式的区间估计方法 掌握必要样本单位数的确定方法
实证依据:老鼠实验,随着实验笼里老鼠密度增 高,老鼠表现烦躁不安,母鼠不愿看护自己幼鼠, 抢食现象加剧,最后导致自相残杀。
需研究的问题:这类现象在人类中是否存在? 难点:对人类无法使用象老鼠那样进行自相残杀 的实验。 两组设计人员分别提出了各自的方法
2020/8/5
7
组A:采用问卷法,具体做法是 1. 确定房间面积,招聘应试人员 2. 设计调查问卷,反映受访者心态变化,如是否喜欢新 增加的陌生人,是否容忍活动区域的减小
科学体现在对抽样误差的把握 误差的计算与控制是我们面临的严重挑战
不同方法有不同特点,如何选择恰当的方法? 下面有几个案例: 案例一:人口密度和人的行为的关系研究 假说:人口密度过高可能产生负效应,引发犯罪 和精神病 理论依据:马尔萨斯人口论,其论点有“人口过 剩是贫困的主要原因”,“过剩人口会造成社会 病态”。
问题一:患病原因可能是那三艘船上有导致生 病的物质? 问题二:上有橙汁船的人可能就喜欢喝橙汁? 问题三:上船之前水手身体状况一样吗?
辛辛那提电气公司
辛辛那提电气公司是一个公用事业型公司。它为大辛辛 那提地区的居民提供煤气和电力。1991年,该公司进行了 一次关于建筑物特征的抽样调查,以了解在其服务范围内 的商业建筑物的能源需求量。
案例二 坏血病的原因调查 17世纪初,英国海军患坏血病 背景:海上帝国,坏血病的威胁,国防部进行研究 怀疑:维生素摄入量少 实验方法:四艘军舰离港,一艘有橙汁供应,三艘没有 结果:有橙汁供应水手身体状况良好,没有橙汁供应水 手开始成批生病 结论:缺乏维生素摄入是导致产生疾病的原因 如何完善上述实验?
2020/8/5
12
用分层简单随机抽样方法选择样本,从公司的记 录可以得到,在其服务范围内过去一年每个商业建
筑物的总用电量。由于许多建筑物要研究的特征
(如规模、雇员数量等)都与用电量有关,因此选择 用电量这一标准将建筑物总体划分为6层。
第一层包含100个商业建筑物.它们都是用电 量大户,将这些建筑物中的每一个都包含在样本中。
本章我们将学习有关抽样调查的设计与实施等
问题,就像辛辛那提电气公司进行调查所要考虑 的问题一样,这些是统计学家要考虑的问题。抽 样调查常常用来树立公司的形象,政府和其他机 构也常常利用抽样调查来了解总体各个部分的情 况。
2020/8/5
14
第一节 抽样法概述
一、抽样法的含义和基本特点:
按随机原则从总体中抽取一部分单位进行调查, 并以调查结果对总体数量特征作出具有一定可靠 程度的估计与推断,从而认识总体的一种统计方 法。也是一种收集资料的方法,所以也称为抽样 调查。
内 容 框 架
2020/8/5
3
调查能测准吗?也能,也不能。看例子:
美国总统竞选预测:
民主党候选人 共和党候选人
实际
1968 汉佛莱(50%) 尼克松(50%) 尼(50.3%)
1972
尼克松(62%) 尼(61.8%)
1976 卡特(51%)
卡(51.1%)
1980
里根(52%) 里(55.3%)
3. 刚开始是一人一间房,以后逐次增加,每增加新人, 就回答一Байду номын сангаас问题
4. 实验结果发现,高密度人群增加了人与人之间相互厌 恶的倾向
组B:文档调查,具体做法是 1.按人口密度将分析区域划出若干块(实验区域为某市) 2.查阅“某市地方公众记事录”,里面有人口密度,犯 罪率,精神病患者人数等宝贵资料存在的问题,表象上 看,人口密度和犯罪数量相关,但人口密度和犯罪数量 又与另外变量,如职业、种族、教育、收入等要素相关, 人口密度高的地方犯罪率高,但人口密度高的地方居住 者的教育水平、收入水平偏低,职业差。是职业、文化 程度、收入水平影响犯罪率?还是人口密度影响犯罪率?
概率抽样有以下几种形式: 1.简单随机抽样 2.分层抽样 3.整群抽样 4.等距抽样。
2、非概率抽样 非概率抽样不是完全按随机原则选取样本。组成 总体的很大部分单位没有被抽中的机会(零概 率),使调查很容易出现倾向性偏差。